Three.js 官网
本示例演示了多种并行归约算法的性能对比与实现原理。
参考实现基于以下书籍和代码库中的CUDA/WGSL代码翻译而来:
算法0-2: 《使用CUDA进行并行编程》 作者:Richard Ansorge
算法3: betann reduce_all 内核 作者:zcbenz
算法4: GPUPrefixSums 归约方法 作者:b0nes164

子组归约算法原理演示

使用 subgroupAdd() 函数捕获每个工作组的子组归约结果(鼠标悬停查看动画效果)