Three.js 官网
本示例演示了多种并行归约算法的性能对比与实现原理。
参考实现基于以下书籍和代码库中的CUDA/WGSL代码翻译而来:
算法0-2:
《使用CUDA进行并行编程》
作者:
Richard Ansorge
算法3:
betann reduce_all 内核
作者:
zcbenz
算法4:
GPUPrefixSums 归约方法
作者:
b0nes164
子组归约算法原理演示
使用 subgroupAdd() 函数捕获每个工作组的子组归约结果(鼠标悬停查看动画效果)