去年开始从java后端开发转到了这个方向,学习到了很多sycl的知识,但是cuda的应用范围更加广泛,所以还是打算研究一下。 这个仓库主要会记录下将建的并行编程模型,如reduce,scan,matmul,conv等算法的实现以及优化,总结下常见的性能优化方案,以及性能测量工具的使用,还有就是性能预估之类(Roof line model)
- 仓库框架的搭建,主要是基础的工具类
- Roof line model
- reduce
- scan
- matmul
- conv
- 常见优化总结
| Name | Name | Last commit date | ||
|---|---|---|---|---|