This is stars and forks stats for /BBuf/how-to-optim-algorithm-in-cuda repository. As of 29 Apr, 2024 this repository has 549 stars and 50 forks.
how-to-optim-algorithm-in-cuda 我也维护了一个学习深度学习框架(PyTorch和OneFlow)的仓库 https://github.com/BBuf/how-to-learn-deep-learning-framework 以及一个如何学习深度学习编译器(TVM/MLIR/LLVM)的学习仓库 https://github.com/BBuf/tvm_mlir_learn , 有需要的小伙伴可以点一点star 本工程记录如何基于 cuda 优化一些常见的算法。请注意,下面的介绍都分别对应了子目录的代码实现,所以想复现性能的话请查看对应子目录下面的 README 。 0. how-to-compile-pytorch-from-source 记录如何手动编译 PyTorch 源码,学习 PyTorch 的一些 cuda 实现。 1. reduce 这里记录学习 NIVDIA 的reduce优化官方博客 做的笔记。完整实验代码见这里 , 原理讲解请看:【BBuf的CUDA笔记】三,reduce优化入门学习笔记 。后续又添加了 PyTorch BlockReduce...
how-to-optim-algorithm-in-cuda 我也维护了一个学习深度学习框架(PyTorch和OneFlow)的仓库 https://github.com/BBuf/how-to-learn-deep-learning-framework 以及一个如何学习深度学习编译器(TVM/MLIR/LLVM)的学习仓库 https://github.com/BBuf/tvm_mlir_learn , 有需要的小伙伴可以点一点star 本工程记录如何基于 cuda 优化一些常见的算法。请注意,下面的介绍都分别对应了子目录的代码实现,所以想复现性能的话请查看对应子目录下面的 README 。 0. how-to-compile-pytorch-from-source 记录如何手动编译 PyTorch 源码,学习 PyTorch 的一些 cuda 实现。 1. reduce 这里记录学习 NIVDIA 的reduce优化官方博客 做的笔记。完整实验代码见这里 , 原理讲解请看:【BBuf的CUDA笔记】三,reduce优化入门学习笔记 。后续又添加了 PyTorch BlockReduce...
repo | techs | stars | weekly | forks | weekly |
---|---|---|---|---|---|
Clowfoe/IMPOSTOR-UPDATE | HaxeCLua | 92 | 0 | 157 | 0 |
ponylang/net_ssl | PonyPowerShellMakefile | 5 | 0 | 7 | 0 |
linuxdeepin/deepin-music | QMLC++CMake | 181 | 0 | 87 | 0 |
CN-Belief/MIUI- | C++ | 155 | 0 | 27 | 0 |
lnis-uofu/SOFA | VerilogTclPython | 118 | 0 | 27 | 0 |
vitoplantamura/BugChecker | CC++Other | 845 | +4 | 121 | +1 |
NVISOsecurity/CobaltWhispers | CMakefile | 210 | 0 | 29 | 0 |
PintaProject/Pinta | C#ShellPython | 1.5k | 0 | 243 | 0 |
fmrico/book_ros2 | C++PythonCMake | 413 | 0 | 76 | 0 |
EmberGL-org/EmberGL | C++C | 282 | 0 | 33 | 0 |