如题
鉴于目前的CUDA都或多或少地要求使用某个特定版本的cuda,甚至特定版本的llvm
我看不下去了,自己写了一个cuda-min
虽然编译起来比较麻烦,但这个库是通用的,不针对任何特定cuda版本和sm版本
在编译时,应该使用一些特定rustflags,比如nvptx这个target,在编译时要指定target-cpu为显卡(是的,target_cpu填显卡)的对应sm型号(比如3060是sm_86)
虽然目前这个库的正经用法可能只是手写ptx汇编
但至少可以在这里写个宏,把rust当成手动循环展开器
1
共 1 条评论, 1 页
评论区
写评论