< 返回版块

Neutron3529 发表于 2025-04-13 22:08

Tags:cuda, nvptx

如题

鉴于目前的CUDA都或多或少地要求使用某个特定版本的cuda,甚至特定版本的llvm

我看不下去了,自己写了一个cuda-min

虽然编译起来比较麻烦,但这个库是通用的,不针对任何特定cuda版本和sm版本

在编译时,应该使用一些特定rustflags,比如nvptx这个target,在编译时要指定target-cpu为显卡(是的,target_cpu填显卡)的对应sm型号(比如3060是sm_86)

虽然目前这个库的正经用法可能只是手写ptx汇编

但至少可以在这里写个宏,把rust当成手动循环展开器

评论区

写评论
tyree3 2025-04-15 14:55
  ╭────────────╮
  │   👍 点个赞!   │
  ╰────────────╯
     \(^▽^)/
1 共 1 条评论, 1 页