NVIDIA 发布 CUDA-Oxide 0.1:实验性 Rust 到 CUDA 编译器
CUDA-Oxide 是 NVIDIA Labs 新放出的实验性项目,目标不是再包一层 DSL,而是把“用原生 Rust 写 CUDA 内核”这条链路直接打通。
- Rust 直出 PTX:走自定义
rustccodegen 后端,把标准 Rust 代码编译到 NVIDIA PTX - 单源代码工作流:主机端与设备端代码可以放在同一份 Rust 源码中构建
- 保留 Rust 语言表达力:支持更贴近 Rust 的类型系统、抽象方式与设备端编程体验
- 仍处 Alpha 早期:目前还在积极开发期,API、稳定性和工具链都还有继续变化的空间
如果这个方向后续跑顺,Rust 在 GPU 编程上的想象空间会比现在大很多。
原文链接:https://nvlabs.github.io/cuda-oxide/
Burn 0.21.0 发布:框架开销最高降低 8 倍
Burn 0.21.0 这次更新很扎实,覆盖分布式训练、内核调优、后端调度和嵌入式 / WebAssembly 场景,属于那种“工程能力和性能一起往前推”的版本。
- 分布式训练提速明显:围绕可微分集合操作重做分布式栈,设备传输速度提升 16-21 倍,
all_reduce提升约 6 倍 - 框架开销继续下压:官方给出的数据里,部分场景框架开销最高下降到原来的八分之一左右
- 内核可靠性增强:自动调优、微基准和验证层都做了加强,能更早发现越界访问等问题
- 工程化更完整:新增
burn.toml项目级配置、burn-dispatchcrate,以及面向 WebAssembly / 嵌入式的轻量 CPU 后端 Burn Flex
对关注 Rust AI / ML 框架的人来说,这次版本更新值得认真看一遍。
原文链接:https://burn.dev/blog/release-0.21.0/
hpke-ng:更快、更小、更安全的 Rust HPKE 实现
Symbolic Software 发布了新的 HPKE 实现 hpke-ng。它不只是做性能优化,也是在重新审视 Rust HPKE 库该怎么做 API 设计和安全边界。
- 性能很能打:在和
hpke-rs的 62 项对比里,27 项领先、32 项持平、3 项落后 - 后量子路径优势明显:ML-KEM / X-Wing 等测试里提速比较突出,而且没有出现落后的条目
- 安全问题驱动重写:团队此前在
hpke-rs中报告过零共享密钥检查缺失、消息计数器溢出等问题 - 类型级密码套件设计:把运行时枚举切到类型状态表达,尽量把约束前移到编译期处理
这类“性能 + 安全 + API 设计”三条线一起推进的密码学基础库,通常都值得多看两眼。
原文链接:https://symbolic.software/blog/2026-05-08-hpke-ng/
Monocurl:用 Rust 做交互式数学动画
Monocurl 是一个面向 STEM 动画的交互式桌面应用和编程语言,想做的是把“数学表达 + 动画渲染 + 演示输出”放进同一套工作流里。
- 一份源码多种产出:可以输出图像、视频和幻灯片演示
- 强调交互式创作:参数调整、播放和渲染可以在同一工作区里完成
- 语言和编辑器一起设计:不是在通用工具上拼出来,而是专门为程序化动画场景定制
- 学习材料比较完整:官网已经提供从基础语法到高级主题的一整套学习路径
如果你对 Rust 在创意工具、可视化表达这条线上的应用感兴趣,这个项目挺有意思。
原文链接:http://monocurl.github.io/
评论区
写评论还没有评论