写CUDA到底难在哪?

2025-06-21 03:40:16

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?
广告位810*200
相关阅读
相对于 Linux,Windows Server 存在的意义是什么?

相对于 Linux,Windows Server 存在的意义是什么?

Windows Server有个功能叫域,它类似统一认证,开...

2025-06-19
***拍大尺度片子时摄影师不会看光吗?

***拍大尺度片子时摄影师不会看光吗?

我现在从事服装行业(内衣)。 这么说把,现在的***,想接...

2025-06-20
为什么全世界无一人能实现新mac直接全功能稳定装Win 11 arm,或PC直接装macOS arm?

为什么全世界无一人能实现新mac直接全功能稳定装Win 11 arm,或PC直接装macOS arm?

各方互设关卡互不相让的结果。 不说苹果,就是Windows...

2025-06-20
为什么英特尔不开发一种全大核CPU?

为什么英特尔不开发一种全大核CPU?

因为,英特尔需要去考虑各种奇怪软件的兼容性,而不是像AMD,...

2025-06-20
有人 espresso 直接喝吗,为什么?

有人 espresso 直接喝吗,为什么?

八九十年代,下地干活的中老年人, 天蒙蒙亮起床第一件事,找去...

2025-06-20