写CUDA到底难在哪?
来源:
编辑:
时间:2025-06-20 03:45:10

对GPU进行性能优化时,cudagraph是绕不开的话题。
不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。
NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。
本文尝试从底层原理出发,根据文档 和 …。
-
{dede:pagebreak/}


网友评论:
{dede:include file='ajaxfeedback.htm' /}
栏目分类

最新文章

热门文章
- 女性到底是厌恶键政,还是厌恶某些键政的人?
- 现在读写速度最快的硬盘,能在30年前的计算机上当做内存使用吗?
- 为什么早期穿越剧《穿越时空的爱恋》《寻秦记》没有觉得那么「雷」人?
- 为什么任天堂在NS2上没有选择使用OLED屏幕以提升续航能力和显示效果?
- 为什么都认为无GC语言一定会比有GC语言要快?
- 阿里合伙人「缩编」至 17 人,张勇、彭蕾、俞永福等 9 人退出,对阿里业务及企业管理有哪些影响?
- 为什么web worker可以在前端开多线程,解决单线程卡死页面的问题,但是没有得到广泛使用?
- 为什么有的房东喜欢把房间租给女租户?
- 有听过什么特别毁三观或者特别奇葩的事情吗?
- 如何评价女明星梅根福克斯的身材?


