网站地图官方微信:
网站首页 滦河镇 古绛镇 梧桐镇 庐阳区 盐塘乡 兔街镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 古代刚考中进士一般授予什么官职,一段时间后又能当上什么等级的官(平均水平)? |

    昨天(6月8号)回答了一个三甲知县能不能当尚书的问题,然后有...

    查看详情>>
  • | 如何评价“寡姐”斯嘉丽·约翰逊的身材? |

  • | 你的亲戚提过什么过分的要求? |

  • | 国产手机AI「好用」的背后,是技术差距还是文化差异? |

  • | 沃尔特收购湖人大部分股权交易估值达 100 亿美元,创职业体育队最高纪录,为什么湖人的商业价值这么大? |

  • | 飞机这么多按钮都要一个个地打开,为什么不能一键启动? |

  • | 有没有便宜点的AI算力显卡? |

  • | 为什么我感觉黑神话剧情的风评反转了? |

  • | Python+rust会是一个强大的组合吗? |

  • | 安徽一银行两名客户经理因吃客户一碗面每人被罚 3000 元,这个处罚力度合理吗? |

  • | 既然C#等开源语言,为啥***le还要弄个基本上一模一样的Swift? |

  • 人类在工程技术上的演讲,很多时候都是翻倍演进法。 比如 p...

    2025-06-19
  • 巧了,刚从汕头回来,到汕头第一天专门去吃了当地很出名的 杏花...

    2025-06-19
  • 当年刚买相机没多久,约朋友拍照,刚开始就拍拍袜子,拍拍脚啥的...

    2025-06-19
  • 看了高赞回答,很多人心里完全接受不了,2000多年前的古希腊...

    2025-06-19

关注我们

添加微信好友,关注最新动态