GPU行业专题报告:GPU框架,从ROCm、Pytorch看生态壁垒.pdf
- 上传者:y****
- 时间:2023/11/13
- 热度:1450
- 0人点赞
- 举报
GPU行业专题报告:GPU框架,从ROCm、Pytorch看生态壁垒。我们认为今后三年是国产 GPU 发展关键窗口期,生态建设至关重要。以 ROCm 为代表的生态实现了并行计算软件库的广覆盖,对主流 AI 框架如 Pytorch 等 的完善支持都是生态建设的核心。优先推荐性能优良、软件库覆盖率高且能够 持续迭代、已获得客户认可的公司如海光信息。昇腾 NPU 率先获得 Pytorch 原生支持,且研发资源强大,未来有望持续领先。建议关注华为昇腾整机合作 伙伴高新发展、神州数码、拓维信息。
国产 GPU 发展窗口期已至,生态构筑核心优势。AI 发展带动算力硬件需求,我 们认为未来三年可能是国产 GPU 发展关键窗口期。目前国产算力硬件理论性能 可接近国际主流,但软件生态是限制理论性能和开发者使用的重要因素。
CUDA:GPU 生态先驱,AI 时代基础设施。CUDA 是 GPU 生态的先驱,实现 了 GPU 从图形硬件向算力硬件的转变。2006 年 CUDA 推出后,开发者无需再 通过图形 API 来调用 GPU,而是可以直接操控 GPU。CUDA 在长期发展中逐 步渗透了 HPC 与 AI 生态,2023 年已经迭代到第 12 代 API,具备了巨量软件组 件,塑造了用户习惯,如今要将其取代需要巨量的时间和资源投入。以 CUDA 为模板,我们可以发现,其他算力芯片的生态要接近 CUDA 的地位,应当尽可 能在(并行计算相关)软件库覆盖率以及 AI 框架支持度方面进行投入。
并行计算软件库覆盖度:以 ROCm 为例。CUDA 为用户提供便利的同时,也带 来了代价,一是需要承受英伟达硬件不低的成本,二是闭源的 CUDA 导致部分 使用者面临供应不确定性。因此需要 CUDA 的低成本替代方案,目前 AMD 推 出的 ROCm 软件平台未来有望替代 CUDA。
ROCm 出现前为何 CUDA 长期没有挑战者?OpenCL 与硬件均有不足。 OpenCL 在 2015 年才添加 C++支持,长期对高层软件库支持不足,而 CUDA 早在 2013 年就已经支持 C/C++/Fortran/Python。硬件方面,AMD 在 2017 年首次推出 MI 系列数据中心 GPU,但与同期的 NVIDIA V100 相比存在一定差距,也不利于生态的形成。
ROCm 为何能够成为生态转折点?2015 年 Boltzman 计划推出以来,全 新的软硬件平台解决了此前短板。硬件方面,全新 CDNA 架构与 NVIDIA 的架构各有优势;软件方面,重构的HIP平台也全面优于OpenCL。ROCm 通过 Hipify 工具利用现有 CUDA 代码;软件库方面,经过 5 年建设,到 2020 年的 ROCm4.0 时代,已经初步实现 AI 与 HPC 领域基础库的全面 支持;基础软硬件支持方面,现有的 CDNA 与 RDNA 系列架构得到较全 面的支持,虚拟化支持也为数据中心云化部署创造了条件;性能方面, ROCm 在良好优化下与 CUDA 并无性能差距。
ROCm 的未来?用开源占据大生态。ROCm 作为后发者,采用开源方式, 聚集开发者力量是合理选择。目前 ROCm 生态中,除专为 AMD 硬件优 化的 AOCC 编译器外,均为开源组件。我们认为未来 ROCm 与 CUDA 可能类似 Python 和 MATLAB 的发展路线,ROCm 可能在部分大型统一 生态领域获得认可,而 CUDA 在大量细分场景的优势有望持续。
免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。
- 相关标签
- 相关专题
- 全部热门
- 本年热门
- 本季热门
- GPU图形处理器行业深度研究报告:GPU研究框架 4524 12积分
- GPU行业深度研究:AI大模型浪潮风起,GPU芯片再立潮头.pdf 3586 12积分
- 人工智能芯片市场研究:GPU将成为主流,国产化曙光初现.pdf 3311 8积分
- 自动驾驶芯片行业专题报告:GPU的现在和ASIC的未来.pdf 3181 8积分
- 半导体行业专题研究:从英伟达看国产GPU发展机遇与挑战.pdf 2543 8积分
- 半导体行业专题报告:ChatGPT对GPU算力的需求测算与相关分析.pdf 2453 10积分
- 集成电路行业专题报告:从全球领先企业看GPU发展方向.pdf 2409 8积分
- GPU行业深度研究.pdf 2183 10积分
- 英伟达研究报告:GPU设计到软件CUDA+ Omniverse开发,建立人工智能和元宇宙生态系统.pdf 2066 8积分
- GPU行业专题报告:GPU框架,从ROCm、Pytorch看生态壁垒.pdf 1451 8积分
- 字节跳动:2025年GPU Scale-up 互联技术白皮书.pdf 1302 6积分
- 海光信息研究报告:高端“CPU+GPU”双卡位,迎自主可控核心驱动.pdf 529 6积分
- GPU供电趋势专题报告:多相DrMOS价值量倍增.pdf 511 6积分
- 顺丰科技:2025年EffectiveGPU技术白皮书.pdf 481 11积分
- 景嘉微研究报告:国产GPU先驱者,定增加码高性能GPU.pdf 405 6积分
- 景嘉微研究报告:国产GPU先锋,技术积淀与研发优势驱动未来.pdf 393 5积分
- 算力芯片行业深度研究报告:算力革命叠浪起,国产GPU奋楫笃行.pdf 313 6积分
- 图形化GPU产业调研报告.pdf 268 26积分
- 景嘉微研究报告:专用GPU迭代破局,拥抱通用广阔市场.pdf 255 5积分
- 计算机行业专题报告:GPU+ASIC渗透加速,液冷市场规模再添增量.pdf 252 5积分
- 算力芯片行业深度研究报告:算力革命叠浪起,国产GPU奋楫笃行.pdf 313 6积分
- 计算机行业专题报告:GPU+ASIC渗透加速,液冷市场规模再添增量.pdf 252 5积分
- 星环科技公司研究报告:算力架构革命,星环GPU_Native数据库先行.pdf 189 5积分
- 超威半导体:GPU+CPU双轮驱动增长.pdf 172 3积分
