2025年国产算力AI芯片专题:一文读懂华为昇腾310芯片

  • 来源:东兴证券
  • 发布时间:2025/02/24
  • 浏览次数:2241
  • 举报
相关深度报告REPORTS

国产算力AI芯片专题:一文读懂华为昇腾310芯片.pdf

国产算力AI芯片专题:一文读懂华为昇腾310芯片。Q1:海外龙头复盘:如何看待英伟达的发展历程?英伟达自1993年成立以来,通过战略性的研发和合作,在GPU领域取得显著成就。英伟达公司在1999年上市,2006年推出CUDA平台,使得GPU的应用扩展至数据科学和人工智能等多个领域。2016年,英伟达发布了支持深度学习的超语言学习平台级计算机DGX-1,进一步巩固其在AI时代的领导地位。目前,英伟达在数据中心、游戏、专业可视化和自动驾驶领域拥有广泛的产品和应用。英伟达凭借超前布局+构筑软硬件生态壁垒在算力芯片领域稳居龙头地位,华为昇腾的发展路径展现出对这一模式的借鉴与创新。Q2:华为昇腾的发展情...

海外龙头复盘:如何看待英伟达的发展历程?

英伟达成长启示: 超前布局+构筑软硬件生态壁垒

英伟达飞速发展,直接原因在于搭上了人工智能的顺风车。之所以英伟达能够利用好这两个风口,根源是其于2006年决定布局 GPGPU(通用目的图 形处理器),开发CUDA平台,使得英伟达的GPU不仅可以用于加速计算、人工智能领域,还自带底层的算法、模型和应用。GPGPU+CUDA的软硬件生 态链为英伟达构筑了强大的竞争壁垒。 AGI产业发展提升全球算力需求,英伟达作为算力芯片龙头,凭借超前布局+构筑软硬件生态壁垒在算力芯片领域稳居龙头地位,在AI产业爆发期实 现利润及估值双提升。 在分析英伟达通过超前布局与软硬件生态壁垒奠定AI芯片霸主地位的基础上,华为昇腾的发展路径展现出对这一模式的借 鉴与创新。

华为昇腾的发展背景是怎样的?

华为计算、系统、大模型快速协同发展成果突出

在云计算领域,华为云基于鲲鹏、昇腾等ICT技术积累,践行“一切皆服务”战略,立足行业数字化“云底座” 和“使能器”的定位,以云作为数字经济重要底座,以AI加快重塑千行百业。华为面向金融、汽车、制造、港口等 传统行业和各类新兴企业,把在“云-网-边-端-芯”的技术积累,以云服务的方式开放给全球客户,提供包括数据 库、iDME、ERP、盘古大模型等众多产品在内的解决方案。

以昇腾310芯片为例,昇腾芯片有优势有哪些?

昇腾AI处理器本质上是一个SoC

满足飞速发展的深度神经网络对芯片算力的需求,昇腾AI处理器本质上是一个SoC(System on Chip)。以昇腾310 AI 处理器为例,主要可以应用 在和图像、视频、语音、文字处理相关的应用场景。其主要的架构组成部件包括特制的计算单元、大容量的存储单元和相应的控制单元。该芯片大 致可以划为:芯片系统控制CPU(Control CPU),Al计算引擎(包括AI Core和AI CPU),多层级的片上系统缓存(Cache)或缓冲区(Buffer), 数字视觉预处理模块(Digital Vision Pre-Processing,DVPP)等。 Ascend310 AI处理器集成了2个AI Core。AI Core 是计算核心,负责执行矩阵、向量、标量计算的算子任务,AI CPU承担非矩阵类复杂计算。 Cache & Buffer:SOC片内有层次化的memory结构,AI core内部有两级memory buffer,SOC片上还有8MB L2 buffer,专用于AI Core、AI CPU,提 供高带宽、低延迟的memory访问。芯片还集成了LPDDR4x控制器,为芯片提供更大容量的DDR内存。

AI Core是昇腾AI处理器的计算核心,采用华为自研的达芬奇架构

AI Core是昇腾AI处理器的计算核心,采用华为自研的达芬奇架构,实现了高通量、大算力和低功耗。达芬奇架构的主要包括:计算单元:包含三 种基础计算资源(矩阵计算单元、向量计算单元、标量计算单元);存储系统:AI Core的片上存储单元和相应的数据通路构成了存储系统;控制 单元:整个计算过程提供了指令控制,相当于AI Core的司令部,负责整个AI Core的运行。在 AI Core 中,存储单元为各个计算单元提供被转置 过并符合要求的数据,计算单元返回运算的结果给存储单元,控制单元为计算单元和存储单元提供指令控制,三者相互协调合作完成计算任务。 达芬奇架构针对AI运算特征而设计,以高性能3DCube计算引擎为基础,实现算力和能效比大幅提升。每个Al Core可以在1个时钟周期内完成4096 次 MAC运算。集成了张量、矢量、标量等多种计算单元支持多种混合精度计算,支撑训练和推理两种场景的数据精度要求。统一的架构,可以支持 从几十毫瓦到几百瓦芯片。

华为昇腾近期有哪些最新看点?

昇腾发展看点:DeepSeek系列新模型正式上线昇腾社区

2025年1月,中国杭州深度求索人工智能基础技术研究有限公司先后发布了DeepSeek-V3和DeepSeek-R1两款大模型,性能与OpenAI的付费 模型ChatGPT-o3性能相当,定价大幅降低,性价比突出,引发市场震动。1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行 榜,在美区下载榜上超越了ChatGPT。 2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台 上开箱即用,推理快速部署,带来更快、更高效、更便捷的AI开发和应用体验。

报告节选:


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至