2025年国产算力AI芯片专题：一文读懂华为昇腾310芯片

来源：东兴证券
发布时间：2025/02/24
浏览次数：2241
举报

相关深度报告REPORTS

国产算力AI芯片专题：一文读懂华为昇腾310芯片.pdf

国产算力AI芯片专题：一文读懂华为昇腾310芯片。Q1：海外龙头复盘：如何看待英伟达的发展历程？英伟达自1993年成立以来，通过战略性的研发和合作，在GPU领域取得显著成就。英伟达公司在1999年上市，2006年推出CUDA平台，使得GPU的应用扩展至数据科学和人工智能等多个领域。2016年，英伟达发布了支持深度学习的超语言学习平台级计算机DGX-1，进一步巩固其在AI时代的领导地位。目前，英伟达在数据中心、游戏、专业可视化和自动驾驶领域拥有广泛的产品和应用。英伟达凭借超前布局+构筑软硬件生态壁垒在算力芯片领域稳居龙头地位，华为昇腾的发展路径展现出对这一模式的借鉴与创新。Q2：华为昇腾的发展情...

海外龙头复盘：如何看待英伟达的发展历程？

英伟达成长启示: 超前布局+构筑软硬件生态壁垒

英伟达飞速发展，直接原因在于搭上了人工智能的顺风车。之所以英伟达能够利用好这两个风口，根源是其于2006年决定布局 GPGPU（通用目的图形处理器），开发CUDA平台，使得英伟达的GPU不仅可以用于加速计算、人工智能领域，还自带底层的算法、模型和应用。GPGPU+CUDA的软硬件生态链为英伟达构筑了强大的竞争壁垒。 AGI产业发展提升全球算力需求，英伟达作为算力芯片龙头，凭借超前布局+构筑软硬件生态壁垒在算力芯片领域稳居龙头地位，在AI产业爆发期实现利润及估值双提升。在分析英伟达通过超前布局与软硬件生态壁垒奠定AI芯片霸主地位的基础上，华为昇腾的发展路径展现出对这一模式的借鉴与创新。

华为昇腾的发展背景是怎样的？

华为计算、系统、大模型快速协同发展成果突出

在云计算领域，华为云基于鲲鹏、昇腾等ICT技术积累，践行“一切皆服务”战略，立足行业数字化“云底座” 和“使能器”的定位，以云作为数字经济重要底座，以AI加快重塑千行百业。华为面向金融、汽车、制造、港口等传统行业和各类新兴企业，把在“云-网-边-端-芯”的技术积累，以云服务的方式开放给全球客户，提供包括数据库、iDME、ERP、盘古大模型等众多产品在内的解决方案。

以昇腾310芯片为例，昇腾芯片有优势有哪些？

昇腾AI处理器本质上是一个SoC

满足飞速发展的深度神经网络对芯片算力的需求，昇腾AI处理器本质上是一个SoC（System on Chip）。以昇腾310 AI 处理器为例，主要可以应用在和图像、视频、语音、文字处理相关的应用场景。其主要的架构组成部件包括特制的计算单元、大容量的存储单元和相应的控制单元。该芯片大致可以划为：芯片系统控制CPU（Control CPU），Al计算引擎（包括AI Core和AI CPU），多层级的片上系统缓存（Cache）或缓冲区（Buffer），数字视觉预处理模块（Digital Vision Pre-Processing,DVPP）等。 Ascend310 AI处理器集成了2个AI Core。AI Core 是计算核心，负责执行矩阵、向量、标量计算的算子任务，AI CPU承担非矩阵类复杂计算。 Cache & Buffer：SOC片内有层次化的memory结构，AI core内部有两级memory buffer，SOC片上还有8MB L2 buffer，专用于AI Core、AI CPU，提供高带宽、低延迟的memory访问。芯片还集成了LPDDR4x控制器，为芯片提供更大容量的DDR内存。

AI Core是昇腾AI处理器的计算核心，采用华为自研的达芬奇架构

AI Core是昇腾AI处理器的计算核心，采用华为自研的达芬奇架构，实现了高通量、大算力和低功耗。达芬奇架构的主要包括：计算单元：包含三种基础计算资源（矩阵计算单元、向量计算单元、标量计算单元）；存储系统：AI Core的片上存储单元和相应的数据通路构成了存储系统；控制单元：整个计算过程提供了指令控制，相当于AI Core的司令部，负责整个AI Core的运行。在 AI Core 中,存储单元为各个计算单元提供被转置过并符合要求的数据,计算单元返回运算的结果给存储单元,控制单元为计算单元和存储单元提供指令控制,三者相互协调合作完成计算任务。达芬奇架构针对AI运算特征而设计，以高性能3DCube计算引擎为基础，实现算力和能效比大幅提升。每个Al Core可以在1个时钟周期内完成4096 次 MAC运算。集成了张量、矢量、标量等多种计算单元支持多种混合精度计算，支撑训练和推理两种场景的数据精度要求。统一的架构,可以支持从几十毫瓦到几百瓦芯片。

华为昇腾近期有哪些最新看点？

昇腾发展看点：DeepSeek系列新模型正式上线昇腾社区

2025年1月，中国杭州深度求索人工智能基础技术研究有限公司先后发布了DeepSeek-V3和DeepSeek-R1两款大模型，性能与OpenAI的付费模型ChatGPT-o3性能相当，定价大幅降低，性价比突出，引发市场震动。1月27日，DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜，在美区下载榜上超越了ChatGPT。 2月4日，DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区，支持一键获取DeepSeek系列模型，支持昇腾硬件平台上开箱即用，推理快速部署，带来更快、更高效、更便捷的AI开发和应用体验。

报告节选：

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）