2024年国产算力专题报告:国产算力加速发展,产业链蓄势待发
- 来源:国信证券
- 发布时间:2024/06/03
- 浏览次数:1709
- 举报
通信行业国产算力专题报告:国产算力加速发展,产业链蓄势待发.pdf
通信行业国产算力专题报告:国产算力加速发展,产业链蓄势待发。国内智算中心加速建设,国产算力产业链前景广阔。AI是新质生产力的重要组成,黄仁勋也提出每个国家构建自己的主权AI基础设施,我国正在加速建设智算中心,包括政府、运营商和互联网等积极推进。同时以昇腾为代表的国产算力芯片已取得长足进步,加速国内落地,带动国产算力产业链的发展。从智算中心基础设施视角,本文从服务器、交换机和光模块三个维度对国产算力产业链进行分析:算力服务器快速增长,液冷、机架式方案加速应用。相较于通算服务器的整体出货相对疲软,算力服务器需求旺盛,IDC预计2027年中国加速服务器市场规模将达到164亿美元。传统来看,浪潮信息在...
一、政策支持,投资启动,国内智算中心加速建设
智算中心:新质生产力的引擎,主权AI的基础
智算中心是以 GPU、AI 加速卡等智能算力为核心、集约化建设的新型数据中心,为人工智能应用提供所需的算力服务、数据服务和 算法服务,使能各行各业数智化转型升级。作为 AI 技术发展的关键底座,智算中心的建设和部署在全球范围内提速。从国内视角, 一方面,AI是新质生产力的构成,而算力中心是AI发展的基础和引擎,另一方面,黄仁勋也提出主权AI的概念——每个国家都需要拥 有自己的人工智能基础设施。
全球算力竞争加速,我国智算算力储备对比美国相对落后。据工信部数据,2023年我国智算算力达到70EFlops,同比增长70%;海 外高性能算力芯片出货快速增长,推动算力规模爆发,推算2023年英伟达H100新增算力有望超过1000EFlops(FP16)。
基于此,政策上我国高度重视AI发展,而在落地方面,国内互联网龙头、ICT龙头、运营商等先后推出大模型产品,如Kimi等产品用 户量增长迅速。我国智算中心建设正加速布局,并且国产算力自主可控的产业趋势明确。
国内智算能力有望加速追赶海外——网络角度
随着AI集群的规模不断扩大,智算能力的落地不仅以来单卡性能的提升,超大规模集群的系统和工程能力也发挥重要作用。网络层面, 当前的AI集群规模已经从数千个GPU增长到数万个GPU,未来可能会发展到数十万乃至数百万个加速单元的超级计算集群,AI时代需 要建造比现在规模更大的数据中心,或者将一个数据中心内部分割出多个集群建筑单元,构建一个逻辑上规模更大的数据中心。更大 规模的AI集群需要DCI互联网络支撑。
我国在分布式智算中心所需的DCI网络层面有望发挥优势。如中国移动已开启骨干网400G升级;中国电信联合华为2024年2月份在北 京电信现网完成800G超高速波分技术验证,于近日成功在实验室完成万亿/十万亿级参数大模型分布式训练仿真验证,在北京电信武 清、永丰、瀛海三地IDC机房完成数百亿参数经典大模型的分布式训练任务,测试分布式训练性能达到集中式单智算中心训练性能的 90%以上。其中在瀛海到武清的业务节点,进一步验证了单波PS-64QAM 1.2T的现网传输能力。
政府侧:重视AI发展,大力推进国内智算中心建设
总体规划层面,政策注重人工智能发展,对底层基础设施,尤其是智算中心加强规划。如国务院国资委召开中央企业人工智能专题推 进会。会议认为,加快推动人工智能发展,是国资央企发挥功能使命,抢抓战略机遇,培育新质生产力,推进高质量发展的必然要求。 其中提出要夯实发展基础底座,把主要资源集中投入到最需要、最有优势的领域,加快建设一批智能算力中心。 地方政府层面,上海、北京等多个地方政府已先后出台政策,在算力、运力、存储方面均有明确规划。
互联网:资本开支回暖,加大AI投资
国内互联网厂商资本开支显著回暖,AI为重要投资方向。2023年三季度开始,国内BAT合计资本开支实现同比增长,趋势在2024年 一季度延续——据BAT财报显示,24Q1合计资本开支265.7亿元,同比增长223%,环比增长44%。其中,阿里巴巴资本开支101.7亿 元(同比+305%,环比+40%),腾讯资本开支143.6亿元(同比+226%,环比+91%),百度资本开支20.4亿元(同比+57%,环比44%)。AI是BAT重要的投资方向,百度、阿里、腾讯等公司密集发布大模型,BAT 也均表示将持续加大人工智能投入。
供给侧:禁运背景下,国产算力替代具有必要性
美国对中国先进芯片进口限制持续升级。2022 年8月,美国首次针对中国实施大规模芯片出口制裁,停止出口A100和H100两款芯片 和相应产品组成的系统。2023 年10 月,美国颁布新的半导体出口限制,对芯片算力和性能密度做了更严格的规定,对性能满足以下条 件的芯片实施出口管制:(1)总计算能力TPP(算力*位宽)超过4800的芯片;(2)TPP超过1600且PD(TPP/芯片面积)超过5.92的芯片; (3)2400≤TPP<4800,且1.6≤PD<5.92的芯片;(4) 1600≤TPP,且3.2≤PD<5.92的芯片。根据该要求下,英伟达A100/A800、 H100/H200/H800、L4、L40s均不满足出口条件。2024年4月美国再次修订防止中国取得美国AI芯片和芯片制造设备的规定。这一背景 下,国内算力自主可控是必然趋势。
产业趋势:大规模集群应用趋势明显
万卡以上的大规模集群加速建设。以运营商为例,中国移动预计24年商用三大自主可控万卡集群——即哈尔滨、呼和浩特、贵阳三个 自主可控万卡集群,总规模近6万张GPU,充分满足大模型集中训练需求;同时推理方面,中国移动将按需在1500个边缘节点部署推理 算力,形成“中心大集群、边缘广分布、中训边推、训推一体”的智算网络。中国电信3月22日宣布天翼云上海临港国产万卡算力池正 式启用,算力集群规模达15000卡,其中包括全国首个单池万卡规模的国产液冷算力集群。
二、服务器:算力服务器快速增长,液冷、机架式方案 应用加速
通算需求相对疲软,整体出货量下降
通算服务器需求相对疲软,算力服务器快速增长。服务器整体市场维度,2023年由于宏观经济不景气、库存周期以及资本开支等因素 影响,服务器市场出货量下海,据IDC数据显示,2023年全球服务器出货量约371万台,同比下降6%;受益于AI服务器出货增长,由 于价值量较高,总体服务器市场规模同比提升11.8%至306亿美元。
AI服务器需求旺盛,国内规模有望破百亿美元
AI服务器需求高增。Trendforce预计2023年AI服务器(包含搭载GPU、FPGA、ASIC等)出货量近120万台,同比增长38.4%,占整 体服务器出货量近9%,至2026年将占15%,2022-2026年AI服务器出货量年复合成长率至22%。 国内视角,IDC数据显示2023年上半年加速服务器市场规模达到31亿美元,同比增长54%,预计2027年中国加速服务器市场规模将达 到164亿美元。
国内AI服务器竞争格局:浪潮信息份额靠前,关注昇腾系厂商
AI服务器视角,此前浪潮信息份额靠前。据IDC数据,2022年国内加速计算服务器市场中,浪潮信息、新华三、宁畅位居前三,份额 分别为47%、11%、9%,浪潮信息份额大幅领先。 随着国产芯片发展,国内AI服务器竞争格局或产生变化(参考运营商招标),昇腾系相关服务器厂商份额有望提升。
服务器趋势一:卡间高速互联规模扩大,机柜式方案有望加速应用
基于 Transformer 的大模型演进趋势遵循 Scaling Law,参数量走向万亿级是可预见的必然趋势。新型的算法结构带来了新的分布式 训练策略,如专家系统(Mixture-Of-Experts,MoE)并行,高速通信需求进一步扩展至百卡级别,卡间互联的最优解指向 Switch 交 换拓扑,“超级服务器”等机柜式方案有望加速应用——通过利用提高 GPU 南向的 Scale up 互联能力,提升张量并行或 MOE 并行 对大模型训练任务的收益,实现性能跃升,缩短训练总时长,实现大模型训练整体性能的优化。
铜互联:机柜式方案高速互联的选择
对比光互连,铜互联拥有功耗、成本等方面的优势。英伟达GB200 NVL72方案中,72个GPU通过超5000根铜缆实现互联,在短距离 连接中,铜互联对比光互连具有成本低、功耗低等优势——正如英伟达官网对以太网DAC铜缆产品的优势描述包括:成本最低的高速 互联、功耗和延迟接近零、高度可靠。
服务器趋势二:功耗显著提升,液冷加速应用
随着单卡功率的持续提升,AIDC集群的单机柜功率显著提升。H100单卡TDP 700W,对应单服务器设计功率约10kW,以标准单机柜 4个AI服务器计算,单机柜功率超过40kW;预计B200单卡TDP 将达到1000W,对应单机柜功率有望突破50kW。 一般认为,风冷散热所适配的单机柜功率在4-40kW左右区间,液冷的最佳单机柜功率适配区间在50kw及以上水平。考虑到下一代 Blackwell芯片单机柜功率有望突破50kW,风冷已达散热极限,采用液冷散热大势所趋。
液冷竞争格局(国内):液冷设计非标,部分服务器厂商自研
由于目前液冷服务器的机柜需要定制,需绑定机柜(基础设施)和服务器(ICT设备),因此以中科曙光(曙光数创)、浪潮信息(组建 液冷工程师团队)为代表的服务器厂商采用自研+代工的形式布局液冷,目的是攫取液冷高溢价,从而提高盈利能力。
三、交换机:AI集群无损通信的载体,以太网应用加速
网络架构——胖树架构
胖树(Fat-Tree)组网由 Leaf 交换机、Spine 交换机和 Core 交换机组成, 如图所示。每8台Leaf交换机和下挂的AI服务器做为一个 group,8台 Leaf 交换机又和上面 N 台 Spine 交换机组成一个pod,胖树组网以 pod 为单位进行扩展。在胖树组网中,Spine 交换机和 Leaf 交换机之 间采用 Fullmesh 全连接,所有Spine1都 Full-Mesh 连接至第一组 Core,所有 Spine2 都 Full-Mesh 连接至第二组Core,依次类推。 Spine交换机和 Leaf 交换机上下行收敛比都为1:1。 胖树架构下,假设单台交换机端口数为P,则单台交换机最多可下联 P/2张GPU,2层胖树网络最大可连接GPU数量为P*P/2,3层胖树网络 最大可连接GPU数为P*P/2*P/2;以GPU端口:交换机端口视角,最大 连接情况下两层组网GPU:交换机端口数=1:3,三层组网则为1:5。
以太网AI改进方案:超以太网联盟(UEC)
UEC联盟成立,为人工智能基础设施打造超大以太网。2023 年 7 月,AMD、Arista、博通、思科、Eviden、HPE、英特尔、Meta 和微软宣布成立超以太网联盟 (UEC),这是一个由Linux基金会主持的组织,致力于开发物理层、链路层、传输层和软件层以太网 技术,国内阿里云、百度、世纪互联、字节跳动、华为、新华三、光迅科技、腾讯、锐捷网络等都已加入。预计UEC将于2024年 推出第一批完全基于标准的产品。
数据中心交换机将是行业增长主要驱动力
随着互联网网间流量急剧增长、企业业务上云以及数据中心云化建设成为趋势,互联网公司、金融行业、运营商和智能制造企业在加大数 据中心网络投资,数据中心交换机增速高于行业,且我国数据中心交换机发展空间大。从数据中心和非数据中心交换机发展看: 2023年全球数据中心交换机增速为11.2%,全球非数据中心交换机增速为24.9%,全球总体交换机增速为18.5%,全球数据中心交换机 增速低于行业,但预计未来增速稳定在8%左右,2028年全球数据中心交换机增速预计达7.2%。 2023年中国数据中心交换机增速为-3.7%、非数据中心交换机增速为-5.0%、整体交换机行业增速为-4.4%,中国数据中心交换机增速 高于行业,且预计未来增速稳定在8%-10%左右,2028年中国数据中心交换机增速预计达8.6%,高于全球增速,中国数据中心交换机 相较全球数据中心交换机发展空间更大。
交换机上游:关注国产高端交换芯片方案
商用市场交换芯片市场海外主导,关注国产高端方案。交换芯片可分为交换机厂商自研自用以及商用,在自用市场中,思科、华 为等领先厂商凭借在交换机的领导地位位居前列,如2020年国内自用芯片市场华为份额达88%;商用市场方面,博通竞争优势突 出,全球市场份额约70%,国内市场份额约62%;Marvell、瑞昱等位居第二梯队,Marvell全球份额约29%,国内份额约20%。国 内厂商开始起步,根据灼识咨询数据,盛科通信2020年国内销售额排名第四,占据1.6%的市场份额。 盛科通信拟于2024年推出Arctic系列,交换容量最高达到25.6Tbps、支持最大端口速率800G,面向超大规模数据中心,交换容量 基本达到行业前列水平。
四、光模块:速率迭代升级,关注国产链供应商
数通市场:传统数据中心需求平稳,AI成为核心增长来源
全球市场来看,数通光模块市场整体规模目前约50亿美元,AI成为后续核心增长来源。光模块是AI投资中网络端的重要环节,其与训 练端GPU出货量强相关,同时推理段流量需求爆发也有望带动需求增长。在算力投资持续背景下,AI成为光模块数通市场的核心增长力。 据Coherent数据,预计2023年以太网光模块整体市场规模接近45亿美元(考虑用于存储连接的FC光模块,数通市场规模接近50亿美 元),其中800G、1.6T及3.2T的高速数通光模块市场规模将从2023年的6亿美元以超过70%的CAGR增长至2028年的超过90亿美元,预 计AI相关的800G以上数通光模块市场规模将占所有数通光模块的近60%。
国内:国产算力配套400G有望逐步起量,800G开始应用
国内光模块应用进度相对落后于海外,随着国产算力发展,配套400G/800G光模块需求有望起量。参考华为昇腾Atlas 300T A2训练卡 技术文档,其PCIe接口为PCIe x16 Gen5,配套网络接口为1个200GE QSFP-DD接口,支持RoCE协议;若参考海外路径,交换机采用 200G聚合方案,也可应用400G光模块。而从交换机口径,如前文所述,锐捷网络AI-FlexiForce智算中心网络解决方案中,NCP交换机 采用400G下行。随着速率进一步提升,国内800G光模块有望逐步应用。
报告节选:


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
-
标签
- 算力
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 《中国智算中心产业发展白皮书(2024年)》电子版.pdf
- 2 国产算力AI芯片专题:一文读懂华为昇腾310芯片.pdf
- 3 2024年算力行业投资策略:多模态推动技术迭代,国产化助力产业成长.pdf
- 4 算力行业专题报告:国央企加大算力基础设施建设,国产算力大有可为.pdf
- 5 DeepSeek R1深度解析及算力影响几何.pdf
- 6 2024中国智能算力行业白皮书.pdf
- 7 AI算力芯片行业专题报告:AI时代的引擎.pdf
- 8 通信行业专题报告:算力新迭代,连接大扩展,红利稳增长.pdf
- 9 PCB行业专题报告:AI算力浪涌,PCB加速升级.pdf
- 10 AI算力产业专题报告:NVIDIA GB200,重塑服务器铜缆液冷HBM价值.pdf
- 1 AI算力芯片行业专题报告:AI时代的引擎.pdf
- 2 PCB行业专题报告:AI算力浪涌,PCB加速升级.pdf
- 3 中国能建研究报告:能源及算力基础设施龙头,求新求变蓄势向上.pdf
- 4 AI算力行业专题报告:AI产业高景气持续,算力国产化大势所趋.pdf
- 5 电子行业深度研究报告:国内算力需求爆发,供应链扬帆起航.pdf
- 6 液冷行业分析报告:AI算力时代,液冷需求爆发.pdf
- 7 AI 算力芯片行业专题报告:AI算力芯片是“AI时代的引擎”,河南省着力布局.pdf
- 8 计算机行业专题研究:DeepSeek重构算力基建长期价值的认知.pdf
- 9 AIDC电能质量深度研究报告:AIDC建设热潮呼之欲出,算力电力必须协同发展.pdf
- 10 2025年新质算力发展白皮书-生成式AI驱动算力基础设施向纵深升级.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2025年太空算力的崛起,算力模式演变和中美路径探索
- 2 2025年全球算力竞争格局分析:中美领跑,智能算力成核心引擎
- 3 2025年电力与算力协同发展分析:绿电直连与智能调度成关键路径
- 4 2025年中国算力发展分析:AI计算开放架构如何破解万卡集群效能瓶颈
- 5 2025年人工智能算力知识产权分析:创新驱动与生态博弈下的竞争新格局
- 6 2025年算力基础设施质量评估分析:可访问性与健康度成高质量发展核心指标
- 7 2025年算力电力协同发展分析:绿电直供与智能调度成关键路径
- 8 华为算力基础设施安全体系分析:端管云协同架构如何重塑AI时代的数据防护格局
- 9 2025年中国算力产业分析:综合算力指数揭示"东部引领、中西部崛起"新格局
- 10 2025年算力城域网发展分析:中国智能算力规模将突破1000EFLOPS
- 1 2025年太空算力的崛起,算力模式演变和中美路径探索
- 2 2025年全球算力竞争格局分析:中美领跑,智能算力成核心引擎
- 3 2025年电力与算力协同发展分析:绿电直连与智能调度成关键路径
- 4 2025年中国算力发展分析:AI计算开放架构如何破解万卡集群效能瓶颈
- 5 2025年人工智能算力知识产权分析:创新驱动与生态博弈下的竞争新格局
- 6 2025年算力基础设施质量评估分析:可访问性与健康度成高质量发展核心指标
- 7 2025年算力电力协同发展分析:绿电直供与智能调度成关键路径
- 8 华为算力基础设施安全体系分析:端管云协同架构如何重塑AI时代的数据防护格局
- 9 2025年中国算力产业分析:综合算力指数揭示"东部引领、中西部崛起"新格局
- 10 2025年算力城域网发展分析:中国智能算力规模将突破1000EFLOPS
- 最新文档
- 最新精读
- 1 2026年中国医药行业:全球减重药物市场,千亿蓝海与创新迭代
- 2 2026年银行自营投资手册(三):流动性监管指标对银行投资行为的影响(上)
- 3 2026年香港房地产行业跟踪报告:如何看待本轮香港楼市复苏的本质?
- 4 2026年投资银行业与经纪业行业:复盘投融资平衡周期,如何看待本轮“慢牛”的持续性?
- 5 2026年电子设备、仪器和元件行业“智存新纪元”系列之一:CXL,互联筑池化,破局内存墙
- 6 2026年银行业上市银行Q1及全年业绩展望:业绩弹性释放,关注负债成本优化和中收潜力
- 7 2026年区域经济系列专题研究报告:“都”与“城”相融、疏解与协同并举——现代化首都都市圈空间协同规划详解
- 8 2026年历史6轮油价上行周期对当下交易的启示
- 9 2026年国防军工行业:商业航天革命先驱Starlink深度解析
- 10 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
