2026年通信行业超节点与Scale up网络专题之英伟达:行业标杆,领先优势建立在NVLink和NVLink Switch
- 来源:东兴证券
- 发布时间:2026/02/05
- 浏览次数:152
- 举报
通信行业超节点与Scale up网络专题之英伟达:行业标杆,领先优势建立在NVLink和NVLink Switch.pdf
通信行业超节点与Scaleup网络专题之英伟达:行业标杆,领先优势建立在NVLink和NVLinkSwitch。大语言模型(LLM)参数规模从千亿级向万亿级乃至十万亿级演进,跨服务器张量并行(TP)成为必然选择;此外混合专家(MoE)模型在Transformer架构LLM中的规模化应用,更使跨服务器专家并行(EP)成为分布式训练和推理的关键技术需求。为应对TP和EP对网络带宽与延迟的极为严苛的要求,构建超高带宽、超低延迟的Scaleup网络(纵向扩张网络)成为业界主流技术路径。目前英伟达超节点已经推出成熟方案。2024-2026年,英伟达陆续推出GH200NVL72、GB200/GB300NV...
LLM 训练要求高带宽与延迟,驱动超节点成为 AI 算力网络创新方向
大语言模型(LLM)参数规模从千亿级向万亿级乃至十万亿级演进,跨服务器张量并行(TP)成为必然选择; 此外混合专家(MoE)模型在 Transformer 架构 LLM 中的规模化应用,更使跨服务器专家并行(EP)成为 分布式训练和推理的关键技术需求。为应对 TP 和 EP 对网络带宽与延迟的极为严苛的要求,构建超高带宽、 超低延迟的 Scale up 网络(纵向扩张网络)成为业界主流技术路径。
超节点主要由计算节点、交换节点和 Scale-up 网络互联构成。通过 Scale up 网络,可将几十、上百甚至上 千张 XPU 高速互联构建为超节点(SuperPoD),像一台超级 XPU 服务器一样实现高效的计算和通信协同 能力。 其中 Scale up 网络互联是超节点的核心要素。Scale up 网络互联方案直接影响超节点系统的功耗、散热、 成本、规模、可靠性和可维护性等关键指标。目前主流的互联方案有铜缆互联和光纤互联两大类:
铜缆互联方案(如英伟达的 NVL72 超节点及 NVSwitch Scale-Up 网络采用的 DAC 即无源铜缆技术) 具有功耗低、成本低、可靠性高的明显优势。不过,受限于铜缆的信号传输距离,单个超节点的规模较 小,目前商用的英伟达 NVL72 超节点最大支持 72 张 XPU 卡。
光纤互联方案(如华为的 CloudMatrix384 超节点及 Unified Bus (UB)Scale-Up 网络采用的 AOC 技术) 则突破铜缆距离限制,超节点规模可以做的更大,目前商用的华为 CloudMatrix384 超节点可支持多达 384 张 XPU 卡,但这种互联技术方案也存在明显短板,如光模块功耗大,成本高,故障率高。

目前英伟达、谷歌、AMD 以及华为四家头部 AI 算力芯片厂商均推出各自的 Scale up 协议。英伟达在 AI 数 据中心的 Scale up 网络中采用自研的 NVLink 高速互连技术;AMD 与 AWS、思科、谷歌等公司组成超以太 网联盟(UALink);Google 采用私有 ICI 协议,机柜之间运用 OCS 光交换技术;华为推出自研的灵衢协议 技术(UB)。
Scale up 网络主要有两个技术方向。一是封闭的私有技术方向,以英伟达、Google 为典型代表,二者均采 用专有协议:NVLink 仅向第三方半开放 CPU/Chiplet 接入权限;Google ICI Link 则服务于自研 TPU 集群; 二是基于 Ethernet 的开放技术方向,以各大互联网和云计算公司以及一些 GPU 芯片公司为代表。开放标准 以 UALink 和华为灵衢为代表,UALink 基于标准以太网组件打造开放互联协议,华为灵衢从 2.0 版本起转向 开放标准。目前两者均处于生态建设初期。
英伟达:超节点领先优势建立在 NVLink 和 NVLink Switch
2.1 Scale up 网络核心技术:NVLink 与 NVLink 交换机
NVLink 与 NVLink 交换机是英伟达构建单机柜 Scale up 网络的核心技术组合。二者协同演进,从早期点对 点互联发展到如今全互联通信,并支持多代 GPU 架构算力芯片。2026 年 1 月,英伟达发布第六代 NVLink 以及 NVLink 交换机,两者支持最新的 Rubin 架构。从性能指标看,第六代 NVLink 交换机支持的 GPU-to-GPU 通信带宽为 3.6TB/s;在 VR NVL72 系统中提供 260TB/s 聚合带宽。其中每 GPU 的 NVLink 带宽保持不变, 与 NVLink5.0 一致,仍为 100GB/s。

NVLink 重新设计通信架构,推出网状拓扑理念。为实现 AI 训练集群高带宽与低延迟数据传输,NVLink 允 许 GPU 之间形成多对多的直接通信网络,每个 GPU 都可以同时与多个其他 GPU 建立高速通信链路。NVLink 协议创新如下: 在物理层面,NVLink 采用差分信号传输技术,具有高带宽和高抗干扰性能。每个链路由多对差分信号线组成, 每对信号线负责传输一个方向的数据。SerDes 模块是 NVLink 物理层的核心组件,负责将并行数据转换为高 速串行流,并在接收端进行反向转换。NVLink 的 SerDes 设计采用时钟数据恢复技术,以及集成复杂的自适 应均衡电路。 在链路层,NVLink 定义多种类型的符号,包括数据符号、控制符号和填充符号,实现复杂的通信协议功能; 设计精细的信用机制,实现不同优先级的流量调度。 除此之外,NVLink 其他创新之处包括多 Lane 绑定技术、统一内存空间等。
NVSwitch 是实现 Scale up 网络复杂交换的关键设备。 早期的 NVLink 实现主要采用点对点连接模式,GPU 之间通过直接的串行链路进行通信。当系统包含多个 GPU 时,点对点模式的连接复杂度呈平方级增长。 作为专门的交换芯片,NVSwitch 可以提供多端口的高速交换能力。NVLink 的交换网络采用多阶 Clos 网络 架构,Clos 网络通过多级交换结构实现输入端口到输出端口的任意连接。
2.2 GB200 NVL72 超节点:铜缆互联,总交换容量 129.6TB/s
目前英伟达超节点已经推出成熟方案,在行业中处于领先地位。2024-2026 年,英伟达陆续推出 GH200 NVL72、GB200/ GB300 NVL72、VR200 NVL72 三代超节点。
Hopper 架构开启超节点 Scale up 初步探索。GH200 通过 NVLink 和 NVLink-C2C(Chip-to-Chip)技 术,使得每个 GPU 可以访问其他所有 CPU 和 GPU 芯片的内存,实现 GPU 与 CPU 内存统一编址。
Blackwell 架构推动 Scale up 标准化。GB200 NVL72 将 Scale-up 规模稳定在 72 个 GPU/机柜,形成 可复制标准化方案。NVL72 由 18 个 Compute Tray(计算托架)和 9 个 Switch Tray(网络交换托架) 构成。其中,Compute Tray 是计算核心单元,负责提供强大的计算能力;Switch Tray 是高速通信枢纽, 用于实现 GPU 之间的高速数据交换。NVL72 背板通过“NVLink5 私有协议 + 铜线缆”将 18 个 Compute Tray 中的 72 颗 B200 GPU 和 9 个 Switch Tray 中的 18 颗 NVSwitch 芯片进行满带宽全连接。
Rubin架构推动Scale up方案带宽倍增。2026年1月CES展会,英伟达发布Rubin架构VR200 NVL72。 其中 NVLink 6 Switch 实现单 GPU 的互连带宽提升至 3.6 TB/s,上代为 1.8TB/s。Scale out 方面, Spectrum-6 交换机支持 CPO(共封装光学)技术,将 32 个 1.6Tb/s 硅光光学引擎与交换芯片直接封装 集成。
目前全球算力芯片公司进入芯片性能与超节点性能并行竞争的新阶段。GB200 NVL72 作为全球超节点发展 的标杆产品,我们将从多个维度拆解其硬件构成以及重点性能指标。 从算力和通信性能看:GB200 NVL72 提供 180 PFLOP 的 TF32 Tensor Core 算力,总内存容量 13.8TB,内 存带宽 576TB/s;Scale up 带宽 64800 单向 GB/s。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
- 沙利文咨询:2025全球通信站点储能系统白皮书.pdf
- 各国电信-信息通信技术的经济问题.pdf
- 通信行业AI电源专题:AI能耗高速增长引发电源架构重要变革.pdf
- 通信设备行业ESG白皮书.pdf
- 通信服务行业ESG白皮书.pdf
- 超节点与Scale up网络行业:谷歌、AMD、国产超节点持续发力,打破英伟达独大格局.pdf
- AI算力行业周报:AMD拿下Meta订单,英伟达业绩超预期.pdf
- 汽车行业周报:英伟达发布自动驾驶模型平台,Robotaxi产业化持续推进.pdf
- 英伟达:全栈算力之巅,物理AI新纪元.pdf
- 科技行业:英伟达吸收Groq定义AI下半场!.pdf
- 叁才云科:2026年内容分发网络(CDN)行业发展白皮书.pdf
- 互联网行业:第57次中国互联网络发展状况统计报告.pdf
- 设计安全,AI智能:为智能威胁时代重新定义网络弹性.pdf
- 产业观察:量子哈密顿学习,密歇根大学实现基因调控网络推断的新跨越.pdf
- 计算机行业深度分析报告:AI重塑网络结构,CDN转型“分布式大脑”.pdf
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 国网信通(600131)研究报告:国网系信息通信服务商,云网融合优势突出.pdf
- 2 5G大产业机遇深度解析(115页PPT).pdf
- 3 5G行业发展最新进展研究报告(45页PPT).pdf
- 4 射频前端滤波器产业105页深度研究报告
- 5 光模块行业深度报告:产业拐点+市场共振.pdf
- 6 中国UWB定位技术企业级应用市场调研(2019 版).pdf
- 7 国家电网:被忽略的5G网络建设方、使用方、运营商.pdf
- 8 物联网产业104页深度研究报告:物联网研究框架与投资机会分析
- 9 车联网产业链深度研究:大幕开启,科技新基建先行.pdf
- 10 光模块专题报告:电信与数通共振,光模块迎高景气.pdf
- 1 2025低空经济场景应用与通信需求白皮书.pdf
- 2 通信行业分析:硅光加速渗透拐点已至.pdf
- 3 通信行业专题报告:国防信息化与智能化建设有望提速,关注板块修复机会.pdf
- 4 光通信行业深度:驱动因素、发展趋势、产业链及相关公司深度梳理.pdf
- 5 通信运营商专题:2024年业绩总结与云计算业务重估.pdf
- 6 通信行业专题报告:数据中心互联技术专题五,液冷—智算中心散热核心技术.pdf
- 7 仕佳光子研究报告:AI驱动光通信技术升级,AWG、MPO打开成长空间.pdf
- 8 政策与产业共振,卫星通信板块迎“奇点时刻”.pdf
- 9 通信行业专题研究:DeepSeek算力效率提升≠算力通缩,国产算力需求方兴未艾.pdf
- 10 通信行业专题报告:光铜共进,AEC等或受益于AI高速短距连接需求.pdf
- 1 政策与产业共振,卫星通信板块迎“奇点时刻”.pdf
- 2 通信行业光通信系列报告一:AI需求与产品高端化,共驱光模块市场增长新周期.pdf
- 3 通信行业深度:无光不AI,硅基光电子引爆新一轮算力革命.pdf
- 4 光通信行业系列报告二:光电共封装重构算力互连架构,CPO开启高密度高能效新时代.pdf
- 5 通信行业深度报告:超节点,光、液冷、供电、芯片的全面升级.pdf
- 6 通信行业深度报告:超节点:光、液冷、供电、芯片的全面升级.pdf
- 7 通信行业:AI强者恒强,卫星拐点已至.pdf
- 8 2026年通信行业年度投资策略:AI基建与应用加速,卫星互联趋势明显.pdf
- 9 光通信行业深度:驱动因素、发展趋势、产业链及相关公司深度梳理.pdf
- 10 移远通信深度报告:从连接模组到智能生态,领军5G_A与AI时代.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2026年通信行业AI电源专题:AI能耗高速增长引发电源架构重要变革
- 2 2026年通信·行业专题报告:数据中心互联技术专题,AI变革推动OCS新技术快速发展
- 3 2026年通信行业专题报告:商业航天快速发展,火箭及卫星制造率先受益
- 4 2026年通信设备行业“液冷加速度”系列报告三:液冷0→1后,从头部厂商表现再看行业变化
- 5 2026年通信行业端侧AI崛起:场景化硬件重构人机交互,引爆产业链新机遇
- 6 2026年通信行业:光纤行业迎来景气周期
- 7 2026年通信行业投资策略:谷歌TPU v7与OCS光交换,架构革新与产业链机遇
- 8 2026年通信行业投资策略:商业航天建设期主线确立,AI算力提供景气强化
- 9 2026年光通信行业深度:驱动因素、发展趋势、产业链及相关公司深度梳理
- 10 2026年通信行业:云厂商大幅提升资本开支预期推动AI建设,量子计算产业进入发展新阶段
- 1 2026年通信行业AI电源专题:AI能耗高速增长引发电源架构重要变革
- 2 2026年通信·行业专题报告:数据中心互联技术专题,AI变革推动OCS新技术快速发展
- 3 2026年通信行业专题报告:商业航天快速发展,火箭及卫星制造率先受益
- 4 2026年通信设备行业“液冷加速度”系列报告三:液冷0→1后,从头部厂商表现再看行业变化
- 5 2026年通信行业端侧AI崛起:场景化硬件重构人机交互,引爆产业链新机遇
- 6 2026年通信行业:光纤行业迎来景气周期
- 7 2026年通信行业投资策略:谷歌TPU v7与OCS光交换,架构革新与产业链机遇
- 8 2026年通信行业投资策略:商业航天建设期主线确立,AI算力提供景气强化
- 9 2026年光通信行业深度:驱动因素、发展趋势、产业链及相关公司深度梳理
- 10 2026年通信行业:云厂商大幅提升资本开支预期推动AI建设,量子计算产业进入发展新阶段
- 1 2026年通信行业AI电源专题:AI能耗高速增长引发电源架构重要变革
- 2 2026年通信·行业专题报告:数据中心互联技术专题,AI变革推动OCS新技术快速发展
- 3 2026年通信行业专题报告:商业航天快速发展,火箭及卫星制造率先受益
- 4 2026年通信设备行业“液冷加速度”系列报告三:液冷0→1后,从头部厂商表现再看行业变化
- 5 2026年通信行业端侧AI崛起:场景化硬件重构人机交互,引爆产业链新机遇
- 6 2026年通信行业:光纤行业迎来景气周期
- 7 2026年通信行业投资策略:谷歌TPU v7与OCS光交换,架构革新与产业链机遇
- 8 2026年通信行业投资策略:商业航天建设期主线确立,AI算力提供景气强化
- 9 2026年光通信行业深度:驱动因素、发展趋势、产业链及相关公司深度梳理
- 10 2026年通信行业:云厂商大幅提升资本开支预期推动AI建设,量子计算产业进入发展新阶段
- 最新文档
- 最新精读
- 1 2026年中国医药行业:全球减重药物市场,千亿蓝海与创新迭代
- 2 2026年银行自营投资手册(三):流动性监管指标对银行投资行为的影响(上)
- 3 2026年香港房地产行业跟踪报告:如何看待本轮香港楼市复苏的本质?
- 4 2026年投资银行业与经纪业行业:复盘投融资平衡周期,如何看待本轮“慢牛”的持续性?
- 5 2026年电子设备、仪器和元件行业“智存新纪元”系列之一:CXL,互联筑池化,破局内存墙
- 6 2026年银行业上市银行Q1及全年业绩展望:业绩弹性释放,关注负债成本优化和中收潜力
- 7 2026年区域经济系列专题研究报告:“都”与“城”相融、疏解与协同并举——现代化首都都市圈空间协同规划详解
- 8 2026年历史6轮油价上行周期对当下交易的启示
- 9 2026年国防军工行业:商业航天革命先驱Starlink深度解析
- 10 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
