我们认为随着大型算力集群的建设逐步推进,网络架构 中的连接或进一步丰富,博通有望凭借产品矩阵完整、技术迭代迅速,开放生态三大优势 受益于网络架构的变革。
1.完整产品线,成本及性能优势
博通具备完整的产品线,能够覆盖数据中心网络的多个关键环节。在数据中心网络领域, 博通具有丰富完整的产品线,主要相关产品包括:1)以太网连接、交换和 PHY:具体包 括以太网交换和路由商用芯片、网络适配器、控制器、PHY(端口物理层)和 PHY 收发器, 包括 Jericho AI、Tomahawk 等系列产品;2)PCIe 交换芯片和重定时器:包括 PCIe 交换 机产品及完整的端到端 PCIe 解决方案,为数据中心、服务器和网络设备提供高性能连接; 3)光学产品:可插拔光收发器模块等各类光学器件,专为有线网络应用而设计的高密度、 高速光互连的广泛产品组合,以及专用激光器、探测器、发射器、接收器和调制器,可用 作封装选项或工业应用中的组件,其核心技术包括 VCSEL(垂直腔面发射激光器)、EML (电吸收调制激光器)、CPO(共封装光学器件)等。从产品覆盖面看,博通的产品覆盖了 数据中心网络架构的交换、互连多个环节,通过广泛的产品组合,博通实现对数据中心网 络架构的全方位优化。
高性能计算领域 IB 及以太网方案重要性上升。在数据中心中的网络架构有多种构建方式, 当前高性能数据中心中的网络架构多基于 InfiniBand (IB)网络通信标准构建。IB 标准起源于 1999 年,2019 年 Nvidia 收购了 InfiniBand 独立供应商 Mellanox,积极推进基于 IB 的网络 架构,InfiniBand 在前 500 名计算系统榜单中的占比不断上升,截止 2024 年 6 月,前 500 名计算系统中基于 IB 构建互联的厂商数占比从 2022 年 6 月的 39%上升至 48%,按算力计 算,占比则从 2022 年 6 月末的 32%上升至 39%。2023 年 4-6 月,博通推出 Jericho3-AI 以太网络芯片、英伟达发布 Spectrum-X 网络平台、思科推出交换机芯片 G200,各大厂商 陆续推出基于以太网方案的适用于 AI 的交换芯片,以太网方案应用有所增加,从承载算力 的角度看,占比从 2022 年 6 月底的 45%上升至 2024 年 6 月底的 49%,同样是高性能计 算领域重要的选择。
公司积极推进以太网应用,交换芯片核心产品具备性能优势。博通积极推进基于以太网的 交换产品,核心产品包括 Jericho AI、Tomahawk 交换芯片。2023 年 3-4 月公司陆续发布 最新一代以太网交换产品,包括 2023 年 3 月发布的 Tomahawk 5、2023 年 4 月发布的 Jericho3-AI,产品展现出较强的性能、灵活性等优势。我们认为凭借在大规模集群中的性 能优势,Jericho3-AI、Tomahawk5 系列产品有望充分受益于生成式 AI 的发展趋势。 Jericho3-AI 展现出相较于 IB 的性能优势。2023 年 4 月公司推出 Jericho3-AI 通过诸如长 距离 SerDes、分布式缓冲和高级遥测等属性实现性能的提升,其网络接口具有 144 个 SerDes 通道,在 106-Gb/s PAM4 模式运行时,可支持最高 14.4T 总带宽和最多 72 个网络 端口(运行在 200G 带宽),可处理 800G 的端口速度,最高吞吐量为 28.8Tb/s,提供每秒 26 PB 的以太网带宽,在单个集群中可连接 32,000 个 GPU。据博通高级副总裁兼核心交 换事业部总经理拉姆·瓦莱加 (Ram Valega) 在开放计算项目(OCP)活动中的发言 (2023.4),在一组网络基准测试中,Jericho3-Al 运行 NCCL 任务的表现比 InfiniBand 快 约 10%。
Tomahawk5 有助于降低成本、复杂性、功耗。2023 年 3 月公司宣布 Tomahawk 5 系列以 太网交换机/路由器芯片现已批量出货。该芯片支持 64 个 800GbE、128 个 400GbE 或 256 个 200GbE 端口,最多具有 64 个集成 Peregrine SerDes 内核,每个内核都配有八个集成 106-Gb/s PAM4 SerDes 收发器和相关 PCS,可原生支持多种物理连接选项,从而实现广 泛的介质、速度和覆盖范围。据公司官网,等量组群规模比较下,使用 Tomahawk 5 方案 能够实现单个设备更高的性能,从而实现交换机数量及层数的减少,从而降低成本、复杂 性和功耗。
2.AI 时代迭代进一步加速,技术优势或进一步扩大
基础技术扎实,为产品迭代打下良好基础。公司具备扎实的基础技术,吸收了 AT&T/贝尔 实验室、朗讯和惠普/安捷伦的丰富技术遗产,为产品迭代打下良好基础。随着 AI 对于大规 模算力集群的需求逐步显现,博通掌握的 DSP、SerDES 等核心技术有望在数据中心网络 架构中发挥重要作用。其中 DSP(Digital Signal Processing)是一种专用的微处理器芯片, 针对数字信号处理的运行需求进行了优化,在 AI 场景下与 AI 加速器配合使用,能够以低功 耗、低成本实现对数字信号的处理;SerDES 技术则用于对高速芯片间通信中使用的数字数 据进行序列化和反序列化,支持 PCIe、MIPI、以太网、USB 等多种数据速率和标准,主要 作用是尽量减少 I/O 互连的数量。博通所掌握的核心技术有助于降低构建大型算力集群的网 络架构成本,为产品迭代打下基础。

交换芯片产品迭代速度有望加快,技术优势或进一步扩大。从博通的交换芯片产品看,主 要产品线包括三大系列:Tomahawk(战斧)系列具有高带宽的特征,适用于超大规模数据 中心;Trident 系列具有多功能特点,带宽相较 Tomahawk 稍低,多用于企业和云;Jericho 系列带宽较低,但扩展性强,有高缓存。产品主要的进步方向主要包括集成更多的、具备 更高传输速度的 SerDes 核心实例、支持带宽更大的核心端口,通过产品的不断迭代,实现 功耗和成本的节省。从产品迭代的节奏看,以往每隔 2 年产品能够实现带宽的翻倍,当前 交换产品支持的带宽已达到 51.2T,我们认为随着 AI 的需求不断显现,头部厂商产品迭代 速度或进一步加快,技术优势或进一步扩大。
光学互连产品业界领先,率先在生成式 AI 场景落地。在光学领域,公司凭借此前积累的技 术遗产打造了有竞争力的光学产品,并积极推进光学技术在生成式 AI 网络中的应用。 VCSEL(垂直腔面发射激光)相比于 LED 和 EEL 技术,在精确度、小型化、低功耗、可 靠性等角度具备优势;EML(电吸收调制激光器)主要用于 100G/200G/400G/800G 收发 器,相比于 DML(直接调制激光器)技术,通过在半导体材料上施加电压来调制激光的振 幅和相位,从而实现高速光调制,具有高速、高效率、低噪声等优点;CPO(共封装光学) 将光学器件和芯片异质集成在单个封装基板上,实现功耗的节省。据公司官网,继成功将 100G/通道 VCSEL 和 EML 芯片部署到第一代生成 AI 网络中之后,2024 年 3 月,博通推 出 200G VCSEL 和 EML 产品。在 CPO(共封装光学)方面,公司于 2024 年 3 月推出业 界首个适用于可扩展 AI 系统的 51.2 Tbps 共封装光学以太网交换机平台 Bailly。我们认为 公司的光学产品在 AI 数据中心互连中具备丰富的应用场景,有望持续受益于 AI 算力集群规 模扩大带来的互连需求增长。
发布重定时器芯片,PCIe6.0 端到端方案推出可期。PCIe 是用于连接 CPU、AI 加速器、 NIC 和存储设备的协议。2022 年,PCI Express(PCIe)标准组织 PCI-SIG 宣布正式发布 PCIe 6.0 规范,与 PCIe5.0 相比,PCIe6.0 将数据速率从 32GT/s 翻倍至 64GT/s,从 NRZ 编码 转换到 PAM4 编码,可以在单个通道、同样时间内封包更多数据,从传输的可变大小 TLP 到固定大小 FLIT,从而提高带宽效率,降低延时。据公司官网,2024 年 3 月,博通推出全 球首款 5nm PCIe Gen 5.0/CXL2.0 和 PCIe Gen 6.0/CXL3.1 重定时器。博通重定时器与其 PEX 系列交换机相结合,构成了业界首个端到端 PCIe 产品组合。据公司官网,PCIe Gen 6.0/CXL3.1 交换机将于今年(2024 年)晚些时候提供样品。我们认为公司积极把握数据中 心处理器连接增长机遇,PCIe 产品迭代或不断加速。
3.拥抱开放生态优化 AI 网络,生态壁垒逐步巩固
博通强调开放生态,打造异构系统。对于 AI 大型集群的构建,存在两种可能路径。路径一 是通过提升产品集成度,实现整体处理效率的提升,路径二是在不同环节中使用不同厂商 的产品,在 AI 集群中呈现异构系统的方式。博通强调对于开放生态的支持,在产品中贯彻 了由开放标准驱动的理念,基于以太网、PCIe 等开放标准设计产品,博通方案支持多种 NIC、加速器,便于云厂商、OEM 厂商构建异构的解决方案,有望在 AI 为代表的高性能计 算场景中受益于开放生态的建立。 联合巨头创建 UEC,率先实现 UEC 目标落地。2023 年 7 月,博通作为创始成员之一,创 立了超级以太网联盟(UEC),UEC 从物理层、链路层、传输层到软件层多个层次实现对 以太网的优化改造,通过启用针对 AI 流量优化的流量多路径/喷洒和拥塞通知来提高网络效 率,满足 AI 对于网络架构的需求。博通在产品中率先推动 UEC 目标落地,在 Jericho3-AI 结构中支持流量多路径/喷洒和端到端拥塞控制,Tomahawk 5 凭借其认知路由功能提供多 路径、负载平衡和改进的拥塞管理。博通作为技术的重要贡献者,有望持续引领以太网生 态在 AI 网络架构中的发展。

简化以太网开发及管理,高性能计算中的以太网生态不断壮大。UEC 采用系统化方法,采 用模块化、兼容、可互操作的层,并进行紧密集成,通过启用免配置的端到端拥塞控制来 简化网络管理,通过为 AI 和 HPC 提供精简的 API 来简化软件开发,便于技术能力较弱的 成员同样能够基于以太网生态打造产品。当前多供应商生态系统逐步建立,包括可互操作 的以太网交换机、NIC、电缆、收发器、光学器件、管理工具和软件,为 AI 网络架构的实 现打下了良好的基础。截止 2024 年 3 月,据 UEC 官网,参与成员已达 55 家,以太网生 态有望进一步壮大。
具备兼容性优势,PCIe 生态发展给公司带来机遇。相较于主要用于系统之间互连的以太网 技术,PCIe 主要用于芯片与芯片之间的连接,包括连接 CPU 与各类高速外围设备,Nvidia 通过 NV Link 实现了每通道传输速率的提升,在高端 GPU 通信场景中展现出了较强的能力; 而在其他的通信场景中,如 CPU 与 GPU、SSD、网卡、显卡等通信中,PCIe 凭借相对简 单的设计,点对点与设备通信,无需复杂的路由和交换机制,通用接口能够兼容多种设备 等优势,仍有望发挥重要作用。在小型模型训练、AI 推理等部分对于 GPU 间高速互连依赖 度较低的应用场景中,PCIe 以较低的能耗和较强的兼容性,同样展现出良好的使用价值。 博通关注生态开放性,在 PCIe 产品领域积极布局,拥有 ExpressFabric 交换机和重定时器 解决方案、PCI Express 交换芯片、PCIe 软件开发套件。我们认为未来 AI 应用中 PCIe 或 仍在网络架构中扮演重要角色,博通有望受益于 PCIe 领域的完整产品布局。