2024年电子行业英伟达产业链跟踪报告：Blackwell将于2025年加速成长，光铜板供应链有望深度受益

来源：光大证券
发布时间：2024/09/25
浏览次数：1502
举报

相关深度报告REPORTS

电子行业英伟达产业链跟踪报告：Blackwell将于2025年加速成长，光铜板供应链有望深度受益.pdf

电子行业英伟达产业链跟踪报告：Blackwell将于2025年加速成长，光铜板供应链有望深度受益。英伟达：FY25Q2持续高增长，B系列将成2025年出货主力。Non-GAAP口径下，英伟达FY25Q2收入300.40亿美元，同比增长122%，环比增长15%；FY25Q2数据中心业务收入262.72亿美元，同比增长154%，环比增长16%。英伟达预计FY2025Q3将实现收入325亿美元，毛利率75%。英伟达H200平台在2024Q2开始向客户发货。Hopper出货量预计在2024H2持续增长。Blackwell延迟影响有限，看好Blackwell在2025年的放量趋势。英伟达8月表示Blac...

1、英伟达：FY25Q2 持续高增长，B 系列机柜将成 2025 年出货主力

1.1 英伟达 FY25Q2 和 FY25Q3 持续高成长

Non-GAAP 口径下，英伟达 FY25Q2 收入 300.40 亿美元，同比增长 122%，环比增长 15%；毛利率 75.7%，同比增长 4.5Pts，环比下降 3.2pts；净利润 169.52 亿美元，同比增长 152%，环比增长 11%。

英伟达 FY25Q2 数据中心业务收入 262.72 亿美元，同比增长 154%，环比增长 16%。数据中心业务增长的关键来自于生成式 AI 模型的训练和推理；视频、图像和文本数据的预处理和后处理；合成数据生成、基于 AI 的推荐系统、SQL 和向量数据库处理。

英伟达 H200 平台在 2024Q2 开始向大型 CSP、消费级互联网客户和企业客户发货。Hopper 出货量预计在 2024H2 持续增长。Hopper 供应/可用性已经大幅改善。 Blackwell 系列芯片正在被广泛试用，生产爬坡计划在 2024Q4 开始，并持续到 2025 年；预计 Blackwell 将在 2024Q4 实现数十亿美元的收入。Blackwell 的需求远超过供应，英伟达预计这种供不应求的情况将持续到 2025 年。 FY25Q2 网络业务同比增长是由 InfiniBand 和用于 AI 的以太网推动的，其中包括 Spectrum-X 端到端以太网平台。 Non-GAAP口径下，英伟达预计FY2025Q3 将实现收入325亿美元，毛利率75%。

1.2 英伟达 Blackwell 和 GB200 NVL36/72 重磅发布

2024 年 3 月 19 日英伟达 GTC 大会上，黄仁勋在发布 Blackwell 产品。Blackwell 架构拥有 2080 亿个晶体管。两块晶片之间通过一条细线贴合，组成 B200 GPU （Largest Die Possible×2 = B200），也叫做 Blackwell GPU。这是两块晶片首次以这样的方式进行贴合并组成一块晶片。晶片之间进行带宽互联，数据传输速率达每秒 10TB。2080 亿个晶体管几乎同时访问与芯片连接的内存，因此 Blackwell 芯片不存在内存局限和缓存的问题。将两个 B200 GPU 与一个基于 ARM 的 Grace CPU 进行配对，再通过 900GB/s 的超低功耗 NVLink 连接在一起，可以组成 GB200 超级芯片。Blackwell 的顶部有 NVLink，底部有 PCI Express。将两个 GB200 超级芯片合并安装到一块主板上，可以组成一个 Blackwell 计算节点。Blackwell Compute Node 也叫 Compute Tray。把 18 个 Blackwell 计算节点（Compute Tray）组合在一起，可以形成新一代计算单元：GB200 NVL72（Blackwell Node × 18 + NVLink Switch X 9 = GB200 NVL72）。GB200 NVL72 中一共包含了 9 个 NVLink 交换节点（Switch Tray），每个交换节点中配置了 2 颗 NVLink Switch 芯片，向外提供 14.4TB/s 的聚合带宽。如果要训练一个 1.8 万亿参数量的 GPT 模型，需要 8000 张 Hopper GPU，消耗 15 兆瓦的电力，连续跑上 90 天。但如果使用 Blackwell GPU，只需要 2000 张，同样跑 90 天只要消耗四分之一的电力。除了训练之外，生成 Token 的成本也会随之降低。GB200 NVL72 训练和推理性能相比于等同数量的 H100 GPU 表现提升 4 倍和 30 倍。

Blackwell 架构的 GPU 产品投产，将成为英伟达 2024、2025 年的重要营收驱动。得益于客户对 AI/加速计算计划的持续支出，以及对其 Hopper H100 和新 H200 GPU 平台（Blackwell GB200/B200/B100）的强劲需求，Blackwell 架构将成为英伟达 2024、2025 年的重要营收驱动。 Blackwell Ultra 将于 2025 年发布，下一代平台名为 Rubin。英伟达以每年一次的更新节奏，构建覆盖整个数据中心规模的解决方案，将这些解决方案分解为各个部件，以每年一次的频率向全球客户推出。英伟达采用最先进的工艺技术、封测技术、内存技术和光学技术，推动产品性能的不断提升。英伟达的计算机平台能够向后兼容，且架构上与已有软件完美契合时，产品的上市速度将显著提升。因此 Blackwell 平台能够充分利用已构建的软件生态基础，实现较高的市场响应速度。Blackwell Ultra 将会确保所有产品都保持 100%的架构兼容性。

1.3 英伟达 GB200 机架拥有 4 种不同形式

GB200 机架提供 4 种不同的主要外形尺寸（分别是 GB200 NVL72、GB200 NVL36x2、GB200 NVL36x2（Ariel）、x86 B200 NVL72/NVL36x2），每种尺寸均可定制 1、GB200 NVL72 需要大约 120kW/机架。通用 CPU 机架支持高达 12kW/机架，而更高密度的 H100 风冷机架通常仅支持大约 40kW/机架。每机架超过 40kW 是 GB200 需要液体冷却的主要原因。GB200 NVL72 机架由 18 个 1U 计算托盘和 9 个 NVSwitch 托盘组成。每个计算托盘高 1U，包含 2 个 Bianca 板。每个 Bianca 板包含 1 个 Grace CPU 和 2 个 Blackwell GPU。NVSwitch 托盘有两个 28.8Gb/s NVSwitch5 ASIC。

2、GB200 NVL36 * 2 是两个并排互连在一起的机架。大多数 GB200 机架将使用此外形尺寸。每个机架包含 18 个 Grace CPU 和 36 个 Blackwell GPU。每个计算托盘的高度为 2U，包含 2 个 Bianca 板。每个 NVSwitch 托盘都有两个 28.8Gb/s NVSwitch5 ASIC 芯片。每个芯片有 14.4Gb/s 指向背板，14.4Gb/s 指向前板。每个 NVswitch 托盘有 18 个 1.6T 双端口 OSFP cages，水平连接到一对 NVL36 机架。 3、带有定制“Ariel”板（而不是标准 Bianca）的特定机架，主要由 Meta 使用。由于 Meta 的推荐系统训练和推理工作负载，它们需要更高的 CPU 核心和每 GPU 更多的内存比率，以便存储大量嵌入表并在 CPU 上执行预处理/后处理。该机架与标准 GB200 NVL72 类似，但 Bianca 板被替换为具有 1 个 Grace CPU 和 1 个 Blackwell GPU 的 Ariel 板。由于每个 GPU 的 Grace CPU 内容翻倍，因此与 NVL36x2 相比，此 SKU 的价格会更高。与 NVL36x2 类似，每个 NVSwitch 托盘有 18 个 1.6T 双端口 OSFP cages，水平连接到一对 NVL36 机架。 4、B200 NVL72 和 NVL36x2 将使用 x86 CPU 而不是 Nvidia 内部的 grace CPU。这种规格称为 Miranda。每个计算托盘的 CPU 到 GPU 的比例将保持不变，即每个计算托盘 2 个 CPU 和 4 个 GPU。

2、英伟达 Blackwell 芯片短期延迟小幅影响 2024 年出货节奏，不改 2025 年产业趋势

2.1 英伟达 B 系列芯片小幅延期，未来将推出 B102 和 B200A

根据 Semi Analysis，英伟达 Blackwell 系列芯片量产遇到问题，导致原定 2024Q3/Q4 和 2025H1 的生产目标延后。预计英伟达 Hopper 系列芯片将弥补 Blackwell 系列芯片的出货缺口。

GB200 是英伟达最先进的 Blackwell 芯片，基于 GB200 芯片的 NVL72 机柜的功率密度约 125kW/rack，但大部分数据中心部署的单机柜功率密度为 12-20kW/rack。由于功率密度和计算能力的复杂程度，量产爬坡的挑战性巨大，配电、过热、液冷等问题均需要解决。英伟达 Blackwell 是第一个使用台积电 CoWoS-L 封装工艺的芯片。

CoWoS-L 使用 RDL interposer（RDL 中介层）去桥接各种计算芯片和存储芯片。 CoWoS-L 是 CoWoS-S 的下一代产品。随着 AI 芯片需要满足更多逻辑单元、存储单元和 IO 接口的需求，CoWoS-S 的尺寸和性能面临更多的挑战。台积电已经将 CoWoS-S 的 Interposer 扩展到了 AMD MI300 芯片约 3.5 倍大小。随着 Interposer 尺寸变得更大，不仅价格更贵，而且生产这种 Interposer 将变得更难，因为 silicon Interposer 很脆且易碎。CoWoS-L 是一项更复杂的技术，代表着 CoWoS 封装技术的未来。英伟达和台积电有非常激进的 CoWoS-L 爬坡计划，计划未来单季度量产 100 万颗以上 CoWoS-L 芯片。

目前台积电没有足够的 CoWoS-L 产能。台积电过去几年建立了大量的 CoWoS-S 产能，其中英伟达占据最大份额。目前随着英伟达迅速将需求转向 CoWoS-L，台积电一方面为 CoWoS-L 建造了一个新的工厂 AP6，一方面在 AP3 工厂将 CoWoS-S 转向 CoWoS-L。转产 CoWoS-S 将导致 CoWoS-S 产能利用率不足，且 CoWoS-L 爬坡进度较慢。

由于系统设计复杂和 CoWoS-L 良率较低这两个问题，台积电无法向英伟达提供足够的 Blackwell 芯片。因此，英伟达几乎完全将其产能集中在 GB200NVL36x2 和 NVL72。B100 和 B200 的 HGX 形态基本被取消了。英伟达推出 B102（单 die）/B200A。为了满足需求，英伟达将推出一款基于 B102 的 Blackwell GPU，称为 B200A。这款 B102 芯片也将用于中国版 Blackwell，称为 B20。B102 是一个带有 4 层 HBM 的单 die 计算芯片。这款芯片可以封装在 CoWoS-S 上，而不是封装 CoWoS-L 上。英伟达其他 2.5D 封装供应商，如Amkor、ASE SPIL 和 Samsung 都可以提供相关的产品。B200A 将取消 C2C I/O，设计上更为简单。

B200A 将用于满足对中低端 AI 系统的需求，并将取代 HGX 8-GPU 外形尺寸的 B100 和 B200 芯片。B200A 将采用 700W 和 1000W 的 HGX 外形尺寸，HBM3E 达到 144GB，内存带宽高达 4TB/S。B200A 也将有一个 ultra 版本。B200A ultra 不会有内存升级，尽管芯片可能会重新设计以提升 FLOPS。B200A Ultra 还引入了全新的 MGX NVL36 外形。B200A Ultra 也将像最初的 B200A 一样采用 HGX 配置。 Blackwell Ultra，Blackwell 的中代增强产品，CoWoS-L 封装的 Blackwell Ultra 将被称为B210或B200 Ultra。Blackwell Ultra包含高达288GB的12层HBM3E 内存和性能增强 50%的 FLOPS 算力。对于超大规模市场的客户来说，GB200 NVL72/36x2 将继续是最具吸引力的，因为它在推理过程中对超过 2 万亿参数的模型具有最高的性能/TCO。如果超大规模客户无法获得 GB200 NVL72/36x2，他们可能仍然需要购买 MGX GB200A NVL36。此外，在功率密度较低或非液冷数据中心，MGX NVL36 看起来更有吸引力。HGX Blackwell 服务器仍将被超大规模云计算客户购买，因为它是用于出租给外部客户的最小计算单位，但购买量将比以前低得多。对于小型模型，HGX 的性能/TCO 最优，因为这些模型不需要大量的内存，NVL8 的内存可以满足这些小型模型的需求。

neocloud（新兴云市场）的大多数客户不会购买 GB200 NVL72/36x2，因为难以寻找拥有液冷或高能耗指标的托管服务提供商。此外，对于有限的 GB200NVL72/36x2 来说，大多数 neocloud 客户通常比超大规模客户（hyperscalers）优先级更靠后。对于最大的 neocloud 客户来说，如 Coreweave，有自建/改造数据中心的需求，将选择 GB200 NVL72/36x2。对于 neocloud 市场的其余客户来说，大多数人将选择 HGX Blackwell 服务器和 MGX NVL36，因为这些服务器只能使用风冷和较低能耗的机架进行部署。目前，大多数 neocloud 客户的部署都是使用功率密度为 20kW/机柜的 Hopper 服务器；未来，这些 neocloud 客户有可能部署 MGX GB200 NVL36，因为这只需要 40kW/ 风冷机柜。 MGX GB200A NVL36 SKU 是一款全风冷的 40kW/机架服务器，36 个 GPU 与 NVLink 完全互连。每个机架将有 9 个计算托盘和 9 个 NVSwitch 托盘。每个计算托盘是 2U，包含一个 Grace CPU 和四个 700W B200A Blackwell GPU，而GB200NVL72/36x2 有两个 Grace CPU 和四个 1200W BlackwellGPU。MGX NVL36 设计的 CPU 与 GPU 的比例仅为 1:4，而 GB200NVL72/36x2 的比例为 2:4。此外，每个 1U NVSwitch 托盘只有一个交换芯片，每个交换芯片的带宽为 28.8Tbit/s。

2.2 鸿海：GB200 延迟出货对 2025 年基本无影响

GB200 由于设计缺陷导致短期延迟出货，在英伟达和供应链相关公司的业绩方面，2024 年或有部分影响，2025 年基本无影响。2024 年 8 月 14 日鸿海法说会表示，由于 GB200 新产品规格和技术提升较大，设计难度较高，动态调整很常见，目前开发的 AI 服务器都按照进度进行，2024Q4 开始小批量出货 GB200 服务器，2025Q1 有望放量，后续产品周期有望持续加速。鸿海认为 GB200 由于设计缺陷导致延迟出货造成的影响已经基本消除。

3、光模块：AI 供应链最核心受益赛道

3.1 光模块产业趋势：AI 驱动 800G/1.6T/3.2T 数通光模块快速成长

AI 驱动全球光模块行业快速成长。光模块是 AI 投资中网络端的重要环节，其与训练端 GPU 出货量强相关，同时推理段流量需求爆发也有望带动需求增长。在算力投资持续背景下，AI 成为光模块数通市场的核心增长力。根据 Lightcounting 和 Coherent 预测，全球数通光模块市场 23 年-28 年的 CAGR 为 18%，其中，AI 用数通光模块市场 CAGR 为 47%。增长驱动力主要来自 800G、 1.6T、3.2T 光模块需求，据 Coherent 数据，到 2027 年，整个数通市场 800G 及以上速率的光模块市场规模占比将超过 50%。

更高的互联速率+更多的互联数增长奠定了光模块广阔的市场空间。AI 已明确加快了光模块技术迭代，并且显著缩短了光模块周期，之前从 100G 过渡到 400G 用了超过 3 年，为了实现更高的传输速率以匹配日渐提高的计算速度需求，从 800G 到 1.6T 的代际替换有望缩短至不到两年。根据 FiberMall 数据预测， 2021-2025 年交换机密度预计大约每 2 年翻 1 倍，相对应光模块速率也将同步匹配。Marvell 于在其投资者交流会提到，模型规模变大带来的多卡并行，越来越多的交换网络层数使得连接数的上升幅度比 GPU 的增幅更快。Scaling law 下，大模型规模越来越大带来交换网络层数提升，光模块配比提升。GPT-3 在 1K 个集群上训练，对应需要 2500 个光互连；GPT-4 在 25K 个集群上训练，对应需要 75000 个光互连。未来的 10 万个超大计算集群，需要 50 万个光互联（5 层架构，GPU 与光模块的配比为 1:5），随着 Scailing law 的演进，为了实现 AGI，未来甚至可能会出现 1:10 光模块配比的网络架构。总的来说，更多的 GPU 驱动更多的端口连接；同时，随着 GPU 算力愈来愈强，需要更多的带宽来保持它们处理数据，因此，更高算力的 GPU 需要更高速的端口。这两个因素导致了超大规模数据中心连接需求的指数级增长，这是一个庞大且迅速增长的市场。根据 Coherent 对于行业未来的产品路线图预测，50Tb/s 交换机时代，单通道 100G 的 800G 光模块于 2023 年开始大规模量产（已量产）；单通道 200G 的 800G 光模块于 2024 年批量出货；LPO 方案于 2024H2 批量出货。100Tb/s 交换机时代，单通道 200G 的 1.6T 光模块将于 2024 年年底量产，LPO 方案也于2024 年年底开始量产；单通道 200G 的 3.2T 光模块将于 2026 年年初量产，可应用于 100Tb/s 交换机，也可用于下一代 200 Tb/s 交换机。

AI 用光模块中，预计硅光光模块市场规模增速最快。 1、VCSEL 激光器用在多模光模块中，适用于短距离传输且成本收益比较高，由于 AI 训练集群中 GPU 间互联需求大幅提升，预计其会快速增长。Coherent 预计 AI 用 VCSEL 光模块市场规模将从 2023 年的 3 亿美金增长至 2028 年的 16 亿美金，占比从 6%提升至 14%。 2、EML 激光器应用在单模光模块中，适用于长距离互联，多用于上层交换机互联以实现大规模 AI 集群， Coherent 预计 AI 用 EML 光模块市场规模将从 2023 年的 6 亿美金增长至 2028 年的 20 亿美金，占比从 12%提升至 18%。硅光由于在硅基衬底上集成光子和电子器件，实现了光模块的高集成度、小型化和低功耗，预计 1.6T 及以上速率硅光光模块占比会越来越高，Coherent 预测 AI 用硅光光模块市场规模将从 2023 年的 2 亿美金增长至 2028 年的 34 亿美金，占比从 3%提升至 29%。

受到 AI 拉动，中国光模块出口额 2024 年以来高速增长。根据海关总署数据， 2024 年 8 月全国光模块出口金额为 37.46 亿元，同比+72.3%；1-8 月累计出口 290.89 亿元，同比+78%。国内光模块前两大龙头（海外市场）中际旭创和新易盛总部分别位于江苏省和四川省，所以观察这两个省份光模块的出口数据可以一定程度表征 AI 用光模块的景气度：2024 年 8 月江苏省光模块出口金额为 18.75 亿元，同比+80.9%；1-8 月累计出口 166.08 亿元，同比+115.2%。2024 年 8 月四川省光模块出口金额为 7.66 亿元，同比+237.4%；1-8 月累计出口 45.23 亿元，同比+160.7%。

3.2 英伟达推出 B 系列 GPU，提振高速率光模块需求

英伟达于 2024 年 3 月发布了新一代人工智能芯片 Blackwell GPU，新的 B200 GPU 拥有 2080 亿个晶体管，可提供高达 20petaflops 的 FP4 算力，而 GB200 将两个 GPU 和一个 Grace CPU 结合在一起，可为 LLM 推理工作负载提供 30 倍的性能，同时还可能大大提高效率，与 H100 相比，它的成本和能耗最多可降低 25 倍。英伟达声称，训练一个 1.8 万亿个参数的模型以前需要 8000 个 Hopper GPU 和 15 兆瓦的电力。如今，2000 个 Blackwell GPU 就能完成这项工作，耗电量仅为 4 兆瓦。在具有 1750 亿个参数的 GPT-3 LLM 基准测试中， GB200 的性能是 H100 的 7 倍，而英伟达称其训练速度是 H100 的 4 倍。

Blackwell 系列 GPU，提振高速率光模块需求。不同英伟达 GPU 产品以及不同互联方式下，光模块和 GPU 的比例关系如下表格。即使新一代 B200 和 GB200 产品在 ConnectX-7 网卡规格下，跟上一代光模块用量相同，但未来搭配 ConnectX-8 的 GB200 产品将大幅提升对于 1.6T 光模块的需求，且在 B 系列 GPU 的生命周期中，搭配 ConnectX-8 的 NVL72 将会是主力产品。此外，随着大模型的不断迭代，未来向通用型人工智能迈进，NVL576 这种大规模高速互联的组网方式需求也将不断攀升，从而拉动 1.6T 光模块需求（ GPU 与 1.6T 光模块的比例为 1:9）。

4、铜连接：GB200 NVL 引领创新，AI 服务器将驱动铜缆持续高景气

4.1 铜缆是短距离互联的最佳路径

直连铜缆（Direct Attach Cable，DAC），或称 Twinax 铜缆、高速线缆，是一种固定长度、两端有固定连接器的线缆组件。

DAC 铜缆包含有源（active）和无源（passive）两种，有源 DAC 铜缆内置了放大器和均衡器，可以提升信号质量，但相对成本较高。大多数情况下，当传输距离小于 5 米时，可以选择使用无源 DAC 铜缆，而当传输距离大于 5 米时，可以选择有源 DAC 铜缆。 DAC 铜缆上的连接器与光模块相比，接口类型相同，但缺少了昂贵的光学激光器和其他电子元件，因此可以大大节省成本和功耗，广泛应用于数据中心网络中的短距离连接。在 TOR 场景下，DAC 铜缆是进行机柜内短距离布线的最佳选择。在 EOR 场景下，如果传输距离小于 10 米，也可以选择使用 DAC 铜缆。

DAC 电缆可分为两种类型：无源铜电缆（PCC）和有源 DAC。有源 DAC 可以进一步分为有源铜线（ACC）和有源电缆（AEC）。无源和有源 DAC 电缆都可以通过铜线直接传输电信号。前者可以在没有信号调节的情况下进行传输，后者在收发器内部配备了电子设备以增强信号。 ACC 有源铜线作为一种有源铜线，利用 Redriver 芯片架构，并采用 CTLE 均衡来调整 Rx 端的增益。本质上，ACC 的作用是作为一根有源电缆放大模拟信号。 AEC 有源电缆代表了有源铜线电缆的一种更具创新性的方法，AEC 利用 Retimer 芯片架构放大和均衡 Tx 和 Rx 端子，而且重塑 Rx 端子处的信号。

4.2 英伟达 GB200 NVL 使用铜缆连接 Switch Tray 和 Compute Tray

GB200 的前端、后端和带外网络基本相同，但 NVLink 扩展到机箱外部则会产生差异，每一代超大规模定制都会有所不同。 HGX H100 中 8 个 GPU 和 4 个 NVSwitch4 ASIC 使用 PCB 走线连接在一起，它们位于同一 PCB（即 HGX 基板）。在 HGX Blackwell 上，NVSwitch ASIC 位于中间，以减少 PCB 走线的长度，同时 224G SerDes 进行了升级。

但是在 GB200 上，NVSwitches 与 GPU 位于不同的托盘上，因此需要使用光学或 ACC 在它们之间进行连接。 NVL72 中保留了与 HGX Hopper/Blackwell 相同的扁平 1 层 NVLink 拓扑，因此只需通过 NVSwitch 进行 1 跳（hop）即可与同一机架内的任何 GPU 通信。而在 NVL36x2 中，只需 1 跳即可到达同一机架中 36 个 GPU 的任何一个，但为了与旁边机架中的其他 36 个 GPU 通信，需要 2 个 NVSwitch 才能跨机架。直观地看，一个额外的 NVSwitch 连接会增加延迟，但对于训练模型来说这个延迟并不明显。一个额外的 NVSwitch 连接会对推理运算产生轻微影响。

4.3 铜连接用量有望大幅提升

Nvidia 表示，如果使用光模块，则需要为每个 NVL72 机架增加 20kW 的功耗。 Semianalysis 表示，如果需要使用 648 个 1.6T 双端口光模块，每个光模块的功耗约为 30W，则功耗为 19.4kW/机架，与 Nvidia 的说法基本相同。每个 1.6T 光模块的价格约为 850 美元，仅光模块成本一项就高达每机架 550,800 美元。如果按 Nvidia 75%的毛利率计算，则意味着最终客户需要为每机架 NVLink 收发器支付 2,203,200 美元。这是 DGX H100 NVL256 因光模块成本过高而从未发货的主要原因之一。此外，与铜缆甚至上一代光纤相比，1.6T NVLink 光模块等前沿光模块的可靠性要差得多。因此，有源铜缆 (ACC)铜缆更便宜、省电且可靠。每个 GPU 都有 900GB/s 的单向带宽。每个差分对 (DP) 能够在一个方向上传输 200Gb/s，因此每个 GPU 需要 72 个 DP 才能实现双向传输。由于每个 NVL72 机架有 72 个 GPU，这意味着有 5184 个差分对。每条 NVLink 电缆包含 1 个差分对，因此有 5184 条电缆。

每个 Blackwell GPU 都连接到 Amphenol Paladin HD 224G/s 连接器，每个连接器有 72 个差分对，连接器连接到背板 Paladin 连接器。使用 SkewClear EXD Gen 2 电缆连接到 NVSwitch 托盘 Paladin HD 连接器，则每个连接器有 144 个差分对。从 NVSwitch Paladin 连接器到 NVSwitch ASIC 芯片，需要 OverPass 跨接电缆，因为每个交换机托盘有 4 个 144 DP 连接器（576 DP）。PCB 走线会产生串扰，且 PCB 上的损耗比跨接电缆上的损耗更严重。

使用 NVL36x2，则每个系统将需要额外的 162 条 1.6T 双端口水平 ACC 电缆，这些电缆对于连接机架 A 和机架 B 之间的 NVSwitch 托盘来说非常昂贵。此外， OSFP 还需要额外的 324 条 DensiLink 跨接电缆。仅这些 DensiLink 跨接电缆就需要每台 NVL36x2 增加 10,000 多美元的成本。此外，NVL36*2 需要两倍的 NVSwitch5 ASIC 来实现机架 A 和机架 B 之间的连接，这将使NVLink铜缆总成本比NVL72增加一倍以上。尽管NVL36x2的NVLink 背板比 NVL72 贵两倍多，但因为功率和冷却限制，大多数购买者仍会选择 NVL36x2 设计。由于 NVL36x2 的普及，电缆供应商销量有望大幅增加。

4.4 铜连接产业链持续高景气：精达股份子公司恒丰特导镀银高速铜线业务快速发展

精达股份是一家从事铜基电磁线、铝基电磁线、特种导体研发、制造、销售和服务于一体的国家级高新技术企业，产品广泛应用于新能源汽车、光伏逆变器、人工智能、军工、航空航天、家电、特种电机、5G 通讯及电子产品等领域，畅销全国并远销欧洲、南美、东南亚、中东、日本等全球市场。公司在长三角、珠三角和环渤海地区拥有三大生产基地，直接或间接控股公司 26 家，现已成为全球电磁线行业领军企业。精达股份发布 2024 年半年报。公司 2024 年上半年实现营收 103.74 亿元，同比增长 19.89%，主要是产销量增长所致；实现归母净利润 2.89 亿元，同比增长 38.62%；实现归母扣非净利润 2.72 亿元，同比增长 37.37%。2024H1 公司产品生产和销售总量分别为 168,776 吨和 167,660 吨，同比增长 12.48%、 11.51%。其中特种电磁线产品产量 134,705 吨、销量 133,379 吨，同比增长 15.10%、14.12%。

精达股份控股子公司恒丰特导产品主要应用于 AI 服务器、数据中心、军工、航空航天、高速通信、消费电子及医疗器械等领域。恒丰特导的终端用户有国内外知名数据中心、AI 消费电子产品、各大研究院所等。恒丰特导与高校合作研发的“高性能铜及贵金属丝线材关键制备加工技术与应用”项目荣获 2024 年国家科学技术进步奖二等奖，该项目经过多年协同攻关，突破了高性能铜基丝线材制备加工核心技术瓶颈，开发出具有自主知识产权的成套制备加工技术，成功应用于铜及贵金属丝线材等系列产品，项目推动了我国铜及贵金属丝线材制造水平迈向“超微细”先进水平。特种导体是在普通导体基础上发展起来的一系列具有独特性能和特殊结构的产品。相对于量大面广的中低端普通导体产品，特种导体采用新材料、新结构、新工艺或新设计，具有技术含量高、适用条件严格、附加值高等特点，最初主要应用于军事工业领域。随着现代社会向电气化、自动化、信息化和网络化方向发展，算力服务器、数据中心、航空航天、通信、医疗、消费电子等领域对应用材料提出了更高的性能要求，特种导体也由早期的军工用途，迅速拓展到上述领域。特种导体市场逐渐向更细的专业化方向发展，相应的研究和开发也随着下游产品的销售的快速增长和更新迭代得到了迅猛发展。特种导体中的代表产品近年来保持市场规模增长，根据 QYResearch 数据，全球镀银导体市场规模由 2017 年的 19.85 亿元增长至 2022 年的 34.69 亿元，增长率达到 74.80%。

特种导体下游应用领域广泛，随着下游产业的不断升级迭代，终端应用产品向集成化、功能化、微型化等方向发展，特种导体应用市场发展提速，有望带动公司产品需求的进一步增长。在数据通信领域，特种导体主要用于 5G 基站和数据中心内部交换机、服务器等网络设备之间的高速互联，实现高速数据传输。随着人工智能（AI）、云计算、大数据等技术的快速发展，数据中心、服务器和高性能计算设备对高速数据传输的需求急剧增加，铜高速连接器由于其在短距离信号传输中的绝对优势，市场规模有望显著提升。LightCounting 数据显示，2023 年至 2027 年高速铜缆市场以年复合增长率 25%的速度持续扩张。当前国内高速线缆市场规模已经超过百亿元，预计未来高速铜缆增量市场空间将约千亿元。恒丰特导 2024H1 实现营收 5.49 亿元，同比增长 42.32%，主要原因是镀银导体销量增加、主要原材料价格上涨双重叠加；其中镀银导体业务实现营收 2.72 亿元，同比增长 63.57%，主要是因为高速镀银特种导体销量有较大幅度增加，叠加主要原材料价格上涨，联动销售价格上升所致。公司 24H1 实现归母净利润 0.34 亿元，同比增长 23.71%。恒丰特导生产的镀银高速铜线产品在提高导电性、耐腐蚀性和抗氧化性等方面起到重要作用，主要外资客户有安费诺、Molex、百通、泰科等，国内客户有乐庭、立讯精密、新亚电子、神宇通信、兆龙互联等。公司镀银导体业务营收大幅度增长充分论证了下游铜缆市场的高景气。随着算力需求的不断增长，未来有望快速发展。

5、PCB：英伟达持续引领 AI 服务器 PCB 创新

5.1 子行业 HDI、高多层板和封装基板将保持较快增速

PCB 是电子信息技术产业的核心基础组件，在全球电子元件细分产业中产值占比最大。根据 Prismark 报告，受复杂多变的国际环境和美元升值带来的汇率变化等问题的影响，2023 年全球 PCB 市场产值同比下降 15%，为 695 亿美元。在低碳化、智能化等因素的驱动下，数字经济、人工智能、云计算及数据中心、智能汽车、绿色能源、AR/VR、卫星通讯等 PCB 下游应用领域将蓬勃发展，相关领域的市场需求扩大将进一步带动 PCB 需求的持续增长。Prismark 的最新预测数据显示，2028 年全球 PCB 市场规模将超过 900 亿美元，2023-2028 年年均复合增长率为 5.4%。

2024 年以来，全球 PCB 行业呈现结构分化的弱复苏态势。根据 Prismark 报告， 2024 年一季度 PCB 行业产值为 167 亿美元，环比下降 7.1%、同比下降 0.1%，预期 2024 年产值为 730.26 亿美元、同比增长约 5%。受益于人工智能、高速网络和智能汽车产业的发展，相关产品领域延续较高景气度，尤其 18 层及以上 PCB 板、高阶 HDI 板等细分市场迎来强劲的增长，传统多层 PCB、封装基板的复苏进展略慢，整个 PCB 产业朝着高性能、高层数、高精密度、高可靠性升级的趋势愈加明确。根据 Prismark 报告，预期 2028 年全球 PCB 行业市场规模将达到 904.13 亿美元，2023-2028 年复合增长率为 5.4%。其中，高多层高速板（18 层及以上）、高阶 HDI 板和封装基板领域有望实现优于行业的增长速度，预期 2028 年市场规模分别为 27.80、148.26、190.65 亿美元，2023-2028 年复合增长率分别为 10.0%、7.1%、8.8%。

5.2 AI 是 HDI、高多层板和封装基板等子行业重要的成长驱动力

PCB 作为电子产业的一种核心基础组件，广泛应用于 AI 服务器及周边产品，如 GPU 载板、Switch 载板、OAM（加速模块）、UBB（GPU 母板）以及电源、硬盘等配件。相较于传统服务器，AI 服务器所需的 PCB 具有高密度及多层设计、高性能材料、精细制造工艺、优质的信号传输及散热等特性，对 PCB 供应商的生产工艺以及供应链提出了更高的要求。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）