2025年北美算力确定性高，国产AI芯片迎来高斜率增长期，应用商业化加速

来源：中信建投证券
发布时间：2025/11/12
浏览次数：312
举报

相关深度报告REPORTS

北美算力确定性高，国产AI芯片迎来高斜率增长期，应用商业化加速.pdf

北美算力确定性高，国产AI芯片迎来高斜率增长期，应用商业化加速。1)算力端围绕龙头确定性、新技术升级方向、本土化产业集群加速以及订单外溢寻找投资机会，重点关注散热、PCB、电源及供电方向。2)中期维度看，订单向国产芯片倾斜是必然趋势。考虑到国产芯片逐渐进入量产交付阶段，预期市场集中度将看到显著提升，重点关注在云厂商中份额提升较为明显的芯片厂。3)以OpenAI为代表的厂商今年都加快了应用商业化，收入快速增长，寻找AI对各行业赋能和改造的投资机会。展望2026年AI投资，我们认为有两大类投资机会：1）算力端围绕龙头确定性、新技术升级方向、本土化产业集群加速以及订单外溢寻找投资机会；2）以Open...

一、算力需求变化及更新

1.1 算力投资要点

算力领域我们认为有以下投资机会： 1）龙头公司增长确定性：英伟达需要整个产业链研发能力快速迭代、快速响应。若能力不够很难进入英伟达产业链，或者份额显著下降，PCB、光模块等龙头公司与下游芯片公司跟踪紧密、地位稳固，其中 P CB 价值量未来将受益于正交背板使用、cowop 工艺的提升； 2）新技术升级方向，英伟达阶段性着重解决问题的方向，是获取超额利润的子方向。2025 年开始，系统方案的供电、散热问题成为整个系统的瓶颈点。北美缺电越来越明显，电力系统需要更加稳定以及更加高效的输送方式，关注 HVDC 和更高效的 SST 固态变压器等技术。同时随着芯片性能提升，散热方面遇到越来越多的瓶颈，关注液冷板、CDU、UQD 等领域大陆企业份额提升的投资机会，其次如何稳定提高芯片计算频率，对于 AI 芯片来说是一个提升性能的关键办法，针对下一代芯片封装方案演进是未来重要投资方向，关注微通道盖板、金刚石衬底或者热界面材料； 3）产业链加速本土化集群。为应对快速的研发迭代，产业集群优势逐步显现，如 PCB 产业链国内下游高份额之后，上游的覆铜板，覆铜板上游的树脂、玻纤布、铜箔等等都开始了国内企业加速验证，光模块亦是如此； 4）订单外溢。围绕份额变化投资，随着龙头公司订单外溢，整个产业链都呈现高景气度，部分公司份额提升。

1.2 推理成本持续下行带动云计算产业高景气

1.2.1 云计算是 AI 产业发展的核心底座

云计算是 AI产业发展的核心底座。云计算本质上是算力的共享化与弹性化，从过往的分散式单点服务器到当前的集群式数据中心，其核心是实现了算力发展的规模效应。伴随云计算产业规模逐步扩大，规模效应促使算力获取成本持续降低，并促使算力应用加速渗透（如 SaaS 和 AI），而应用规模的快速扩大与经常性收入的日益增长，将促使了算力产业更进一步发展，并带来算力成本进一步降低，以形成正向催化循环，直至应用渗透率提升至一定规模，成本下降刺激效应极大减弱为止。

云计算 IaaS 更偏重资产运营模式，SaaS 则是典型轻资产赛道，MaaS 收费模式兼具 IaaS 与 SaaS 特性，但与 IaaS 厂绑定更加紧密。IaaS 作为算力资源基座，需要较大资金成本用于服务器、交换机等采购，以及数据中心租赁与建设，再通过算力资源池的租赁获取持续性收入，核心指标关注单项目 IRR 与整体 EBITDA 利润率， SaaS 则更多是以标准化软件的形式提供订阅服务，ARR 与留存率等是核心关注指标。从收费模式上看 Maa S 兼具 IaaS 与 SaaS 业务特性，既可以根据 Token 消耗收费，也可以采用会员订阅制，但整体看以 Token 消耗量收费为主，并且由于生态建设原因，目前大部分 MaaS 市场由 IaaS 大厂占据。

下游客户群体转变，云厂市占率重新向互联网大厂集中。国内云计算市场的高速增长起源于 2010 年，主要的云服务供应商则在 2009-2013 年左右出现（阿里云 2009 年，百度云 2012 年，腾讯云 2013 年），其后 2015 年起伴随信息化基础设施建设逐步完备，云原生架构开始对传统软件架构进行替换，公有云市场随之快速增长。 2021 年以后，一方面互联网整体业务进入收缩周期，另一方面政务云（如一网通等）则进入加速建设阶段，此消彼长之下，运营商市场份额进入上行通道。24Q2 开始，AI 驱动下阿里云营收增速由负转正，以火山、阿里云为代表的大厂开始重新进入资本开支高增阶段。

1.2.2 推理成本快速下降，Token 消耗增长拉动云端需求

自从 23 年 Chatgpt 出现以来，基于 AI 业务 token 消耗的快速提升，海外大厂开启 CAPEX 高额投入周期，持续在模型训练和推理端加大算力投入，模型性能得到快速迭代。与此同时，伴随 24 年 12 月以来 DeepSeek V3 和 R1 的逐渐发布，其首次实现了国产模型在推理任务上与 OpenAI-o1 的基本相当，并引发了访问流量的快速增长（Web 端，2024 年 10 月至 2024 年 12 月 DeepSeek 访问量分别为 245/422/1101 万，其中 11 月和 12 月分别同比增长 72.24%/160.90%）。伴随 Deepseek 带来的降本范式（FP8 混合精度训练框架与大规模 EP 并行等）持续演化，模型输入/输出成本得到快速下降，AI 应用大范围推广成为可能。云计算产业作为模型训练/推理需求快速扩大下的直接受益方，进入了持续高景气周期。

24 年以来，推理成本优化成为技术突破核心重点。2024 年是应用推理主导之年，一方面基模能力方面，原生多模态与推理模型等持续得到突破，另一方面，工程学降本能力得到极大提升，模型推理成本实现十倍以上降低。总体看，模型架构层面，多头潜在注意力机制与稀疏结构等陆续被应用于主流模型当中，通过降低模型实际参数量的方式实现推理成本缩减；芯片运算层面，通过并行策略优化（张量并行/数据并行/专家并行）与异步操作、算子融合等方式，尽量减少芯片的通信/读写时长占比，提升计算效率；模型规模方面，通过低精度量化、蒸馏、剪枝等方式在不影响模型性能的背景下以跟小的模型实现同等效果。

当推理成本突破临界点后，AI+传统应用成为 Token 消耗快速扩大的核心根源。以 Google AI Overview 为例，自从 2024 年 5 月谷歌推出 AI Overview 之后，通过语义理解带来的精准情景识别，谷歌广告业务收入保持持续上行态势，2025Q1 依旧有 10%营收增速。当前全球每月有 15 亿用户在消费 AI Overviews 生成的内容，并直接驱动美国和印度地区的搜索量增长超过 10%。在此基础上，2025 年谷歌大会上，AI Mode 作为 Agent 模块，被搭载在浏览器中正式推出，其本身除了增强搜索外，同时也具备交互能力，可以根据用户要求直接完成对应功能（如商旅购票等）。总体而言，伴随推理成本的快速下滑，AI 开始与传统应用入口进入到深度融合阶段，AI 功能使用量快速上行，并直接带来 Token 消耗的快速增长。

后续看，长文本+低时延依旧是推理侧的优化主流，并直接决定新应用场景开辟进度。一方面，伴随推理能力持续增强，Agent 成为产业必然趋势，而 Agent 本身是一个拆分任务与多轮执行的过程，会先将任务拆分成若干子步骤，然后依次生成并执行每个步骤，最后再对执行结果进行校验。每一步都要调用一次 LLM 来生成文本，再调用一次 LLM 来检查可行性，这样下来仅一个小任务就可能需要数次到十余次的推理调用。多次调用导致的必然结果就是 token 输入/输出累积量的快速扩大，从而对模型输入长度上限提出极高要求。后续长文本的优化（本质上是计算力消耗线性化的过程）将带来推理成本的进一步下降，同时也将对视频生成/理解功能应用场景的开辟起到极大帮助；另一方面，通过并行等方式进一步降低时延（提升吞吐率）依旧是核心重点， 2024 年 12 发布的 DeepSeek-V3，其大 EP 集群推理方案可以大幅降低推理时延，推理 TPOT 可以达到 10ms 级别，相比 2024 年 LLM 推理普遍要求的 100ms 标准提升了 10 倍。目前，主流推理框架开销已经可以做到个位数 ms 级别，后续主要优化点在提升 HBM 带宽的利用率，更大规模的算子融合或许是未来的发展方向。

1.2.3 通过现象看本质，云业务经营业绩本身是 CAPEX 的前瞻指标

北美四大云厂商一季度资本开支总计 773 亿美元，同比增长 62%，二季度资本开支总计 958 亿美元，同比增长 64%。亚马逊 2025Q2capex为 322 亿美元，同比增长 83%，公司表示二季度资本开支可以代表下半年单季度资本开支水平；微软 2025Q2（2025 财年第四财季）capex 为 242 亿美元，同比增长 27%，预计下季度（2026 财年第一财季）资本开支超过 300 亿美元（对应同比增长超过 50%）；谷歌 2025Q2capex 为 224 亿美元，同比增长 70%，并将全年资本开支由 750 亿美元上调至 850 亿美元，还表示 2026 年的投资将会继续增长； Meta2025Q2capex 为 170 亿美元，同比增长 101%，并将全年资本开支指引由 640 亿-720 亿美元上调至 660 亿美元-720 亿美元，表示 2026 年还会显著加大 AI 投资。

站在当前时点，云厂云业务营收增速与营业利润率（或 EBITA 利润率）是 CAPEX 投入的前瞻指引。2023 年以来，伴随着 Transform 架构下 Scaling law 的持续生效，各家大厂均对模型训练做出大量投入。考虑到此时海外厂商并不以投入产出比来做出 CAPEX 投入的衡量，且模型能力边界本身尚不清晰，因此 25 年以前，更多以 CAPEX 本身作为实际算力需求的前瞻指引。但 25 年以来伴随 Pre-train 层面能力边界逐步逼近上限，模型训练需求相对增速放缓，推理开始成为核心需求来源，CAPEX 投入产出比逐步进入可测算阶段。在此基础上，云业务增速与营业利润率趋势成为算力需求的直观体现，也是后续 CAPEX 投入力度的核心决定因素。

以阿里云为例，24Q2 是阿里云算力投入决策的核心拐点。2022 年以来，由于互联网大厂业务的快速收缩，阿里云营收增速快速下滑，同时伴随着云资源池利用率的降低，营业利润率随之下降。23 年以来，通过提升公有云业务占比以提升利润率与发展 AI 以实现营收提速成为阿里云的核心战略。伴随 24Q2 阿里云营收增速首次由负转正（AI 业务贡献较大增量），GPU 实例业务的需求和盈利性的首次得到论证，因此从 24Q3 开始，阿里云 CAPEX 投入力度快速加大，并在 24Q4 的业绩交流会上宣布三年 3800 亿资本开支计划。

当前国内云厂仍处于资本开支投入第一阶段，短期投入力度具备保障。参考海外厂商，云业务的发展往往有三个阶段，而目前我国云计算业务还在第一阶段。以微软为例，23Q1 开始其率先进行大额 CAPEX 投入，以配合 OpenAI 模型的快速发展，受益于更高利润率的 AI 业务快速发展，23Q1-23Q3 公司 Azure 营业利润率进入快速上行阶段；随后，从 23Q4 开始高额资本开支开始逐渐对折旧端产生压力，相对应的微软也做了员工数量削减，希望通过费用的控制来维持营业利润率的持续上行；后续，伴随折旧压力更加放大，资本开支进入平稳周期。

目前阿里云的营收分为对内关联交易和对外商务，对内 AI 部分主要支持夸克，钉钉，高德等调用通义/DeepSeek 模型，对外创收中的 AI 业务主要包含 GPU 租赁、MaaS 服务、模型服务（百炼与 PAI 平台）三类。由于近年来模型侧价值量逐渐被云端内化（MaaS 的价值量被带入到了 IaaS 中），导致 GPU租赁成为了公有云业务中毛利率更高的部分，大幅资本开支本质是为了让高毛利率 GPU 租赁业务占比快速扩大，以此拉动 AI 业务规模快速增长。在此思路下，从 24Q2 开始，AI 业务成为支撑公有云增长核心动力，24Q2 一半以上营收增速来自 AI 贡献，且在后续持续保持 100%以上同比增长。

相比传统 CPU实例，中期看 GPU实例将具备更高投入产出效率。一方面，传统公有云商业模式下，云厂主要提供计算、网络、存储等同质化服务，难以在客户体验上产生本质性不同，更多是依托规模效应。而 GP U 租赁时代，客户需求主要聚焦于模型训练与推理，智算平台的运维能力和自动化、容错率是竞争优势的核心区分， “有效训练时长”是各家智算业务中的一项关键性能指标，如阿里云今年四月就强调，其“万卡级超大规模训练中，一个月内灵骏 GPU 集群有效训练时长占比能超过 93%”，相对而言，大厂云平台具有更强稳定性；另一方面，在提供 GPU 实例租赁的服务同时，大厂同时也会提供模型训练/推理加速服务，通过算力与通信的调度实现训练效率数倍式提升。双重优势下，大厂 GPU 实例租赁具备一定溢价能力，相对传统 CPU 实例更具备投入产出比。

中期维度看，云厂依旧具有较大 CAPEX 投入潜力。以阿里为例，其企业实际可用的现金流大致等于“经营活动现金流量净额-资本开支-分红/回购支出”。从未来三年看，假设年化 15%+现金流入增量，扣除资本开支与分红回购之后（阿里有三年回购计划），阿里的现金流入还有近 2000 亿元总余量，足以支撑后续资本开支金额追加。2024自然年维度阿里资本开支占经营活动现金净流入占比仅40%+（对比海外厂商普遍占比超过 50% ），考虑到其同时还具有 5000 亿以上账面存量资金，高算力需求下，后续存在进一步加大资本开支可能性。

1.3 先进制程供不应求，封装加速迭代

台积电先进制程及封装技术发展趋势： 1）先进制程：根据台积电 2025Q3 财报显示，先进制程营收比重已达 74%，其中 5 纳米占 37%，3 纳米占23%，N2 工艺在 25 年年底实现量产。市场需求方面，N2 工艺已锁定 15 家左右的核心客户，其中 10 家聚焦高性能计算（HPC）领域，苹果、英伟达、AMD 等头部企业占据主要产能。台积电宝山与高雄工厂已完成量产准备，预计 2026 年第二季度全面投产，月产能将达 6 万片晶圆，规模远超 3nm 初期水平，每块 2nm晶圆的初步定价将达到 3 万美元。2026 年，台积电将为其 N2 技术增加两个变化版本：具有背面供电的 N2P 和用于 HPC 的 N2X。更先进的 A16（1.6nm）工艺预计 2026 年下半年正式量产，该技术采用背面供电与超级电轨设计，电流密度提升 40% 以上，可满足高效能运算产品的极限算力需求，目前已进入风险量产阶段。

2）先进封装：台积电的先进封装工艺分为三个大类，CoWoS，InFO，SoIC。CoWoS 包括 CoWoS-S、CoWoSL 和 CoWoS-R，主要是根据中介层材质不同分类，其中 CoWoS-S 中介层是采用硅（Sillicon），CoWoSL 使用 LSI（本地硅互连），CoWoS-R 中介层使用 RDL布线来连接小芯片。InFo 技术属于晶圆级封装（WLP) 技术，广泛用于消费电子领域。TSMC-SoIC 则是在 CoWoS 和 InFo 前两种技术路线之上的 3D 堆叠，SoIC 可以根据芯片集成需求整合于 CoWoS 或 InFO。SoIC 平台提供 SoIC-P（Bumped）和 SoI CX（Bumpless）两种堆叠方案，SoIC-P 是微凸块堆叠解决方案，适用于对成本比较敏感的应用，如移动应用；SoIC-X 是 Hybrid Bonding（混合键合）模式，适合 HPC、AI 领域。台积电最基本的封装方案是采用硅中介层的 CoWoS，整合一个计算芯片（SoC）和 8 个 HBM 内存，提供基准计算能力（定义为 1 倍）；随着技术进步，采用 SoIC 技术的 CoWoS 封装可以集成更多计算单元和 12 个 HBM，将计算能力提升至 3.5 倍；进一步扩大封装尺寸的 CoWoS（SoIC）可以实现 7 倍的计算能力；而最终的晶圆级系统（SoW-X）则实现了超过 40 倍的计算能力提升。同时互联能力也有明显提升，早期实现包括 2023 年的 N5 芯片堆叠在 N6 上（采用 9 微米间距，0.4 个 Reticle 大小）和 2024 年的 N4 芯片堆叠在 N5 上（采用 6 微米间距，0.8 个 Reticle 大小）。技术路线图继续向前发展，2025 年推出 N3 芯片堆叠在 N4 上（采用 6 微米间距，1 个 Reticle 大小），2026 年将实现 N2/A16 芯片堆叠在 N3 上（采用 5 微米间距， 1 个 Reticle 大小），最终在 2029 年实现 A14 芯片堆叠在 N2 上（采用下一代间距技术，1 个 Retic le 大小）。

Cowos 产能：根据 TrendForce 的数据，预计到 2025 年底，台积电的月 CoWoS 产能将达到约 7 万至 7. 5 万片晶圆，较 2024 年几乎翻倍。管理层还表示，对 CoWoS 的需求将持续到 2026 年，并且正在努力提升产能以实现供需平衡。根据目前供需情况，预计到 2026 年底，月产能将进一步增至约 9 万至 10 万片晶圆，预计 2026 年全年产能超过 100 万片。

1.4 推理降本需求下，以存带代算成为主流

1.4.1 HBM+DRAM 构筑推理体系基石，SSD+HDD 承接输入/输出结果

大模型中产生的存储需求主要来自于三类：1）模型参数权重；2）输入/输出/过程中的 KV cache 缓存；3）输入/输出数据本身的存储：

模型参数权重：训练阶段最主要的内存消耗，推理阶段内存消耗占比小于训练阶段。模型在开始提供服务之前其全部参数（包括所有专家）都需要加载到 GPU 集群的 DRAM 中。这确保了任何⼀个专家在被路由器选中的时候，都能被立即调用。如果专家参数还在别的存储上时，临时去读取的延迟将是无法接受的。

KV cache 缓存：大模型的本质是利用 token 和 token 之间的隐形关联来去推理下一个 token 是什么词的概率，这种隐形关联就是 KQV 矩阵。传统 LLM 的生成过程是自回归的，模型每生成一个新的 token，都需要重新计算一遍 KQV 矩阵，对算力较为浪费。KV cache 则是在首次计算时，将每个 token 的 K 和 V 向量存⼊缓存中；此后在生成新的 token 时，只需为最新的词元计算 Q/K/V，再从缓存中读取其余历史向量即可，从而实现算力的大幅节约。

输入/输出数据本身：用户所有的输入输出数据（文字图片视频音频），都会根据数据冷热被存入本地 SSD/HDD 或远端存储服务器，占据一定存储空间性。

基于带宽的不同，两套体系所面对的存储需求也不同。总体看，从 HBM 到 DRAM 到 SSD，存储容量上升，读写带宽下降，读写延迟拉长。从细分场景看，HBM+DRAM 负责热数据处理，SSD+HDD 负责冷数据处理，二者面临的是完全不同的需求。

HBM+DRAM 主要承接模型参数+KV cache 缓存需求。主要基于 HBM 与 DRAM 较大的读写带宽与较低的读写延迟，确保推理过程中首字延迟与吞吐量持续保持在较高的状态。

SSD+HDD 主要承接输入/输出数据（文本图片视频音频存储需求）。主要利用其低成本和大容量优势，SSD 相较 HDD 成本更高，但无论是读写速度、乱序读取能力、可靠性等均有较大提升。因此过往企业级 SSD 替代 HDD 的趋势一直存在。

1.4.2 从单次推理看三级存储体系实际运作方式

单次推理中存储体系的运转分四步构成，其中 SSD+HDD 主要负责输入/输出结果的存储，DRAM 则用于 KV cahe 的缓存匹配与定期保存，HBM 主要负责模型参数加载：

Prompt 输入：用户输入 Prompt 后，通过 Prompt 匹配在 RAG 或用户数据库中匹配上下文关联信息，并打包输入模型侧。

KV Cache 缓存命中：Prefill 阶段模型接受数据后，通过 Prefix KVCache 匹配，从 DRAM 中匹配 KVCache 缓存，若缓存命中，则将 KVCache 从 DRAM 中加载到 HBM，并对未匹配到的 prompt 部分计算 KVCache。

HBM 内部循环：计算结束后，将 KV Cache 通过 PCIE 接口传递至 Decode 环节，并在 decode 的循环过程中，KVCache 将在 HBM 和 GPU 之间反复读写。

KV Cache 卸载：计算完成后，输出完整结果，并将结果（文本/图片/音频/视频）存储至 SSD 或 HDD，同时将完整的 KVCache 卸载至 DRAM，并根据缓存命中率要求和 DRAM 池容量决定缓存时间（往往长达数小时或数天）

1.4.3 如何看待 HBM/DRAM/SSD AI 需求来源

对于 HBM/DRAM/SSD 三级体系，考虑到 DRAM 需求跟随 Token 消耗量呈现线性增长趋势，未来需求高速增长值得期待。此外，考虑到 SSD 存储需求主要与文件存储类型相关，将持续受益于后续 Agent 与多模态等模型技术发展。 HBM：HBM 需要搭载的是模型权重与单轮对话的 KVCache 缓存，需求更多在于带宽，容量上若模型上下文长度得到极大突破，则会有容量升级需求；本质上，除了模型存储模型权重外，HBM 的需求主要由单轮对话的长度中枢决定，从对话到 coding+Agent 再到多模态，每一次都是对话中枢长度的飞跃 DRAM：DRAM 主要用于 KV Cache 矩阵的缓存，本质上其需求量级主要由 KV Cache 的缓存时间决定。缓存时间越长，其他 prompt 缓存命中的概率越高，对应的推理成本就越小（缓存命中是非缓存命中成本的十分之一）。目前业界对 DRAM 做特殊配置不多，国内缓存周期一般仅有 3-4 个小时，但缓存命中率也较低（低于 50%），提升缓存命中率最直接的方式就是提高 DRAM 容量 SSD：SSD 存入的主要是输入与输出的数据（文本/图片/视频/音频/其他文件），理论上大模型渗透率越高，to B 和 to C 上传文件/图片/视频等大体量文件的频次就会越高，存储需求就会越大，多模态与 Agent 都是对 SSD 存储需求的极大催化。

DRAM 供给端近年来存在多重约束，供给扩张显著慢于行业需求增量。截至 2025 年第三季度，全球 DRAM 月产能约 150 万片（12 英寸晶圆），其中三星 66 万片、SK 海力士 43.5-48.5 万片、美光 41.8-42 万片，三大厂商合计占比超过 90%。当前产能利用率已达 82%，处于正常供需区间（80%-85%）的上限。在总体产能紧缺的背景下，内部结构的转变放大了 DRAM 的供给短缺。一方面，DDR4 产能加速退出仍在持续。三星、海力士、美光等国际大厂将在 25Q4-26Q1 时间区间逐渐停止 DDR4 供应，以确保更高毛利率的产品能占据更高比重；另一方面，过往资本开支对于 AI 训练效率的重视导致 HBM 配置标准大幅提升，促使晶圆厂产能向高端产品倾斜，而以 HBM 为代表的高端品对晶圆的大幅消耗（其消耗的晶圆容量是标准 DRAM 的三倍以上），导致标准 DRAM（DDR5、LPDDR）供应短缺。考虑到标准 DDR5 的需求与 AI 整体 token 消耗呈现线性相关关系，供不应求背景下，近期 DRAM 价格上升幅度十分显著。

Nand 层面，受益于 AI 数据生成需求高涨与机械硬盘产能不足，SSD 同样进入价格大幅上涨周期。2024 年以来，由于市场供过于求，三星、SK 海力士、美光、西部数据和铠侠等五大原厂纷纷采取减产措施。美光、海力士 2025 年计划整体减产幅度均为约 15%。但近年来，一方面，伴随 AI 推理算力消耗快速扩大，上下文内容存储需求提升，从需求侧对固态硬盘产生增量需求，另一方面，伴随机械硬盘产能的持续紧缺，部分 QLC 固态硬盘被用于填补机械硬盘需求，导致固态硬盘供需进一步失衡，并带来持续性涨价趋势。从细分品类角度看，在中低端品类（QLC 和 TLC）价格大幅上涨后，高端品类（SLC 和 MLC）也先后进入大幅涨价阶段，AI 高频数据存储需求被快速挖掘。

1.5 液冷及近芯片端散热

数据中心从整体到局部散热需求同步提升，建议关注液冷新方案与散热新材料。从单芯片、单机柜 TDP 趋势来看，风冷已经无法满足服务器散热需求，逐渐走向液冷方案。需求侧，北美 GPU、ASIC 芯片液冷方案渗透率持续提升，同时国内超节点方案逐步推出，都将催生更大的液冷市场，液冷从“高端选配”走向“必选方案”。从外置液冷零部件到芯片封装，热界面材料（TIM）可视作热量从内到外的“高速路”在芯片散热中，T IM 1 和 TIM2 发挥着“双导热引擎”作用。此外，近芯片端散热讨论度骤升，金刚石等新材料的应用有望对芯片进行全方位散热，应用领域包括衬底、热沉片以及复合材料。整体来看，从机柜到芯片散热需求的提升将推动散热方案及产品不断迭代，带来千亿级市场空间。

1.5.1 液冷散热已成“必选方案”，把握千亿级赛道

高算力需求推动算力中心单机功率密度提升。风冷系统通过让冷源更靠近热源，或者密封冷通道/热通道的方案，来适应更高的热密度散热需求。随着机架密度升至 20kW 以上，多种液冷技术应运而生，从而满足高热密度机柜的散热需求。液冷散热契合算力中心绿色低碳发展持续深化的需要。PUE（Power Usage Effectiveness, 数据中心总能耗/IT 设备实际能耗）是算力中心最常见的评价性能指标，也是行业评价算力中心绿色性能的主要衡量指标，PUE 值越接近于 1，代表算力中心的绿色化程度越高。液冷技术主要分为冷板式、浸没式和喷淋式液冷技术等技术类型，其中冷板式液冷技术作为成熟度最高、应用最广泛的液冷散热方案。

冷板式液冷技术：通过冷板将芯片等发热元器件的热量间接传递给封闭在循环管路中的冷却液体，冷却液带走热量，并将其传递到一次侧回路，通过冷却系统进行冷却，最后将热量排出系统。冷板式液冷系统可以分为一次侧（室外）循环和二次侧循环（室内）两部分。其中，二次侧循环主要通过冷却液温度的升降实现热量转移，而一次侧的热量转移主要是通过水温的升降实现。成本方面，一次侧占到液冷成本的 30%左右，二次侧占 70%左右。冷却效果：冷板一般使用在平坦表面时换热效果最佳，例如 CPU、GPU 和存储器模块等，不适用于电源和 IC 电容器等其他组件，综合来看，冷板液冷可带走机架中设备产生的 70-75%的热量，因此需要采用混合冷却方法。

冷板式液冷二次侧（室内侧）核心部件：①液冷板（Liquid Cooling Plate）：液冷板是一种通过液体循环来吸收和转移热量的散热设备，广泛应用于高性能计算和数据中心。它们通常安装在服务器或电子设备上，通过液体流动来冷却设备。②快速断开装置（QD）：允许快速方便地连接和断开液体管线，且不会产生漏液。③冷却液分配单元（Coolant Distribution Unit，CDU）：负责冷却剂的分配、调节和监控。它们确保每个服务器都能获得适量的冷却液，以维持适宜的运行温度。CDU 分为 L2A，包括：RPU（泵、水箱）、散热片、风扇。以及 L2L，包括：RPU 和钎焊板式换热器（BPHE）。④机柜内部管线（Manifold）：柜内管线包括 Rack Manifold（机架管）和 Row Manifold（行管），是液冷系统中用于分配冷却液的管道系统。Rack Manifold 负责将冷却液分配到机架中的各个服务器。Row Manifold 则负责在机架内部分配冷却液到每行的服务器。

冷板式液冷机柜价值量拆分（以 GB200 NVL72 机柜为例）。GB200 NVL72 机柜内部液冷系统的整体价值约为 8.4 万美元，占机柜成本的 2.8%左右（假设机柜液冷总成本 300 万美元）。分零部件来看，GB200 NVL72 机柜包含 126 颗芯片，其中，Compute Tray 包含芯片 108 颗（72*GPU+36*CPU），对应冷板价值量约 3.2 万美元；Switch Tray 芯片对应冷板价值量约 3600 美元，合计占比达 43%。冷却分配单元（CDU）单价 3 万美元，占 35.8%。快接头价值量占比约 10.5%，Manifold 约占 4.8%。总体来看，液冷板与 CDU 两项合计占整体液冷成本的 78.8%，为液冷方案的核心零部件。

浸没式液冷是一种通过将发热的电子元器件（如 CPU、GPU、内存及硬盘等）全部或部分直接浸没于装有非导电惰性流体介质的机箱中的液冷散热技术。它包含两个循环：一次侧循环利用室外冷却设备（如冷却塔或冷水机组）与热交换单元（如 CDU 等）进行热交换，排出冷却液热量；二次侧循环中，CDU 与液冷箱内的 IT 设备热交换，传递热量给冷却液。根据冷却液在循环散热过程中是否发生相变，分为单相浸没式液冷和双相浸没式液冷。①单相浸没式：作为传热介质的二次侧冷却液在热量传递过程中仅发生温度变化，而不存在相态转变，过程中完全依靠物质的显热变化传递热量。②两相浸没式：作为传热介质的二次侧冷却液在热量传递过程中发生相态转变，依靠物质的潜热变化传递热量。

浸没式液冷由于发热元件与冷却液直接接触，散热效率更高，相对于冷板式和喷淋式液冷，噪音更低，能解决高热密度机柜的散热问题。①单相浸没式液冷中，介电冷却液（沸点较高）保持液体状态，电子部件直接浸没在液体中，热量从电子部件传递到液体中。通常使用循环泵将经过加热的冷却液流到热交换器，在热交换器中冷却并循环回到容器中。②相变浸没式液冷是以相变冷却液（沸点较低）作为传热介质，在工作状态下，当冷却液的温度升高到系统压力所对应的沸点时，冷却液发生相变，从液态变化为气态，通过汽化热吸收热量，实现热量的转移。

喷淋式液冷：直接接触式液冷，面向芯片级器件精准喷淋，通过重力或系统压力直接将冷却液喷洒至发热器件或与之连接的导热元件上的液冷形式。散热效果：喷淋式液冷也可完全去除散热风扇（实现 100%液体冷却），换热能力强，相较于浸没式液冷节省冷却液，数据中心 PUE 可降至 1.1 左右。喷淋式液冷需要对机柜和服务器机箱进行改造，运维难度较大，节能效果差于浸没式液冷。

2025 年是服务器液冷的“爆发元年”，新方案迭代利好国产厂商。市场预期 GB300 机柜 Q4 大量出货，当前处于液冷零部件上量的关键时间节点。此前，GB200 服务器液零部件厂商主要集中在台系 AVC、Coolermas ter、 Delta 等企业，GB300 大陆厂商送样参与度大幅提升。同时部分台企将目光瞄准大陆厂商，液冷零部件厂商积极送样，利好国产液冷产业链。台系液冷厂商 9 月收入同环比高增，AVC（奇鋐科技）9 月实现收入 145 亿新台币，同比增长 128.4%，环比增长 14.9%，1-9 月累计收入 918.6 亿新台币，同比增长 80.6%，主要受益于服务器液冷订单，表现出强劲的增长态势。台达电 9 月实现收入 571 亿新台币，同比增长 53.8%，环比增长 19.2% ，1- 9 月累计收入 3558.9 亿新台币，同比增长 29.8%。双鸿 9 月实现收入 23 亿新台币，同比增长 64.4%，环比增长 24.6%，1-9 月累计收入 156.9 亿新台币，同比增长 35%。液冷产品主要集中在服务器（Server）领域，产品包括液冷板、水泵、Manifold、CDU、快接头等。

1.5.2 TIM1&TIM2：芯片散热的“双导热引擎”

以液冷散热解决方案视角，关注外置冷板与芯片封装之间的散热通道——热界面材料。热界面材料（TIM）是用于涂敷在散热器件与发热器件之间，降低两者接触热阻所使用材料的总称。由于器件制造公差和表面粗糙度的存在，器件之间通常会有微小的空隙。这些空隙含有空气，而空气是热的不良导体，常温下导热系数仅为 0.026W/(m·K)，就会造成比较大的接触热阻。因此，导热界面材料（TIM）被用来填补这些空隙，排出空气，提供更好的热传导路径，降低界面热阻，从而提升散热效率。芯片通过 TIM 与热沉进行贴合，TIM 在远端冷却和近芯片冷却中起到十分关键的作用。

热界面材料产品类型丰富。依据导电性差异，可分为绝缘型与导电型热界面材料；从组成角度来看，可以细分为单组份与双组份热界面材料；若按构成成分划分，包括有机型、无机型以及金属型热界面材料等。此外，根据特性及发展历程的不同，热界面材料涵盖导热膏、导热垫片、相变材料、导热凝胶、导热灌封胶、导热胶带和黏接剂等多种类型。其中，导热膏、导热垫片、相变材料等在市场中产量较高，应用范围也较为广泛。

芯片 TIM材料需综合考虑水平及垂直方向导热，兼顾高导热性与安全性。电子设备中，芯片产生的热量经过散热器（Heat spreader）、散热片（Heat sink）等散热器件散发到空气中，当固体接触时表面具有粗糙度，缝隙会被空气（热导率仅 0.026W/(m·K)）填充，低热导率不利于热量传导，因此在散热器件之间需要高导热材料填充替代空气。TIM1 由于和芯片直接接触，因此需要兼顾高热导率和高电绝缘性。TIM 材料需考虑水平方向及垂直方向导热效率，水平方向导热避免热点集中，垂直方向导热尤为重要，与材料材质和厚度密切相关。

TIM1 直接接触芯片，对导热性能要求较高。TIM1 是一种芯片与封装外壳之间的导热材料，与发热量极大的芯片直接接触，这就要求 TIM1 具有低热阻和高热导率，热膨胀系数与硅片匹配。TIM1 基材一般采用高分子材料，如硅胶、环氧树脂等，这些材料具有良好的柔韧性和界面适应性，能够很好地贴合芯片和均热板的表面。导热填料常用的有氮化硼（BN）、氧化铝（Al₂O₃）、石墨烯等。TIM1 需满足绝缘要求，因此基体与填料均选用绝缘材料。当前，氮化硼（BN）和氧化铝（Al₂O₃）是主流填料，其中氮化硼的热导率高于氧化铝，使复合材料的整体导热系数在 1–23 W/(m·K)。填料用量增加可提升热导率，但过量会使体系黏度上升、加工性能下降。若填料本身导电，其含量越高，复合材料电阻率越低、绝缘性能越差。因此，必须确定最佳填料比例，在热导率、黏度、绝缘性与热膨胀系数之间取得平衡。

TIM2 的材料组成同样包含基材与导热填料两部分，需兼顾散热效率与成本。其基材以高分子材料为主，根据需求也可采用液态金属等特殊材料，以更好地适配均热板与散热器间的复杂结构及微小间隙，从而有效提升热传递效率。在导热填料的应用上，TIM2 与 TIM1 的选择范畴类似，但在填充比例控制及微观排布方式上会根据自身性能要求进行针对性调整。此外，TIM2 的研发设计在充分满足散热性能需求的基础上，还需充分考虑材料成本控制与工业化生产的可加工性，以确保产品能够适应规模化生产和成本控制。

液冷方案迭代将对热界面材料提出更高的要求。服务器液冷包括冷板式、浸没式和喷淋式三种方案，当前以冷板式液冷为主，占比达到 80%-90%，浸没式相较于冷板式液冷前期建设及后期运维成本更高，但有着比冷板式更高的散热上限。浸没式液冷包括单相和两相两种方案，单相式浸没液冷通过高/低温浸没液循环实现热量交换；两相式浸没通过浸没液相变蒸发，之后冷凝后循环使用进行散热。无论是单相式还是两相式浸没式液冷，场景中都会有加热、机械力和有机溶剂溶解等作用，对散热系统存在潜在的破坏风险。因此热界面材料需要具备高导热系数、低热阻、高热稳定性、抗机械冲刷、抗有机溶解及侵蚀溶解等特点。

1.5.3 近芯片高效散热需求提升，把握新材料的应用

近芯片散热需求持续提升，“热点”问题亟待解决。随着半导体产业遵循着摩尔定律逐步向 2 纳米、1.6 纳米甚至是 1.4 纳米迈进，尺寸不断缩小，功率不断增大，带来了前所未有的热管理挑战。芯片在运行过程中会产生大量热量，若散热不及时芯片温度将急剧上升，进而影响其性能和可靠性。芯片内部热量无法有效散发时，局部区域会形成“热点”，导致性能下降、硬件损坏及成本激增。当电子设备温度过高时，工作性能会大幅度衰减，当芯片表面温度达到 70-80℃时，温度每增加 1℃，芯片的可靠性就会下降 10%。

在持续推动芯片性能突破的过程中，如何超越传统热力学极限已成为行业关键挑战。随着算力需求爆发式增长，芯片功率密度不断攀升，散热能力直接制约着性能的释放与系统的稳定性。在此背景下，近芯片端的均匀散热成为技术突破的核心所在，而封装环节因其紧贴芯片、主导热量导出的特点，正成为未来产业价值增长的重要领域。台积电与英伟达作为产业链上下游的领军企业，虽定位不同，却在技术演进方向上高度协同，共同聚焦于三大关键目标的实现：一是降低热阻。通过优化热界面材料、改进微凸块与中介层结构，减少从晶粒到散热器的热传导阻力，提升导热效率；二是增加有效散热面积。在封装内部集成更复杂的微流道、均热板或三维堆叠结构，扩展散热界面，增强单位面积散热能力；三是支撑高功率高密度运行。为下一代 AI 芯片在更高功率与更高晶体管密度下的稳定工作提供可靠热管理基础，避免过热降频或失效。

硅集成微通道：台积电方案利用先进的硅制造技术，在有源硅芯片的背面直接制造硅微柱阵列，以实现直接液体冷却。经验证，硅集成微型冷却器（IMC-Si）能实现高散热低能耗的效果。微软成功测试了一种新型冷却系统，其散热效果比目前常用的冷板高出三倍。该系统采用微流体技术，将液体冷却剂直接引入热源硅片内部。硅片背面直接蚀刻出微小通道，形成凹槽，使冷却液能够直接流经芯片上，从而更高效地散热，微流体技术能将 GPU 内部硅片的最高温升降低 65%，但具体降低幅度会因芯片类型而异。

衬底新材料：目前，几乎所有高端 AI 芯片都采用台积电的 CoWoS 先进封装技术，而其中的硅中介层是散热的关键瓶颈。硅中介层存在诸多问题：热导率低，易导致热量容易堆积形成“热点”；结构脆弱，在大尺寸封装中容易出现开裂、翘曲；热膨胀系数不匹配，导致封装可靠性下降。在此背景下，以碳化硅和金刚石为代表的新型材料方案逐渐崭露头角。以金刚石为例，其作为半导体衬底材料优势显著。1）高热导率：金刚石在目前已知材料中热导率最高，能在高功率密度设备中有效散热。2）高带隙：金刚石的带隙约为 5.5eV，能够在高温、高电压环境中稳定工作，特别适用于高温/高功率电子设备。3）极高的电流承载能力：金刚石的电流承载能力远超传统半导体材料，能适应高电流应用。4）优异的机械强度：金刚石的硬度和抗磨损性使其在苛刻的工作条件下能够保持稳定性能，增加器件的可靠性和寿命。5）抗辐射性：金刚石的抗辐射性使其适合用于空间、核能等高辐射环境中。

热界面材料：一方面，金刚石粉末可以作为填料应用于导热凝胶。导热凝胶主要由高导热填料和弹性基体组成，导热填料通常以固体粉末形式存在，涵盖金属、非金属以及高导热性能的陶瓷、碳基材料等。常见的导热填料有氧化铝、氮化硼、碳纤维、石墨、金刚石等。其中，金刚石粉末凭借其极高的导热性能，被广泛用于高端导热材料，尤其适用于需要高效热传导和低热膨胀的场景。另一方面，金刚石本身可以作为热界面材料。金刚石本身具有优异的物理和化学特性，是优质的导热材料，但目前存在加工难度大、成本高等问题。

关注芯片散热新材料应用，金刚石材料优势显著。金刚石作为一种散热材料，它的热导率可以达到 2000W/m·K，是碳化硅（SiC）、硅（Si）和砷化镓（GaAs）热导率的 4 倍、13 倍和 43 倍，比铜和银的热导率高出 4-5 倍。在热导率要求超过 500W/m·K 时，金刚石是唯一可选的热沉材料。金刚石作为散热材料主要有三种应用方式：金刚石衬底、热沉片以及在金刚石结构中引入微通道。Akash Systems 的钻石冷却 GPU 技术可以有效降低 GPU 热点温度 10-20 摄氏度，风扇速度减少 50%，超频能力提升 25%，并延长服务器寿命一倍，预计可为数据中心节省数百万美元的冷却成本，同时温度降低高达 60%，能耗降低 40%。

金刚石作为半导体衬底材料优势显著。1）高热导率：金刚石在目前已知材料中热导率最高，能在高功率密度设备中有效散热。2）高带隙：金刚石的带隙约为 5.5V，能够在高温、高电压环境中稳定工作，特别适用于高温/高功率电子设备。3）极高的电流承载能力：金刚石的电流承载能力远超传统半导体材料，能适应高电流应用。 4）优异的机械强度：金刚石的硬度和抗磨损性使其在苛刻的工作条件下能够保持稳定性能，增加器件的可靠性和寿命。5）抗辐射性：金刚石的抗辐射性使其适合用于空间、核能等高辐射环境中。

金刚石复合材料的应用。传统金属散热材料（如铜、铝）虽然导热性能较好，但其热膨胀系数与高导热、轻量化要求难以兼顾。金刚石因其导热率可超过 1000 W/m·K，被认为是理想的增强相材料。芯片主动散热通过在芯片外部封装增加散热器，其中微通道液冷凭借出众的性能脱颖而出。最新的“片上微通道冷却”技术，直接在基板上加工微通道结构并通入液体，实现芯片级主动冷却。金刚石拥有超高热导率，且线膨胀系数低，与铜复合形成的金刚石铜复合材料，不仅线膨胀系数大幅降低，热导率更远超钨铜、金刚石铝等传统复合材料，完美契合第三代半导体的热管理需求。

国内外积极布局金刚石材料在半导体散热中的应用。2024 年 12 月，华为申请公布使用金刚石散热层的半导体器件专利。在申请的半导体器件中，钝化层位于第一外延层和金刚石散热层之间，钝化层朝向金刚石散热层的一侧表面设置有凹槽，该结构不仅可以增加金刚石散热层与钝化层的接触面积，从而增加金刚石散热层与钝化层之间的结合力，还可以减小栅极与金刚石散热层之间沿半导体器件的厚度方向的热扩散距离，大幅提高半导体器件的散热效率。2023 年 10 月，华为与哈尔滨工业大学联合申请公布一项专利《一种基于硅和金刚石的三维集成芯片的混合键合方法》。通过采用混合键合方法，可以实现硅和金刚石的高效集成，将芯片产生的热量快速地导出，并减少热阻，从而提高芯片的散热效率，提高芯片的性能和可靠性。

Diamond Foundry 是一家专注于人造钻石领域的公司，在钻石散热领域，Diamond Foundry 的技术具有显著的地位，2022 年，收购德国的 Audiatec 公司后成功制造了世界上第一个单晶金刚石晶片，2023 年，Diamond Foundry 宣布制造出了世界上第一块单晶金刚石晶圆。这块金刚石晶圆直径 100 毫米，重量 110 克拉，具备极高的导热性和电绝缘性。钻石散热技术可让 GPU 计算能力提升三倍，温度降低 60%。

总体来看，伴随算力需求提升与第三代半导体发展，未来金刚石在高端散热市场空间广阔，建议持续关注金刚石等新材料在半导体行业的应用，未来将有不错的应用空间。

1.6 PCB 及上游材料

服务器平台持续升级带来 CCL 材料等级提升及 PCB 层数增加。根据 Prismark 数据，PCIe3.0 总线标准下，信号传输速率为 8Gbps，服务器主板 PCB 为 8-12 层，相对应的 CCL 材料 Df 值在 0.014-0.02 之间，属于中损耗等级；PCIe4.0 总线 16Gbps 的传输速率，PCB 层数需要提高到 12-16 层，CCL 材料 Df 值在 0.008-0.014 之间，属于低损耗等级；当总线标准提升至 PCIe5.0，数据传输速率达到 36Gbps，PCB 层数需要达到 16 层以上，CCL 材料 Df 值降至 0.004-0.008 区间，属于超低损耗材等级。2024 年 BrichStream 平台开始逐渐渗透，尽管 P CI e 标准认为 5.0（AMD 平台对应 Zen5），但 CCL 材料等级已经逐渐向 UltraLowLoss 升级，PCB 板层数提升至 18-22 层。

AI 服务器 PCB 层数及 CCL 等级显著高于传统服务器，且新增 GPU 板组。由于 AI 服务器架构相对更复杂、性能要求更高，单台服务器中 PCB 价值量较传统普通服务器会有明显的提升。PCB 价值量增加点来自于：（1）新增 UBB 母板。AI 服务器最大的差异在于在传统 CPU 的基础上增加 GPU 模块来支持计算功能，因此从过往的 1 块主板（CPU 母板）为主变为 2 块主板（CPU 母和 GPU 母版）。UBB 主板是搭载 GPU 加速卡的平台，与 GPU 加速模块（SXM/OAM 模块）直接相连，为 GPU 加速模块提供高效的数据传输与交换通道，同时具备一定的数据管理功能，通常具有高性能、高稳定性和高可拓展性等特点。（2）OAM加速卡增加 HDI需求。在 AI 服务器中，为了增加 GPU 互连的通道数和传输速率，其硬件方案集成度都相对以往 CPU 更高，对应的 PCB 转向 HDI。英伟达 A100、H100、GH200、B100 产品的加速卡均采用 HDI 工艺制造，在 NVL72 的机架架构中，Switch Tray 也有可能采取 HDI 工艺。

北美 PCB 账面与账单比率连续 8 个季度维持在 1 以上。账面与账单比率是通过将过去三个月预订的订单价值除以调查样本中同期公司的销售额计算得到的，账面与账单比率超过 1.00 的比率表明当前的需求领先于供应，这是未来 3-12 个月销售增长的积极指标，2024 年 9 月至 2025 年 4 月，北美 PCB 在账面与账单比例分别为 1.08、1.25、1.15、1.19、1.24、1.33、1.24、1.21，目前已连续 8 个月维持在 1 以上。

GB200 PCB 设计材料全面升级。GB200 NVL72 核心是采用 superchip 设计的 Bianca 主板，一个系统内共 18 个 Compute Tray、9 个 Switch Tray 和 36 个 superchip。单个 Compute Tray 内有两个 superchip，每片 superchip 有 1 颗 CPU 和 2 颗 GPU，取消了 UBB 板和单独 CPU 主板。相比 H100，NVL72 的 CPU 和 GPU 都在同一块 superchip 板上，因此不再需要用以承载单颗 GPU 的 OAM 加速卡和 CPU 主板。Switchtray 承担 GPU 的互联功能，因此不再需要 UBB 板。即 NVL72 取消原来的 UBB，使用 Switchtray 进行 GPU 互联。芯片封装技术升级带动 SLP 需求提升。CoWoS 是台积电开发的一种先进封装技术，属于 2.5D IC 封装范畴，它是通过将多个裸芯片（如 GPU、HBM、ASIC 等）直接封装到一块中介层（Interposer）上，然后再将中介层连同芯片一起封装到底部基板上，再将基板焊接在 PCB 上。CoPoS（Chip-on-Panel-on-Substrate）用大型矩形面板替换晶圆级封装，相对 CoWoS 的优势在于更低的单位面积成本。 CoWoP（Chip-on-Wafer-on-PCB）和 CoWoS 最大的差异在于取消封装基板，中介层和芯片直接封装在 SLP（Substrate-Like PCB）上。SLP 是使用改良半加成法（mSAP）的 Any-Layer HDI，mSAP 介于减成法和半加成法之间，主要是针对前者线路精密度不足与后者工艺复杂的问题改良。CoWoP 带来更高的信号完整性、电源完整性和散热能力，同时降低封装基板带来的成本。

高多层承载服务器主板升级，压合与通孔工艺成核心壁垒。高多层板（High Layer Count PCB）即层数较高的多层板，Prismark 将 18 层及以上的多层板定义为高多层板。高多层电路板通常由内部的导电层和外部的终端层组成，中间通过绝缘层隔开，通过在内部导电层上布线，可以实现更高的线路密度和更复杂的电路结构。引入高多层板可以实现更多的线路和互联通孔，以满足高速率、大带宽、高计算密度需求，主要用于户外基站、数据存储和数据中心等大空间设备。高多层往往需要更好的介电性能、更高的机械强度和热稳定性。目前高多层的核心壁垒在于压合时板材翘曲与层间分层控制、层间对位精度与高纵横比孔的结构可靠性，它们决定了良率、机械可靠性与信号完整性的基本上限，是量产高层板型的关键工艺门槛。

HDI板向更高阶进化，良率与成本控制成胜负手。HDI（High Density Interconnector）是生产印刷电路板的一种技术。使用激光钻微盲/埋孔技术实现线路和元件高密度集成的电路板即 HDI PCB，也称高密度互联板。HDI 板的阶数即增层的次数，可以任意层相互联通的 HDI 即 Any-Layer HDI。引入 HDI 的目的是缩短线宽线距，减小孔径，从而满足小型化、高集成度的应用场景，此特性对消费电子等领域的紧凑设计、高速通信领域的损耗减小至关重要。根据产业链经验，HDI 是将孔径缩小到 6mil 以下的必由之路。目前 HDI 板的核心壁垒在于激光钻孔、微孔填铜和阶数堆叠的良率控制。激光钻孔强调孔位精确和孔壁光滑，填铜过程中可能出现气泡和微孔顶部不平整等问题；增层的过程中则存在微孔错位、分层和板材翘曲等挑战。

英伟达 RubinUltra 将采用正交背板替代传统铜缆，是支撑其超高算力与高速传输的核心硬件架构之一。该背板采用三块 26 层 PCB 或四块 26 层 PCB 压合而成，搭配 M9 树脂基材、HVLP4 铜箔与 Q 布（石英纤维布）的高端材料组合，通过计算板与交换板垂直相交的连接方式，直接实现业务板卡与交换网板的对接，取代了传统机柜的铜缆连接方案。其独特结构让板卡间走线距离大幅缩短至接近零，无需依赖背板额外走线。采用正交背板方案，一方面能提升传输性能，显著降低信号衰减与串扰；另外一方面，精简的连接路径减少能耗损耗，能效与稳定性更优。

PCB 材料方面：相比 H100 的 CPU 主板、OAM 和 UBB 所用到的 M6/M7 级 CCL，GB200 NVL72 的 superchip 材料将升级为更高等级（M7+）的 CCL，损耗降低，同时信号传输速率更高、布线密度更大、散热效果更好的 HDI，以满足 GPU 大幅度提升的 AI 计算性能要求。下一代 Rubin 将开始使用 M9 系列 PCB 材料。M9 材料主要用于 Rubin 服务器的计算卡、正交背板、与交换网板等核心部件。M9 具备超低介电损耗（Df），采用碳氢树脂体系，Df≤0.001，可将 1.6T 光模块信号损耗降低 30%以上，显著减少信号衰减与串扰。搭配石英布（Q 布，CTE=5ppm/℃），热变形小；树脂 Tg＞280℃，在 200W/cm²高功率密度下仍能保持 PCB 平整度，避免高温翘曲与焊点失效。采用 HVLP4 低粗糙度铜箔（Rz＜0. 2 μm）+球形二氧化硅填料，层间结合力达 1.2N/mm（传统 PCB 的 2.4 倍），抗分层与抗剥离能力强，确保高密度多层板长期可靠运行。

覆铜板（CCL）是 PCB 的基础材料，也是决定 PCB 性能的关键。覆铜板主要由铜箔、增强材料（玻纤布）、树脂等组成，覆铜板是将增强材料浸以树脂粘结剂，在一面或双面覆以铜箔，最后经热压而成板状材料。覆铜板的性能指标大致可以从物理性能、化学性能、电性能、环境性能等进行区分。覆铜板材料本身在电场作用下存在一定的能量耗散，会造成信息传输过程中的信号损失，不利于信息的高速传输。其中，最为关心的是电性能中的 Dk 与 Df（介电常数和介质损耗因子）。

展望未来，PCB 将聚焦于高频高速化、高密度化、集成化方向发展。高频高速化：随着数据速率从 112Gbps 向 224Gbps 甚至更高迈进，对 PCB 材料的介电性能、铜箔的粗糙度以及电路设计的精准度提出了严苛挑战；高频高速化：电子产品的小型化、多功能化趋势，推动 PCB 向更细的线宽线距、更小的孔径和更高的层数发展。任意层互连（Anylayer HDI）、埋入式无源/有源元件等技术将更加普及；集成化：先进的封装技术如系统级封装（SiP）、扇出型晶圆级封装（FOW LP）等，需要更高精度的类 IC 基板，对 PCB 集成化提出更高要求。P CB 覆铜板按照 PCB 技术进步而不断演化，以松下 Megtron 系列为行业参照，当前 CCL 已经从 M4/M6 进展到 M 8 系列，未来将进一步演进到 M9 系列。

为满足覆铜板的升级对 Dk/Df 的要求，覆铜板主要原材料树脂、玻纤布、铜箔等也同步进行提升。树脂体系从传统的环氧树脂/FR-4 体系走向 PPO/OPE，以及未来的碳氢树脂；玻璃布从传统 E-glass 玻纤布升级成使用具有更低介电常数和损耗的玻璃纱；铜箔已经从标准反转处理箔（RTF）发展到低轮廓（LP）、极低轮廓（VLP）和超低轮廓（HVLP）铜箔，铜箔的表面粗糙度（Rz）已从几微米降低到 1 微米以下。

1）树脂：高速覆铜板对电性能要求更严苛，PPO、碳氢等树脂材料受到关注。随着 AI 服务器、CPU 服务器 PCIe、交换机、光模块持续升级，对上游 CCL 及其树脂材料要求也相应升级。从 Df 介电损耗指标出发：在 M6、M7、M7N 级 CCL 领域，PPO、PI 等树脂、改性 BMI 的 Df 值满足要求；在 M8 级 CCL 领域，PP O 等树脂的 Df 值满足要求；在 M9 级及以上 CCL 领域，Df 值要求在 0.001 以内，树脂材料或向碳氢、PTF E 体系迭代。但另一方面，碳氢树脂、PTFE 树脂面临粘结性差、加工难度大等问题，运用在覆铜板领域有局限性，有待工艺进一步优化。

PPO 电化学性能优异，改性后成为高速 CCL 理想材料。聚苯醚简称 PPO，是一种耐高温的热塑性树脂；由 2，6-二甲基苯酚聚合得到，相对分子量为 2.5～3 万，并于 1965 年实现了工业化生产。改性前的聚苯醚优点是：具备突出的耐热、力学性能、电气绝缘性能等。缺点是熔融温度高，熔融粘度大，加工困难，浸透性差，不耐某些有机溶剂，不能满足覆铜板的要求。因此为了将 PPO 提升加工性等性能以用于覆铜板领域，必须将其改性为热固性树脂。

高端电子树脂格局集中，国产替代势在必行。覆铜板生产以大陆为主，国产上游材料供应链迎来机遇：2020 年中国大陆地区覆铜板产量（含台资、日资）已占全球的 76.9%，在高速 CCL 需求快速增长下，国产 PP O 供应链迎来战略性机遇。行业格局集中：尽管有部分厂商布局低分子量 PPO，但实际批量出货的厂商仅有少数几家，其中以 SABIC、圣泉集团为代表。另外圣泉集团、东材科技、世名科技等国产厂商也在加速布局下一代碳氢树脂。

2）玻纤布：电子布在 CCL中起增强作用，由电子级玻璃纤维织造而成。电子纱是玻璃纤维中的高端产品，被广泛应用于各类电子产品。玻璃纤维具有耐腐蚀、耐高温、吸湿性小、强度高、质量轻、电绝缘和阻燃等优良性能，被广泛运用于消费电子、工业、通信、航天航空等领域，电子级玻璃纤维纱，业界通称“电子纱”，是玻璃纤维纱中的高端产品，单丝直径不超过 9 微米，具备优异的耐热性、耐化学性、电气及力学性能。电子纱是制造电子级玻璃纤维布的主要原材料，被广泛用于各类电子产品中。电子布由电子纱制造而成，在 CCL 中起增强作用。电子级玻璃纤维布由电子级玻璃纤维纱织造而成，可提供双向（或多向）增强效果，属于重要的基础性材料，业界通称“电子布”。电子布具有高强度、高耐热性、耐化性佳、耐燃性佳、电气特性佳及尺寸安定性佳等优点，起绝缘、增强、抗胀缩、支撑等作用，使印刷电路板具备优异的电气特性及机械强度等性能。电子布作为基材在覆铜板行业的大规模应用，解决了 PCB 容易短路、断路等问题，目前 70%以上的 CCL 采用电子布作为基材。

高频 PCB 需要 LowDk 玻纤布，提高 SiO2 或 B2O3 质量分数为有效制备手段。AI 等行业发展牵引高频 PCB 需求，降低玻纤布的 Dk 值能有效满足前述需求。人工智能等行业的迅速发展对电子级玻璃纤维提出了更高的要求，为了减少信号传输的滞后和强度的衰减，要求电子级玻璃纤维在高频下具有更低的介电常数（5 左右）和介电损耗（＜10-3）。目前应用最广泛的传统 E-玻纤的 Dk 值一般在 6.6 左右，明显高于一般树脂基材（2.0- 4.0 左右），无法满足高频 PCB 的要求，所以降低玻纤的介电常数尤为重要。为了满足高频 PCB 对玻纤低介电常数的需求，玻纤企业开发了低介电（LowDk）玻璃纤维。提高 SiO2 或 B2O3 的质量分数是制备 LowDk 玻纤的有效手段，但会降低加工性能并提高生产成本。在现有的技术条件下，LowDk 的玻璃纤维一般具备高质量分数的 SiO2 或高质量分数的 B2O3，亦或者是同时具备，如日本旭硝子株式会社开发的 D-玻纤，其 Dk 仅为 4.1，相比 E-玻纤降低了 38%。但碱金属和碱土金属氧化物含量的降低会导致成纤温度升高，加工性能变差，且因为 B2O3 价格昂贵，生产成本会显著提高。

日本技术实力领先，中国企业市场份额有望快速提升。日本的 LowDk 玻纤发展较早，技术领先，此外美国、中国台湾、中国大陆的相关企业也占据一定市场份额。据 QYR（恒州博智）统计，全球低介电玻璃纤维核心厂商有日东纺、AGY、台玻、富乔和泰山玻纤等，前五大厂商占有全球大约 93%的份额。目前市场上成熟的 Lo wDk玻纤主要有日本东纺的 NE 低介电玻璃纤维、AGY 的 L-glass 低介电玻璃纤维、泰山玻璃纤维有限公司的 T LD －glass 低介电玻璃纤维和重庆国际复合材料有限公司的 HL 低介电玻璃纤维等。

3）PCB 刀具：PCB 刀具是用于 PCB 电路板的特殊切削工具。PCB 刀具通常由硬质合金制成，具有高硬度和耐磨性，可以在 PCB 板上进行精确、高效的切割、开槽、铣削和钻孔等操作。常见的 PCB 刀具包括钻头、铣刀、V槽刀及其他 PCB 专用特种刀具。 PCB 刀具具有高效性、精确性、耐磨性、多适用性的优点。高效性方面，PCB 刀具能够高效地削除电路板上的材料，提高生产效率；精确性方面，能够精确地切割、孔加工和铣削 PCB，保证电路板的质量；耐磨性方面，PCB 刀具通常采用高硬度和耐磨性材料制成，具有较长的使用寿命；适用性方面，能够处理不同种类的基板材料，如 FR-4、金属基板等。以钻针为例，其主要用于 PCB 制程中的钻孔工序，包括钻出通孔、盲孔等，或对已有的孔进行扩孔。

常见的 PCB 刀具有钻头、铣刀、v槽刀和清洁刀等。钻头用于在 PCB 板上钻孔，通常使用微细的钻尖，可以实现高精度的孔径和孔位。铣刀用于去除 PCB 板表面的材料，通常通过旋转刀具和移动 PCB 来削减材料，以实现平整的表面或特定形状的切割。V 槽刀用于在 PCB 板表面开槽，通常采用 V 形的刀口设计，可用于切割出直角边界、倒角或者打入标记。切割刀则用于将整个 PCB 板分割成所需的尺寸，通常使用圆盘形或环形刀片，可以快速而准确地切割 PCB 板。清洁刀用以去除 PCB 表面的毛刺和残留物，以确保板子的表面平整、干净，并提供更好的电气连接性。

涂层技术能提升 PCB 刀具性能与寿命。涂层是刀具非常常见的一项工艺，在刀具形成后，外发涂层会让刀具的整体质量更加优秀，在润滑、抗耐磨、排屑等方面实现较大提升，涂层其实也分为很多不同的样式，常见的钻头涂层有黄钛 TIN，紫钛高铝钛等。一般涂层刀具的切削力比未涂层刀具平均降低 15%-20%左右，与之对应的则是涂层刀具寿命的提升。ta-C 是一种无氢 DLC 涂层，其 sp³与 sp²键比值高，具有极高硬度和强润滑性， ta-C 涂层显著提升了孔位精度和加工品质，在有效降低断针发生几率、防止涂层钻针粘着，改善排尘等方面发挥重要作用。薄而光滑和高硬度等特点充分保证了刃口锋利，可应用于加工有色金属复合材料、中高 T G、无卤素高速板、软板、铝基板、封装板等。

PCD 钻针是 PCB（印制电路板）钻针中适配高精度、高硬度加工需求的高性能品类，其核心优势源于关键材质——PCD 即聚晶金刚石，由金刚石微粉在高温高压环境下与结合剂烧结而成，这种材质赋予了钻针远超传统硬质合金钻针的卓越性能。它的硬度接近天然金刚石，耐磨性极强，在连续钻孔过程中能有效减少刃口磨损，不仅大幅降低了钻针的更换频率，还能长期维持稳定的钻孔精度，避免出现孔径偏差、孔壁粗糙、毛刺过多等影响 PCB 质量的问题。同时，PCD 材质的导热性优良，钻孔时产生的热量可快速传导扩散，减少高温对 PCB基板材料的热损伤，尤其适配批量精密钻孔场景。在加工 7135D、Q 布等高磨耗板材时,普通钻头仅能完成百孔级加工，PCD 微钻已实现数千孔的稳定输出，寿命提升数十倍至百倍。使用 PCD 加工过程中，孔壁质量大幅提升，确保孔壁光滑均匀，为精密电路构筑提供可靠保障。

4）电解铜箔：PCB 铜箔是印制电路板（PCB）的核心导电材料，具有导电性强、厚度均匀性好、与基材结合力优异等特点，直接影响 PCB 的信号传输效率、散热性能和机械强度，是连接 PCB 各层电路的“神经中枢”。从技术属性看，电解铜箔与压延铜箔是 PCB 用铜箔的两大品类，其中电解铜箔因生产效率高、厚度可控性强（可至 1μm 以下）、成本相对较低，是中高端 PCB 的主流选择。根据应用领域电解铜箔可分为锂电铜箔和标准铜箔；根据铜箔厚度不同，可以分为极薄铜箔(≤6μm)、超薄铜箔(6-12μm)、薄铜箔(12-18μm)、常规铜箔(18-70μm) 和厚铜箔(>70μm)；根据表面状况不同可以分为双面光铜箔、双面毛铜箔、双面粗铜箔、单面毛铜箔和低轮廓铜箔(RTF 铜箔、VLP 铜箔、HVLP 铜箔)等。

不同铜箔的有着不同的接触粗糙度与光学粗糙度。铜箔接触粗糙度是指用金刚石探针在铜箔表面直接扫描得到的微观峰谷高度指标（常用 Ra、Rz 表示），它量化了铜箔与基材或信号电流之间的“物理接触面”起伏程度，数值越小，铜面越平滑，趋肤损耗越低；光学粗糙度是指利用白光干涉或激光共聚焦等无接触光学手段，扫描铜箔表面后获得的微观三维形貌参数（常用 Ra、Rz、Sdr 表示），它反映铜面真实峰谷与比表面积，数值越小表明表面越“镜面”，与接触粗糙度差异随平滑度提升而缩小。

随着 PCB 板信号速率变高，对 SI 的要求愈高，即对铜箔表面粗糙度有更高要求。例如，PCIe-6.0 与 224GPAM4 的信号 Nyquist 频点高达 56GHz，趋肤深度仅 0.28µm；HVLP4（Rz≈1µm）已无法保证信号完整性， HVLP5（Rz ≤0.8 µm）成为“硬门槛”。 HVLP5 是目前商用领域信号损耗最低的铜箔之一。HVLP5 的表面粗糙度（Rz）进一步降低至 0.8µm 以下，部分产品甚至可以做到更低。这种极致平滑的表面最大程度地减少了趋肤效应带来的信号衰减，成为当前高速覆铜板优选铜箔。

1.7 功率密度持续升级持续演进，重视机柜式服务器升级机遇

从供电过程本质上，电源本身不产生任何能量，只是作为电网中电能的传导，其核心是实现整流与变压两项功能。整流即是实现不同形态电能的转换（直流变交流、交流变直流），变压即是实现电压的升高或降低。此外，针对于特定场景，电源会添加额外功能，如服务器电源就需要在散热、监控、电流调节上做额外的功能追加从用途功能分类上，电源可分为嵌入式电源与非嵌入式电源，嵌入式电源通常被直接安装在设备内部或特定空间内，又可分为普通开关电源与模块电源两类，其中模块电源往往是被镶嵌在电路板上。

整体来看，AI 电源的架构从供电次序的角度来看主要分为三级：UPS—AC/DC—DC/DC。在数据中心的电力从电网传输到加速器芯片的过程中，电压要从 1-3 万伏特降低至 0.5~1 伏特以供芯片使用，其中电源主要指 AC/DC 与 DC/DC 部分。AC/DC 环节的输入是 PDU 输入的交流电，经过降压、整流两个过程最终输出 12V 直流电，此后再经过层层降压以达到芯片的工作电压（AI 服务器因为耗电大,为减少损耗所以可能选择先输出较高的 50V/48V 电压）。DC/DC 环节则进一步将电压调降至芯片可用电压，一般而言是将 12V 降至 1V 或 0. 8V，若整体服务器功耗较大，也可能是先从 50V/48V 降至 12V，再从 12V 降低至 1V 或 0.8V。

核心看，伴随服务器（尤其是 AI服务器）功耗总额的快速提升，在 OCP ORV3 标准限制下服务器电源必须通过提升功率密度并维持高能源转化率（钛金 96%以上）以满足服务器运转需要。更好的材料、更优的拓扑、更多的集成是功率密度提升的主要途径，因此电源行业不仅享受了总功耗提升带来的需求快速上行，同时也因为材料变更、散热需求加强等因素带来了单瓦特价格提升现象，并助力行业空间快速扩容。此外，考虑到近期大陆区域外流片难度加大，伴随大陆区域流片芯片占比增加，电源功耗需求有望呈现进一步提升趋势。

从实际配置角度看，服务器整机品类繁多，不同服务器芯片配置方案不同。以 DGX 系列为例，DGX A100 整机功耗上限 6.5KW，DGX H100 整机功耗上限 10.2KW，NVL 72 整机功耗 120KW。伴随单电源功耗总额快速上升，电源功率密度也处于持续提升进程当中，考虑到功率密度的提升同时还伴随着单功耗价格的上升，市场空间快速扩容。

此外，伴随单机柜容纳 GPU 数量逐渐增多，机柜功耗总额快速提升（NVL 72 总功耗已达 120KW）。机柜类服务器占比的提升在三个层面对供电系统提出更高要求：1）更高性能的供电总线；2）更高压的交流与直流电（如 DC/DC 模块电压输入可达 800V，从而大幅减少发热损耗）；3）更低损耗的内部供电电路。从而使得电源获得了额外的溢价能力，市场空间更加广阔。

后续伴随海外 Rubin 架构芯片产品落地，服务器电源功率密度有望再次实现飞跃。近期，英伟达联合其他电器设备供应商，发布预定 2027 年落地的 800 V HVDC 数据中心电力基础设施计划，以用于支持 1 MW 及以上的 IT 机架。考虑到当前机柜式服务器中电源的溢价主要来自于空间的紧缺以及散热能力的提升，远期 1MW 机柜必将衍生出更高价值量的电源需求。

1.8 铜链接：超节点优势显著，铜连接趋势放量

在大模型训练过程中，包括多种并行计算方式，例如 TP（张量并行）、 EP（专家并行）、PP（流水线并行）和 DP（数据并行）。通常来说张量并行和专家并行需要较大的通信量，对大规模 GPU 集群的通信能力提出较高要求。GPU 集群的组网通常分为 Scale Up 和 Scale Out 两种拓展方式，Scale Up 向上扩展，也叫纵向扩展，增加单节点的资源数量。Scale Out 向外扩展，也叫横向扩展，增加节点的数量。Scale Out 网络提供 Tbps 级别的带宽，Scale Up 网络提供 10Tbps 带宽级别的互联，Scale Up 凭借通信速度更快、成本更低、方便运维成为发展重点，搭建超大带宽互联 16 卡以上 GPU-GPU 的 Scale Up 系统成为一个重要趋势，这样的 Scale Up 系统通常被称为超节点。

超节点作为重要的产业趋势已经被国内外众多服务器选为下一代方案，同时大部分的超节点方案都会采用铜连接作为主要承载载体。通信网络中常见的连接解决方案包括光通信和高速电通信，无源 DAC 作为电通信的主要解决方案其不包含光电转换器模块，具有很高的成本效益和运营可靠性，成为实现短距离传输的优秀解决方案。目前的铜缆已经实现 224G 以太网 Serdes 高速通信技术升级，短距离传输性价比突出，在 AI 服务器高集成度的趋势下，铜连接呈现一定的趋势放量。业界主流的超节点方案主要包括私有协议方案和开放组织方案两种，私有协议主要包括英伟达、Trainium 方案、华为方案等。在英伟达方案中，GB200NVL72 服务器采用大量的铜连接作为机柜内部通讯方式， GB200NVL72 机柜中不同的计算托盘间采用电缆进行互联，内部使用电缆长度累计接近 2 英里，共有 5000 多条独立电缆。计算托盘内同样采用大量铜连接作为服务器内的 GPU 芯片互联。GB200NVL72 服务器中包含三种铜缆：三种柜内线（NVL72 机柜以内的定义为柜内线）以及柜外线（机柜间的互联定义为柜外线）。计算托盘间的铜缆连接：单张 B200 对应 1 条 NVLink5.0 连接，每条传输双向 1.8TB/s 带宽，Serdes 对应的规格为 224Gbps 通信协议，铜缆也采用难度更高的 224Gbps 产品，即单张 B200 上面通常连接 72 个差分对（72 根线）即可以达到可支持的 1.8TB/s 的带宽。NVL72 单个 Rack 中共有 72 张 B200，可以得出需要 5184 根线（72*72），平均长度约 0.6 米，合计 5184*0.6=3110 米，考虑背板线主要采用高端的 26AWG 型号的线，单价按照 9 元/米计算，则单个 NVL72 机柜中背板线高速铜线价值量为 27994 元/台。

交换机内部互联：NVSwitch 芯片全部通信带宽连接背板连接器，总共需要 5760 根 overpass 线，每根 0.3 米，9 个交换托盘合计 1728 米，单价按照 7 元/米计算，则合计 12096 元/台。在 NVL36 解决方案中，NVSwitch 芯片一方面连接背板连接器，一方面连前端 I/O 端口，其中连接背板连接器的 OverPass1 线共 2880 根，每根 0. 3 米；连接前端 I/O 端口的 OverPass2 线目前为 1440 根，每根 0.5 米，9 个交换托盘合计也为 1584 米，单价按照 7 元/米计算，则合计 11088 元/台。计算托盘内部：由 PCIE线实现 CPU 与 I/O 端口之间的互联，单个 tray 预计 0.4*16*8*4=205 米，NVL72 合计 18 个 tray 盘，则合计为 205*18=3690 米。单价按照 2.5 元/米计算，则价值量为 9216 元。 X800 交换机内部：内部高速线总数为 1152 根，长度 0.5 米，单价按照 7 元/米计算，则价值量为 4032 元。

英伟达服务器市场规模测算：考虑到 2025 年 NVL36、NVL72 机柜整体出货量（NVL72 预计 3 万台以及 NVL36 1.5 万台），铜缆高速线市场就达到 38 亿+。考虑到 2026 年 NVL36、NVL72 机柜整体出货量（NVL72 预计 9 万台），铜缆高速线市场就达到 70 亿+，保持高速增长。在 AWS 的 Trainium2 中，Scale up同样采用铜连接方案。每台服务器单元包括 64 个 Trainium2 芯片（跨两个机架）连接在一起，形成一个 4x4x4 三维环面的单一扩展世界大小，称为 Trainium2-ultra，同样采用 DA C 和 AEC 方案。

在开放协议中，目前的开放标准不止一个，基本上都是以以太网技术（ETH）为基础，以太网技术最成熟、最开放，也拥有最多的参与企业。在超节点开放标准中，其中比较有代表性的，是由开放数据中心委员会（ODCC）主导、中国信通院与腾讯牵头设计的 ETH-X 开放超节点项目。在 ETH-X 的架构中，分为 Scale-up 和 Scaleout 两个主要组网部分，其中 Scale-up 网络负责 HBD 内部 GPU 与 GPU 之间的互联， HBD 可以由一个或者多个高功率 Rack 组成，通过 Scale-up 进行扩展；多个 HBD 通过 Scale-out 的扩展方式组成更大的 GPU 集群。国内字节、阿里、腾讯新一代服务器分别采用超节点设计，预期将进一步带动铜连接整体市场空间。

1.9 国产算力：替代趋势较为明确，生态能力逐步完善

中期维度看，订单向国产芯片倾斜是必然趋势。由于美国政府芯片法案多轮制裁，英伟达旗舰芯片向中国的售卖持续受阻，从 2022 年的片间互联、23 年的算力以及算力密度限制、到 2025 年初的 1700GB/s 通信带宽限制，英伟达产品被迫多次进行阉割，竞争力持续下降。云厂商以及人工智能初创公司基于算力稳定供应诉求，将更多算力采购规划倾斜向国产芯片，并且比重不断加大。目前看伴随国产先进制程逐渐成熟，低端版英伟达芯片在国内将不再是具有性价比的采购选项，国产算力市占率大幅抬升时机已经成熟。

目前国产芯片市场集中度提升趋势明显。由寒武纪、华为为代表的芯片公司凭借强大的技术实力、优异的产品性能、以及前线业务资源的大量投入，最先实现商业化客户业务的成功落地，在大模型推理算力建设中贡献大量算力；以天数智芯、沐曦、昆仑芯为代表的创业公司也在奋起直追，通过良好的产品性能以及性价比，争取大规模商业化客户成单机会，近期可以观察到国内芯片厂商纷纷投入大量人力物力资源，尝试与多家头部互联网客户进行业务绑定。

国内芯片生态建设分为两大路线，一条是以天数智芯、沐曦、海光等主打 GPGPU 路线，追求与英伟达的 CUDA 兼容，实现兼容性与通用性提高，在客户处实现迁移成本与迁移时间大幅度下降，在英伟达的生态圈内抢占市场。后续 CUDA 升级或模型升级，CUDA 兼容路线软件栈同样需要更新升级以适配，长期跟进对人力消耗较大；另一条则是以华为的 Mindspore 为代表的自主生态，试图在英伟达生态圈外建立单独生态圈，与英伟达进行竞争。其后续突围能力，除技术成熟度外，更多考量产品出货量与基于 Mindspore 开发的研发人员数量，对长期持续投入具有较高要求。

1.10 估值分析及展望

从当前视角看，中美权益市场（美股纳斯达克 100 指数更具代表意义）整体均处于过往十年估值分位数高位，但 A 股绝对估值仍有一定提升空间。2025 年 11 月 7 日，Wind 全 A 整体 PE 估值达到 22.24，估值分位数为 89%，纳斯达克 100 指数整体 PE估值达到 34.02，估值分位数为 88.2%，绝对估值层面 A 股仍处于相对低位。从细分科技视角看，与非大陆区域科技公司对比，同领域大陆公司具备更高估值水平，但考虑到国内科技产业仍处于发展初期，长期业绩增速仍具有较大提升空间，伴随后续业绩兑现逐步落地，长期高估值维持或将成为可能，并驱动后续市值体量持续上行。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）