液冷技术分类与发展驱动因素有哪些?

液冷技术分类与发展驱动因素有哪些?

最佳答案 匿名用户编辑于2025/07/25 10:18

冷板式液冷为当下主流,多线并进重构解决方案。

根据热器件是否与冷却液接触,液冷技术可以分为直接接触式和间接接触式两种。直 接接触式是指将冷却液体与发热器件直接接触散热,这类液体包括单相浸没式液冷、两相 浸没式液冷、喷淋式液冷;间接接触式是指冷却液体不与发热器件直接接触,通过散热器 间接散热,这类液体包括单相冷板式液冷、两相冷板式液冷。其中,室外侧包含室外冷 源、一次侧冷却液,室内侧包含冷量分配单元(CDU)、二次侧冷却液以及液冷机柜。该 液冷系统的基本原理是:二次侧冷却液在机柜内吸收设备热量,并通过 CDU 内的换热器 将热量传递给一次侧冷却液,一次侧冷却液通过室外冷源最终将热量释放到大气环境中, 完成散热。

根据冷却液在冷板中是否发生相变,冷板式液冷可以分为单相冷板和两相冷板。单相 冷板式液冷通过液冷板将发热器件的热量间接传递给液冷板中的二次侧冷却液。二次冷却 液在设备吸热和 CDU 放热过程不发生相变。根据液冷板覆盖范围,这种液冷可以分为局 部液冷或全液冷:局部液冷通常仅覆盖高功耗器件,一般带走设备 70%左右的热量,剩余 30%热量仍需通过机房空调或液冷背门以风冷的形式带走;全液冷需要根据通信设备硬件 架构和结构布局定制化设计液冷板,以覆盖所有发热器件。两相冷板不同的是二次侧冷却 液在设备内通过液冷板吸热发生汽化,在 CDU 内冷凝为液态,充分利用了冷却液的相变 潜热,综合散热能力更强,可达 300W/cm2 以上。

以单相冷板式液冷机柜为例,内包含分液器、液冷板、流体连接器、液冷管路、漏液 检测传感器等。1)二次侧冷却液:二次侧热量载体以去离子水、乙二醇水溶液、丙二醇水 溶液为主。2)单相冷板 CDU:可分为集中式和分布式。其中,集中式 CDU 布置在机柜 外,每列机柜布置一台或几台 CDU;分布式 CDU 安装在液冷机柜内,免二次侧管路部 署,可根据机柜功耗灵活部署。3)分液器:用于机柜内流量分配与收集,将低温二次侧冷 却液分配到各设备节点,并收集与液冷板换热升温后的冷却液。4)液冷板:液冷板设计需 要根据设备芯片功耗进行芯片冷板设计。5)流体连接器:可实现无泄漏通断,在设计选型 时需要综合考虑工作流量、温度、压力、流阻特性等。6)液冷管路:二次侧冷却液流通通 路,参与液冷机柜内各设备节点的流量-流阻分配。7)漏液检测传感器:针对沿液冷板、 液冷管路、分液器等可能出现液体泄漏的位置或路径布置,及时检测泄漏状态,并触发漏 液告警策略。

根据冷却液在换热过程中是否相变,浸没式液冷可以分为单相浸没和两相浸没。单相 浸没式液冷通过将发热元件浸没在冷却液中,直接吸收设备产生的热量。通信设备竖插在 浸没机柜内,二次侧低温冷却液由浸没机柜底部流入。二次侧冷却液在循环散热过程中始 终维持液相。两相浸没液冷二次侧冷却液在设备内吸热由液态转化为气态,通过冷凝器冷 凝放热由气态转化为液态。这种液冷技术充分利用液体的相变潜热,散热能力相比于单相 浸没显著提升。

喷淋式液冷是用低温冷却液直接喷淋 IT 组件的发热元件。热后的高温冷却液换热后 再次循环进入服务器喷淋,整个过程中无相变。它和浸没式液冷一样也属于接触式液冷, 差异在于喷淋式加强了对流换热。喷淋式与单相浸没式液冷比较类似,可当作一种特殊形 式的浸没液冷,因此喷淋式可以采用与单相浸没一样的冷却液。

单相液冷为当下主流,多条液冷技术路线快速发展,针对不同应用场景各具优势。单 相冷板式液冷在液冷数据中心的应用占比达 90%以上,是现阶段及未来一段时间业内主流 的液冷技术方案。单相浸没式液冷节能优势更突出,且近年来该技术逐步趋于成熟,相关 产业链快速发展完善,小规模商用不断推进。此外,喷淋式、两相冷板式、两相浸没式这 3 种液冷方案的技术研究和产业生态尚需完善。但于此同时,相关技术路线实际使用中存 在部分问题,如冷板式液冷水基工质泄漏导致设备短路烧毁;单相浸没式液冷散热能力受 液体流速约束,散热能力表现较弱,无法满足更高功耗 CPU/GPU 的散热需求;液冷系统 制冷量未随负载变化及时调控,导致节能收益不明显;现阶段液冷数据中心的建设成本高 等。

驱动因素一:芯片功率快速提升,风冷策略面对挑战。 英伟达新一代芯片功率密度较高,对散热基础设施提出颠覆式挑战。随着芯片算力的 快速发展,芯片的 TDP(Thermal Design Power)——散热功率的快速攀升。从英伟达 V100 到 GB200 的芯片散热功率的变化值来看,芯片散热功率很快达到 1200W 以上,甚至 更高。按照英伟达最新的计划,采用最新芯片架构的 GB200 算力模组,模组的散热功率达 到 5400W(两块 GB200),如此高的芯片功率密度,给 GPU 服务器的供电和散热等基础设 施提出了颠覆式的挑战。

单机柜平均功率快速增长,30kw 以上占比显著提升。据 CDCC 数据,2020-2024 年全 球单机柜平均功率从 8.4kw 增长至 14.7kw,其中单机柜功率达 30kw 以上的占比从 5%增长 至 17%,预计至 2026 年,单机柜平均功率将达到 19.4kw,单机柜功率达 30kw 以上的占比 则达到 29%。数据中心从 GPU 芯片到机柜的各个层级的功耗都呈现出显著的增长趋势, 其产生的热量也随之增加。

机架密度提升至 20kW 以上后使用液冷更具有效性。8kW 以上单机柜功率密度成为目 前新建数据中心的主流选择。为提升市场竞争力,市场通过升级改造的方式来提高单柜功 率密度。目前,通算最大功率密度已超过 30kW/柜,智算功率上升更快,已达 100kW/柜, 以目前市场最为先进的 GB200 整机柜产品 NVL72 为例,其一架机柜的 GPU 卡数量达到 72 张,总功率达到 132kW。整机柜功率密度的提升对机房制冷技术提出了更高的要求。传 统风冷系统受数据中心建筑面积与单位运营成本等因素的影响散热上限一般为 20kW/柜, 越来越难以为继。液冷技术采用液体替代空气作为冷却介质,将液体直接或间接接触发热 器件,可使散热效率大幅提升,能够有效满足单点、整机柜、机房的高散热需求。

驱动因素二:先进封装带来复杂热路径,传统散热策略失效。 先进封装带来高算力的同时,也导致了热量分布不均匀。热复杂性是指热量的积聚和 扩散路径的复杂性。除了“摩尔定律”外,“超越摩尔定律”是集成电路发展的另一技术路 线,即以多样化的封装方式提升系统性能。2015 年以后,集成电路发展进入“后摩尔时 代”,芯片特征尺寸已接近物理尺寸极限。因此,为满足 AI 加速器等高计算需求,支持多 芯片异构集成的先进封装技术成为发展趋势,例如台积电的 CoWoS 技术、英特尔的 Foveros 技术、苹果的 UltraFusion 技术。先进封装工艺通过紧密地堆叠各种组件,实现在 相同封装尺寸内集成更多功能和特性。然而当一个封装中集成了多个异构芯片时,电源路 径的长度和宽度会发生变化、不同芯片类型的热特性也存在差异,特别是叠加动态变化的 工作负载,更易导致热量分布不均匀现象,出现局部热点,从而使传统散热策略失效。

传统风冷基于稳态热阻模型设计,液冷更适应瞬态热冲击以保持芯片稳定性。以 NVIDIA 最新的 GB200 系列为例,其 B200 芯片采用了台积电的 CoWoS 封装技术,集成了 多个 H100/B100 逻辑 Die 与 HBM 堆栈。这些先进封装的特点是:多层堆叠结构(例如 TSV + HBM 堆栈);多芯片系统级集成(如 Chiplet 架构);更小的热通道、更长的热路 径;多种材料界面组成复杂热阻网络;热在这些路径中被反复折射、阻滞,每一层的材料 变化、每一次结构过渡,都是一个潜在的“热阻塞点”。而在微观层面,“界面热阻”成为决 定热管理成败的关键因素之一。一旦 TIM 失效或材料膨胀系数失配,轻则热阻增大,重则 直接导致封装层剥离、失效。简而言之,先进封装虽然带来了更高的计算密度,但也让热 更难“走出去”。传统散热系统(风冷、冷板)设计多基于稳态热阻模型,而现实中,瞬态 热冲击才是真正能压垮芯片稳定性的根源。这也是近年来微热管、微通道冷却结构、甚至 TSV 内集成液体散热等“近芯片冷却”方案被重新审视的原因。

GB300 单机柜液冷板及 UQD 数量大幅增长,设备价值量有望不断提升。以 GB200 NVL72 机柜为例,该机柜共有 18 个计算节点,每个计算节点对应 2 个 GPU 模组,1 个 GPU 模组对应 2 个 GPU 和 1 个 Grace CPU,而 1 个模组使用 1 个液冷板,假设液冷板单价为 500 美元,芯片用液冷板价值量为 1.8 万美元,加上 switch 使用的 9 个液冷板,机架 层面液冷板价值量为 2.43 万美元;另外 CDU、Manifold、UQD 价值量各为 3 万、1.2 万、 1.2 万美元,加上其他部分液冷总成本约为 7.91 万美元。而下一代 GB300 芯片由于采用了 独立液冷板设计,每个芯片配备单独的液冷板,因此液冷板和 UQD 数量大幅提升,计算 下来液冷总成本约为 9.5 万美元。而 2027 年推出的 Rubin Ultra NVL576 机架功率将达到 600KW,实现 100%液冷,甚至有望引入两相液冷技术,对液冷设备将提出更高要求。

参考报告

液冷行业分析报告:AI算力时代,液冷需求爆发.pdf

液冷行业分析报告:AI算力时代,液冷需求爆发。液冷介绍:冷板式液冷为当下主流,多线并进重构解决方案。液冷技术可以分为直接接触式和间接接触式两种,直接接触式包括单相浸没式液冷、两相浸没式液冷、喷淋式液冷;间接接触式包括单相冷板式液冷、两相冷板式液冷。多条液冷技术路线快速发展,针对不同应用场景各具优势,其中单相冷板式液冷在液冷数据中心的应用占比达90%以上,是现阶段及未来一段时间业内主流的液冷技术方案。单相浸没式液冷节能优势更突出,且近年来该技术逐步趋于成熟,相关产业链快速发展完善,小规模商用不断推进。此外,喷淋式、两相冷板式、两相浸没式这3种液冷方案的技术研究和产业生态尚需完善。驱动因素:芯片功...

查看详情
相关报告
我来回答