第一章 前言与行业综述
随着人工智能大模型训练、高性能计算(HPC)、5G/6G通信及工业互联网的爆发式增长,全球算力需求呈指数级上升。CPU/GPU/NPU等核心芯片的热设计功耗(TDP)持续攀升——英伟达H100单卡达700W,B200突破1000W,下一代Vera Rubin平台单卡TDP预计超2000W,单机柜功率密度已从传统数据中心的3~5kW/柜跃升至30~120kW/柜,部分AI训练集群NVL72机柜突破200kW。

传统风冷散热在物理层面面临空气比热容低、风道阻力大、风扇功耗高等瓶颈,当单机柜功率超过20~30kW后风冷方案能效急剧恶化,PUE(电源使用效率)往往达1.5以上且难以再降。在此背景下,液冷技术(Liquid Cooling)凭借液体比热容约为空气1000倍、导热系数约为空气25倍的优异热物理性能,成为高密度算力场景下的刚需散热方案,也是各国"双碳"目标下数据中心PUE硬约束(≤1.25或更低)的唯一合规路径。
本白皮书旨在系统梳理液冷技术原理、主流路线、行业应用场景、经济性与能效表现、产业链格局及发展趋势,为算力基础设施建设者、IDC运营商、行业用户及产业从业者提供决策参考。
第二章 液冷技术路线详解
液冷技术按换热方式可分为冷板式液冷(Cold Plate / Direct-to-Chip)、浸没式液冷(Immersion Cooling)和喷淋式液冷(Spray Cooling),此外还有处于研发阶段的芯片内置微通道液冷及两相流相变液冷。
2.1 冷板式液冷(间接液冷)
原理:在CPU/GPU等高功耗芯片表面通过导热界面材料(TIM)贴合带有内部微通道的金属冷板(通常为铜或铝),去离子水或水-乙二醇溶液在冷板内循环带走热量,经CDU(Coolant Distribution Unit,冷却分配单元)与外部冷源换热后排走。非核心发热部件(内存、电源、网卡等)仍可保留风冷辅助。
技术特点:
•对现有服务器架构改动最小,只需更换冷板扣具与管路,兼容存量机房;
•初期改造/建设成本较低,是当前商业化最成熟、市场占有率最高的路线(约占国内液冷数据中心市场80%~85%);
•支持单机柜30~80kW散热,微通道强化冷板可延伸至100kW+;
•PUE可达1.10~1.25,部分温水冷却方案可达1.08~1.15;
•存在漏液风险,需配备漏液检测与快速切断装置。
细分演进:单相冷板(目前主流);泵驱两相冷板(利用工质相变潜热,换热系数更高,适合下一代超高热流密度芯片,部分国内厂商已实现单芯片解热>2500W)。
2.2 浸没式液冷(直接液冷)
原理:将服务器主板、CPU/GPU、内存等整体浸入绝缘冷却液中(通常为电子级氟化液或合成烃类油),发热元件直接与液体接触传热。按冷却液工作状态分为:
•单相浸没式:冷却液始终为液态,经外部换热器冷却后循环回槽;
•两相浸没式:低沸点冷却液吸热沸腾气化,蒸气在顶部冷凝盘管凝结回流,利用汽化潜热极大提升换热效率。

技术特点:
•散热能力极强,支持单机柜100~300kW甚至更高,适合万卡级AI训练集群、国家级超算;
•服务器全浸没可实现"零风扇"运行,机房噪声<20dB,PUE低至1.03~1.10;
•绝缘冷却液成本较高(特别是全氟聚醚类氟化液),初期CAPEX约为风冷2~4倍;
•需专用密封槽体、补液系统及严格的材料兼容性测试(密封圈、PCB阻焊层、塑胶件等);
•设备维护需从液中取出,运维习惯差异大。
2.3 喷淋式液冷
原理:通过精密喷嘴将绝缘冷却液直接喷洒至芯片或高发热器件表面,吸热后沿重力回流至底部收集箱过滤冷却循环。介于冷板与浸没之间,冷却液用量较浸没式少约60%。
技术特点:
•适合瞬态高热冲击场景(AI推理突发负载、刀片服务器局部热点);
•改造灵活,无需整机浸泡;
•喷嘴有微量堵塞风险,市场占比较小(<5%),属细分补充方案。

2.4 三大路线对比
对比维度
冷板式液冷
浸没式液冷(单相/两相)
喷淋式液冷
散热上限(单机柜)
30~100kW+(微通道可达更高)
100~300kW+
50~120kW
典型PUE
1.10~1.25
1.03~1.10
1.08~1.15
初期成本
低~中(适配存量)
高(需专用槽体+冷却液)
中
运维难度
低(近似风冷)
中(需换液/取放设备)
中(喷嘴维护)
适用场景
存量改造/通用AI推理/运营商IDC
超高密AI训练/超算/新建绿色园区
边缘计算/瞬态热冲击
当前市场占比(国内)
≈82%~85%
≈13%~15%(快速提升)
<3%
第三章 液冷行业应用场景
3.1 互联网与云计算数据中心(核心场景)
大型云服务商(阿里云、腾讯云、华为云、AWS等)及互联网企业部署大规模GPU/TPU集群用于大模型训练与推理,单机柜密度普遍≥50kW。冷板式液冷因其改造成本可控成为推理集群与部分训练集群首选;浸没式液冷在头部云厂的超高密度训练池试点(如阿里云张北数据中心浸没式液冷集群),实现PUE≈1.09及服务器部件失效率显著降低。
三大运营商(中国移动/联通/电信)在"东数西算"枢纽节点新建智算中心已明确液冷标配要求,2026年起多个集采项目覆盖冷板、CDU及浸没式系统。
3.2 超算与科研计算中心
国家级超算中心(如"神威""天河"系列后续机型)及高校科研HPC集群,因CPU/GPU密集型长时间满载运行,对散热均匀性和温控精度要求极高。浸没式液冷或冷板+浸没混合方案可有效抑制热斑、减少因温度过高引起的降频(Thermal Throttling),保障持续峰值算力输出。
3.3 金融与政府涉密数据中心
银行、证券及政务云数据中心强调高可靠、低故障率与绿色评级。冷板式液冷因运维模式接近传统风冷、风险可控,成为此类场景改造主流;部分新建绿色金融数据中心试点全液冷方案以满足LEED/绿色建筑认证及地方PUE考核。
3.4 新能源与储能系统液冷
大型集装箱式电化学储能电站电芯一致性要求高,温差过大会加速老化甚至引发热失控。液冷储能温控较风冷可将电池包温差控制在±2~3℃以内(风冷通常±5℃以上),显著延长循环寿命,已成为2024年后新建大型储能项目的标配方案。

3.5 新能源汽车超充与车载热管理
600kW及以上液冷超充枪采用内置冷却液循环管线,解决大电流充电时枪线及模块过热问题,实现"充电5分钟续航300km"体验;车载三电系统(电机/电池/电控)及智能座舱高算力芯片(智驾SoC)也逐渐引入微型液冷回路。
3.6 工业与高端装备
•特高压换流阀/大功率电力电子:IGBT模块液冷散热确保大功率变流设备稳定运行;
•大型医疗影像(CT/MRI):高功率X射线管及梯度线圈液冷保证成像质量与设备寿命;
•工业激光加工:光纤激光器泵浦源及晶体需精密液冷控温;
•5G/6G基站AAU:部分高功率宏基站引入液冷散热模块降低噪声并缩小体积。
第四章 能效分析与全生命周期经济性
4.1 PUE与绿色指标
•风冷典型PUE:1.40~1.80(老旧机房可达2.0);
•冷板式液冷PUE:1.10~1.25(采用自然冷却/温水冷却可逼近1.08);
•浸没式液冷PUE:1.03~1.10(两相浸没最优可达1.02~1.04);
•WUE(水利用效率):液冷可大幅减少或取消加湿/蒸发冷却用水,适合缺水地区。
液冷数据中心较风冷年均节电率可达30%~50%,单兆瓦IT负载年节电量约200万~300万kWh,折合碳减排1500~2400吨CO₂e(按0.75kg/kWh折算)。
4.2 TCO(总拥有成本)分析
成本项
风冷
冷板式液冷
浸没式液冷
CAPEX(初设+设备)
基准
+20%~40%(改造)/ +40%~60%(新建)
+100%~200%
OPEX(制冷电费/年)
基准
-30%~40%
-40%~50%
冷却液更换/维保
低(水基定期补水防腐)
中~高(绝缘液定期过滤再生/补充)
服务器寿命影响
正常
略有提升(低温运行)
明显提升(恒温±1~2℃,无粉尘)
投资回收期
通常2~4年(视电价与负载率)
3~6年(高电价区更短)
注:浸没式液冷虽初投高,但在高电价地区、超高密场景(≥100kW/柜)及需极低PUE拿绿色补贴的项目上,全生命周期TCO可追平甚至优于风冷。

第五章 液冷产业链与市场竞争格局
液冷产业链可分为上、中、下游三层:
5.1 上游——核心零部件与材料
•冷板/微通道冷头:精密铜/铝合金加工,代表企业包括国内外ICT温控厂商及专业钎焊加工厂;
•CDU(冷却分配单元):含循环泵、过滤器、换热器、膨胀罐、自控系统;
•快速接头(QD/盲插接头):关键可靠性部件,要求无滴漏、耐多次插拔;
•冷却液:
水基(去离子水+缓蚀剂):冷板式主流,成本低;
合成烃类油(白油/PAO):单相浸没式常用,成本适中;
氟化液(全氟碳化合物/全氟聚醚):两相浸没及高端冷板,性能最优但单价高,国产替代加速(3M退出部分市场带来机遇);
•密封材料/管路/传感器/漏液检测系统。
5.2 中游——液冷系统设计与集成
提供整机柜液冷服务器、液冷机柜、CDU及外围冷源(干冷器/冷水机组/自然冷却塔)的一体化方案。国内代表企业:英维克(冷板+浸没双线)、曙光数创(浸没式龙头)、申菱环境(运营商集采核心)、高澜股份(双线布局)、同飞股份、依米康等;海外代表:Vertiv、Schneider Electric、STULZ、Motivair等。
5.3 下游——终端用户
•云服务商/互联网巨头(自建或租用)
•三大运营商及广电网络
•金融/政府/央企数据中心
•超算中心/科研院所
•储能集成商/充电桩运营商/工业用户
2025年中国液冷数据中心市场规模约159.8亿元(+45.2% YoY),预计2026年达232.5亿元,2028年突破470亿元;全球市场2026年预计超百亿美元,液冷在AI数据中心渗透率2026年有望突破40%。

第六章 政策标准与行业规范
•中国:《新型数据中心发展三年行动计划(2021-2023)》及后续延续文件要求新建大型数据中心PUE≤1.3,国家枢纽节点≤1.25;工信部《数据中心能效提升行动计划(2026-2028)》草案拟要求新建大型/超大型PUE≤1.1;中国信通院、工信部电子标准院已立项多项液冷行业标准(冷板接口尺寸、冷却液兼容性、CDU安全规范等),三大运营商联合发布《一体化全栈液冷技术白皮书》。
•欧盟:《能源效率指令》(EED)要求2026年后新建数据中心PUE<1.3,部分成员国要求≤1.2;欧盟《绿色协议》推动液冷+余热回收耦合。
•美国:DOE(能源部)液冷加速计划,部分州(加州等)对高PUE征收差别电价。
•国际标准组织:IEC SC 48正在制定数据中心液冷系统安全标准;ASHRAE TC 9.9持续更新高密冷却技术指南。
第七章 挑战与制约因素
1.初期投资偏高:液冷单柜CAPEX为风冷2~3倍,中小企业改造意愿弱,存量替换慢于新建;
2.标准尚未完全统一:各厂商冷板扣具尺寸、QD接口、冷却液配方存在差异,跨品牌兼容性问题增加运维复杂度;
3.冷却液国产化与成本:高端氟化液此前依赖进口(3M Novec等),虽国产替代加速但大规模降本仍需时间;
4.漏液安全顾虑:83%的IDC运维方将漏液监测列为首要顾虑,需强化双重密封、压力传感与AI漏液预警;
5.运维人才缺口:液冷系统涉及流体力学、暖通、IT设备多学科交叉,专业培训体系待完善。
第八章 未来发展趋势展望
8.1 技术融合与芯片-散热协同设计
未来散热将与芯片设计深度绑定——英伟达Vera Rubin平台将100%全液冷写入芯片设计规范,英特尔至强6900系列推全域液冷认证。微流体冷却通道直接嵌入芯片封装(On-chip Microfluidics)是下一代研究方向,可将热流密度承受能力提至500W/cm²以上。

8.2 冷板主流化与浸没高阶化并行
未来3~5年冷板式液冷仍主导商业化落地(占80%+),浸没式液冷在万卡AI训练集群、超算中占比持续提升;两相冷板、微通道强化冷板缩小二者性能差距。
8.3 液冷+余热回收耦合
利用液冷回水温度较高(40~55℃)的特点,通过热泵提温后接入区域供暖/生活热水,实现"算力供热",欧洲已有多个项目落地,国内园区级试点启动。
8.4 国产供应链全面崛起
冷板、QD、CDU国产化率已较高;氟化液国产厂商(巨化、永太等)加速填补进口退场空白;整机厂(华为、曙光、浪潮、新华三)将液冷纳入标准服务器BOM,推动规模化降本。
8.5 多行业横向拓展
从数据中心向外辐射至储能、超充、高端制造、通信基站,液冷技术应用边界持续拓宽,"全场景液冷"成为热管理行业共识方向。

第九章 结语
液冷技术已从"可选增值配置"正式进阶为AI算力时代高密度场景下的基础设施刚需。在芯片功耗持续突破物理阈值与全球数据中心PUE严监管的双重驱动下,冷板式液冷将率先在存量改造与新建智算中心大规模铺开,浸没式液冷将在超高密度训练与超算领域树立绿色标杆。随着行业标准逐步统一、国产冷却液与核心部件成熟、规模效应带动成本下行,液冷产业将于2026~2030年进入全面放量期,成为绿色数字基础设施的核心支柱。
建议算力投资者与IDC运营商:新建项目按全液冷架构预留管路与承重设计;存量改造优先评估冷板式液冷ROI;超高密度AI训练池可试点浸没式液冷以获取极致PUE与更低设备故障率。


