推广 热搜: 采购方式  滤芯  带式称重给煤机  甲带  气动隔膜泵  减速机型号  无级变速机  链式给煤机  履带  减速机 

收藏级——液冷冷板深度研究报告

   日期:2026-05-29 11:21:23     来源:网络整理    作者:本站编辑    评论:0    
收藏级——液冷冷板深度研究报告

1. 研究背景与范围

随着AI大模型训练与推理需求的爆发式增长,数据中心单机柜功率密度已从传统的30kW/柜攀升至100-200kW/柜,部分超算集群甚至突破500kW/柜。传统风冷散热方案触及35kW/机柜的散热天花板,液冷技术成为高密度算力场景的唯一可行选择。

冷板式液冷(Cold Plate Liquid Cooling)因其技术成熟度高、改造成本可控、兼容现有服务器架构等优势,在液冷市场中占据约65%-70%的份额,是当前落地最广泛的液冷技术路线。冷板作为热传导路径中的核心组件,其性能直接决定了整个液冷系统的散热效率与可靠性。

研究范围:本报告聚焦于数据中心应用场景下的液冷冷板技术,覆盖单相/两相冷却体系,不涵盖浸没式液冷、喷淋式液冷等其他技术路线的冷板结构。 

2. 冷板工作原理

2.1 基本传热路径

冷板式液冷遵循"芯片-界面-冷板-冷却液"的四级传热路径:

1.芯片发热: CPU/GPU等发热元件工作时产生大量热量,芯片表面热流密度可达100-500 W/cm²。

2.界面传导:通过导热界面材料(TIM)填充芯片与冷板之间的微隙,降低接触热阻。

3.冷板导热:热量经冷板金属基体(铝/铜)传导至内部流道壁面。

4.对流换热:流道内的冷却液流过壁面时通过对流换热吸收热量,最终由流体带出系统。

2.2 单相 vs 两相冷却对比

对比维度

单相冷却

两相冷却

工作原理

冷却液始终保持液态,依靠显热吸热

冷却液在冷板内沸腾相变,利用潜热吸热

散热能力

热流密度 100-300 W/cm²

热流密度 300-800+ W/cm²

冷却液类型

去离子水、乙二醇水溶液

介电氟化液(3M Novec等)

系统复杂度

中低

中高(需气液分离、冷凝回流)

适用场景

当前主流数据中心(80%+应用)

超算、极高功率密度芯片

3. 冷却对象定位分析

在标准服务器节点中,冷板并非覆盖所有元件,而是选择性冷却最高热流密度的区域。以下是冷板覆盖的目标清单:

冷却目标

典型功耗

热流密度

优先级

GPU(核心)

700-2000W

200-500 W/cm²

强制

CPU(中央处理器)

350-500W

100-200 W/cm²

强制

VR/VRM(电压调节模块)

50-150W

50-100 W/cm²

建议

HBM(高带宽内存)

30-60W(每堆叠)

30-60 W/cm²

建议

DDR5/LPDDR(内存条)

10-15W(每DIMM)

10-25 W/cm²

可选

NVSwitch/交换芯片

200-400W

50-100 W/cm²

建议

光模块(800G/1.6T)

15-30W

高热密度局部热点

可选

工程要点:实际工程设计中,GPU/CPU冷板为必装组件;VR/HBM冷板通常与GPU冷板集成设计为一体化模组;对于超过40kW/机柜的场景,建议内存也纳入冷板覆盖范围。 

4. 冷板结构形式详解(含图文)

液冷冷板看似只是一块带有进出液口的金属板,但其内部流道的几何设计与制造工艺直接决定了热阻、压降、可靠性和成本。截至2026年5月,工业界主流文献与专利实践中可归纳为六大类结构形式。

4.1 冲压 + 钎焊冷板

在薄铝板上冲压出流道凹槽,叠放盖板后经真空钎焊密封。典型厚度3-8mm,流道截面为半圆形或矩形,宽度2-6mm。可处理热流密度50-150 W/cm²。模具投入期4-12周,量产单件成本20-60元。

优势:大批量成本低、厚度薄、适合中等热流场景。劣势:通道几何受限、性能上限较低。

4.2 CNC铣削(机加工)冷板

/铜块整体铣削流道后经钎焊或扩散焊密封。最小流道宽度可达0.5-1.0mm。可处理热流密度150-300 W/cm²。设计自由度完全自由,可实现蛇形、并联、分形等多种流道形式。单件成本100-500元。

优势:几何自由度最高、性能优、适合打样/中小批量。劣势:材料浪费大、铜材加工周期长。

4.3 嵌入式(圆形)管冷板

铜管弯曲成型后嵌入底板凹槽中,通过灌封或焊接固定。管径4-12mm(常用6-8mm)。可处理热流密度30-80 W/cm²。无需模具投入,是成本最低的结构方案。

优势:成本最低、工艺简单、交付最快。劣势:热阻高、均匀性差、灌封胶长期老化风险。

4.4 挤压扁管(型材)冷板

铝合金挤压成型(内带4-12孔阵列),切割至所需长度后端部封堵。可处理热流密度50-150 W/cm²。大批量成本低、内部流道均匀、材料浪费少。

优势:经济实惠、浪费少、内部几何形状一致。劣势:仅适用于长条形结构、歧管设计受限。

4.5 梳状翅片(铲齿/削面)+ 钎焊冷板

在基板表面刮削/冲压形成高密度薄翅片(厚度0.15-0.5mm,密度8-15片/cm),盖板钎焊密封。表面积增量可达3-8倍。可处理热流密度200-400 W/cm²。

优势:极高换热面积、适合高热流场景。劣势:工艺复杂、钎焊质量敏感。

4.6 压铸 + 摩擦搅拌焊接(FSW)冷板

高压压铸成型腔体后使用FSW固态焊接密封。可成型三维立体复杂流道。FSW焊缝强度达母材80-95%。可处理热流密度150-350 W/cm²。模具投入极高(20-50万元)。

优势:复杂一体成型、结构强度高。劣势:模具成本极高、限于特定铝合金。

4.7 前沿:3D打印微通道冷板

2026年技术热点:金属3D打印(SLM/EBM技术)成为下一代微通道冷板的核心制造路线。通过拓扑优化算法设计的仿生流道(分形树状结构、螺旋流道),可将冷却液与热源接触面积提升3-5倍。广东微控智能装备已实现0.04mm级微通道的批量制造突破。2025年全球市场约13.91亿元,预计2032年达26.68亿元(CAGR 7.3%)。 

5. 冷却介质体系

冷却液是冷板系统的"血液",其选择直接影响散热效率、系统材料兼容性和维护成本。以下是四大类冷却液的对比:

类型

导热系数 (W/m·K)

比热容 (kJ/kg·K)

优势

劣势

去离子水

0.60

4.18

导热最优、成本最低

导电、需杀菌、0°C结冰

乙二醇水溶液(20-50%)

0.35-0.45

3.2-3.8

防冻、抗腐蚀

导热下降20-30%

丙二醇水溶液

0.30-0.40

3.0-3.6

食品级安全

导热性更低

介电氟化液

0.06-0.07

1.0-1.3

绝缘、两相冷却

导热仅水1/10、价格极高

碳氢合成油

0.12-0.15

1.8-2.2

绝缘、宽温域

导热性中等

工程建议:对于绝大多数数据中心冷板系统,去离子水 + 缓蚀剂 + 杀菌剂是性能与成本最优的组合。仅在室外管路或0°C以下环境才需要切换至乙二醇水溶液。 

6. 供液温度设计规范

供液温度的设计直接影响冷板散热能力、系统能效(PUE)和凝露风险。以下是基于ODCC、ASHRAE和主要设备厂商设计规范的推荐值:

参数

单相冷板系统

两相冷板系统

CDU二次侧供液温度

18-25°C(典型22°C)

35-45°C

CDU二次侧回液温度

35-45°C

45-55°C

冷板进出口温差

10-15°C

5-10°C(相变主导)

防凝露要求

供液温度≥ 机房露点 + 3°C

通常高于露点,风险低

水温波动

±1°C

±1.5°C

二次侧流量(单GPU 700W)

0.8-1.2 L/min

0.3-0.5 L/min

ASHRAE液冷分类等级(W1-W5)中,W1级供液温度18-27°C(对应冷水机组),W5级供液温度18-60°C(对应全自然冷却+余热回收,PUE <1.05)。工程设计建议供液温度设定在22-28°C之间的最优点,实现散热能力与PUE的平衡。

7. 散热性能指标

冷板热阻(微通道/CNC方案):0.01-0.05K/W

热流密度(3D打印微通道):500-1000+W/cm²

单板极限功率(MLCP+两相):2000-5000W

7.1 冷板材料导热系数

材料

导热系数 (W/m·K)

相对成本

推荐场景

铝合金 6061

167

1.0x(基准)

成本敏感、中低功率

铝合金 6063

201

1.1x

挤压型材冷板

铝合金 1050

222

1.2x

高导热铝冷板

纯铜 C11000

391

3-4x

高性能GPU冷板

铜合金 C18150

325

4-5x

高强铜冷板

金刚石铜复合材料

500-700

15-30x

2026年新兴方向

7.2 不同冷板方案散热能力对比

冷板类型

热阻 (K/W) @2L/min

热流密度 (W/cm²)

单板可承受功率

冲压钎焊铝冷板

0.08-0.12

50-150

300-600W

CNC铣削铜冷板

0.03-0.06

150-300

700-1200W

梳状翅片铜冷板

0.02-0.04

200-400

1000-1800W

3D打印微通道铜冷板

0.01-0.02

500-1000+

1500-3000W

两相冷板(氟化液)

0.005-0.015

400-800+

1200-2000W

最佳导热能力:截至2026年5月,3D打印铜微通道冷板在实验室条件下已达1000+ W/cm²的热流密度处理能力(广东微控 0.04mm微通道方案),NVIDIA要求的MLCP量产目标为 >500 W/cm²,用于其下一代Rubin(2000W级)和Feynman芯片平台。 

8. 产业格局与厂商研究

8.1 国际主流冷板厂商

厂商

总部

核心产品

客户/定位

CoolIT Systems

加拿大卡尔加里

DLC冷板、CDU

Dell/HP/Lenovo OEM供应链

Asetek

丹麦(春秋电子收购)

服务器DLC冷板、机架CDU

全球服务器OEM、HPC

Boyd Corporation

美国

Aavid系列冷板

工业/军工/数据中心

Laird Thermal

美国

定制化冷板

通信/数据中心

Wieland

德国

微通道冷板

欧洲工业/数据中心

8.2 中国大陆冷板厂商格局

厂商

股票代码

核心能力

主要客户/定位

英维克

002837

液冷全链条(冷板+CDU+管路)

三大运营商、互联网大厂

飞荣达

300602

两相液冷冷板模组

NVIDIA供应链认证

高澜股份

300499

纯水冷却、电力电子液冷板

电力/数据中心/新能源

东山精密

002384

精密钣金+液冷板冲压

通信/数据中心结构件

三花智控

002050

微通道换热器、液冷阀件

全球制冷龙头

银轮股份

002126

铝钎焊冷板、换热器

汽车+数据中心双赛道

春秋电子(Asetek)

603890

收购Asetek+液冷板

AI服务器液冷全球OEM

广东微控

非上市

0.04mm微通道冷板

高精度液冷板制造

产业催化剂:NVIDIA于2025年Q3正式要求其液冷供应商加速开发MLCP技术,以满足Rubin(2000W级)和Feynman下一代GPU平台的散热需求。这直接推动了微通道技术的加速迭代和中国厂商进入NVIDIA供应链的进程。 

9. 技术瓶颈与痛点

冷板技术在向更高功率密度演进的过程中仍面临以下八大核心瓶颈:

9.1 微通道加工精度与成本矛盾

传统CNC铣削无法加工<0.3mm的微通道;EDM加工成本极高(单件>2000元);3D打印虽可制造<0.1mm通道,但表面粗糙度(Ra 5-15μm)增加了流阻和结垢风险。

9.2 流道腐蚀与结垢

水基冷却液在长期运行中(>3年)对铝制流道产生电化学腐蚀,特别是异种金属接触处的电偶腐蚀。结垢导致热阻上升、压降增加,系统效率平均每年衰减2-5%。

9.3 TIM界面可靠性

传统导热硅脂在>150W/cm²热流密度下寿命显著缩短(从5年降至1-2年)。液态金属TIM对铝的腐蚀问题尚未完全解决。

9.4 密封可靠性

真空钎焊气孔率需控制在<0.5%;冷板与管路间O型圈在热循环中老化加速,建议每3-5年更换。

9.5 流量分配不均

多芯片冷板组(如NVIDIA NVL72系统)中,并联流道的流量分配不均会导致部分芯片温度偏离目标值>10°C。

9.6 供液温度-凝露-散热三角矛盾

提高供液温度可降低PUE但散热能力下降;降低供液温度可增强散热但可能低于机房露点导致凝露风险。

9.7 金刚石铜规模化瓶颈

导热系数达500-700 W/m·K,是传统铜的1.5-1.8倍,但制备成本高(>3000元/kg)、加工难度大。

9.8 标准化缺失

冷板接口尺寸、流道设计参数、测试标准尚未统一,用户更换供应商或扩容时面临兼容性风险。ODCC正推动《电子信息设备用液冷冷板技术规范》制定。

10. 工程选型建议

10.1 冷板选型决策矩阵

场景

推荐冷板类型

推荐材质

推荐冷却液

供液温度

通用服务器CPU (200-400W)

冲压钎焊/CNC铣削

Al 6061

去离子水

20-25°C

AI推理GPU A100/H200 (350-700W)

CNC铣削铜/梳状翅片

Cu C11000

去离子水+缓蚀剂

20-25°C

AI训练GPU B200 (700-1200W)

梳状翅片铜/3D打印微通道

Cu/Cu-Diamond

去离子水+缓蚀剂

22-28°C

下一代Rubin (1500-2000W)

MLCP/3D打印微通道

Cu/Cu-Diamond

去离子水/两相工质

25-30°C/38-42°C

边缘/低功耗 (50-200W)

嵌入式管/挤压扁管

Al

去离子水

18-22°C

10.2 工程设计检查清单

1.热设计目标:芯片结温≤ 85°C(GPU)/ 90°C(CPU),冷板进出口温差 ≤ 15°C

2.流量确定: Q = P / (ρ × Cp × ΔT),ΔT通常取10-15°C

3.压降限制:单冷板压降≤ 30kPa(推荐15-20kPa)

4.防凝露校验:供液温度≥ 机房露点温度 + 3°C安全余量

5.材料兼容性:所有接触冷却液的部件需进行1000小时腐蚀测试

6.密封验证:出厂前100%进行氦检漏(泄漏率 < 1×10⁻⁸ Pa·m³/s)

7.冗余设计: A级数据中心液冷系统N+1 CDU配置

8.运维预留:预留供液温度/流量/压差在线监测接口

关注我们获取更多精彩内容

麦麦展.8月深圳展位、演讲、参会咨询:袁经理 15221898851

好文推荐—点击下方文字

图文解说——液冷产业链全景图解
英伟达 Rubin GPU “散热危机” 与 3D打印纯铜液冷板让芯片散热进入“1%”能耗时代
英伟达 Rubin GPU 设计调整!
台链锁定 NV:10 家台湾液冷核心厂 + 20 家大陆代工厂全揭秘,谁在掌控 GB300/Rubin 万亿产能命脉?
微通道冷板+镀金散热盖——英伟达 Rubin/VR200散热及供应链重构
英伟达液冷CDU供应链企业
免责声明:资料来源网络,我司整理,信息真实性,也乐于分享。如有侵权或涉及版权等问题,请第一时间联系我司 15221898851 进行删除处理,谢谢!
 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON