
1. 研究背景与范围
随着AI大模型训练与推理需求的爆发式增长,数据中心单机柜功率密度已从传统的30kW/柜攀升至100-200kW/柜,部分超算集群甚至突破500kW/柜。传统风冷散热方案触及35kW/机柜的散热天花板,液冷技术成为高密度算力场景的唯一可行选择。
冷板式液冷(Cold Plate Liquid Cooling)因其技术成熟度高、改造成本可控、兼容现有服务器架构等优势,在液冷市场中占据约65%-70%的份额,是当前落地最广泛的液冷技术路线。冷板作为热传导路径中的核心组件,其性能直接决定了整个液冷系统的散热效率与可靠性。
研究范围:本报告聚焦于数据中心应用场景下的液冷冷板技术,覆盖单相/两相冷却体系,不涵盖浸没式液冷、喷淋式液冷等其他技术路线的冷板结构。 |
2. 冷板工作原理
2.1 基本传热路径
冷板式液冷遵循"芯片-界面-冷板-冷却液"的四级传热路径:
1.芯片发热: CPU/GPU等发热元件工作时产生大量热量,芯片表面热流密度可达100-500 W/cm²。
2.界面传导:通过导热界面材料(TIM)填充芯片与冷板之间的微隙,降低接触热阻。
3.冷板导热:热量经冷板金属基体(铝/铜)传导至内部流道壁面。
4.对流换热:流道内的冷却液流过壁面时通过对流换热吸收热量,最终由流体带出系统。

2.2 单相 vs 两相冷却对比
对比维度 | 单相冷却 | 两相冷却 |
工作原理 | 冷却液始终保持液态,依靠显热吸热 | 冷却液在冷板内沸腾相变,利用潜热吸热 |
散热能力 | 热流密度 100-300 W/cm² | 热流密度 300-800+ W/cm² |
冷却液类型 | 去离子水、乙二醇水溶液 | 介电氟化液(3M Novec等) |
系统复杂度 | 中低 | 中高(需气液分离、冷凝回流) |
适用场景 | 当前主流数据中心(80%+应用) | 超算、极高功率密度芯片 |
3. 冷却对象定位分析
在标准服务器节点中,冷板并非覆盖所有元件,而是选择性冷却最高热流密度的区域。以下是冷板覆盖的目标清单:
冷却目标 | 典型功耗 | 热流密度 | 优先级 |
GPU(核心) | 700-2000W | 200-500 W/cm² | 强制 |
CPU(中央处理器) | 350-500W | 100-200 W/cm² | 强制 |
VR/VRM(电压调节模块) | 50-150W | 50-100 W/cm² | 建议 |
HBM(高带宽内存) | 30-60W(每堆叠) | 30-60 W/cm² | 建议 |
DDR5/LPDDR(内存条) | 10-15W(每DIMM) | 10-25 W/cm² | 可选 |
NVSwitch/交换芯片 | 200-400W | 50-100 W/cm² | 建议 |
光模块(800G/1.6T) | 15-30W | 高热密度局部热点 | 可选 |
工程要点:实际工程设计中,GPU/CPU冷板为必装组件;VR/HBM冷板通常与GPU冷板集成设计为一体化模组;对于超过40kW/机柜的场景,建议内存也纳入冷板覆盖范围。 |
4. 冷板结构形式详解(含图文)
液冷冷板看似只是一块带有进出液口的金属板,但其内部流道的几何设计与制造工艺直接决定了热阻、压降、可靠性和成本。截至2026年5月,工业界主流文献与专利实践中可归纳为六大类结构形式。

4.1 冲压 + 钎焊冷板
在薄铝板上冲压出流道凹槽,叠放盖板后经真空钎焊密封。典型厚度3-8mm,流道截面为半圆形或矩形,宽度2-6mm。可处理热流密度50-150 W/cm²。模具投入期4-12周,量产单件成本20-60元。
优势:大批量成本低、厚度薄、适合中等热流场景。劣势:通道几何受限、性能上限较低。
4.2 CNC铣削(机加工)冷板
铝/铜块整体铣削流道后经钎焊或扩散焊密封。最小流道宽度可达0.5-1.0mm。可处理热流密度150-300 W/cm²。设计自由度完全自由,可实现蛇形、并联、分形等多种流道形式。单件成本100-500元。
优势:几何自由度最高、性能优、适合打样/中小批量。劣势:材料浪费大、铜材加工周期长。
4.3 嵌入式(圆形)管冷板
铜管弯曲成型后嵌入底板凹槽中,通过灌封或焊接固定。管径4-12mm(常用6-8mm)。可处理热流密度30-80 W/cm²。无需模具投入,是成本最低的结构方案。
优势:成本最低、工艺简单、交付最快。劣势:热阻高、均匀性差、灌封胶长期老化风险。
4.4 挤压扁管(型材)冷板
铝合金挤压成型(内带4-12孔阵列),切割至所需长度后端部封堵。可处理热流密度50-150 W/cm²。大批量成本低、内部流道均匀、材料浪费少。
优势:经济实惠、浪费少、内部几何形状一致。劣势:仅适用于长条形结构、歧管设计受限。
4.5 梳状翅片(铲齿/削面)+ 钎焊冷板
在基板表面刮削/冲压形成高密度薄翅片(厚度0.15-0.5mm,密度8-15片/cm),盖板钎焊密封。表面积增量可达3-8倍。可处理热流密度200-400 W/cm²。
优势:极高换热面积、适合高热流场景。劣势:工艺复杂、钎焊质量敏感。
4.6 压铸 + 摩擦搅拌焊接(FSW)冷板
高压压铸成型腔体后使用FSW固态焊接密封。可成型三维立体复杂流道。FSW焊缝强度达母材80-95%。可处理热流密度150-350 W/cm²。模具投入极高(20-50万元)。
优势:复杂一体成型、结构强度高。劣势:模具成本极高、限于特定铝合金。
4.7 前沿:3D打印微通道冷板
2026年技术热点:金属3D打印(SLM/EBM技术)成为下一代微通道冷板的核心制造路线。通过拓扑优化算法设计的仿生流道(分形树状结构、螺旋流道),可将冷却液与热源接触面积提升3-5倍。广东微控智能装备已实现0.04mm级微通道的批量制造突破。2025年全球市场约13.91亿元,预计2032年达26.68亿元(CAGR 7.3%)。 |
5. 冷却介质体系
冷却液是冷板系统的"血液",其选择直接影响散热效率、系统材料兼容性和维护成本。以下是四大类冷却液的对比:
类型 | 导热系数 (W/m·K) | 比热容 (kJ/kg·K) | 优势 | 劣势 |
去离子水 | 0.60 | 4.18 | 导热最优、成本最低 | 导电、需杀菌、0°C结冰 |
乙二醇水溶液(20-50%) | 0.35-0.45 | 3.2-3.8 | 防冻、抗腐蚀 | 导热下降20-30% |
丙二醇水溶液 | 0.30-0.40 | 3.0-3.6 | 食品级安全 | 导热性更低 |
介电氟化液 | 0.06-0.07 | 1.0-1.3 | 绝缘、两相冷却 | 导热仅水1/10、价格极高 |
碳氢合成油 | 0.12-0.15 | 1.8-2.2 | 绝缘、宽温域 | 导热性中等 |
工程建议:对于绝大多数数据中心冷板系统,去离子水 + 缓蚀剂 + 杀菌剂是性能与成本最优的组合。仅在室外管路或0°C以下环境才需要切换至乙二醇水溶液。 |
6. 供液温度设计规范
供液温度的设计直接影响冷板散热能力、系统能效(PUE)和凝露风险。以下是基于ODCC、ASHRAE和主要设备厂商设计规范的推荐值:
参数 | 单相冷板系统 | 两相冷板系统 |
CDU二次侧供液温度 | 18-25°C(典型22°C) | 35-45°C |
CDU二次侧回液温度 | 35-45°C | 45-55°C |
冷板进出口温差 | 10-15°C | 5-10°C(相变主导) |
防凝露要求 | 供液温度≥ 机房露点 + 3°C | 通常高于露点,风险低 |
水温波动 | ±1°C | ±1.5°C |
二次侧流量(单GPU 700W) | 0.8-1.2 L/min | 0.3-0.5 L/min |
ASHRAE液冷分类等级(W1-W5)中,W1级供液温度18-27°C(对应冷水机组),W5级供液温度18-60°C(对应全自然冷却+余热回收,PUE <1.05)。工程设计建议供液温度设定在22-28°C之间的最优点,实现散热能力与PUE的平衡。
7. 散热性能指标
冷板热阻(微通道/CNC方案):0.01-0.05K/W |
热流密度(3D打印微通道):500-1000+W/cm² |
单板极限功率(MLCP+两相):2000-5000W |
7.1 冷板材料导热系数
材料 | 导热系数 (W/m·K) | 相对成本 | 推荐场景 |
铝合金 6061 | 167 | 1.0x(基准) | 成本敏感、中低功率 |
铝合金 6063 | 201 | 1.1x | 挤压型材冷板 |
铝合金 1050 | 222 | 1.2x | 高导热铝冷板 |
纯铜 C11000 | 391 | 3-4x | 高性能GPU冷板 |
铜合金 C18150 | 325 | 4-5x | 高强铜冷板 |
金刚石铜复合材料 | 500-700 | 15-30x | 2026年新兴方向 |
7.2 不同冷板方案散热能力对比
冷板类型 | 热阻 (K/W) @2L/min | 热流密度 (W/cm²) | 单板可承受功率 |
冲压钎焊铝冷板 | 0.08-0.12 | 50-150 | 300-600W |
CNC铣削铜冷板 | 0.03-0.06 | 150-300 | 700-1200W |
梳状翅片铜冷板 | 0.02-0.04 | 200-400 | 1000-1800W |
3D打印微通道铜冷板 | 0.01-0.02 | 500-1000+ | 1500-3000W |
两相冷板(氟化液) | 0.005-0.015 | 400-800+ | 1200-2000W |
最佳导热能力:截至2026年5月,3D打印铜微通道冷板在实验室条件下已达1000+ W/cm²的热流密度处理能力(广东微控 0.04mm微通道方案),NVIDIA要求的MLCP量产目标为 >500 W/cm²,用于其下一代Rubin(2000W级)和Feynman芯片平台。 |
8. 产业格局与厂商研究
8.1 国际主流冷板厂商
厂商 | 总部 | 核心产品 | 客户/定位 |
CoolIT Systems | 加拿大卡尔加里 | DLC冷板、CDU | Dell/HP/Lenovo OEM供应链 |
Asetek | 丹麦(春秋电子收购) | 服务器DLC冷板、机架CDU | 全球服务器OEM、HPC |
Boyd Corporation | 美国 | Aavid系列冷板 | 工业/军工/数据中心 |
Laird Thermal | 美国 | 定制化冷板 | 通信/数据中心 |
Wieland | 德国 | 微通道冷板 | 欧洲工业/数据中心 |
8.2 中国大陆冷板厂商格局
厂商 | 股票代码 | 核心能力 | 主要客户/定位 |
英维克 | 002837 | 液冷全链条(冷板+CDU+管路) | 三大运营商、互联网大厂 |
飞荣达 | 300602 | 两相液冷冷板模组 | NVIDIA供应链认证 |
高澜股份 | 300499 | 纯水冷却、电力电子液冷板 | 电力/数据中心/新能源 |
东山精密 | 002384 | 精密钣金+液冷板冲压 | 通信/数据中心结构件 |
三花智控 | 002050 | 微通道换热器、液冷阀件 | 全球制冷龙头 |
银轮股份 | 002126 | 铝钎焊冷板、换热器 | 汽车+数据中心双赛道 |
春秋电子(Asetek) | 603890 | 收购Asetek+液冷板 | AI服务器液冷全球OEM |
广东微控 | 非上市 | 0.04mm微通道冷板 | 高精度液冷板制造 |
产业催化剂:NVIDIA于2025年Q3正式要求其液冷供应商加速开发MLCP技术,以满足Rubin(2000W级)和Feynman下一代GPU平台的散热需求。这直接推动了微通道技术的加速迭代和中国厂商进入NVIDIA供应链的进程。 |
9. 技术瓶颈与痛点
冷板技术在向更高功率密度演进的过程中仍面临以下八大核心瓶颈:
9.1 微通道加工精度与成本矛盾
传统CNC铣削无法加工<0.3mm的微通道;EDM加工成本极高(单件>2000元);3D打印虽可制造<0.1mm通道,但表面粗糙度(Ra 5-15μm)增加了流阻和结垢风险。
9.2 流道腐蚀与结垢
水基冷却液在长期运行中(>3年)对铝制流道产生电化学腐蚀,特别是异种金属接触处的电偶腐蚀。结垢导致热阻上升、压降增加,系统效率平均每年衰减2-5%。
9.3 TIM界面可靠性
传统导热硅脂在>150W/cm²热流密度下寿命显著缩短(从5年降至1-2年)。液态金属TIM对铝的腐蚀问题尚未完全解决。
9.4 密封可靠性
真空钎焊气孔率需控制在<0.5%;冷板与管路间O型圈在热循环中老化加速,建议每3-5年更换。
9.5 流量分配不均
多芯片冷板组(如NVIDIA NVL72系统)中,并联流道的流量分配不均会导致部分芯片温度偏离目标值>10°C。
9.6 供液温度-凝露-散热三角矛盾
提高供液温度可降低PUE但散热能力下降;降低供液温度可增强散热但可能低于机房露点导致凝露风险。
9.7 金刚石铜规模化瓶颈
导热系数达500-700 W/m·K,是传统铜的1.5-1.8倍,但制备成本高(>3000元/kg)、加工难度大。
9.8 标准化缺失
冷板接口尺寸、流道设计参数、测试标准尚未统一,用户更换供应商或扩容时面临兼容性风险。ODCC正推动《电子信息设备用液冷冷板技术规范》制定。
10. 工程选型建议
10.1 冷板选型决策矩阵
场景 | 推荐冷板类型 | 推荐材质 | 推荐冷却液 | 供液温度 |
通用服务器CPU (200-400W) | 冲压钎焊/CNC铣削 | Al 6061 | 去离子水 | 20-25°C |
AI推理GPU A100/H200 (350-700W) | CNC铣削铜/梳状翅片 | Cu C11000 | 去离子水+缓蚀剂 | 20-25°C |
AI训练GPU B200 (700-1200W) | 梳状翅片铜/3D打印微通道 | Cu/Cu-Diamond | 去离子水+缓蚀剂 | 22-28°C |
下一代Rubin (1500-2000W) | MLCP/3D打印微通道 | Cu/Cu-Diamond | 去离子水/两相工质 | 25-30°C/38-42°C |
边缘/低功耗 (50-200W) | 嵌入式管/挤压扁管 | Al | 去离子水 | 18-22°C |
10.2 工程设计检查清单
1.热设计目标:芯片结温≤ 85°C(GPU)/ 90°C(CPU),冷板进出口温差 ≤ 15°C
2.流量确定: Q = P / (ρ × Cp × ΔT),ΔT通常取10-15°C
3.压降限制:单冷板压降≤ 30kPa(推荐15-20kPa)
4.防凝露校验:供液温度≥ 机房露点温度 + 3°C安全余量
5.材料兼容性:所有接触冷却液的部件需进行1000小时腐蚀测试
6.密封验证:出厂前100%进行氦检漏(泄漏率 < 1×10⁻⁸ Pa·m³/s)
7.冗余设计: A级数据中心液冷系统N+1 CDU配置
8.运维预留:预留供液温度/流量/压差在线监测接口
关注我们获取更多精彩内容



好文推荐—点击下方文字


