推广 热搜: 采购方式  滤芯  带式称重给煤机  甲带  气动隔膜泵  减速机型号  无级变速机  链式给煤机  履带  减速机 

2026超节点大会深度报告-全液冷成为标配

   日期:2026-01-24 15:43:09     来源:网络整理    作者:本站编辑    评论:0    
2026超节点大会深度报告-全液冷成为标配
2026超节点大会是由开放数据中心委员会(ODCC)主办的智算领域年度盛会,于2026 年1月22日在北京中关村皇冠假日酒店成功举办。大会以智算新质生产力为核心主题,聚焦超节点技术创新与产业落地,构建全链路、深层次的智算升级生态体系。
本文基于 2026 超节点大会 (ODCC) 全部16份会议文档的深度综合分析报告。通过对这16份文档的交叉验证与系统化梳理,我们发现“超节点(Super Node)”已经从单一的服务器硬件概念,演进为一套包含物理工程、互连协议、芯片架构、系统设计以及软件调度的庞大复杂生态系统。其核心驱动力在于:在摩尔定律放缓和制程受限的双重背景下,通过Scale-Up(垂直扩展)技术,将成百上千颗 GPU 在逻辑上整合成“超级计算机”。2026超节点大会(ODCC)全部16份会议文档,资料免费获取请加:lxyc18615618005
以下是按技术层级分类的深度分析报告:

第一部分:顶层系统架构设计 (The Brain)

核心厂商:阿里云、百度、腾讯、中兴通讯
关键趋势:存算解耦、正交架构、全液冷
这一层级定义了超节点的“骨架”和“大脑”,云厂商和系统厂商正在重构数据中心的物理形态。

1.架构演进:从 Scale-Out 到 Scale-Up

阿里云 (AL128): 明确了 128卡 Scale-Up 是应对 MoE(混合专家模型)训练的终极形态。通过 A112A11 (Combine & Dispatch) 模块实现的超节点,相比传统集群在 MoE 解码阶段性能提升约 30%。
阿里云磐久超节点服务器
百度 (天池): 提出了 四级内存体系 (4-Level Memory Hierarchy),通过 CXL 技术引入 L3 级扩展内存和 L4 级分布式共享内存,打破了单卡的显存墙限制。

2.物理形态变革:正交与液冷

中兴通讯 & 阿里云: 为了解决 128 卡互连带来的信号衰减,双方均采用了 “正交架构”。计算节点(GPU)与交换节点呈90度直接对插,取消了传统背板,将 224G 信号的链路损耗控制在 26dB 以内。
全液冷时代:面对单柜 360KW (中兴) 甚至更高的功耗,风冷被彻底淘汰。中兴实现了 >80% 的液冷占比(覆盖 Switch 和 CPU),百度则采用了 HVDC Sidecar (侧挂高压直流) 配合微通道冷板。阿里云明确指出随着 NVIDIA Rubin Ultra 等下一代芯片功耗突破,声明必须采用液冷技术才能满足芯片散热。在 Scale-Up(超节点)与 Scale-Out(传统集群)的对比中,立讯明确指出 Scale-Up 架构必须采用 “全液冷”,而 Scale-Out 架构则是“风冷/液冷可选”。这印证了液冷是超节点的标配。

百度天池超节点散热需求

3.互连标准之争:

腾讯 (Eth-X Ultra): 主推基于以太网的开放全光互联标准,旨在打破私有协议垄断,强调光电解耦。
阿里云 (ALS): 推广自研的 ALS (ALink System),强调端到端的软硬一体化性能。

第二部分:核心协议与芯片 (The Nerves)

核心厂商:华为、合见工软、楠菲微、奇异摩尔、博通
关键趋势:内存语义、国产化突围、Chiplet
这一层级是国产算力突围的主战场,核心逻辑是“非对称竞争”——用架构和协议的优势弥补单芯片制程的劣势。

1.协议创新:内存语义替代网络协议

华为 (灵衢 UB): 提出了 统一总线 (Unified Bus),用内存语义的 Load/Store 指令替代 TCP/IP 网络通信。在金融高频交易场景中,这是华为重点展示的场景,将通信时延从 1500ns+ 压降至 <600ns。
华为 (灵衢 UB)总线技术
合见工软 (SUE): 推出了 SUE (Scale Up Ethernet) 协议 IP。它能在普通的以太网交换芯片(如 Broadcom Tomahawk)上实现类 NVLink 的性能,支持 384 卡大规模组网,总内存容量达到北美单机架构的 3.6倍。
合见工软 (SUE)线技术

2.国产互连芯片落地:

楠菲微 (UALink): 展示了 UALink 交换芯片和接口 IP 的实测数据,延迟低至 300ns 级别,并支持在网计算,标志着国产 Scale-Up 网络芯片的成熟。
楠菲微 (UALink)产品
奇异摩尔 (IO Die): 针对 IO 墙问题,推出了基于OISA 标准的独立 IO 芯粒(Chiplet)。通过将互连功能剥离出主芯片,大幅提升了互连带宽密度。
奇异摩尔超节点芯粒

3.以太网底座:

博通 (Broadcom): 坚持以太网路线,推出了 Rail-only 拓扑设计,优化了 AI 训练中的集合通信效率,并推动 51.2T/102.4T 交换芯片成为行业基座。
博通芯片交换技术

第三部分:物理互连与光电技术 (The Veins)

核心厂商:立讯精密、海思光电
关键趋势:铜退光进、NPO/CPC
在 224G/448G 超高频信号下,物理传输介质面临极限挑战。

1.铜的极限 (CPC):

立讯精密: 推出了 CPC (Co-Packaged Copper) 方案,将连接器直接植入芯片基板,实现了 224G 信号的低功耗短距传输,单晶圆带宽可达 256Tb/s。
立讯NPO解决方案

2.光的进化 (NPO):

海思光电 & 立讯: 均选择了 NPO (近封装光学) 路线而非 CPO。NPO 在保证高密度(密度提升9倍)的同时,实现了光电物理解耦,解决了维护难题。海思方案相比传统可插拔模块成本降低 50%。
NPO优势

第四部分:运营、调度与仿真 (The Soul)

核心厂商:小红书、基流科技、联通、华为
关键趋势:亲和性调度、断点续训、数字孪生
硬件就绪后,如何“用好”万卡集群成为关键。

1.精细化运营:

小红书: 揭示了“碎片化”是最大的性能杀手。提出了 “亲和性调度”,即感知物理网络拓扑,将通信密集的任务调度到同一个高带宽域(HBD)内,拒绝跨域通信带来的抖动。
小红书亲和性调度
基流科技 (Venus): 针对大模型训练不稳定的痛点,通过全链路日志和故障驱逐机制,实现了 断点续训,将训练中断恢复时间缩短了 70%。
基流科技产品架构

2.网络规划与仿真:

华为 (OpenSUN): 建立了超节点数字孪生仿真平台,在建设前即可通过算法验证路由策略(如 ECMP vs NSLB)和拓扑结构,降低试错成本。
华为UB仿真平台
中国联通: 提出了 “算力感知网络”,并在全国布局 “4+4+31+X” 算力中心,推动白盒化交换机在运营商网络的落地。
中国联通整体布局

第五部分:2026 超节点生态综合对比表

为了更直观地展示各家厂商在生态中的位置与贡献,总结如下表:
总结论:
2026年的超节点技术已经不仅仅是堆叠硬件。中国产业界正在通过 “光电融合的物理底座”(立讯/海思/中兴)、“开放兼容的互连协议”(合见/楠菲/华为)以及 “智能感知的软件调度”(小红书/基流),构建一套独立于先进制程之外的超级算力系统。这标志着 AI 基础设施的竞争焦点已从单一芯片的性能,彻底转向了系统级工程能力的较量。
欢迎关注「液冷产业链最前沿」!这里是液冷技术、市场动态、产业链分析的专属阵地,为你拆解行业干货、前沿技术突破与企业布局。添加好友:lxyc18615618005,免费领取最新研报。跟着我们走在液冷赛道最前端以下为最新内容,点击链接即可深度阅读:
全球首个GW级超算!马斯克xAI“巨像2号”,详解其核心参数、液冷技术与产业链
英伟达官宣温水冷却!部分冷却制造商股票大跌
2026年国际消费电子展(CES)-聚焦液冷相关信息
2025 年 Top10数据中心建设项目—液冷技术分析
90分钟演讲全程拆解:2026CES英伟达战略发布会(含 Vera Rubin 芯片、Alpamayo 自动驾驶)
 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON