3月29日,在第二届浦江AI学术年会上,上海人工智能实验室联合沐曦、奇异摩尔等企业正式发布《超节点技术体系白皮书》。这标志着国产AI算力建设从单点芯片性能追赶,转向以“超节点”为单位的系统级架构竞争。
一、为何要定义“超节点”?算力竞赛进入集群时代
随着大模型参数量突破万亿,单纯堆砌GPU数量已无法满足算力需求。通信延迟和异构协同难,成为制约国产集群效能的“隐形天花板”。

超节点的核心价值在于“统一协同”。白皮书将其定义为新型架构单元,旨在将计算、存储、互联等资源组织成统一系统。其目标是在更大规模下维持高带宽、低时延,让成百上千张加速卡能“像一颗芯片一样工作”,而非简单的硬件堆砌。
二、白皮书核心看点:从“可用”到“好用”的工程化指南
这份白皮书并非单纯的理论探讨,而是针对产业落地痛点的“操作手册”。其重点解决了三大核心问题:
◆异构协同难:不同厂商芯片间的接口与协议割裂,白皮书提出了架构标准化的方向。
◆跨域调度效率低:针对大规模训练中的通信瓶颈,给出了互联协议与调度策略。
◆工程化部署复杂:为高密度、液冷等复杂工程场景提供了参考架构。

三、产业链分工:沐曦侧重芯片架构,奇异摩尔聚焦互联方案
在超节点生态中,参与企业各司其职,形成了从芯片到网络的完整闭环:
◆沐曦(芯片侧):作为GPU芯片厂商,提供了超节点架构下的芯片级数据与系统需求,其此前发布的耀龙S8000G2等超节点产品,正是这一理念的硬件实践。
◆奇异摩尔(互联侧):作为互联解决方案商,贡献了ScaleUp协议、IO芯粒及AI原生网卡等关键技术。其KiwiG2GIOD互联芯粒方案,是解决芯片间高速互连的关键底座。
四、行业影响:国产算力的“合纵连横”
此次白皮书的发布,是国产AI产业链的一次“合纵连横”。它试图在英伟达NVLink生态之外,建立一套基于开放标准的国产超节点技术体系。

对于行业而言,这意味着算力基础设施的竞争维度已经升级。未来评价国产算力集群的指标,将不再是单一的TFLOPS算力值,而是“系统级”的互联带宽与算力利用率。这为国产芯片在系统层面实现“非对称超越”提供了理论路径。