想象一下,你正坐在一家生意火爆的超级寿司店里,你就是那个处理海量订单的核心大厨(ASIC/GPU 芯片)。
1. 过去的“跨街配送”模式(传统可插拔光模块):在以前,你的食材仓库(数据源)和加工台(芯片)离得很远。每当大厨需要食材,必须由服务员(电信号)穿过长长的走廊,甚至跨过街道,去门口的驿站(可插拔模块)取货。
- 累人的长跑: 服务员跑这几十米(数十厘米的电互连距离)非常辛苦。
- 偷吃的体力活: 因为路太长,服务员在跑动中满头大汗,为了补充体力,他们竟然要吃掉分给大厨的一半干粮(DSP 功耗占到了总能效的一半)。
- 距离的魔咒: 如果你想把两家分店连起来共享食材,要是用普通的滑梯(铜缆),超过两米食材就滑不动了,导致你的店根本没法开大。
2. CPO 带来的“桌边传送阵”革命:老板一拍大腿,决定进行 CPO(共封装集成) 改造:直接把取货的小电梯安装在大厨的灶台旁边。
- 瞬时送达: 取货距离从“跨街长跑”变成了“伸手即得”,距离从几十厘米缩短到几毫米。
- 能耗奇迹: 因为不用长跑了,那些累得满头大汗、乱吃干粮的服务员(DSP)失业了,整个店的运送能耗瞬间下降了 50% 到 80%。
- 打破空间限制: 那些原本受限于两米的滑梯,现在换成了光速传送门,即便分店在街对面,也能像在同一个房间里一样无缝协作。
3. 聪明的“外置灯泡”设计(外部激光源 ELS):为了防止传送阵的发动机太热烫伤大厨,老板把产生动力的“激光灯泡”挂在了店门外的墙上。这样灯泡如果坏了,维修工不用拆开大厨的灶台,在门口像换灯泡一样随手一拧就修好了。
第一章:行业概览与核心价值主张
1.1 CPO 的定义与技术本质
共封装光学(CPO)技术通过将光引擎直接集成在高性能计算或网络专用集成电路(ASIC)的同一封装或模块内,旨在彻底改变数据中心的互连格局。该技术通过缩短电互连距离(从数十厘米缩短至数十毫米),显著降低了信号传输过程中的功耗、延迟,并提升了带宽密度。
1.2 行业爆发的驱动力:AI 时代的算力需求
随着人工智能工作负载对网络带宽、覆盖范围、密度和可靠性的要求日益严苛,传统的可插拔收发器正在接近其物理极限。
- 带宽密度瓶颈:
传统电接口(SerDes)在 224G 速率下的损耗急剧增加,传输距离受到极大限制。 - 功耗压力:
在 800G 及更高带宽下,DSP(数字信号处理器)占到了光模块总功耗的约 50%。 - CPO 的响应:
CPO 方案相较于 DSP 收发器,可降低 50% 以上甚至高达 80% 的数据传输能耗。
第二章:应用场景深度解析:横向扩展与纵向扩展
CPO 在 AI 集群中主要应用于两种截然不同的架构场景:
2.1 横向扩展(Scale-out)网络
主要用于 GPU 间的通信(后端网络),采用 InfiniBand 或以太网协议。
- 现状:
虽然英伟达已推出 Quantum-X 和 Spectrum-X 等 CPO 交换机,但由于互操作性和可维护性的顾虑,首批产品的采用率预计有限。 - 价值:
CPO 能够帮助将三层网络扁平化为两层,显著减少交换机数量并降低网络总功耗(可减少达 48%)。
2.2 纵向扩展(Scale-up)网络:CPO 的“杀手级应用”
用于 GPU 间实现内存共享等极高带宽、极低延迟的连接(如 NVLink 架构)。
- 痛点:
现有的铜缆方案(如 NVLink)在 200G/通道下传输距离仅限两米。 - 机遇:
CPO 是支持本十年后期纵向扩展带宽持续增长的核心技术。一旦部署,纵向扩展域将不再受距离限制,可跨越多个机架。
第三章:CPO 技术路径与核心组件深度解析
3.1 封装技术:台积电 COUPE 成为首选方案
台积电的 COUPE(紧凑型通用光子引擎)工艺正在成为行业集成的金标准。
- 技术优势:
通过 SoIC(系统整合芯片)键合工艺,实现电子集成电路(EIC)与光子集成电路(PIC)的无凸点堆叠,其带宽密度是传统凸点集成的 23 倍以上。 - 路线图:
从 1.6T 的插拔式光引擎演进到中介层(Interposer)上的 12.8T 光引擎,实现单位面积带宽的跨越式提升。
3.2 调制器技术:MZM、MRM 与 EAM 的三强争霸
- 微环调制器(MRM):
体积极小(数十微米级),功耗极低,天然支持波分复用(WDM)。它是英伟达、台积电、Ayar Labs 和 Lightmatter 的首选路径。 - 马赫-曾德尔调制器(MZM):
性能最成熟、热敏性低,支持 200G/400G 传输,是 Nubis 的核心方案,但缺点是尺寸巨大(毫米级)且功耗较高。 - 电吸收调制器(EAM):
具有极佳的热稳定性(可耐受 80°C 环境),尺寸适中,功耗低,是 Celestial AI 的关键差异化优势。
3.3 光纤耦合与光源方案
- 耦合方式:光栅耦合(GC)
因支持多排光纤布局、高 2D 密度及简化的晶圆级测试,受到英伟达和台积电的青睐。 - 光源布局:
行业已达成共识采用 外部激光源(ELS)。这解决了激光器热敏感及高故障率带来的维护难题,允许像更换收发器一样通过前面板更换激光模块。
第四章:竞争格局与核心玩家洞察
4.1 芯片巨头:英伟达与博通
- 英伟达(Nvidia):
推出 115.2T 的 Quantum-X 800-Q3450 CPO 交换机。其重大突破在于实现了 200G MRM 的量产出货。 - 博通(Broadcom):
作为 CPO 领军者,已演进至第二代 Bailly 51.2T 全光交换机。博通已承诺未来全面转向台积电 COUPE 工艺以维持扩展竞争力。
4.2 创新型初创企业
- Celestial AI:
致力于通过光中介层消除“硅海滩”限制,实现 XPU 直接访问大规模共享 HBM 内存池。其已被 Marvell 收购,预示着纵向扩展网络的巨大潜力。 - Ayar Labs:
专注于基于 UCIe 标准的光重定时芯片,其 TeraPHY 芯片旨在实现芯片组间的标准化光互联。 - Nubis:
核心优势在于独特的 2D 光纤阵列(表面耦合) 技术,实现了极高的光纤出线密度。 - Lightmatter:
研发的 Passage™ 光子超级芯片是一款 4000 平方毫米的光学中介层,通过集成数百个激光器的 VLSP 技术提供 114 Tbit/s 的聚合带宽。
第五章:CPO 供应链深度拆解
英伟达 CPO 生态系统涉及复杂的精密组件供应:
- 连续波激光器:
Lumentum 是目前的主要供应商,Coherent、古河电气和元捷紧随其后。 - 光纤连接单元(FAU):TFC(天孚通信)
是英伟达首批 CPO 交换机最重要的供应商之一,凭借强大的制造能力和成本优势占据核心地位。 - 光纤切换盒(Shuffle box):T&S(太辰光)
是该领域的龙头,通过自动化对准技术解决了成百上千根光纤的路由管理难题。 - 封装与测试:
涉及 ASE(日月光)、Fabrinet 和顺兴。测试端,Keysight(是德科技)、ficonTEC、Teradyne(泰瑞达)等提供高精度的电光测试设备。
第六章:挑战与未来趋势
6.1 可靠性与可维护性
Meta 在 ECOC 2025 上发布的数据显示,CPO 交换机的平均故障间隔时间(MTBF)可达 260 万小时,远优于插拔式光模块。然而,CPO 交换机内部的光纤布线极度复杂,一旦出现非插拔组件损坏,更换难度极高。
6.2 互操作性之争
CPO 技术目前仍处于“狂野西部”阶段,缺乏类似插拔式模块的统一标准。英伟达等厂商倾向于推广专有的端到端解决方案以确保性能,而行业仍呼吁在组件层面实现标准化,以降低成本并防止供应商锁定。
6.3 演进路线
未来的 CPO 性能提升将依赖三大维度:
- 光纤数量:
致力于实现 80 微米间距及多芯光纤技术。 - 单通道速率:
向 200Gbaud 及 PAM6/PAM8 等更高阶调制演进。 - 波分复用(WDM):
探索 64 波长以上的梳状激光器,以最大化单根光纤的容量。
结语
共封装光学(CPO)已超越试点阶段,正逐步进入大规模量产部署的门槛。随着英伟达和博通等巨头完善供应链,CPO 将在本十年后期成为驱动 AI 纵向扩展网络发展的核心引擎。尽管制造复杂性和互操作性仍是挑战,但其带来的极致能效比和带宽密度已使其成为下一代互连技术的“圣杯”。


