——从NVL72、NVL144到NVL576/1152,光通信增量如何从光模块扩散到3D FAU、CW光源、保偏光纤与高密连接
一、报告摘要
本图核心观点是:AI服务器集群的互联架构正在从传统“柜内电连接 + 柜外光连接”,逐步走向更高比例的光互联。随着NVIDIA GPU集群从NVL72、NVL144进一步演进到NVL576、NVL1152等更大规模系统,单GPU对应的光引擎数量,即“GPU:OE”比例可能显著提升。
这里的OE可以理解为Optical Engine,即光引擎。它不是传统可插拔光模块,而是更接近CPO、OIO、光I/O、硅光引擎等新型光互联形态中的核心器件。
图中最重要的投资逻辑可以概括为一句话:
AI集群规模扩大,不只是拉动光模块,而是会重估整个光引擎上游材料和精密器件产业链。
其中,增量最明显的方向包括:
3D FAU / 光纤阵列单元
CW高功率光源 / UHP光源
保偏光纤
高密度光连接器
MPO/MTP、MT插芯、光纤阵列
硅光PIC耦合相关器件
CPO/OIO封装与热管理
光模块、交换机与AI集群整机网络
图中把重点从传统光模块延伸到更上游的光引擎零部件,认为未来真正的高弹性可能不只在中际旭创、新易盛这类光模块龙头,也可能向天孚通信、太辰光、致尚科技、光库科技、长飞光纤、源杰科技、Coherent、Lumentum、Corning、Amphenol等更细分环节扩散。
二、核心逻辑:AI集群从“电互联”走向“光互联”
AI服务器的性能瓶颈不只在GPU算力,还在GPU之间、服务器之间、机柜之间的数据交换效率。
在大模型训练中,GPU不是孤立工作的,而是通过高速互联组成一个大型计算集群。集群规模越大,对带宽、延迟、功耗、信号完整性的要求越高。
传统方案中,短距离Scale Up多使用电连接,长距离Scale Out更多使用光连接。但随着系统规模继续扩大,纯电互联会面临几个问题:
第一,铜连接距离受限。高速电信号在铜缆或PCB背板中传输时,损耗、串扰和功耗会快速上升。
第二,功耗压力上升。高速SerDes、电缆驱动、重定时器都会增加系统功耗。
第三,系统复杂度提高。大规模GPU集群需要更多交换层级,传统可插拔光模块和铜连接的组合会带来布线、散热和成本压力。
第四,带宽升级速度加快。从400G、800G到1.6T、3.2T,单通道速率持续提高,电互联难度越来越大。
因此,光互联正从传统Scale Out链路,逐步向更靠近GPU、交换芯片和系统内部的位置前移。
这就是CPO、OIO、硅光引擎、光I/O被重新重视的根本原因。
三、几个关键概念解释
1. Scale Up
Scale Up指的是单个系统、单个机柜或局部GPU域内部的高速互联。
比如一个NVL72机柜内部,GPU之间通过NVLink/NVSwitch组成一个高带宽统一系统,这类互联更强调极低延迟和高带宽。
传统上,Scale Up更多采用电连接,因为距离较短、延迟可控。
但当系统从NVL72扩展到NVL576甚至NVL1152,单机柜内部互联已经不足以支撑更大规模系统,跨柜Scale Up就可能需要引入光互联。
2. Scale Out
Scale Out指的是机柜与机柜之间、集群与集群之间、服务器节点与网络交换层之间的连接。
这类连接距离更长,天然更适合光模块和光纤。
传统800G/1.6T光模块主要受益于Scale Out需求。
3. OE,Optical Engine
OE即光引擎,是图中最核心的变量。
传统光模块是一个完整可插拔模块;而光引擎更接近于嵌入式、共封装或近封装的光电转换单元。
未来CPO/OIO方案中,光引擎可能靠近交换芯片、GPU或封装基板,以降低功耗和提升带宽密度。
图中使用“GPU:OE”比例来衡量单个GPU系统需要多少光引擎。这个指标非常关键,因为它直接决定上游3D FAU、CW光源、保偏光纤、连接器等器件的需求弹性。
4. CPO
CPO即Co-Packaged Optics,共封装光学。
它的核心思路是把光引擎与交换芯片或计算芯片放得更近,减少高速电信号传输距离,从而降低功耗并提高带宽密度。
5. OIO / Optical I/O
OIO可以理解为更广义的光输入输出。相比传统板级电连接,OIO更强调把光信号引入芯片、封装或系统内部互联。
如果未来GPU之间、GPU与交换芯片之间部分链路采用光I/O,光引擎数量会显著提升。
四、图中架构推演:从NVL72到NVL1152
1. NVL72 / Oberon架构:柜内电互联为主,柜外光互联为辅
图中第一部分讨论的是NVL72,也就是当前NVIDIA较常被讨论的72 GPU机柜级方案。
在这一阶段,核心特点是:
Scale Up在柜内,主要用电;Scale Out在柜外,主要用光。
也就是说,单个机柜内部GPU之间的高速互联仍以电连接和NVLink体系为主,而机柜外连接到其他节点、交换机或更大集群时,才更多依赖光模块。
图中给出的推演是,在NVL72阶段,GPU对应OE的比例相对较低,大致可以理解为:
GPU:OE约为1:4级别。
这意味着光引擎虽然已经重要,但主要需求仍集中在传统光模块和Scale Out互联侧。
这一阶段最受益的仍然是:
800G/1.6T光模块
光模块上游光器件
MPO/MTP跳线
数据中心高密度光纤布线
光模块制造与测试
对应公司主要是中际旭创、新易盛、Coherent、Lumentum、Fabrinet、天孚通信、太辰光等。
2. NVL144 / Kyber架构:单系统规模扩大,OE需求开始明显提升
第二部分讨论的是Kyber架构,对应NVL144。
相比NVL72,NVL144把系统GPU数量进一步提高。随着GPU数量增加,柜内与柜间互联复杂度明显上升。
图中的核心判断是:
NVL144阶段,Scale Up仍可能以柜内电互联为主,但Scale Out链路复杂度提升,GPU:OE比例明显提高。
图中给出的推演是:
GPU:OE可能从NVL72的1:4提升到1:14左右。
这意味着每个GPU背后对应的光引擎数量明显增加,上游器件需求开始出现非线性扩张。
这一阶段的变化在于:
第一,光模块仍然受益。第二,光引擎开始成为重要变量。第三,FAU、CW光源、保偏光纤等上游器件弹性开始显现。第四,高密度连接器和光纤阵列需求上升。第五,系统厂商对低功耗、高带宽密度方案的需求增强。
NVL144可以看作光互联从传统Scale Out向更复杂系统网络过渡的关键阶段。
3. NVL576:跨柜Scale Up打开,光引擎需求进入新阶段
图中第三部分讨论NVL576。
NVL576可以理解为多个NVL72系统进一步组合,形成更大规模GPU域。
在这种架构下,单个机柜内部电互联已经不足以覆盖全部Scale Up需求,跨柜Scale Up成为必须解决的问题。
如果跨柜Scale Up继续依赖电连接,会面临距离、功耗、信号完整性、布线复杂度等问题。因此,图中判断NVL576阶段光互联的角色显著提升。
这一阶段最关键的变化是:
光不再只是Scale Out工具,而可能开始承担部分Scale Up连接。
一旦光进入Scale Up,光引擎数量会大幅提升。
图中推演显示,NVL576阶段GPU:OE比例可能进入更高区间,例如接近1:38级别。
这意味着:
在同样GPU数量下,光引擎需求相比NVL72大幅提升。不仅传统光模块放量,CPO/OIO相关光引擎、FAU、光源、保偏光纤都会进入增量周期。
NVL576对应的产业链意义非常大:
第一,光引擎成为核心增量。第二,3D FAU成为最大弹性环节之一。第三,外置CW光源和高功率光源需求提升。第四,保偏光纤和精密光连接件需求增加。第五,光纤阵列与PIC耦合工艺重要性提升。第六,传统光模块企业和精密光器件企业的边界开始模糊。
4. NVL1152:更大规模系统推动光互联向系统级基础设施演进
图中第四部分讨论NVL1152,对应更大规模的Kyber架构迭代。
如果NVL1152由多个NVL144系统组成,那么其互联复杂度会进一步提高。
在这个阶段,系统很可能需要同时解决:
柜内GPU高速互联
跨柜Scale Up互联
Scale Out网络互联
多层交换结构
高带宽低延迟传输
功耗与散热约束
光纤布线密度
图中推演显示,如果二层、三层网络进一步光化,那么GPU:OE比例可能维持在高位,甚至接近1:36或更高水平。
这说明:
未来AI集群越大,光引擎越可能从“辅助器件”变成“系统级基础设施”。
NVL1152阶段的产业含义是:
光互联不再只是光模块公司单独受益,而是整个光通信上游器件链条重估。
包括:
光引擎OEM
硅光PIC
3D FAU
外置激光源
保偏光纤
高密度光连接器
MPO/MTP
光纤阵列
精密封装
热管理与测试设备
五、图中最重要的指标:GPU:OE比例
图中反复强调“GPU:OE”这个指标,本质上是在重新定义光通信产业链的定价锚。
传统光模块投资框架通常看:
云厂商资本开支
交换机端口数量
800G/1.6T渗透率
光模块ASP
光模块厂商份额
毛利率与年降
但在CPO/OIO时代,新的分析框架可能变成:
单GPU对应多少OE
单OE需要多少FAU
单OE需要多少光源
单OE需要多少保偏光纤
单OE需要多少光连接件
单OE对应多少PIC耦合点
OE良率、封装、测试如何变化
也就是说,光通信的核心变量从“每台交换机需要多少光模块”,转向“每颗GPU背后需要多少光引擎”。
图中试图表达的是:
GPU:OE比例一旦从1:4提升到1:14、1:36、1:38,光引擎上游器件的需求将出现数量级变化。
这就是所谓“新的定价锚”。
六、最大增量环节:3D FAU
图中重点强调3D FAU是最大的增量方向。
FAU,即Fiber Array Unit,光纤阵列单元。它的作用是把多根光纤按精确位置排列,并与硅光PIC、光引擎、耦合结构实现高精度连接。
传统光模块中也需要FAU,但在CPO/OIO、光引擎、硅光深度集成之后,FAU的重要性会进一步提升。
原因有四点:
第一,通道数增加。光引擎需要更多光通道并行传输,单个器件中光纤数量增加。
第二,耦合精度提高。硅光PIC与光纤耦合通常要求微米级甚至更高精度。
第三,封装形态复杂化。从2D光纤阵列向3D FAU演进,结构更复杂,良率壁垒更高。
第四,客户认证更难。AI数据中心对可靠性、温度循环、长期稳定性要求很高。
因此,3D FAU不是普通连接器,而是硅光和光引擎封装中的关键精密结构件。
图中对3D FAU的利润空间做了较激进的测算,虽然具体数字需要进一步核对,但方向上说明市场认为FAU可能从“小器件”变成“大单品”。
A股中与这一方向相关度较高的公司包括:
天孚通信
致尚科技
光库科技
太辰光
长飞光纤
部分精密连接与光无源器件厂商
其中天孚通信的市场关注度最高,因为其本身就是精密光器件平台型公司,产品覆盖透镜、FAU、隔离器、光引擎相关无源器件等多个方向。
七、第二大增量:CW光源与UHP光源
CPO/OIO架构中,光源的形态可能从传统光模块内部集成,逐步向外置连续波光源演进。
CW光源,即Continuous Wave Laser,连续波激光器。UHP光源可以理解为更高功率等级的光源方案。
如果光引擎内部不再集成完整激光器,而是采用外置光源集中供光,那么光源系统会成为重要新增环节。
这种方案的优势包括:
降低光引擎局部热压力
提高系统维护便利性
提升激光器利用效率
有利于集中供光和冗余设计
适配CPO/OIO高密度封装
但它也会带来新的需求:
高功率激光器
激光器阵列
外置光源模块
光功率分配器件
高可靠保偏传输链路
低损耗光连接方案
这一环节受益公司包括:
A股方向:
源杰科技
光迅科技
华工科技
长光华芯
仕佳光子
天孚通信
美股方向:
Coherent
Lumentum
Broadcom
Marvell相关光互联生态
Intel硅光生态
CW光源和UHP光源的核心壁垒在于:
光功率
可靠性
热稳定性
波长控制
线宽与噪声
与硅光PIC的匹配
供光系统冗余设计
如果外置光源路线成为主流,激光器产业链会从传统光模块需求中进一步外溢。
八、第三大增量:保偏光纤
图中还提到保偏光纤。
保偏光纤,即Polarization Maintaining Fiber,主要用于保持光信号偏振态稳定。
在硅光、相干光通信、CPO/OIO等场景中,偏振控制非常关键。
为什么保偏光纤会受益?
第一,硅光器件对偏振敏感。部分硅光器件需要稳定偏振态才能保持低损耗和高效率。
第二,外置光源方案需要稳定传输。如果CW光源与光引擎分离,中间传输链路对偏振、损耗和稳定性提出更高要求。
第三,高密度封装中容错空间更小。光引擎封装越紧凑,对光纤连接和耦合稳定性要求越高。
第四,系统级可靠性要求提高。AI数据中心要求长时间稳定运行,保偏链路可靠性会成为重要参数。
对应公司方向包括:
长飞光纤
亨通光电
中天科技
烽火通信
Corning
Fujikura
OFS
古河电工
不过需要注意,保偏光纤属于高端特种光纤,和普通通信光纤的竞争格局、毛利率、客户认证完全不同。
如果CPO/OIO推动保偏光纤需求放量,真正受益的是具备特种光纤、低损耗光纤、保偏加工和高端客户认证能力的厂商。
九、高密度连接器:MPO/MTP与MT插芯继续受益
光引擎内部靠FAU和PIC耦合,系统外部仍然离不开高密度光纤连接。
MPO/MTP、MT插芯、预端接跳线、高密度光纤配线仍然是AI数据中心的重要基础设施。
随着NVL576、NVL1152这类大规模集群出现,机柜之间、交换机之间、光引擎之间的连接数量会持续增加。
高密度连接器的价值体现在:
节省空间
提高布线效率
支持多芯并行传输
降低现场施工复杂度
提高维护效率
适应高密度机柜环境
对应公司包括:
A股:
太辰光
致尚科技
天孚通信
长飞光纤
亨通光电
中天科技
海外:
US Conec
Senko
Amphenol
TE Connectivity
Corning
Fujikura
MPO/MTP的核心不是塑料外壳,而是MT插芯、导针孔、光纤孔精度、端面研磨、极性管理、清洁检测和低损耗一致性。
AI数据中心对低损耗、高可靠、高密度连接需求提升,会继续拉动这一环节。
十、产业链映射
1. 上游材料与元件
包括:
激光器芯片
CW光源
保偏光纤
光纤阵列
透镜
隔离器
光滤波器
PLC分路器
硅光PIC
MT插芯
精密陶瓷/玻璃/硅基结构件
高端胶水与封装材料
核心受益公司:
A股:天孚通信、源杰科技、光库科技、光迅科技、长飞光纤、华工科技、仕佳光子。海外:Coherent、Lumentum、Corning、Fujikura、Broadcom、Marvell。
2. 中游光引擎与模块
包括:
传统可插拔光模块
硅光模块
CPO光引擎
OIO光引擎
外置光源模块
1.6T/3.2T光模块
光交换相关组件
核心公司:
A股:中际旭创、新易盛、光迅科技、剑桥科技。美股:Coherent、Lumentum、Fabrinet、Broadcom、Marvell。台系/海外:联亚、众达、Innolight相关海外链条。
3. 下游系统与应用
包括:
NVIDIA GPU服务器
AI交换机
云厂商数据中心
超算中心
大模型训练集群
推理集群
以太网/InfiniBand网络
光互联机柜系统
核心受益方向:
GPU与AI服务器
交换机
光模块
光引擎
高密度光连接
光纤光缆
数据中心基础设施
十一、A股投资映射
1. 第一梯队:光模块核心龙头
中际旭创
主要受益于800G、1.6T光模块放量。如果AI数据中心光模块需求持续高增长,中际旭创仍是A股光通信核心资产。
但从图中逻辑看,中际旭创更多受益于传统光模块主线,而不是最纯粹的3D FAU或光引擎上游弹性。
新易盛
同样受益于高速光模块需求,弹性较强。如果1.6T、3.2T升级持续,新易盛仍具备较强成长性。
2. 第二梯队:光引擎上游精密器件
天孚通信
图中逻辑最相关的公司之一。
公司卡位精密光器件、FAU、透镜、隔离器、光引擎相关无源器件。如果CPO/OIO从概念走向量产,天孚通信可能从传统光模块器件供应商,升级为光引擎核心零部件平台。
其投资逻辑是:
光模块升级
硅光渗透
CPO/OIO放量
FAU价值量提升
光引擎上游器件平台化
光库科技
光库科技在保偏器件、光纤激光器件、铌酸锂调制器等方向具备特色。如果保偏光纤、偏振控制、硅光调制、光引擎封装成为重点,光库科技具有一定主题弹性。
源杰科技
主要看激光器芯片和光源方向。如果CW光源、UHP光源、外置光源方案放量,激光器芯片环节有望受益。
3. 第三梯队:高密度连接器与光纤阵列
太辰光
与MPO/MTP、高密度光纤连接器相关度高。AI数据中心高密度布线需求提升,将继续支撑MPO/MTP需求。
致尚科技
市场关注点包括MPO/MTP、光纤阵列、CPO连接相关弹性。如果3D FAU、光纤阵列、光引擎封装放量,公司可能具备较高弹性。
4. 第四梯队:光纤光缆与特种光纤
长飞光纤
普通光纤光缆是基础盘,特种光纤、保偏光纤、高端光纤材料是弹性方向。
亨通光电、中天科技
更多偏光纤光缆、海缆、通信基础设施。AI数据中心内部布线和园区网络建设会有一定拉动,但弹性通常低于光模块和精密器件。
十二、美股与海外投资映射
1. Coherent
覆盖激光器、光器件、光模块、材料平台,是AI光互联升级的重要受益公司。
如果CPO/OIO和外置光源放量,Coherent在激光器、光器件和模块侧都有受益可能。
2. Lumentum
主要看激光器、EML、高速光器件和云数据中心需求。受益于高速光模块和CW光源相关方向。
3. Corning
光纤光缆、数据中心连接基础设施龙头。如果AI数据中心建设继续扩张,Corning受益于光纤、连接和数据中心基础设施。
4. Amphenol
全球连接器龙头。AI数据中心需要大量光连接、电连接、高速线缆和互连系统,Amphenol是基础设施型受益标的。
5. TE Connectivity
同样受益于连接器和数据中心互连需求,但弹性相对Amphenol略弱。
6. Fabrinet
偏光模块和光器件制造代工。如果高速光模块和光引擎制造需求上升,Fabrinet可能受益于产能扩张。
十三、图中观点的投资含义
图中最有价值的地方,不是简单预测某个NVL系统会用多少光引擎,而是提出了一个新的研究框架:
从“光模块出货量”转向“单GPU光引擎用量”。
传统投资看的是:
云厂商CAPEX → 交换机端口 → 光模块数量 → 光模块厂商收入。
新框架看的是:
GPU数量 → GPU:OE比例 → OE数量 → 单OE上游器件价值量 → 3D FAU/CW光源/保偏光纤/连接器需求。
这意味着未来光通信投资可能分为两条主线:
第一条主线是传统高速光模块。代表公司是中际旭创、新易盛、Coherent、Lumentum、Fabrinet。
第二条主线是光引擎上游精密器件。代表公司是天孚通信、太辰光、致尚科技、光库科技、源杰科技、Corning、Amphenol。
如果CPO/OIO发展超预期,第二条主线的弹性可能高于传统光模块主线。
十四、研究型组合建议
A股组合
稳健型组合:
中际旭创
新易盛
天孚通信
太辰光
长飞光纤
光迅科技
进攻型组合:
天孚通信
致尚科技
太辰光
光库科技
源杰科技
新易盛
偏光引擎上游组合:
天孚通信
光库科技
源杰科技
致尚科技
太辰光
长飞光纤
美股/海外组合
Coherent
Lumentum
Corning
Amphenol
Fabrinet
TE Connectivity
Broadcom
Marvell
十五、风险提示
第一,图中NVL576、NVL1152以及GPU:OE比例属于市场推演,并非完全确定的官方BOM。
第二,CPO/OIO路线存在不确定性。未来可能由可插拔光模块、LPO、CPO、NPO、OIO、AOC、铜连接等多路线并存。
第三,光引擎上游器件虽然弹性大,但客户认证周期长,实际量产节奏可能慢于预期。
第四,AI服务器资本开支如果放缓,光模块和光引擎需求会受到影响。
第五,光模块和光器件价格年降较快,可能压制利润率。
第六,部分公司股价已经提前反映较高预期,估值波动可能较大。
第七,海外技术路线、供应链认证、贸易政策和客户集中度均可能带来风险。
十六、结论
这张图的核心不是简单讨论某一代NVIDIA机柜,而是提出了AI光互联产业链的新定价逻辑。
过去,市场主要围绕800G、1.6T光模块定价。未来,如果CPO/OIO和光引擎进入更大规模AI集群,市场可能开始围绕GPU:OE比例重新定价。
一旦GPU:OE比例从1:4提升到1:14,再提升到1:36或1:38,光引擎上游器件需求会被显著放大。
其中,最值得重点关注的增量环节是:
3D FAU
CW/UHP光源
保偏光纤
高密度光连接器
MPO/MTP
硅光PIC耦合器件
光引擎封装与测试
如果用一句话总结:
AI算力升级的下一阶段,不只是光模块从800G走向1.6T,而是光互联从机柜外走向机柜内,从可插拔模块走向光引擎,从单一模块竞争走向上游精密光器件价值重估。
在这一框架下,传统光模块龙头仍是核心资产,但更高弹性的方向,可能来自天孚通信、太辰光、致尚科技、光库科技、源杰科技、长飞光纤,以及海外的Coherent、Lumentum、Corning、Amphenol等光引擎上游和光连接基础设施公司。