SemiAnalysis新年推出第一篇博文即是大热的话题——共封装光学(CPO)的手册,其中深入探讨了该技术的核心优势、市场机遇、技术挑战以及供应链格局。
Co-Packaged Optics (CPO) Book – Scaling with Light for the Next Wave of Interconnect
共封装光学(CPO)——用光为下一代互连扩容
4. CPO 光学引擎的制造考量与商业化路径
-
主芯片与光学引擎的封装方式(Host and Optical Engine Packaging) -
光纤及其耦合方案(Fibers and Fiber Coupling) -
激光源与波分复用技术(Laser Sources and Wavelength Multiplexing) -
调制器类型(Modulator Type)
5. TSMC 的 COUPE 正在成为首选的一体化集成方案
6. CPO 的采用节奏
Nvidia 的首批 CPO 产品将率先用于后端 scale-out 交换机场景。其中,基于 InfiniBand 的 CPO 交换机预计在 2025 年下半年(2H 2025)推出,而 以太网 CPO 交换机则计划在 2026 年下半年(H2 2026)上市。据 SemiAnalyse 判断,这一阶段的主要目标并非快速放量,而是作为市场验证与供应链“热身”阶段,用于推动制造、封装与测试环节的成熟。预计 2026 年全年出货量约为 1 万至 1.5 万台。
要让 CPO 的部署进一步加速、并最终走向大规模普及,仍然需要更具决定性的采用动因。目前来看,可能存在两条触发路径:
一是 在总体拥有成本(TCO)上形成显著优势,使 CPO 相较传统方案具备压倒性的经济性。
这里解释一下,CPO 的 TCO 优势并不体现在某一个单点部件的成本下降,而是一种系统级的整体释放,如果:
-
通过将光学引擎与 ASIC 共封装,电信号走线长度从原本的几十厘米缩短到几十毫米
-
SerDes 从高功耗、高复杂度的 LR 架构退化为 SR / XSR
-
大量 retimer 与重定时电路被直接消除,整体功耗显著下降,进而带动散热系统降级,
-
更高的带宽密度也提升了交换芯片端口的有效利用率
当这些来自电互连、功耗、散热与端口效率的系统级节省,整体上超过共封装带来的制造复杂度、运维不便以及初期良率损失时,CPO 与传统方案的 TCO 曲线便会发生交叉;而一旦这一交叉点出现,数据中心几乎不会再犹豫,CPO 将如同当年光纤取代铜缆一样,迅速成为下一代互连架构中的默认选择。

( 额,AI画图中文字部分仍然有不少幻觉....)
二是 传统电接口的长距离(LR)SerDes 在从交换 ASIC 驱动信号到机箱前面板的过程中,真正撞上速率或传输距离的物理“硬墙”,从而迫使系统架构转向光互连。
这条路径更激进,也更不可逆。
过去,数据中心的高速互连主要依赖电信号:交换芯片(ASIC)生成的信号,通过 PCB 铜线一路跑到机箱前面板,再由可插拔光模块转换为光信号。这个方案在低速和中等带宽下可行,但随着带宽需求不断提升,高速电信号在铜线上跑得越来越困难,信号衰减严重、抖动越来越大,哪怕增加均衡器、Retimer 或提高功耗,也无法彻底解决问题。这就是所谓的“物理硬墙”:电信号到了某个速率或距离后,根本无法再可靠传输。
一旦撞上这堵墙,传统电互连的道路就走不通了。系统架构不得不做出选择:把“电转光”的步骤提前,直接在芯片旁边封装光学引擎,这就是共封装光学(CPO)的核心逻辑。CPO 并不是一个可选的“升级方案”,而是在电互连物理极限下,继续扩展带宽和系统规模的可能唯一可行方案。换句话说,当 LR SerDes 无法再撑下去,CPO 就不再是先进的优化,而是必然的架构演进。
7. CPO 大规模部署的核心挑战
但即便潜在的 TCO 优势存在,数据中心运营商在部署 CPO 系统时仍普遍存在两大顾虑:互操作性不足以及可维护性(serviceability)问题。与可插拔光模块相比,CPO 在标准化、替换和现场维护上的灵活性明显较弱,这直接影响了运营侧的接受度。
1/ CPO 大规模部署的一个核心挑战,是如何在实现互操作性的同时,突破行业长期依赖的、成熟且高度互通的可插拔光模块模式。
互操作性主要有三个维度:电信号、电光信号和机械接口。对于可插拔光模块:
-
电信号互操作性通常由 OIF(Optical Internetworking Forum) 负责;
-
光学互操作性通常由 IEEE(有时也由 OIF)管理。IEEE 通过其 IEEE 802.3 标准定义以太网物理媒介相关(PMD)层,规范了关键参数,如调制方式、通道速率、通道数量、传输距离、介质类型以及光信号波长。符合这些标准的模块,不同厂商的设备可以互换使用,实现真正的“即插即用”;
-
机械接口互操作性通常由 MSA(Multi-Source Agreements,多源协议) 规范,定义专用解决方案并保证多厂商间的兼容性,即便超出了 IEEE 官方标准。
通过 OIF、IEEE 标准与 MSA 的结合,可插拔光模块实现了广泛互操作性和稳健的多厂商生态。
而对于 CPO 来说:
-
电信号兼容性至关重要,否则模块无法与最先进的 SerDes 通信;
-
光学兼容性有助于 CPO 模块在集群中与标准可插拔模块互通;
-
然而,目前 CPO 仍处在“西部荒野”阶段,一些解决方案和架构设计趋向于完全专有的封装形式。新的 OIF 高密度互连工作(如 CPX 模式)正试图解决这一问题。
一旦电信号、光信号和机械接口三方面实现标准化,CPO 的操作体验将非常接近可插拔模块,这将有助于其广泛采用。
2/ CPO 大规模部署的另一个核心挑战是可靠性与可维护性。
CPO 的一大难点在于光纤耦合。可插拔光模块使用预对准标准接口,安装和更换非常方便;而 CPO 光纤必须以亚微米级精度对准芯片微小波导,并且发生在机箱内部拥挤、温度活跃的环境中,难度大幅增加。
光学器件对温度敏感,激光波长和组件效率会随环境变化波动,还会随着时间老化、污染或机械应力而下降;光纤本身也容易受弯曲或扰动影响,增加损耗甚至断裂。
在机箱中,每根光纤长度和布线路径都需精确计算,更换光纤或 FAU(光纤附件单元)时,需要打开机箱、拆卸、重新布线,操作复杂且容易影响其他光纤。这与可插拔光模块热插拔、操作简单形成鲜明对比。
总之,CPO 虽然在性能和带宽上有优势,但可维护性仍是推广前必须解决的关键问题。

总之,CPO 带来的挑战并不局限于封装内部,而是扩展到整个系统层面。光纤管理、前面板接口密度、外置激光光源等,都是必须系统性解决的关键问题。
这意味着,要真正推动 CPO 落地,芯片厂商需要提供端到端的一体化解决方案,而不仅仅是一颗芯片或一个光学引擎,让客户能够直接部署和规模化使用。
这一趋势在 Nvidia 身上体现得尤为明显,其战略重点正从单一芯片性能,进一步延伸到以系统级设计为核心的性能扩展能力。CPO 的推进,本质上也是这一系统化思路在互连层面的延续。


