SemiAnalysis新年推出第一篇博文即是大热的话题——共封装光学(CPO)的手册,其中深入探讨了该技术的核心优势、市场机遇、技术挑战以及供应链格局。

Co-Packaged Optics (CPO) Book – Scaling with Light for the Next Wave of Interconnect

共封装光学(CPO)——用光为下一代互连扩容

4. CPO 光学引擎的制造考量与商业化路径

目前,CPO 尚未进入与大规模普及相匹配的量产阶段。在行业内,Broadcom是唯一一家已经出货过采用 CPO 的量产系统的厂商,其代表产品包括BaillyHumboldt交换机,而NVIDIA 也正开始加入这一阵营。不过,无论是博通还是 NVIDIA,这些 CPO 产品的出货量目前都仍然非常有限。
CPO 引入了大量全新的制造工艺,并伴随着显著的可制造性挑战。在供应链尚未成熟、长期可靠性数据不足的情况下,下游客户对是否大规模采用这一技术普遍持谨慎态度,这也是可以理解的。
要推动 CPO 真正获得市场认可,必须由行业领导者率先投入资源进行产品出货,以此带动整个供应链建立可规模化的制造与测试流程。当前,NVIDIA 正选择率先“下场”,其目标在于推动供应链提前就绪,识别并解决潜在问题,并为数据中心运营商提前铺路,迎接被认为是 CPO“杀手级应用”的场景——Scale-up 网络
在 CPO 的落地过程中,有若干关键组件和工程考量需要重点关注,这些因素都会直接影响系统性能和制造可行性,主要包括:
  • 主芯片与光学引擎的封装方式(Host and Optical Engine Packaging)
  • 光纤及其耦合方案(Fibers and Fiber Coupling)
  • 激光源与波分复用技术(Laser Sources and Wavelength Multiplexing)
  • 调制器类型(Modulator Type)

5. TSMC 的 COUPE 正在成为首选的一体化集成方案

TSMC 正迅速崛起,成为下一代光学引擎(OE)领域中,无论是无晶圆厂巨头还是初创公司都优先选择的代工合作伙伴。首批进入高量产阶段、具备 CPO 端点的产品,正以“COUPE”之名推出——这是“Compact Universal Photonic Engine(紧凑型通用光子引擎)”的缩写。COUPE 方案涵盖了EIC(电子集成电路)与 PIC(光子集成电路)的制造,以及基于 TSMC COUPE 平台的异构集成能力
NVIDIA 已在GTC 2025上公开展示了其基于 COUPE 的光学引擎,这也将成为首批正式出货的 COUPE 产品。尽管博通此前已与其他供应链伙伴合作推出过多代光学引擎产品,但其未来路线图同样选择了 COUPE。此前主要依赖 GlobalFoundries Fotonix 平台来实现单片光学引擎的Ayar Labs,如今也已将 COUPE 纳入其产品路线图。
与其在传统 CMOS 逻辑工艺中的主导地位不同,TSMC 过去在硅光子(SiPho)领域的存在感相对有限,该领域长期由 GlobalFoundries 和 Tower Semiconductor 担任主要代工伙伴。然而,近几年 TSMC 在光子能力上的追赶速度非常快。与此同时,TSMC 还具备其无可争议的优势:领先制程的 CMOS 逻辑能力(用于 EIC),以及行业领先的先进封装技术。目前,TSMC 是唯一一家在合理规模上成功展示并量产 die-to-wafer 混合键合(hybrid bonding)能力的代工厂,已经为 AMD 批量出货了多款采用混合键合的芯片。混合键合是一种在性能上更优的 PIC 与 EIC 连接方式,但其成本也显著更高。英特尔同样在尝试开发类似能力,但在这一前沿技术的推进过程中遇到了不小的挑战。
总体来看,尽管 TSMC 过去在独立硅光子能力上相对薄弱,但如今已经成为 CPO 领域中极其关键的参与者。与其他头部厂商类似,TSMC 的目标是尽可能多地覆盖产业价值链。通过采用 TSMC 的 COUPE 解决方案,客户实际上也等同于承诺使用由 TSMC 制造的 PIC,因为 TSMC 并不封装来自其他代工厂的硅光子晶圆。事实上,许多专注于 CPO 的公司已经明确转向,将TSMC COUPE作为未来数年核心的商业化(go-to-market)方案。

6. CPO 的采用节奏

Nvidia 的首批 CPO 产品将率先用于后端 scale-out 交换机场景。其中,基于 InfiniBand 的 CPO 交换机预计在 2025 年下半年(2H 2025)推出,而 以太网 CPO 交换机则计划在 2026 年下半年(H2 2026)上市。据 SemiAnalyse 判断,这一阶段的主要目标并非快速放量,而是作为市场验证与供应链“热身”阶段,用于推动制造、封装与测试环节的成熟。预计 2026 年全年出货量约为 1 万至 1.5 万台

要让 CPO 的部署进一步加速、并最终走向大规模普及,仍然需要更具决定性的采用动因。目前来看,可能存在两条触发路径:

一是 在总体拥有成本(TCO)上形成显著优势,使 CPO 相较传统方案具备压倒性的经济性。

这里解释一下,CPO 的 TCO 优势并不体现在某一个单点部件的成本下降,而是一种系统级的整体释放,如果:

  • 通过将光学引擎与 ASIC 共封装,电信号走线长度从原本的几十厘米缩短到几十毫米

  • SerDes 从高功耗、高复杂度的 LR 架构退化为 SR / XSR

  • 大量 retimer 与重定时电路被直接消除,整体功耗显著下降,进而带动散热系统降级,

  • 更高的带宽密度也提升了交换芯片端口的有效利用率

当这些来自电互连、功耗、散热与端口效率的系统级节省,整体上超过共封装带来的制造复杂度、运维不便以及初期良率损失时,CPO 与传统方案的 TCO 曲线便会发生交叉;而一旦这一交叉点出现,数据中心几乎不会再犹豫,CPO 将如同当年光纤取代铜缆一样,迅速成为下一代互连架构中的默认选择。

( 额,AI画图中文字部分仍然有不少幻觉....)

二是 传统电接口的长距离(LR)SerDes 在从交换 ASIC 驱动信号到机箱前面板的过程中,真正撞上速率或传输距离的物理“硬墙”,从而迫使系统架构转向光互连。

这条路径更激进,也更不可逆。

过去,数据中心的高速互连主要依赖电信号:交换芯片(ASIC)生成的信号,通过 PCB 铜线一路跑到机箱前面板,再由可插拔光模块转换为光信号。这个方案在低速和中等带宽下可行,但随着带宽需求不断提升,高速电信号在铜线上跑得越来越困难,信号衰减严重、抖动越来越大,哪怕增加均衡器、Retimer 或提高功耗,也无法彻底解决问题。这就是所谓的“物理硬墙”:电信号到了某个速率或距离后,根本无法再可靠传输

一旦撞上这堵墙,传统电互连的道路就走不通了。系统架构不得不做出选择:把“电转光”的步骤提前,直接在芯片旁边封装光学引擎,这就是共封装光学(CPO)的核心逻辑。CPO 并不是一个可选的“升级方案”,而是在电互连物理极限下,继续扩展带宽和系统规模的可能唯一可行方案。换句话说,当 LR SerDes 无法再撑下去,CPO 就不再是先进的优化,而是必然的架构演进。

7. CPO 大规模部署的核心挑战

但即便潜在的 TCO 优势存在,数据中心运营商在部署 CPO 系统时仍普遍存在两大顾虑:互操作性不足以及可维护性(serviceability)问题。与可插拔光模块相比,CPO 在标准化、替换和现场维护上的灵活性明显较弱,这直接影响了运营侧的接受度。

1/ CPO 大规模部署的一个核心挑战,是如何在实现互操作性的同时,突破行业长期依赖的、成熟且高度互通的可插拔光模块模式。

互操作性主要有三个维度:电信号、电光信号和机械接口。对于可插拔光模块:

  1. 电信号互操作性通常由 OIF(Optical Internetworking Forum) 负责;

  2. 光学互操作性通常由 IEEE(有时也由 OIF)管理。IEEE 通过其 IEEE 802.3 标准定义以太网物理媒介相关(PMD)层,规范了关键参数,如调制方式、通道速率、通道数量、传输距离、介质类型以及光信号波长。符合这些标准的模块,不同厂商的设备可以互换使用,实现真正的“即插即用”;

  3. 机械接口互操作性通常由 MSA(Multi-Source Agreements,多源协议) 规范,定义专用解决方案并保证多厂商间的兼容性,即便超出了 IEEE 官方标准。

通过 OIF、IEEE 标准与 MSA 的结合,可插拔光模块实现了广泛互操作性和稳健的多厂商生态。

而对于 CPO 来说:

  • 电信号兼容性至关重要,否则模块无法与最先进的 SerDes 通信;

  • 光学兼容性有助于 CPO 模块在集群中与标准可插拔模块互通;

  • 然而,目前 CPO 仍处在“西部荒野”阶段,一些解决方案和架构设计趋向于完全专有的封装形式。新的 OIF 高密度互连工作(如 CPX 模式)正试图解决这一问题。

一旦电信号、光信号和机械接口三方面实现标准化,CPO 的操作体验将非常接近可插拔模块,这将有助于其广泛采用。

2/ CPO 大规模部署的另一个核心挑战是可靠性与可维护性。

CPO 的一大难点在于光纤耦合。可插拔光模块使用预对准标准接口,安装和更换非常方便;而 CPO 光纤必须以亚微米级精度对准芯片微小波导,并且发生在机箱内部拥挤、温度活跃的环境中,难度大幅增加。

光学器件对温度敏感,激光波长和组件效率会随环境变化波动,还会随着时间老化、污染或机械应力而下降;光纤本身也容易受弯曲或扰动影响,增加损耗甚至断裂。

在机箱中,每根光纤长度和布线路径都需精确计算,更换光纤或 FAU(光纤附件单元)时,需要打开机箱、拆卸、重新布线,操作复杂且容易影响其他光纤。这与可插拔光模块热插拔、操作简单形成鲜明对比。

总之,CPO 虽然在性能和带宽上有优势,但可维护性仍是推广前必须解决的关键问题

总之,CPO 带来的挑战并不局限于封装内部,而是扩展到整个系统层面。光纤管理、前面板接口密度、外置激光光源等,都是必须系统性解决的关键问题。

这意味着,要真正推动 CPO 落地,芯片厂商需要提供端到端的一体化解决方案,而不仅仅是一颗芯片或一个光学引擎,让客户能够直接部署和规模化使用。

这一趋势在 Nvidia 身上体现得尤为明显,其战略重点正从单一芯片性能,进一步延伸到以系统级设计为核心的性能扩展能力。CPO 的推进,本质上也是这一系统化思路在互连层面的延续。

作者 808, ab