CPO，凭什么成了AI算力的“新命门”？

2026-05-26 18:39:22 牛钱网

“欢迎关注牛钱网官微（niumoney_com），我们将每日为您提供专业及时、有价值的信息及交易服务。”

一句话先定调：过去十年，AI卷算力；未来十年，AI卷“怎么把算力连起来”。而CPO，就是这场“互连战争”里，最硬核的那个武器。

01、先讲个真实困境：芯片强了，路堵死了

你有没有想过一个问题：现在我们做的GPU已经快到飞起了，为什么训练一个大模型还要几个月？答案很扎心——不是芯片不够快，是芯片之间“说话”太慢了。

你可以想象一下这个画面：你有一千个天才大脑（GPU），每个人算力爆表。但他们之间传信息，靠的是一条早高峰的国道（铜线）。堵、热、慢。到最后，这一千个大脑的整体智商，不看最强的那个，看最堵的那段路。

这就是今天AI大集群的真实处境。搞芯片的人把晶体管越塞越多，算力翻倍再翻倍。但搞互连的人快扛不住了——铜线的物理极限，到了。

尤其是当AI集群从几十个GPU涨到几万个、十几万个的时候，数据搬运量不是线性增长，是爆炸式增长。于是，整个行业被迫从一个问题转向另一个问题：从“算力战争”转向“互连战争（Interconnect War）”。而CPO，就是这场战争里，被推到最前面的那个技术。

02、先别急着聊技术：先看市场有多大，钱在哪儿

很多人聊CPO一上来就讲硅光、封装、调制器，容易劝退。我们先看钱，你就知道为什么它突然火了。

根据LightCounting 2026年1月的最新报告——

2025年：AI集群里的光互连（包括光模块和CPO）卖了165亿美元。

2026年：预计冲到260亿美元，一年涨60%。

你没看错，百亿美金级别的市场，年增速过半。这还不是顶峰。为什么涨得这么猛？三个原因很直白：

Meta、微软、Oracle这些巨头，2026年的资本支出直接翻倍，而且分析师普遍认为当前预测还偏保守。

供应链短缺正在缓解。前两年VCSEL和InP激光器芯片缺得要命，2026年中开始会慢慢好起来。

3.最重要的一条：AI训练进入了“Scale-up”时代。什么叫Scale-up？简单说就是：以前的互连主要解决数据中心之间、机柜之间的通信（叫Scale-out）。现在瓶颈转移到机柜内部、GPU之间的通信。Scale-up的带宽需求，是Scale-out的9倍。

这意味着：互连的主战场，正在从“远距离”拉到“超短距、超高速”。** 而在这个战场上，铜线彻底不行了，传统光模块也开始吃力。CPO恰恰是为此而生的。

所以不是资本瞎炒，是真的到了非改不可的时候。

03、铜线到底哪里不行了？三个字：扛不住

很多人不理解：铜线用了这么多年，怎么突然就不行了？不是说铜线变差了，是AI的要求变得太离谱了。

第一，信号衰减太严重。电信号在铜线上跑，跑不了几十厘米就开始糊。到了1.6T、3.2T速率，基本就是“出门即崩溃”。你想跨机柜？门都没有。

第二，发热和功耗已经变成灾难。电流越大、频率越高，铜线越热。一个几万卡集群，互连部分的功耗能占到总功耗的20%-30%。这不是技术问题，这是电费账单和散热风扇的物理极限问题。

第三，距离被锁死在1米以内。224G信号下，无源铜缆的有效距离不到1米。这意味着你只能在一个机架里连几台服务器，想做大集群？铜线第一个说不。

所以不是工程师不想继续用铜，是真的物理上不允许。

而光传输呢？几乎是为这个问题量身定做的：功耗低一个数量级，距离可以到几公里，带宽几乎没有上限，发热极小。说白了：光，是铜的终极替代方案。这句话过去听起来像科幻，现在是工程现实。

04 那CPO到底是啥？一句话讲清楚

好，既然光这么好，那直接用光模块不就行了吗？为什么还要搞CPO？问题出在“距离”上——不是光纤的距离，而是芯片到光模块之间那一段铜线的距离。

传统方案是这样的：GPU/交换芯片 ——（PCB铜线）—— 光模块 —— 光纤。问题就出在“芯片到光模块”这段铜线上。这段线虽然不长，但在800G、1.6T的速率下，损耗和干扰已经大得离谱。光模块里还得塞一个DSP芯片来“修复”信号，那个DSP本身功耗就占模块的40%-60%。

于是有人想了一个很直接的办法：我把光模块直接贴到芯片旁边，甚至封在一个壳子里，行不行？这就是CPO——共封装光学。

结构变成：GPU/交换芯片 ↔ 光引擎（贴在旁边）↔ 光纤。

电信号只走几毫米，马上转成光信号。损耗、发热、干扰，全部断崖式下降。

所以CPO不是什么玄学，它就是“把光通信搬到芯片门口”。

05 CPO到底解决了哪三个核心问题？

为了让你记得住，我把它简化成三个“破”：

1. 破“功耗墙”。传统光模块里最耗电的是DSP。CPO把DSP去掉或极度简化，加上电信号路径极短，功耗直接砍一大截。博通在TH6交换机上的实测数据：CPO方案比传统可插拔光模块功耗降低70%，整体能源效率提升3.5倍以上。这不是ppt，是量产数据。

2. 破“带宽墙”。AI训练中，GPU之间需要疯狂的同步。1.6T、3.2T甚至更高。CPO可以轻松做到每平方毫米约2Tb/s的带宽密度，这是传统方案根本够不着的。NVIDIA的Quantum-X光子交换机，单芯片做到28.8Tb/s吞吐量。Spectrum-X更夸张，总频宽可以到400Tb/s。

3. 破“扩展墙”。这是最狠的一点。CPO不是让单个芯片更快，而是让你能把几万个GPU真的连成一个整体。没有CPO，十万卡集群基本是做梦。有了CPO，百万卡集群开始在路线图上出现。

所以黄仁勋才会说：“整个数据中心才是新的计算单元。”互连就是那个把无数GPU粘成一台巨型计算机的胶水。

06 技术难在哪？三座大山

聊完好处，必须得说现实：CPO很难，非常难。

第一座山：封装。你要把计算芯片、光引擎、激光器封在一起。光器件的对准精度是纳米级，比头发丝细几千倍。封装时的任何微小形变，光就偏了，整个链路就废了。这不是传统封装能干的事。

第二座山：散热。GPU本身就是大火炉。光器件又对温度极其敏感。把这两个东西贴在一起，散热设计难度直接拉满。

第三座山：维修。传统光模块坏了，运维拔掉换一个就行，像换灯泡。CPO要是坏了，可能得换整个主板甚至整台服务器。可维护性是CPO落地前必须解决的老大难。

所以你会看到，CPO不是“马上替代一切”，而是先在超大规模AI集群的Scale-up网络里落地，其他地方慢慢渗透。

07 不是替代一切：铜、LPO、NPO、CPO、OIO，谁在哪个位置？

很多人问：CPO会杀死光模块吗？铜线会消失吗？答案是：不会，但各自的位置会重新划，我给你画一个简单的四层：

芯片内部（die-to-die）：还是电互连，未来可能被OIO替代，但不是现在。

芯片到芯片、芯片到光引擎：这是CPO的甜蜜区。封装内部解决。

机架内、主板级：铜缆（DAC/AEC）依然存在，便宜、够用。1.6T短距还是铜的天下。

数据中心之间、广域：传统可插拔光模块依然是主力，尤其是800G及以下。

这里有两个容易被搞混的概念，顺便澄清一下。

LPO（线性可插拔光模块）：把光模块里的DSP拿掉，用线性驱动。功耗降一半，但对信号质量要求更高。适合800G短距，Meta已经在用了。

NPO（近封装光学）：光引擎和芯片不封在一起，但紧挨着，通过高密度PCB连接。比CPO好做，是过渡方案。

OIO（光学I/O）：更激进的未来，直接把光互连做到chiplet级别。Ayar Labs在做，NVIDIA、AMD、Intel都投了。功耗极低、延迟极低，但还早。

CPO是现阶段最激进的“可量产”方案，但不是唯一方案。未来大概率是“LPO + CPO + 铜”共存，各管一段。

08 全球玩家扫描：谁在主导这场战争？

不搞流水账，只说几个你必须知道的角色。

NVIDIA —— 游戏规则改变者。它不是最早做CPO的，但它是最能逼着整个产业往前走的。2025年下半年推出Quantum-X硅光子交换机，2026年下半年推出Spectrum-X光子系统，路线图上明确：从CPO走向OIO。

英伟达的逻辑很简单：我的GPU卖得越多，互连瓶颈就越痛。我自己不解决，客户就卡住，所以它必须冲在最前面。

Broadcom —— 默默干活的霸主。很多人忽略博通，但它在CPO交换机上是最扎实的。Tomahawk 6-Davisson，全球首款102.4Tb/s CPO交换机，已经出货。而且路线图清晰：200G/lane在产，400G/lane在研。它和台积电深度绑定的COUPE技术，是CPO量产的底座之一。

Ayar Labs —— 最值得关注的“黑马”。这家公司名字你可能不熟，但它的投资人名单是：NVIDIA、AMD、Intel、联发科。2026年初刚融了5亿美元，估值37.5亿。它做的是OIO——光学I/O，直接把光互连做到chiplet级别。4Tbps双向带宽，5纳秒延迟，功耗只有传统方案的1/4到1/8。如果它能量产，会彻底颠覆芯片间的互连方式。

台积电（TSMC） —— 最大的“卖铲人”。不管谁赢，大概率都要用台积电的先进制程和COUPE硅光平台。它是最确定性的受益者。

09 中国产业链：追赶、卡位、现实的妥协

讲完国际，必须说国内。不吹不黑，客观拆一下。中国强在哪里？光模块和光引擎环节，已经是全球龙头级别。

中际旭创：800G光模块占全球40%+，英伟达、亚马逊深度绑定。

天孚通信：光引擎领域的绝对垄断者，英伟达独家供应商。精度控制±0.1μm，这不是吹的。

新易盛：在LPO路线上率先突围，拿下Meta独家大单。部分高端无源器件已经打进国际供应链。

仕佳光子：1.6T AWG芯片，英伟达大陆独供。系统集成层面也有突破。

华工科技:：全球首家量产3.2T液冷CPO光引擎，月产能20万只。

中国弱在哪里？最核心的短板：高速光芯片和先进封装。高速EML、薄膜铌酸锂调制器这些高端光芯片，还是严重依赖进口。3D异质先进封装能力，国内整体还处于初期。台积电、ASE领先至少两代。一个很现实的策略：先走NPO/NPC路线。

什么意思？就是用不那么先进的封装，先把光互连做起来。阿里巴巴的磐久128超节点AI Rack，就是典型：用铜缆+连接器，机架级实现128个GPU的Scale-up集群。

这条路的好处是：不用等3D封装成熟，国内现阶段就能做。能争取3-5年的追赶时间。

坏处是：到了2028-2030年CPO大规模爆发的时候，如果先进封装还跟不上，就会再次被卡脖子。

10 几个关键判断：未来五年怎么走？

我试着帮你把路标画清楚，2025年：LPO/NPO率先落地，CPO工程验证、小批量试产。市场总额165亿美元；2026-2027年：CPO开始初步商用部署，主要在800G和1.6T场景。Meta、Oracle率先采用。市场冲到260亿美元以上；2028-2030年:CPO进入大规模部署，硅光渗透率从30%翻到60%，CPO占互连市场30%以上。3.2T开始商用；2030年后:OIO可能从实验室走向产业化，芯片间互连被彻底重做。

11 风险也得说：不是只有光明

任何一个技术，吹过头了就是坑。CPO也一样。

风险一：量产节奏不及预期。封装良率、热管理、成本，任何一个卡住，都会推迟大规模部署。

风险二：成本经济性。初期CPO比传统光模块贵。云厂商是算账的，如果省下来的电费抵不过增加的硬件成本，就会慢。

风险三：标准割裂。Meta、微软都公开喊话，不希望被NVIDIA或博通的专有方案锁定。如果形成几个互不兼容的生态，规模效应就出不来。

风险四：地缘政治对中国的影响。高端光芯片和先进封装设备，美国随时可能卡。国内如果2028年前不能实现关键环节自主，就会在下一代AI基础设施的标准制定中失去话语权。

最后一句总结

回过头看，这篇文章其实只讲了一件事：AI算力的下一个十年，瓶颈不在芯片本身，在芯片之间。CPO、LPO、NPO、OIO，这些名字听着复杂，本质就是一件事：用光取代铜，把成千上万个芯片连成一个真正的大脑。过去我们比的是谁的“脑细胞”更密。未来比的是谁的“神经网络”更快、更省电、更能扩展。而CPO，就是这个“光速神经网络”的第一块关键积木。

它不是终点。但它是一个明确的信号：互连，正在从配角变成主角。

如果你在做AI基础设施、投半导体、或者只是想知道下一个五年的技术方向在哪里——盯紧CPO，盯紧光互连。这场仗，才刚刚开始。

■特别声明：本文引用并整合第三方网站内容，核心目的是分享更多信息，无任何商业盈利意图。转载内容的观点与描述均归原出处所有，本平台不承担相关责任，仅作参考使用。如需维权或存在侵权疑问，请联系我们处理删除事宜，版权始终归属原作者。文章内容仅供参考，不代表本平台及所在机构观点，据此入市风险自负。市场有风险，投资需谨慎！

来源：牛钱网编写，未经授权不得转载，获授权转载刊登时应标明作者及来源。添加客服微信：niumoney1，获得更多精彩财经资讯。

随机标签: