“欢迎关注牛钱网官微(niumoney_com),我们将每日为您提供专业及时、有价值的信息及交易服务。”
一句话先定调:过去十年,AI卷算力;未来十年,AI卷“怎么把算力连起来”。而CPO,就是这场“互连战争”里,最硬核的那个武器。
01、先讲个真实困境:芯片强了,路堵死了
你有没有想过一个问题:现在我们做的GPU已经快到飞起了,为什么训练一个大模型还要几个月?答案很扎心——不是芯片不够快,是芯片之间“说话”太慢了。
你可以想象一下这个画面:你有一千个天才大脑(GPU),每个人算力爆表。但他们之间传信息,靠的是一条早高峰的国道(铜线)。堵、热、慢。到最后,这一千个大脑的整体智商,不看最强的那个,看最堵的那段路。
这就是今天AI大集群的真实处境。搞芯片的人把晶体管越塞越多,算力翻倍再翻倍。但搞互连的人快扛不住了——铜线的物理极限,到了。
尤其是当AI集群从几十个GPU涨到几万个、十几万个的时候,数据搬运量不是线性增长,是爆炸式增长。于是,整个行业被迫从一个问题转向另一个问题:从“算力战争”转向“互连战争(Interconnect War)”。而CPO,就是这场战争里,被推到最前面的那个技术。
02、先别急着聊技术:先看市场有多大,钱在哪儿
很多人聊CPO一上来就讲硅光、封装、调制器,容易劝退。我们先看钱,你就知道为什么它突然火了。
根据LightCounting 2026年1月的最新报告——
2025年:AI集群里的光互连(包括光模块和CPO)卖了165亿美元。
2026年:预计冲到260亿美元,一年涨60%。
你没看错,百亿美金级别的市场,年增速过半。这还不是顶峰。为什么涨得这么猛?三个原因很直白:
Meta、微软、Oracle这些巨头,2026年的资本支出直接翻倍,而且分析师普遍认为当前预测还偏保守。
供应链短缺正在缓解。前两年VCSEL和InP激光器芯片缺得要命,2026年中开始会慢慢好起来。
3.最重要的一条:AI训练进入了“Scale-up”时代。什么叫Scale-up?简单说就是:以前的互连主要解决数据中心之间、机柜之间的通信(叫Scale-out)。现在瓶颈转移到机柜内部、GPU之间的通信。Scale-up的带宽需求,是Scale-out的9倍。
这意味着:互连的主战场,正在从“远距离”拉到“超短距、超高速”。** 而在这个战场上,铜线彻底不行了,传统光模块也开始吃力。CPO恰恰是为此而生的。
所以不是资本瞎炒,是真的到了非改不可的时候。
03、铜线到底哪里不行了?三个字:扛不住
很多人不理解:铜线用了这么多年,怎么突然就不行了?不是说铜线变差了,是AI的要求变得太离谱了。
第一,信号衰减太严重。电信号在铜线上跑,跑不了几十厘米就开始糊。到了1.6T、3.2T速率,基本就是“出门即崩溃”。你想跨机柜?门都没有。
第二,发热和功耗已经变成灾难。电流越大、频率越高,铜线越热。一个几万卡集群,互连部分的功耗能占到总功耗的20%-30%。这不是技术问题,这是电费账单和散热风扇的物理极限问题。
第三,距离被锁死在1米以内。224G信号下,无源铜缆的有效距离不到1米。这意味着你只能在一个机架里连几台服务器,想做大集群?铜线第一个说不。
所以不是工程师不想继续用铜,是真的物理上不允许。
而光传输呢?几乎是为这个问题量身定做的:功耗低一个数量级,距离可以到几公里,带宽几乎没有上限,发热极小。说白了:光,是铜的终极替代方案。这句话过去听起来像科幻,现在是工程现实。
04 那CPO到底是啥?一句话讲清楚
好,既然光这么好,那直接用光模块不就行了吗?为什么还要搞CPO?问题出在“距离”上——不是光纤的距离,而是芯片到光模块之间那一段铜线的距离。
传统方案是这样的:GPU/交换芯片 ——(PCB铜线)—— 光模块 —— 光纤。问题就出在“芯片到光模块”这段铜线上。这段线虽然不长,但在800G、1.6T的速率下,损耗和干扰已经大得离谱。光模块里还得塞一个DSP芯片来“修复”信号,那个DSP本身功耗就占模块的40%-60%。
于是有人想了一个很直接的办法:我把光模块直接贴到芯片旁边,甚至封在一个壳子里,行不行?这就是CPO——共封装光学。
结构变成:GPU/交换芯片 ↔ 光引擎(贴在旁边)↔ 光纤。
电信号只走几毫米,马上转成光信号。损耗、发热、干扰,全部断崖式下降。
所以CPO不是什么玄学,它就是“把光通信搬到芯片门口”。
05 CPO到底解决了哪三个核心问题?
为了让你记得住,我把它简化成三个“破”:
1. 破“功耗墙”。传统光模块里最耗电的是DSP。CPO把DSP去掉或极度简化,加上电信号路径极短,功耗直接砍一大截。博通在TH6交换机上的实测数据:CPO方案比传统可插拔光模块功耗降低70%,整体能源效率提升3.5倍以上。这不是ppt,是量产数据。
2. 破“带宽墙”。AI训练中,GPU之间需要疯狂的同步。1.6T、3.2T甚至更高。CPO可以轻松做到每平方毫米约2Tb/s的带宽密度,这是传统方案根本够不着的。NVIDIA的Quantum-X光子交换机,单芯片做到28.8Tb/s吞吐量。Spectrum-X更夸张,总频宽可以到400Tb/s。
3. 破“扩展墙”。这是最狠的一点。CPO不是让单个芯片更快,而是让你能把几万个GPU真的连成一个整体。没有CPO,十万卡集群基本是做梦。有了CPO,百万卡集群开始在路线图上出现。
所以黄仁勋才会说:“整个数据中心才是新的计算单元。”互连就是那个把无数GPU粘成一台巨型计算机的胶水。
06 技术难在哪?三座大山
聊完好处,必须得说现实:CPO很难,非常难。
第一座山:封装。你要把计算芯片、光引擎、激光器封在一起。光器件的对准精度是纳米级,比头发丝细几千倍。封装时的任何微小形变,光就偏了,整个链路就废了。这不是传统封装能干的事。
第二座山:散热。GPU本身就是大火炉。光器件又对温度极其敏感。把这两个东西贴在一起,散热设计难度直接拉满。
第三座山:维修。传统光模块坏了,运维拔掉换一个就行,像换灯泡。CPO要是坏了,可能得换整个主板甚至整台服务器。可维护性是CPO落地前必须解决的老大难。
所以你会看到,CPO不是“马上替代一切”,而是先在超大规模AI集群的Scale-up网络里落地,其他地方慢慢渗透。
07 不是替代一切:铜、LPO、NPO、CPO、OIO,谁在哪个位置?
很多人问:CPO会杀死光模块吗?铜线会消失吗?答案是:不会,但各自的位置会重新划,我给你画一个简单的四层:
芯片内部(die-to-die):还是电互连,未来可能被OIO替代,但不是现在。
芯片到芯片、芯片到光引擎:这是CPO的甜蜜区。封装内部解决。
机架内、主板级:铜缆(DAC/AEC)依然存在,便宜、够用。1.6T短距还是铜的天下。
数据中心之间、广域:传统可插拔光模块依然是主力,尤其是800G及以下。
这里有两个容易被搞混的概念,顺便澄清一下。
LPO(线性可插拔光模块):把光模块里的DSP拿掉,用线性驱动。功耗降一半,但对信号质量要求更高。适合800G短距,Meta已经在用了。
NPO(近封装光学):光引擎和芯片不封在一起,但紧挨着,通过高密度PCB连接。比CPO好做,是过渡方案。
OIO(光学I/O):更激进的未来,直接把光互连做到chiplet级别。Ayar Labs在做,NVIDIA、AMD、Intel都投了。功耗极低、延迟极低,但还早。
CPO是现阶段最激进的“可量产”方案,但不是唯一方案。未来大概率是“LPO + CPO + 铜”共存,各管一段。
08 全球玩家扫描:谁在主导这场战争?
不搞流水账,只说几个你必须知道的角色。
NVIDIA —— 游戏规则改变者。它不是最早做CPO的,但它是最能逼着整个产业往前走的。2025年下半年推出Quantum-X硅光子交换机,2026年下半年推出Spectrum-X光子系统,路线图上明确:从CPO走向OIO。
英伟达的逻辑很简单:我的GPU卖得越多,互连瓶颈就越痛。我自己不解决,客户就卡住,所以它必须冲在最前面。
Broadcom —— 默默干活的霸主。很多人忽略博通,但它在CPO交换机上是最扎实的。Tomahawk 6-Davisson,全球首款102.4Tb/s CPO交换机,已经出货。而且路线图清晰:200G/lane在产,400G/lane在研。它和台积电深度绑定的COUPE技术,是CPO量产的底座之一。
Ayar Labs —— 最值得关注的“黑马”。这家公司名字你可能不熟,但它的投资人名单是:NVIDIA、AMD、Intel、联发科。2026年初刚融了5亿美元,估值37.5亿。它做的是OIO——光学I/O,直接把光互连做到chiplet级别。4Tbps双向带宽,5纳秒延迟,功耗只有传统方案的1/4到1/8。如果它能量产,会彻底颠覆芯片间的互连方式。
台积电(TSMC) —— 最大的“卖铲人”。不管谁赢,大概率都要用台积电的先进制程和COUPE硅光平台。它是最确定性的受益者。
09 中国产业链:追赶、卡位、现实的妥协
讲完国际,必须说国内。不吹不黑,客观拆一下。中国强在哪里?光模块和光引擎环节,已经是全球龙头级别。
中际旭创:800G光模块占全球40%+,英伟达、亚马逊深度绑定。
天孚通信:光引擎领域的绝对垄断者,英伟达独家供应商。精度控制±0.1μm,这不是吹的。
新易盛:在LPO路线上率先突围,拿下Meta独家大单。部分高端无源器件已经打进国际供应链。
仕佳光子:1.6T AWG芯片,英伟达大陆独供。系统集成层面也有突破。
华工科技::全球首家量产3.2T液冷CPO光引擎,月产能20万只。
中国弱在哪里?最核心的短板:高速光芯片和先进封装。高速EML、薄膜铌酸锂调制器这些高端光芯片,还是严重依赖进口。3D异质先进封装能力,国内整体还处于初期。台积电、ASE领先至少两代。一个很现实的策略:先走NPO/NPC路线。
什么意思?就是用不那么先进的封装,先把光互连做起来。阿里巴巴的磐久128超节点AI Rack,就是典型:用铜缆+连接器,机架级实现128个GPU的Scale-up集群。
这条路的好处是:不用等3D封装成熟,国内现阶段就能做。能争取3-5年的追赶时间。
坏处是:到了2028-2030年CPO大规模爆发的时候,如果先进封装还跟不上,就会再次被卡脖子。
10 几个关键判断:未来五年怎么走?
我试着帮你把路标画清楚,2025年:LPO/NPO率先落地,CPO工程验证、小批量试产。市场总额165亿美元;2026-2027年:CPO开始初步商用部署,主要在800G和1.6T场景。Meta、Oracle率先采用。市场冲到260亿美元以上;2028-2030年:CPO进入大规模部署,硅光渗透率从30%翻到60%,CPO占互连市场30%以上。3.2T开始商用;2030年后:OIO可能从实验室走向产业化,芯片间互连被彻底重做。
11 风险也得说:不是只有光明
任何一个技术,吹过头了就是坑。CPO也一样。
风险一:量产节奏不及预期。封装良率、热管理、成本,任何一个卡住,都会推迟大规模部署。
风险二:成本经济性。初期CPO比传统光模块贵。云厂商是算账的,如果省下来的电费抵不过增加的硬件成本,就会慢。
风险三:标准割裂。Meta、微软都公开喊话,不希望被NVIDIA或博通的专有方案锁定。如果形成几个互不兼容的生态,规模效应就出不来。
风险四:地缘政治对中国的影响。高端光芯片和先进封装设备,美国随时可能卡。国内如果2028年前不能实现关键环节自主,就会在下一代AI基础设施的标准制定中失去话语权。
最后一句总结
回过头看,这篇文章其实只讲了一件事:AI算力的下一个十年,瓶颈不在芯片本身,在芯片之间。CPO、LPO、NPO、OIO,这些名字听着复杂,本质就是一件事:用光取代铜,把成千上万个芯片连成一个真正的大脑。过去我们比的是谁的“脑细胞”更密。未来比的是谁的“神经网络”更快、更省电、更能扩展。而CPO,就是这个“光速神经网络”的第一块关键积木。
它不是终点。但它是一个明确的信号:互连,正在从配角变成主角。
如果你在做AI基础设施、投半导体、或者只是想知道下一个五年的技术方向在哪里——盯紧CPO,盯紧光互连。这场仗,才刚刚开始。
■特别声明:本文引用并整合第三方网站内容,核心目的是分享更多信息,无任何商业盈利意图。转载内容的观点与描述均归原出处所有,本平台不承担相关责任,仅作参考使用。如需维权或存在侵权疑问,请联系我们处理删除事宜,版权始终归属原作者。文章内容仅供参考,不代表本平台及所在机构观点,据此入市风险自负。市场有风险,投资需谨慎!