ICC讯 在GTC大会的传闻被证实后,英伟达正式发布了面向InfiniBand和以太网的共封装光学(CPO)交换机,分别命名为Quantum-X Photonics和Spectrum-X Photonics。其中,InfiniBand CPO将于2025年下半年上市,以太网CPO则计划于2026年下半年推出。需要注意的是,CPO将作为可选方案——英伟达将继续提供支持可插拔模块的交换机系统。
尽管CPO技术此前普及缓慢,但英伟达仍决定迈出这一步。首要原因是节能。黄仁勋在主题演讲中强调,CPO可将每1.6T端口的功耗从30W(可插拔光模块)降至9W,降幅达70%。
英伟达的CPO基于新型微环调制器(MRM),进一步提升了能效。博通的CPO技术通过移除DSP实现了50%的功耗降低,但其基于马赫-曾德尔调制器(MZM)——这是光模块中的标准组件。
该技术的核心组件包括由台积电(TSMC)制造的电子和光子集成电路,并以3D堆叠方式组装。台积电的紧凑型通用光子引擎(COUPE)技术包含用于表面耦合光纤阵列的微透镜。在Quantum-X光子平台中,光学引擎通过中介层与交换机ASIC连接。英伟达未透露各组件的具体作用,但其CPO合作伙伴包括波若威、Coherent、Corning、Fabrinet、富士康、Lumentum、扇港、SPIL、住友、天孚和台积电。
光模块厂商可暂时松一口气——至少未来几年如此。英伟达的首款CPO设计是InfiniBand交换机,而该协议在公司的AI战略中已退居次席,以太网成为主导。事实上,Quantum-X Photonics甚至未出现在英伟达的路线图中。此外,英伟达已推出支持1.6T光模块的Quantum-X800系统,因此首批CPO部署可能用于内部集群。Quantum-X Photonics将作为技术验证的重要一步,但对光模块需求的影响有限。
黄仁勋称Spectrum-X为“巨大成功”,因其将以太网提升至InfiniBand水平。他表示,Spectrum-X将在Rubin时代连接“数十万个”GPU。尽管未公布具体差异,但Spectrum-X采用了与Quantum-X不同的设计,可能代表第二代技术。
英伟达的加入为CPO技术注入新动力。自2021年起,博通一直是CPO的主要推动者。到2027年,两家公司预计将量产200G/通道的CPO交换机,推动生态系统成熟。
Scale-out网络是CPO技术的低风险切入点,但Scale-up光互连更为关键。专家混合模型(MoE)的快速响应需依赖跨GPU的专家并行计算。黄仁勋解释了吞吐量与响应时间的平衡,并举例说明最佳方案需64个GPU并行处理单个专家任务。Blackwell架构的NVL72机架通过NVLink在无源铜背板上构建72-GPU集群。英伟达计划在2026年下半年的Vera Rubin NVL144中采用类似设计,无源电缆数量或翻倍。
英伟达未透露Rubin Ultra NVL576的细节,但其Kyber机架布局对NVLink互连提出新要求。尽管144个GPU可封装于单一机架(最大传输距离约2米),但路线图未提及Feynman的NVLink规模——业界认为其将扩展至多机架,届时需引入光学技术。
英伟达于2022年GTC大会首次公布光纤NVLink计划,并内部构建了至少一个集群。但因重定时光模块的高功耗,该技术未能推广。移除DSP是进步,但仍需持续改进。这解释了英伟达为何冒险采用MRM等新技术。考虑到提升网络的重要性,该公司可能正在研发多种光学技术。
NVLink CPO计划于2028年推出,为英伟达留出两代时间验证扩展网络技术。此举将降低GPU转向CPO的风险——这只是时间问题。这只是一个时间问题,而非是否会发生的问题。
研究报告全文可登录LightCounting订阅页面查看:https://www.lightcounting.com/login