新华三800G LPO交换机的商用突破:从技术创新到体系构建

讯石光通讯网 2025/6/30 19:01:57

  ICC讯 随着AI大模型训练对网络带宽需求的指数级增长,800G交换机成为智算中心不可或缺的基础设施。在这一技术演进过程中,线性直驱光模块(LPO)技术通过创新性地去掉DSP芯片,实现了功耗降低27%、时延减少17%以及成本显著降低的多重突破,已然成为下一代数据中心建设的关键技术。然而,LPO技术将传统光模块中的DSP功能转移到交换机侧,由此衍生出两大核心技术挑战:

  首先,在信号完整性方面,取消DSP后,抑制信号抖动和噪声的任务完全依赖于交换机本身来实现,这对112Gbps PAM4信号的传输质量提出了前所未有的要求,同时在800G超高密度端口配置下,还需确保所有端口在长期运行中的信号稳定性,这对交换机的硬件设计和制造工艺都带来了严苛考验;其次,在多厂商兼容性方面,要支持不同厂商的LPO模块即插即用,这要求交换机必须具备智能化的参数自适应能力,这对芯片级的硬件识别和系统级的软件优化提出了双重挑战。

  紫光股份旗下新华三集团凭借其“架构级创新、智能化调优、多场景协同”独特模式,不仅率先攻克了这些技术难题,更成功实现了800G LPO交换机的规模商用。目前,该解决方案已成功应用于多个互联网、运营商客户,特别是在AI算力基础设施和大模型训练等前沿场景中展现出卓越性能。这一成就源于新华三在高速信号系统全链路设计中的理论创新、硬件优化与器件协同能力的深度融合。

架构级创新:

攻克LPO的物理层挑战

  面对LPO技术带来的严苛挑战,新华三通过传输系统优化、串扰抑制方案和动态补偿机制三大核心技术,构建起高速信号传输的完整保障体系。

  在传输系统方面,新华三创新性地构建了完整的链路损耗控制体系。采用Ultra Low Loss级PCB板材,优化高速信号层叠归一化设计,并通过系统链路全遍历提取仿真,实现了112G PAM4信号传输损耗降低20%以上的突破。这一创新为LPO架构提供了关键的信号质量基础。

  针对高速信号传输中不可避免的串扰难题,研发团队开发了创新的抑制方案。通过小孔技术和偏心孔技术优化布线密度,采用多线径控制动态调整走线间距,同时采用低插损高速连接器,提升高频性能,使全链路信噪比提升超过10dB。这些措施协同作用,确保了高速信号的稳定传输。

  更为关键的是,针对取消DSP后信号补偿的难题,研发团队重点优化了动态补偿机制:当链路中高频信号发生不同程度的衰减时,发送端ASIC芯片针对性在SerDes发送端,提供不同程度的预加重(增强信号跳变沿幅度)或去加重(降低稳态信号电平);同时接收端SerDes动态调整CTLE均衡器(提升高频增益)和DFE抽头权重,实现信号损伤的快速补偿。整套机制通过预训练参数库与硬件补偿模块的协同,在毫秒级时间内完成信号质量优化,既满足LPO规范的眼图要求,又显著降低系统复杂度,展现了硬件精准控制与软件智能调优的深度融合能力。

      这些硬件层面的创新并非孤立存在,而是通过系统级协同实现整体优化:损耗控制确保基础传输质量,串扰抑制提升信号纯净度,高频补偿由预加重硬件电路执行+软件动态调控参数,三者相辅相成,共同确保800G LPO交换机在取消DSP后的稳定性能。

智能化调优:

从硬件补偿到软件自适应优化

  在解决多厂商兼容性这一难题,新华三基于前述硬件层的信号补偿能力,自主研发的智能调优系统以51.2T交换芯片平台为依托,构建起完整的信号质量监测与调节体系。该系统通过硬件层的SerDes的可配置补偿能力和软件层智能算法的协同,构建两级优化体系:ASIC芯片执行基于预训练参数的信号整形(信号补偿),上层软件通过实时信道监测、动态迭代优化超过数十项电信号参数,实现对信号质量的精准调控,成功攻克了“各厂家模块在不同端口参数调优难、异厂家一致性差”的行业痛点。

  这套智能调优系统展现出强大的解决能力。研发团队通过实时监测各端口的眼图质量、抖动特性等关键指标,经过上千小时的优化与数百小时的专业验证,对交换机驱动软件和高速模块寄存器中的高速电信号参数进行数百轮的参数调整,最终生成能够满足业务要求的最优参数模型,将端口误码率控制在业内领先水平,并集成至交换机系统软件。模块上电时,系统自动识别并配置最优电信号参数,确保低误码率运行,实现业务端口的稳定高效。

  在实际应用场景中,该系统自动识别LPO模块类型,并通过智能调优系统中预存的最优参数模型,快速匹配并应用对应配置,确保不同端口性能表现的高度一致。同时,该技术支持热插拔场景,能够在模块更换后在可在毫秒级时延内完成参数自适应,保障业务无感知切换;在多厂商兼容方案方面,系统严格遵循CMIS和SFF-8636国际标准,实现了对各厂家的不同模块规格、不同芯片方案、不同激光器方案、以及多种应用模式(一分二、一分四)等模块的类型读取,可灵活智能识别端口模块模式,实现即插即用。这一突破极大降低了用户部署的复杂度,为LPO技术的规模商用提供了关键支持。

多场景协同:

技术到商业闭环实践

  新华三精心打造了高效的光模块协同体系,成功构建了完整的技术与商业闭环,通过三大核心支柱推动LPO技术规模商用。

  在认证测试体系方面,新华三建立了行业领先的四维认证标准。该体系包含76项严格测试项目:本体认证重点验证光电信号特性和诊断功能;适配测试全面评估与交换机的兼容性;结构测试确保机械强度;环境测试覆盖从低温到高温的全温度范围。只有通过这一严苛认证体系的产品,才能获得新华三交换机适配认证资格。

  可靠性保障体系贯穿光模块全生命周期。认证引入阶段采用DPA分析和极端环境测试;生产阶段实施包括ESS、老化测试、长纤测试等多重筛选;运维阶段通过模块到系统多级智能运维手段实现质量闭环。这套体系使光模块年故障率控制在1000PPM以下,达到业界领先水平。

  新华三建立了覆盖模块、系统、平台三层的智能运维体系。在模块层,除基础诊断功能外,通过专有寄存器扩展支持环回测试等高级功能;在系统层,开发的参数管理系统实现诊断数据实时解析与配置管理;在平台层,部署的健康管理平台基于全生命周期数据构建预测模型,支持故障预警和寿命评估。结合AD-DC智算版的实时监控能力,可对功率、温度等关键指标进行分钟级故障定位,完整覆盖"交换机+GPU服务器"端网光模块监控场景,运维效率显著提升。

  基于在交换机硬件设计、智能调优系统和光模块协同体系方面的全方位技术突破,新华三 800G LPO 交换机已在多个领域取得显著成效:支持头部互联网企业数万卡GPU集群高效互联,降低运营商数据中心动态时延,承载AI智算中心数千卡GPU集群的训练流量,提升了制造业核心系统吞吐能力。这一创新实践不仅突破了AI算力瓶颈,更展现了我国在高端网络设备领域的技术领导力。面向未来,新华三将继续深化技术创新、完善协同体系,积极参与国际标准制定,为全球数据中心网络的绿色发展贡献更多力量。

新闻来源:新华三

相关文章