ICC讯 随着人工智能(AI)和机器学习(ML)工作负载的爆发式增长,数据中心对互连带宽的需求正以前所未有的速度跨越。行业正从800G(基于单通道112G SerDes)迅速向*1.6T(基于单通道224G SerDes)*演进。在这一演进过程中,IEEE 802.3dj标准引入了一项决定性的物理层架构变革——Symbol Multiplexing(符号复用,简称 SM)。
1.6TBASE-R PCS transmit data distribution and bit ordering
一、 什么是Symbol Multiplexing?
在以往的以太网标准(如802.3df)中,物理介质附件(PMA)子层通常采用位复用(Bit Multiplexing, BM)技术。然而,当单通道速率达到224 Gbps时,极短的单位间隔(UI)使得信号极易受到损耗、反射和符号间干扰(ISI)的影响,导致物理信道变得异常脆弱。
为了在这种严苛的误码环境下维持链路可靠性,IEEE 802.3dj 转向使用 SM-PMA(符号复用PMA)。
技术核心:符号复用不再是以“位”为单位进行简单的物理叠加,而是要求PMA能够识别RS-FEC(前向纠错)的符号边界(通常为10位一个符号)。映射模式:针对1.6T以太网,标准定义了符号四元组复用(Symbol-quartet Multiplexing),将来自不同FEC码字的相邻10位符号组成40位的四元组进行处理。实现前提:该技术依赖于精确的*对齐标记(Alignment Markers)锁定和去偏(Deskew)*过程,以确保各条PCS通道在进入复用器前已完成边界对齐。
Symbol multiplexing from PCS lanes to Physical lanes
二、 为什么符号复用能提升FEC性能?
符号复用的引入主要是为了解决单通道200G速率下“突发错误(Burst Errors)”对纠错能力的威胁。
抑制错误扩散:在传统的“位复用”模式下,单一物理通道上的一个长突发错误会被分散到多个FEC符号周期中。由于RS-FEC每条码字最多只能纠正15个符号错误,这种错误的扩散极易导致码字不可纠正,从而引发链路失效。错误遏制(Error Containment):符号复用确保来自单一物理通道的突发错误被限制在尽可能少的FEC符号周期内(理想情况下仅为一个符号)。这种“将鸡蛋放在一个篮子里”的策略,反而保护了整个FEC码字的完整性,显著提高了纠错成功率。
同一1.6T光模块在Bit multiplexing和Symbol multiplexing模式下FEC性能
三、 符号复用模式下测试光模块的重要性
符号复用虽然为1.6T链路提供了鲁棒性,但其带来的变速器(Gearbox)智能性提升也极大地增加了系统复杂性,使得光模块的验证变得至关重要。
1. 规避“虚假健康”的误导
在1.6T时代,单纯依靠非成帧(Unframed)的BERT测试(如传统的PRBS31Q)可能产生严重误判。资料显示,某些光模块在非分帧测试中表现良好(BER达到10⁻⁷),但在切换到成帧(Framed)的FEC模式后,会因为均衡器过载或符号对齐不良产生极长的错误尾迹。只有在符号复用映射(SM)模式下进行带流量的成帧(Framed)测试,才能发现隐藏在FEC层面的突发错误。
2. 验证复杂的链路训练(ILT)
1.6T以太网建议引入跨子层链路训练(ILT)。在这种模式下,ASIC与光模块之间需要通过复杂的握手协议来自主优化发射器参数。如果光模块在符号复用逻辑上存在细微缺陷,可能导致ILT无法完成,或者建立的连接缺乏足够的性能裕量(Margin),导致链路频繁闪断(Link Flap)。(最终版本可能会有变化,新的概念PSU(Path Startup)会涵盖RTS(Ready to Send)和ILT(inter-sublayer link training))
3. 应对极其严苛的散热与信号稳定性
1.6T光模块(如OSFP1600)的功耗预计将达到30W甚至更高(基于3nm制程技术的硅光模块可低至22W左右),这对物理层的信号稳定性提出了巨大挑战。在测试中,必须模拟真实的符号复用环境,通过插入FEC符号错误、L1告警(如LOAMPS)或进行动态偏移(Dynamic Skew)测试,来验证模块在高温和电气噪声下的极限抗干扰能力。
总结
符号复用(Symbol Multiplexing)是以太网从“位处理”时代迈向“符号处理”时代的标志,是实现1.6T超高速传输的技术通行证。对于光模块厂商和数据中心运营商而言,传统的BER测试已不足以支撑可靠性验证。必须利用如VIAVI 公司的ONE LabPro等先进测试平台,在真实的符号映射和FEC成帧域内进行深入分析,方能确保1.6T网络在AI时代的稳定运行。
ONE LabPro,Controller + ONE 1600
比喻理解: 从“散装玻璃杯运输”(BM)到“独立防震包装箱”(SM)我们可以将 1.6T 的数据传输比作在一辆极速颠簸的卡车上运输“玻璃杯”(数据位)。为了保证玻璃杯碎了能修好,我们有一位“修复师”(FEC 纠错算法)。
为什么必须要在SM模式下测试:
逻辑性崩溃:SM 模式要求系统必须精准识别“包装盒”的边界(符号对齐)。如果光模块的Gearbox 逻辑有微小偏差,哪怕只错位 1 个位,所有的“包装盒”都会被剪错位。
测试盲区:如果你用旧的BM测试,你只是在数碎了多少个杯子(Bit BER),这会给你一种“虚假健康”的幻觉。只有在 SM 映射模式下进行成帧测试,你才能验证:
1. 模块的“封盒机器”(逻辑映射)是否工作正常。
2. 它是否真的能利用“独立包装”来抗震(验证 FEC 纠错后的真实性能)。
总结
对于 1.6T 高速光模块,基于 Bit Multiplexing 的测试结果是具有欺骗性的,因为它忽略了 224G 架构中最重要的“符号逻辑层”。不测 Symbol Multiplexing,就相当于检查了一台超音速客机的发动机(位流),却完全没有检查它的增压密封舱(符号对齐与 FEC 增益),这在实际 AI 网络中是极其危险的。