用户名: 密码: 验证码:

人工智能新驱动力-硅基光电子、薄膜铌酸锂及光电协同设计, 破局200Gbps链路高速传输瓶颈

摘要:在人工智能和 ML 技术的推动下,数据消费持续增长,对现代数据中心的高速连接产生了前所未有的需求。为满足这些需求,业界正在积极开发能够支持超过 200 Gbps 数据传输速率的下一代有线收发器

  简介

  在人工智能(AI)和机器学习(ML)技术进步的推动下,数据消费呈指数级增长,对现代数据中心的高速连接产生了前所未有的需求。随着人工智能模型的复杂性不断提高,参数数量达到天文数字(例如,BaGuaLu 的内核数量超过 3,700 万),对带宽和低延迟互连的需求变得非常重要。本文将探讨能够支持超过 200 Gbps 数据传输速率的下一代有线收发器的行业趋势、新兴技术和设计考虑因素,这些对于实现人工智能和数据中心应用中的无缝数据流非常重要,Alphawave的Tony Chan Carusone在ISSCC2024论坛上发布了题为:”The Impact of Industry Trends on 200+Gbps Wireline R&D” 的报告,本文将梳理其中的大致内容。

  驱动连接需求的大趋势

  1. 人工智能连接性和扩展性

  人工智能和 ML 工作负载的快速增长导致了大规模计算集群的部署,这些集群由数百到数千个通过高速链路互连的加速器(xPU)组成。到 2027 年,预计约 50% 的市场收入将由人工智能加速服务器驱动,其中 20% 的以太网数据中心交换机端口将连接到人工智能服务器。此外,预计这些交换机端口中的 50% 将以 400 Gbps 或更高的速度运行,到 2025 年,800 Gbps 的增长速度将超过 400 Gbps(图 1)。

图 1:人工智能连接和扩展的预计增长(来源:Dell'Oro Group 数据中心 IT 资本支出预测,2023 年 1 月)

  2. 分解存储

  推动高速连接需求的另一个重要趋势是分解存储架构的兴起。通过将存储集中在共享池中,数据中心可以提高效率,实现更大的共享池,从而提高资源利用率。然而,这种方法依赖于 PCIe 和 CXL 等低延迟互连,以确保计算资源和分解存储之间的无缝通信。

  3. 有线收发器趋势

  为满足不断增长的带宽需求,有线收发器数据速率大约每五年翻一番(图 2)。预计这一趋势将持续下去,在不久的将来,200 链路收发器将被广泛采用,随后几年将出现 400 Gbps 和 800 Gbps 链路收发器。

图 2:2010-2023 年已发布的收发器,显示数据速率每五年翻一番的趋势(来源:ISSCC 论坛)

  4. 200G 链路的优势

  采用 200Gbps 链路比采用较低数据传输速率的链路更具优势。例如,一个 51.2 Tbps 的 1RU(机架单元)交换机需要 32 个模块,每个模块有 16 x 100 Gbps 光链路,与 8 x 200 Gbps 链路的同等配置相比,激光器数量增加了一倍。通过减少激光器数量,200 Gbps 链路可大幅降低功耗和成本。此外,更高的每信道数据传输速率可使网络拓扑结构更扁平,采用更高的弧度交换机,从而减少延迟-这是人工智能工作负载的关键要求。

  200G 链路的新技术和注意事项

  1. 收发器内部

  要支持 200 Gbps 的数据传输速率,有线收发器必须采用先进的数字信号处理 (DSP) 技术和强大的前向纠错 (FEC) 方案。为了减轻因严重信道损耗(大于 30 dB)而造成的符号间干扰(ISI),必须采用大量均衡,如具有大量抽头的决策反馈均衡器(DFE)。此外,巡回抽头有限脉冲响应(FIR)均衡器等 DSP 技术也有助于解决短电缆信道中的反射问题。

  FEC 在确保通过有损信道进行可靠的数据传输方面发挥着重要的作用。在 200 Gbps 的速率下,需要更强大的 FEC 方案,从而导致解码复杂度、功耗和延迟增加。为了平衡编码增益、功耗和延迟之间的权衡,目前正在探索分段 FEC(每个链路段都由自己的优化 FEC 保护)和串联 FEC(为光链路提供双重保护)等技术。

  在 200 Gbps 速率下采用软决策 FEC 的一个重要架构影响是有效排除了模拟串行器/解串器(SerDes)架构。取而代之的是,有必要在 FEC 和模拟前端 (AFE) 之间进行更紧密的集成,这有利于基于模数转换器 (ADC) 的 DSP SerDes 架构。

  2. 200G 光电子技术

  目前正在为每波长 200 Gbps 的应用研究各种调制技术。电吸收调制激光器(EML)是一种很有前途的选择,提供了适度的摆幅要求和差分驱动配置的潜力。然而,在优化消光比(ER)和啁啾方面仍然存在挑战,尤其是在较长的波长上。

  硅基光电子(SiP)马赫-泽恩德调制器(MZM)和微环谐振器调制器(MRM)因其集成潜力和低成本而颇具吸引力。然而,对于 200 Gbps 的 SiP 调制器来说,同时实现所需的带宽、调制效率 (Vπ) 和低光损耗仍然是一项挑战。

  薄膜铌酸锂(TFLN)调制器也在探索之中,能提供高带宽和低驱动电压,但成本较高,而且存在潜在的集成挑战。

  3. 光/电协同设计

  随着数据速率的提高,光学和电子组件的协同设计和共同优化变得越来越重要。例如,接收器中光电二极管(PD)和跨阻抗放大器(TIA)之间的封装互连对宽带频率响应有重大影响。优化迹线阻抗和采用片上 T 型线圈等技术可以提高带宽并减少反射。

  此外,最佳设计参数可能因 DSP 均衡的存在和功能而异。在没有 DSP 均衡的情况下,最大限度地减少反射至关重要,而在有 DSP 均衡的情况下,保留一些残余反射则有利于实现更好的整体性能。

  4. 光电共封装器件 (CPO)

  为了应对芯片到模块互连的挑战,并实现更高的总带宽,光电共封装器件(CPO)解决方案正日益受到重视。通过将光学引擎与 ASIC 集成在同一封装内,CPO 可以消除对复位时器的需求、降低功耗并减少延迟。不过,CPO 也带来了一些挑战,例如封装内功率密度和热管理的增加,以及创新生态系统的潜在限制。

  超越 200 Gbps: 新兴技术

  1. 并行性: 波分复用和 PSM

  为了使每个波长的传输速率超过 200 Gbps,目前正在探索波分复用(WDM)和并行单模(PSM)光纤架构等技术。波分复用技术是在单根光纤上复用多个波长,从而实现更高的综合数据传输速率。紧凑型调制技术、低成本和低损耗的波长复用器/解复用器以及多波长激光源是实现波分复用技术的关键因素。

  2.高阶调制格式

  提高波特率和采用高阶调制格式(如 6-PAM 和 8-PAM)是实现每线路数据速率超过 200 Gbps 的潜在途径。不过,这些方法需要在模拟带宽、DSP 和编码技术方面取得重大进展。

  3. 相干光通信

  相干光通信是一项在长途网络中得到验证的技术,目前正被用于数据中心内的短距离传输。通过利用双偏振正交幅度调制(DP-QAM)等相干调制格式,相干链路在相同波特率下的数据传输速率是强度调制和直接检测(IM/DD)链路的四倍。

  针对 10 千米以下的传输距离量身定制的轻型相干解决方案的最新发展已显示出良好的效果。这些解决方案利用 O 波段(约 1310 nm)降低 DSP 功耗,同时保持短距离应用可接受的光纤损耗。此外,还在探索同步波特率采样 DSP 架构,以进一步降低相干收发器的功耗和延迟。

  结论

  在人工智能和 ML 技术的推动下,数据消费持续增长,对现代数据中心的高速连接产生了前所未有的需求。为满足这些需求,业界正在积极开发能够支持超过 200 Gbps 数据传输速率的下一代有线收发器。

  200 Gbps 链路的关键技术和考虑因素包括先进的 DSP 技术、强大的 FEC 方案、光学和电子组件的协同设计以及对新光学调制格式的探索。此外,光电共封装和相干光通信正在成为有前途的解决方案,以应对芯片到模块互连的挑战,并在数据中心内实现更高的数据传输速率。

  当我们将目光投向 200 Gbps 以上时,也正在积极研究波分复用技术、高阶调制格式和短距离相干光通信等技术。包括模拟和数字设计、编码理论、光学和系统架构在内的各学科间的合作,对于克服挑战并实现未来人工智能和数据中心应用中的无缝数据流非常重要。

  参考文献

  [1]T. C. Carusone, “The Impact of Industry Trends on 200+Gbps Wireline R&D,” in IEEE International Solid-State Circuits Conference (ISSCC), 2024

1、凡本网注明“来源:讯石光通讯网”及标有原创的所有作品,版权均属于讯石光通讯网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、免责声明,凡本网注明“来源:XXX(非讯石光通讯网)”的作品,均为转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。因可能存在第三方转载无法确定原网地址,若作品内容、版权争议和其它问题,请联系本网,将第一时间删除。
联系方式:讯石光通讯网新闻中心 电话:0755-82960080-168   Right