英特尔发布首款全集成光学I/O芯粒(Chiplet)

讯石光通讯网 2024/6/28 14:34:22

英特尔光计算互联芯粒(Chiplet)有望推动AI基础设施变革性高速率数据处理

  ICC讯 英特尔(Intel)高速数据传输应用集成光子技术取得了具有革命性意义的里程碑式突破。在OFC 2024上,英特尔集成光子解决方案(IPS)集团推出了业界最先进且第一个与英特尔CPU共同封装并传输实时数据的全集成光学计算互连(OCI)芯片。英特尔OCI芯片通过在数据中心和高性能计算(HPC)应用的人工智能基础设施中实现共封装(CPO)的光学输入/输出(I/O),在高带宽互连方面实现了巨大飞跃。

  集成光子解决方案集团产品管理与战略高级总监Thomas Liljeberg表示:“服务器持续增长的数据流量正在考验当今数据中心基础设施的能力,当前的解决方案正迅速接近电气I/O性能的实际极限。然而,英特尔的开创性成果使客户能够将共封装(CPO)硅光子互连解决方案无缝集成到下一代计算系统中。OCI Chiplet提高了带宽,降低了功耗并增加了传输距离,使机器学习工作负载加速,有望彻底改变高性能人工智能基础设施。”

  第一款OCI芯片旨在支持在100米光纤单方向32Gbps速率的64通道传输,有望将满足人工智能基础设施对更高带宽、更低功耗和更长传输距离的需求。它支持CPU/GPU集群连接和新型计算架构的未来可扩展性,包括相干内存扩展和资源分解。

  基于人工智能的应用场景在全球范围内的广泛部署,大型语言模型(LLM)和生成式人工智能的最新发展正在加速这一趋势。更大、更高效的机器学习(ML)模型将在解决人工智能加速工作负载的新需求方面发挥关键作用。未来AI计算平台的扩展需求正在推动I/O带宽的指数级增长和更长的覆盖范围,以支持更大的处理单元(CPU/GPU/IPU)集群和具有更高效资源利用的架构,例如xPU分解和内存池。

  电气I/O(即铜缆连接)提供高带宽密度和低功耗,但仅支持1米甚至更短的传输距离。数据中心和早期人工智能集群中使用的可插拔光模块可以在成本和功率水平上增加覆盖范围,但这在人工智能工作负载的扩展要求下是不可持续的。协封装的xPU光I/O解决方案可以支持更高的带宽,提高功率效率,低延迟和更长的覆盖范围-这正是AI/ML基础设施扩展所需要的。

  例如,用CPU和GPU中的光学I/O取代电气I/O来传输数据,就像从使用容量和范围有限的马车来分发货物,到使用可以在更远的距离上运送大量货物的汽车和卡车。其升级性能和能源成本是光学I/O解决方案(如英特尔的OCI芯片)为人工智能扩展所创造的价值。

  英特尔公司集成光子学解决方案(IPS)组展示了业界首个与英特尔CPU共封装并运行实时数据的全集成光计算互连(OCI)芯片。可在新兴的AI基础设施中为数据中心和高性能计算应用提供共封装光输入/输出。(资料来源:英特尔公司)

  全集成OCI芯片利用英特尔经过现场验证的硅光子技术,将硅光子集成电路(PIC)与电子IC集成在一起,其中包括片上激光器和光放大器。OFC上展示的OCI芯片与英特尔CPU共封装,但也可以与下一代CPU、GPU、IPU和其他片上系统(SOC)集成。

  首款OCI芯片实现支持4Tbps的双向数据传输,与外部组件互连express (PCIe) Gen5兼容。现场光学链路演示展示了两个CPU平台之间通过单模光纤(SMF)跳线的Tx端和Rx端连接。CPU生成并测量了光学误码率(BER),演示展示了在单根光纤上200GHz间隔的8个波长的Tx频谱,以及32 Gbps的Tx眼图,证明了优秀的信号质量。

  目前的芯片支持64*32Gbps通道,每个方向传输100米(尽管由于飞行时间延迟,实际应用可能限制在几十米),利用8对光纤,每对光纤传输8个密集波分复用(DWDM)波长。这种共封装解决方案也非常节能,与可插拔的光收发模块相比,每比特的功耗仅为5pJ。这种超高效率对于数据中心和高性能计算环境至关重要,可以帮助解决人工智能不可持续的电力需求。

新闻来源:讯石光通讯网

相关文章