ICC讯 2024年9月10日,海思光电先进光电实验室主任满江伟博士在第22届讯石研讨会的主论坛《光通信赋能算力底座》上发表了《从通算迈向智算,AI光互联模块技术演进探讨》的主题演讲,分享智算中心网络对光互联的技术需求以及海思光电面向智算中心光互联的星云系列光模块产品和技术。
满江伟博士在分享中指出:在过去的十数年的时间中,短距光模块的应用场景和技术规格经历了由电信运营商网络、通算数据中心网络、AI智算中心网络来驱动演进的不同阶段。随着大模型的爆发性发展带动了AI智算中心向超大规模集群演进,推动着数通短距光模块进入新的发展阶段。
AI智算中心向大规模集群演进的过程中,由于采用了大规模并行计算,AI计算对光链路的可靠性和可用性提出了新的挑战。海思对AI智算中心的故障进行了大规模的深度数据分析,发现光纤链路脏污是首要问题,其导致的丢包会大幅降低AI智算中心集群的可用度;同时,光模块的随机失效率也制约大模型运行效率。为了提升AI集群的可用度,系统层面首先需要减少光纤链路脏污,同时,光模块需要针对性地提高自身的可靠性,协同网络设备来保障AI集群的高可用和高可靠。
海思光电深度整合光电产业的关键技术,与交换、计算相关领域进行协同的规格定义和产品设计,推出面向AI智算中心的星云系列光模块,全面承载AI计算需求,提升AI智算网络的效率,保障AI智算中心的高可用与高可靠。针对链路脏污问题,通过光链路故障高精度实时检测与分析,实现主动在线的光路诊断监测预警和故障定界;同时,依托多年在光芯片领域的技术积累,从产品定义、架构设计、工艺实现等层面综合保证光芯片的高性能及高可靠,显著降低光模块中激光器的失效率,支撑AI智算网络的长期稳定工作。
满江伟博士最后指出,AI及AI智算网络正处于前所未有的加速发展阶段,这对光互联既是机会也是挑战。海思光电打造的星云系列光模块将继续适配AI智算网络对光互联的关键需求,赋能高可用、高可靠、智能化等业务场景,助力AI数据中心的蓬勃发展。