用户名: 密码: 验证码:

2024芯•光论坛 | 主论坛《智能计算与光互联技术》圆满举办

摘要:5月15日,由华为海思光电主办,ICC讯石承办的“2024芯•光论坛:芯光耀智算 互联畅未来”会议在武汉光谷皇冠假日酒店举办。5月15日上午主论坛《智能计算与光互联技术》聚焦智能计算的爆发式增长及互联增长和光电互联技术的最新进展,来自华为昇腾计算、科大讯飞、中国信通院、中国移动研究院和华为海思光电的行业专家进行了深度的分析与探讨。

      ICC讯  2024年5月15日,由华为海思光电主办,ICC讯石承办的“2024芯•光论坛:芯光耀智算 互联畅未来”会议在武汉光谷皇冠假日酒店火热举办。本次大会汇聚了近500位光电子领域专业人士,探讨光电技术的演进趋势,共话全球光互联产业的发展机遇。

      5月15日上午主论坛《智能计算与光互联技术》聚焦智能计算的爆发式增长及互联增长和光电互联的技术最新进展,探讨了光互联在智能计算时代的发展趋势。来自华为昇腾计算、科大讯飞、中国信通院、中国移动研究院和华为海思光电的行业专家及学术大咖进行了深度的分析与探讨。

余海波  华为武汉研究所所长

      华为武汉研究所所长余海波代表主办方致欢迎辞,随着AIGC技术的快速发展,其产业规模未来将突破万亿元,大模型的发展将极大促进光互联产业的发展。希望大家能通过今天的研讨和交流,共同探讨技术创新、产业发展和标准工作,共建健康的行业生态。    

周斌 华为昇腾计算业务CTO

      华为昇腾计算业务CTO周斌发表了主题为《AI的演进及下一代AI计算系统的思考》的精彩演讲。

张骁 科大讯飞基础设施总监

      科大讯飞基础设施总监张骁发表了主题为《大模型训练网络互连-从需求到挑战》的演讲。基于国产算力的扎实国产化积累,科大讯飞在2023年与华为进行软硬件联合攻关大模型国产化算力底座核心难题,构建了国内首个支持万亿级浮点参数大模型训练的国产算力集群“飞星一号”平台,形成了超大模型训练算力集群优势。

      分享中指出在随着大模型的进一步发展,算力规模化趋势突显,网络的互联速度将是关键技术,从机内通信到柜间通信,网络带宽都面临着迅速的增长,需要超大带宽、极致成本和极简运维的联接方案。 同时,大模型的长稳训练需要稳定可靠的网络及联接方案。科大讯飞聚焦TOP问题,联合华为、海思光电采用创新光模块故障预测及分析方法,将任务影响环比下降约70%,大幅降低了光链路故障对训练效率的影响。此外,功耗在数据中心的运营中也是不可忽视的一环,需要产业界在组网架构、通信方案、软件效率等领域持续提升,支撑大模型产业的长期发展。

张海懿 中国信通院技术与标准研究所所长

      中国信息通信研究院技术与标准研究所张海懿所长发表了主题为《智算中心网络技术产业发展展望》的演讲。我国出台系列政策加快布局算力基础设施,智能算力需求激增,高性能智算中心网络建设成为热点。2003-2023年近二十年间智能算力需求指数增长,以GPT为代表的人工智能大模型突破性进展激发了全球智能算力发展热潮,千卡算力芯片构建的集群将成为千亿参数大模型训练的标配。如何加速构建高性能网络以支撑智能算力发展成为业界关注的热点。

      张所长在演讲中提到,智算中心架构涉及到的互联包含了智算接入网络、智算中心间互联、服务器间互联和片上/片间互联多个领域,技术上都在快速发展,其中800G & 1.6T短距以太网将成为承载超高速算力互联重要手段,满足AI大模型等应用场景带来的数据持续增长需求;而800G及更高速率的长距光传输方向正在加快技术标准研究,逐步启动试点验证:

      · 标准化进展:800G和1.6T成为ITU-T、OIF、IEEE 802.3、CCSA等国内外标准组织的研究热点,调制格式、映射技术、扩展C+L光系统、高性能FEC等是标准化的关键。

      · 产业化进展:基于~130G Baud,16QAM调制的800G方案是目前技术研究和产品研发的重点,可以重用400G QPSK产业链。1.6T部署还需依赖200G Baud以上光电器件的成熟。

      此外,800Gb/s和1.6Tb/s的光模块研发应用也正在加速,报告中提到当前8x100Gb/s光模块基本成熟,4x200Gb/s和城域800Gb/s相干光模块是下一步研发的重点。

程伟强 中国移动研究院基础网络技术研究所副所长

      中国移动通信有限公司研究院基础网络技术研究所副所长程伟强发表了主题为《高性能以太网助力智算中心互联》的演讲。

      随着智能算力需求的激增,承载网络成为AI算力高速增长的瓶颈。以太网技术路线逐渐形成产业共识,高带宽、高性能、高可靠和高安全的以太网助力智算中心互联是提升智算中心网络性能和整体算力水平的关键技术之一。

      报告中提到800G将会是DCN和DCI发展的重要代际节点,因为AIGC推动全球云服务商加速部署800G商用网络,以应对日益增长的数据传输需求,并优化数据中心基础设施。数据中心DCN在向800G演进,同时DCI也已经开始启动800G研究,800G以太网标准进展显著,业界加快转向800G应用。

      关于中国移动800GE标准进展,程伟强介绍了中国移动积极参与并推动IEEE 802.3 df & dj工作组的800GE标准化工作,主导多项需求及标准文稿提案,并牵头完成了800GE 20km新项目立项,这是中国公司在IEEE的首个以太网基础标准立项,同时主导通过了20km/40km相关标准框架提案被工作组采纳。

      程伟强的演讲总结聚焦高性能以太网能够助力智算中心互联,并倡议业界伙伴加强投入,提升智算中心网络性能和整体的算力水平。

满江伟 华为海思光电先进光电实验室主任

      华为海思光电先进光电实验室主任满江伟发表了主题为 《AI大模型下光电子互联技术的机遇与挑战》的演讲。满主任在演讲中用数据和图表再现了AI基础设施的核心引擎——GPU的加速演进,从原来的两年一代到现在的一年一代。配套的AI光互连光模块需求也在快速增长。

      为了适配Al对光联接的需求,满江伟指出光模块的演进需要重点关注5大方向:大带宽、低时延、低功耗、高可靠和智能化。海思光电联合产业上下游合作伙伴,在洞察AI对光联接的需求后,打造了星云智能光模块的解决方案,全面承载AI计算需求:

      大带宽:依托自研光电芯片,通过系统级的规格定义和联合优化,满足AI互联的带宽需求

      低时延:采用算法优化、线性直驱等多种方案降低时延,支撑大模型训练效率提升

      低功耗:综合使用低驱EML、无TEC设计、高效率光源等技术,综合降低模块功耗

      高可靠:通过架构极简设计,提高系统可靠性,配合高可靠的光源方案,提升模块长期工作的可靠性

      智能化:联合计算领域进行系统级优化,实现链路的故障智能定界、自愈消除、污损检查等多项功能,大幅提升运维效率

      总 结

      随着GPT等大模型的出现,对计算、训练和推理的算力需求快速提升,推动了GPU和CPU性能持续提高,传统电互联和网络逐渐不能匹配带宽增长的需求,实现下一代智能计算需要新技术大幅提升互联的容量。光互联作为骨干网和数据中心网络的关键环节之一,每一步都需要满足苛刻的功耗、时延及智能等要求,跟上产业需求,配合上下游产业链解决当前带宽增长不足的挑战,共建繁荣的光互联AI产业生态。

内容来自:讯石光通讯网
本文地址:http://www.iccsz.com//Site/CN/News/2024/05/16/20240516130311622404.htm 转载请保留文章出处
关键字:
文章标题:2024芯•光论坛 | 主论坛《智能计算与光互联技术》圆满举办
1、凡本网注明“来源:讯石光通讯网”及标有原创的所有作品,版权均属于讯石光通讯网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、免责声明,凡本网注明“来源:XXX(非讯石光通讯网)”的作品,均为转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。因可能存在第三方转载无法确定原网地址,若作品内容、版权争议和其它问题,请联系本网,将第一时间删除。
联系方式:讯石光通讯网新闻中心 电话:0755-82960080-168   Right