用户名: 密码: 验证码:

中国电信完成业内首个千卡千亿参数模型500公里联合训练试商用

摘要:中国电信完成首个1024卡千亿参数商用大模型分布式联合训练真实用户试商用,该试商用基于北京现网800G广域智联无损网络,通过创新广域无损调度算法、关键帧识别技术,将带宽收敛比提升到32:1;创新WSON 50ms极速倒换技术,实现长距链路中断无感知切换。

  近日,在中国电信集团公司统一组织下,中国电信研究院、天翼云、北京电信成功完成业内首个1024卡千亿参数商用大模型分布式联合训练真实用户试商用,通过武清到瀛海之间的真实光路环回实现了500公里长距互联分布式训练,训练性能达到单数据中心的97%以上,这一重大突破为大模型训练的跨地域协同发展开辟了新的道路。

  本次试商用基于北京现网800G广域智联无损网络以及息壤一站式智算服务平台开展,在互联距离、带宽收敛比以及模型参数方面均产生突破,实现了多数据中心互联及资源整合支持商用模型分布式联合训练。

  在广域智联无损网络技术方面,中国电信创新广域无损调度算法、关键帧识别技术,将带宽收敛比提升到32:1;创新WSON 50ms极速倒换技术,实现长距链路中断无感知切换。系列技术有效解决了长距离传输中网络拥塞丢包、链路故障、建网成本等问题,确保了训练过程的稳定性和高效性——在500公里的长距离传输下,网络传输吞吐率仍能保持在较高水平,为千卡千亿参数商用大模型的联合训练提供了坚实的网络支撑。与此同时,息壤平台支持算力插件、跨地域算网协同、跨数据中心自动并行、断点续训等一系列关键技术能力,实现故障秒级定位、分钟级处理与恢复,保证了百川千亿参数商用模型的快速部署和稳定高效运行。

  此次试商用的成功是中国电信在智算网络领域持续创新和实践的成果,也是积极响应国家战略推动算力网络协同发展的重要举措。未来,中国电信将继续加大在智算网络领域的投入和研发力度,为人工智能产业的发展提供更加强有力的网络支持,助力我国数字经济的高质量发展。

内容来自:讯石光通讯网
本文地址:http://www.iccsz.com//Site/CN/News/2025/02/05/20250205071843120005.htm 转载请保留文章出处
关键字:
文章标题:中国电信完成业内首个千卡千亿参数模型500公里联合训练试商用
1、凡本网注明“来源:讯石光通讯网”及标有原创的所有作品,版权均属于讯石光通讯网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、免责声明,凡本网注明“来源:XXX(非讯石光通讯网)”的作品,均为转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。因可能存在第三方转载无法确定原网地址,若作品内容、版权争议和其它问题,请联系本网,将第一时间删除。
联系方式:讯石光通讯网新闻中心 电话:0755-82960080-168   Right