ICC讯 甲骨文与AMD周四联合宣布,AMD最新Instinct MI355X GPU将登陆甲骨文云基础设施(OCI),为大规模AI训练和推理工作负载提供较前代产品2倍以上的性价比优势。OCI将构建由多达131,072块MI355X GPU加速的zettascale级AI超级计算集群,支持客户开展规模化AI开发。
OCI执行副总裁Mahesh Thiagarajan表示:"我们致力于提供最广泛的AI基础设施选择。AMD加速器与OCI高性能网络、灵活架构的结合,将满足客户对新型智能体应用的训练推理需求。"该方案采用高吞吐、超低延迟的RDMA集群网络架构,MI355X GPU计算性能提升近3倍,高频内存容量增加50%。
AMD数据中心解决方案事业部执行副总裁Forrest Norrod指出:"双方合作始终致力于为客户提供开放、高效且灵活的解决方案。新一代AMD加速器与Pollara网卡将支持更多AI推理、微调和训练场景。"
MI355X核心优势
新平台具备288GB HBM3显存和8TB/s内存带宽,支持4位浮点计算(FP4)标准,采用液冷设计实现单机架125千瓦功率密度。每机架部署64块1400瓦GPU,配合AMD Turin高频CPU(最高3TB系统内存)实现高效任务调度。客户可通过AMD开源ROCm软件栈无缝迁移现有代码,并利用Pollara智能网卡的先进RoCE功能构建高性能网络。
(注:RDMA指远程直接内存访问技术,RoCE为基于融合以太网的RDMA协议)