ICC讯 谷歌云上周三宣布,其第八代自研AI芯片(即张量处理单元)将分为两款。一款名为TPU 8t,面向模型训练;另一款名为TPU 8i,面向推理。推理是指模型的持续使用,也就是用户提交提示词之后发生的事情。
正如您所料,与前几代产品相比,该公司宣称这些新TPU具有令人印象深刻的性能规格:AI模型训练速度提升3倍,每美元性能提升80%,并且能够使超过100万个TPU在单个集群中协同工作。结果应该是比前代产品用更少的能源和成本为客户提供更多的计算能力。谷歌将这些芯片称为TPU而非GPU,是因为其定制的低功耗芯片最初被命名为Tensor。
但谷歌的芯片并不是对英伟达未来的全面冲击,至少现在还不是。与其他大型云提供商(包括微软和亚马逊)一样,谷歌正在使用这些芯片来补充其基础设施中提供的基于英伟达的系统,而不是完全取代英伟达。事实上,谷歌承诺其云平台将在今年晚些时候提供英伟达的最新芯片Vera Rubin。
随着企业将其AI需求转移到这些云上并将其应用程序移植到这些芯片上,自研AI芯片的超大规模企业(包括亚马逊、微软和谷歌)有朝一日可能会减少对英伟达的依赖。
尽管如此,就目前情况而言,押注英伟达失败并不明智。正如著名芯片市场分析师Patrick Moorhead在X上开玩笑说的那样,他在2016年谷歌推出首款TPU时就预测TPU对英伟达(和英特尔)来说是个坏消息。如今英伟达的市值已接近5万亿美元,这意味着这个预测并未经得起时间的考验。
如果一切按照英伟达的计划进行,谷歌作为AI云提供商的增长将为这家芯片制造商带来更多业务,而不是更少,即使许多工作负载运行在谷歌的芯片上。
事实上,谷歌还表示,已同意与英伟达合作设计计算机网络,使基于英伟达的系统能够在其云中更高效地运行。具体而言,这两家科技巨头正在努力加强名为Falcon的软件网络技术。谷歌于2023年在开源数据中心硬件组织的鼻祖——开放计算项目下创建并开源了Falcon。