用户名: 密码: 验证码:

小模型实现大收益!人工智能公司正寻求获利“新思路”

摘要:全球诸多科技公司已经砸下数百亿美元来构建各种大型语言模型,为生成式人工智能产品提供动力,而如今,这些公司开始寄望于一种推动收入增长的新方式——小型语言模型。小型语言模型的参数相较于大型语言模型少很多,但仍然具有强大的功能。

  ICC讯 全球诸多科技公司已经砸下数百亿美元来构建各种大型语言模型,为生成式人工智能产品提供动力,而如今,这些公司开始寄望于一种推动收入增长的新方式——小型语言模型。

  小型语言模型的参数相较于大型语言模型少很多,但仍然具有强大的功能。微软、Meta和谷歌近期都发布了新的人工智能小参数模型。

  通常来说,参数的数量越多,人工智能软件的性能就越好,它所能执行的任务就越复杂和巧妙。上周,OpenAI公司新宣布的最新模型GPT-4o和谷歌的Gemini 1.5 Pro估计拥有超过1万亿参数,而Meta的开源Llama模型约有4000亿参数。

  不过,运行大型语言模型所需的计算能力庞大,也就意味着成本高昂。除了难以说服一些企业客户支付大笔运营费用外,数据和版权问题也成了人工智能产品使用的阻碍。

  替代方案

  一些科技公司目前正在将只有几十亿个参数的小型语言模型视为更便宜、更节能、可定制的替代方案进行宣传。这些模型可以用更少的电力来训练和运行,并且还可以保护敏感数据。

  谷歌、Meta、微软和法国初创公司Mistral已陆续发布了各自的小型语言模型,这些模型显示出先进的功能,并且可以更好地专注于特定的应用功能。

  Meta全球事务总裁Nick Clegg直言,Llama 3最新的80亿参数模型可与GPT-4媲美。他指出,“我认为,在你能想到的几乎所有衡量标准中,你都看到了卓越的表现。”

  微软则表示,其拥有70亿个参数的Phi -3小型模型的性能优于OpenAI模型的早期版本GPT-3.5。

  微软Azure人工智能平台的副总裁Eric Boyd表示,“通过以更低的成本获得如此高的质量,你实际上为客户提供了更多的应用程序,让他们可以做一些令人望而却步的事情。”

  Boyd还指出,“更小的型号将带来有趣的应用,并且能够延伸到手机和笔记本电脑”。

  小型模型另外的一大优势就是可以在设备上“本地”处理任务,而不是将信息发送到云端,这一点可能会吸引那些注重信息隐私的客户。

  目前,谷歌最新的Pixel手机和三星最新的S24智能手机中已嵌入了谷歌的“Gemini Nano”模型;苹果公司也暗示它也在开发AI模型,以运行iPhone上。上个月,苹果发布了OpenELM模型,这是一个小型模型,旨在执行基于文本的任务。

1、凡本网注明“来源:讯石光通讯网”及标有原创的所有作品,版权均属于讯石光通讯网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、免责声明,凡本网注明“来源:XXX(非讯石光通讯网)”的作品,均为转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。因可能存在第三方转载无法确定原网地址,若作品内容、版权争议和其它问题,请联系本网,将第一时间删除。
联系方式:讯石光通讯网新闻中心 电话:0755-82960080-168   Right