各大AI模型训练成本大比拼:谷歌Gemini Ultra高达1.9亿美元

来源: 奥一网
2024-06-05 20:39:05

  随着计算需求的增加,训练它们所需的计算能力的费用也在飙升。为此,AI公司正在重新考虑如何训练这些生成式AI系统。在许多情况下,这些策略包括在当前的增长轨迹下降低计算成本。

  训练成本是如何确定的?

  斯坦福大学与研究公司Epoch AI合作,根据云计算租金估算了AI模型的训练成本。双方所分析的关键因素包括模型的训练时长、硬件的利用率和训练硬件的价值。

  尽管许多人猜测,训练AI模型的成本变得越来越高,但缺乏全面的数据来支持这些说法。而斯坦福大学发布的《2024年AI指数报告》正是支持这些说法的罕见来源之一。

  不断膨胀的训练成本

  下表展示了自2017年以来,经通胀调整后的主要AI模型的培训成本:

  去年,OpenAI的GPT-4培训成本估计为7840万美元,远高于谷歌PaLM (540B) 的训练成本。谷歌PaLM较GPT-4仅早一年推出,但训练成本为1240万美元。

  相比之下,2017年开发的早期AI模型Transformer的训练成本为930美元。该模型在塑造当前所使用的许多大型语言模型的体系结构方面起着基础性作用。

  谷歌的AI模型Gemini Ultra的训练成更高,达到了惊人的1.91亿美元。截至2024年初,该模型在几个指标上都超过了GPT-4,最引人注目的是在“大规模多任务语言理解”(MMLU)基准测试中胜出。这一基准是衡量大型语言模型能力的重要标尺。例如,它以评估57个学科领域的知识和解决问题的熟练程度而闻名。

  训练未来的AI模型

  鉴于这些挑战,AI公司正在寻找新的解决方案来训练语言模型,以应对不断上涨的成本。

  其中的 方法有多种,比如创建用于执行特定任务的较小模型,而其他一些公司正在试验创建自家的合成数据来“投喂”AI系统。但到目前为止,这方面还没有取得明确的突破。

  例如,使用合成数据的AI模型有时会“胡言乱语”,引发所谓的“模型崩溃”。

责任编辑:刘明亮

  “以前,觉得列车员工作好简单,就是走来走去。现在才发现,这个岗位不容易。”陈柳燕说,10个小时,2000公里,方方面面,点点滴滴,事情很多,责任很大。

  记者走访了解到,多地村里诊所和乡镇中心卫生院春节假期“不打烊”,他们通过微信群、大喇叭向村民宣传防疫知识,同时走村入户送医送药。

  <strong>假期长时间看手机,快来解锁正确的姿势【健康幸福过新年】(13)</strong>

郁郁葱葱的山林里

  清晨,西安火车站内,一列绿皮火车迎来旅客。不过,这些旅客既未拖着沉重的行李箱,也没有背着大包小包。无论男女老少,都衣着鲜亮,手上拎着消闲零食——他们踏上的不是春运路程,而是一趟“时髦”之旅。

  “一层层的摆起粉面彩身、身后插着旗伞的兔儿爷——有大有小,都一样的漂亮工细,有的骑着老虎,有的坐着莲花,有的肩着剃头挑儿,有的背着鲜红的小木柜……”在《四世同堂》里,京味文学大师老舍用生动细致的语言描述了北京传统泥塑手工艺品——兔儿爷。

白英琴

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有