算力管理复杂、训练成本过高,专家谈AI困境如何破解

来源: 国际在线
2024-06-30 05:22:26

  中新网6月29日电(中新财经记者 吴涛)“大模型的高速发展使得AI不得不面临算力管理复杂、训练推理成本高、任务调度难等多方面发展瓶颈。”

  近日,在蚂蚁数科举行的一场发布会上,中国信息通信研究院云大所副所长栗蔚指出,云原生凭借其高可用、弹性、可扩展等优势成为突破AI困境的关键,云原生PaaS平台的大模型产品工具链不断完善,将加速大模型技术在行业应用中落地。

  栗蔚表示,根据调研,云原生除了作用于AI之外,之前它作用于很多互联网应用的研发,超过一半中国企业大部分互联网化应用程序都是云原生的架构,甚至传统的核心架构现在也都在云化。

  据介绍,在AI时代,因为大模型对算力需求很大,GPT3.5的时候是1750亿参数,需要500个英伟达的卡,到了GPT5是10万亿的参数,需要50万张英伟达的卡。这种情况下,云将发挥出新的关键作用。

  “50万张英伟达卡计算是不可能在一个数据中心完成的,所以很多大模型计算跨域不可避免,但跨域以后对方是英伟达的卡吗?或者智算底层基础设施都不一定。这种情况下,我们需要什么?中间谁能把应用部署在算力上跑起来呢?”

  栗蔚给出答案,她认为,就是云,AI时代几个发展瓶颈问题基本都是要靠云原生满足的。云原生屏蔽了底层算力的差异,其应用不在乎你底下是CPU还是GPU,还是用了什么样的规格的卡,我只是将应用部署在上面,用你的计算能力,所以云原生发挥了这样的作用。

  “很多企业通过用了云原生,对于底下上千台服务器进行统一的纳管,从而全方位 提升效率和降低成本。”栗蔚强调,云跟AI结合才能充分降低AI的工程化成本,让AI大模型真实地跑起来变成服务。(完)

  自2012年北京中轴线被列入《中国世界文化遗产预备名单》以来,北京市一直高度重视中轴线的保护传承工作,并于2022年10月1日正式实施《北京中轴线文化遗产保护条例》,此次《规划》正是对标世界遗产保护要求,为北京中轴线的保护管理提供方向策略和基础依据。

  而她跨越心理障碍的方式也充满个性,那就是让自己的心理医生走人。

  某一线城市陪诊团队创始人阿杰告诉记者,由于当时医院接诊了许多新冠染者,一些就诊者有所顾忌,担心去医院会增加感染风险,于是就会预约代问诊、代取药等服务,请陪诊师们为自己跑一趟,以减少院内感染的风险。在此情形下,阿杰明显感觉到,这段时间预约陪诊服务的订单少了,预约代问诊、取药服务的订单则有所增多。

  35万人次春节“海底捞”

  每晚23点20分,中国雪都·阿勒泰号从乌鲁木齐站始发,开启全程为908公里的行程。

  2022年,中国的CPI单月涨幅始终运行在3%以下,全年上涨2%,大幅低于美国8%左右、欧元区8%以上、英国9%左右等发达经济体涨幅,也明显低于印度、巴西、南非等新兴经济体7%至10%(1至11月份)的涨幅。

林义心

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有