“买个菜不用开坦克去”!全球AI浪潮开始聚焦“小而美”

来源: 凤凰网
2024-07-07 09:56:19

财联社7月5日讯(编辑 潇湘)在全球范围内,人工智能军备竞赛最初的起点是追求“大”: 巨型模型在海量的数据上进行训练,试图模仿具有人类智能水平的人工智能。

然而如今,大量科技巨头和初创企业正在开始考虑缩小AI软件的规模,使其更便宜、更快速、更专业……

这类AI软件被称为小型语言模型(SLM)或中型语言模型,使用较少的数据进行训练,通常专为特定任务而设计。

作为对比,那些知名的大型语言模型(LLM),如OpenAI的GPT-4,开发成本超过1亿美元,训练的参数达到了逾1万亿。而较小的语言模型则通常在较窄的数据集上进行训练——例如,可能仅仅聚焦于法律问题上,其训练成本往往可能不到1000万美元,参数不到100亿。较小的模型也将消耗较少的算力,因此响应每个查询的成本也较低。

近几个月来,微软就正在大力宣传其名为“Phi”轻量级AI模型系列。微软首席执行官Satya Nadella表示,这些模型的大小只有OpenAI的ChatGPT免费模型的1/100,而执行许多任务的效果却几乎一样好。

微软首席商务官Yusuf Mehdi表示,“我认为,我们越来越有理由相信,未来将是一个由不同(大小)模型组成的世界。”

Mehdi称,微软是全球首批在生成式人工智能上押注数十亿美元的大型科技公司之一。而我们也很快意识到,人工智能的运营成本比公司最初预计的要高。

微软最近还推出了新型的AI笔记本电脑,搭载数十个人工智能模型进行搜索和图像生成。这些模型需要用到的数据非常少,可以在终端设备上运行,而不需要像ChatGPT那样访问庞大的基于云端的数据中心。

谷歌以及人工智能初创公司Mistral、Anthropic和Cohere今年也发布了更小的模型。苹果在六月份公布该公司的AI路线图时,也计划使用小型模型,这样就可以完全在手机上运行软件,使其更为快捷方便、也更为安全。

就连一直处于大型模型模型浪潮前沿的OpenAI,也在5月发布了其旗舰模型的新版本GPT-4o,并称该模型运营成本更低。一位发言人OpenAI表示,该公司对未来发布更小的模型持开放态度。

AI模型浪潮开始聚焦“小而美”

对于许多任务来说——比如汇总文档或生成图像,大型语言模型如今显得可能会有些“奢侈”。一些行业人士将此形容为“相当于开着坦克去买菜”。

目前从事区块链技术研究的Illia Polosukhin是2017年谷歌一篇开创性论文的作者之一,该论文为当前的生成式人工智能热潮奠定了基础。Polosukhin近来就表示,单单计算“2+2”不应该需要进行无数次运算。

事实上,从财务成本的考量来看,在生成式人工智能技术 的回报尚不明确的情况下,企业和消费者也一直在寻找以更低成本运行AI的方法。

位于以色列特拉维夫的人工智能公司AI21 Labs的联合创始人Yoav Shoham称,由于只需使用较少的算力,在许多情况下,小型模型回答问题的成本仅为大型语言模型的六分之一。如果你要进行数十万甚至数百万次回答,使用大模型在经济上其实行不通。

当前的关键在于,如何更有效地将这些较小的模型集中在一组数据上,如内部通信、法律文件或销售数字,以执行撰写电子邮件等特定任务——这一训练过程被称为微调(Fine-tuning)。通过微调,可以让小型模型在执行这些任务时与大型语言模型一样有效,而成本只是大型模型的一小部分。

初创公司Snorkel AI的联合创始人Alex Ratner表示,“让这些更小、更专业的模型在这些更枯燥但更重要的领域工作,是目前人工智能的前沿领域。”

Snorkel AI目前的业务范围包括帮助企业定制人工智能模型。

企业用户也正转向小模型?

益百利首席数据官Ali Khan表示,在公司内部数据上进行训练时,小型模型的表现与大型模型不相上下,而成本仅为大型模型的一小部分。他表示,这些小模型可以针对一个明确的问题领域和一系列任务进行特定训练。

Salesforce人工智能部门主管Clara Shih则表示,这些小模型的响应速度相比大模型也更快。

Shih称,“使用大型模型你会付出过高的成本并且有延迟问题。有时候也根本用不着。”

值得一提的是,在开始向小语言模型转变的同时,诸多AI巨头大型语言模型的迭代速度也在放缓。

自OpenAI去年发布GPT 4(与之前的模型GPT 3.5相比,功能有了显著提升)以来,还没有新的迭代模型(GPT 5)发布。研究人员认为,造成这种情况的原因包括用于训练的高质量新数据稀缺。

这一趋势也让人们开始更为关注小模型。领导Phi模型项目的微软公司高管塞Sébastien Bubeck表示,“现在正是大家都在等待的一个小间歇期,这会让人们的注意力转向,他们会想,‘好吧,我们还能不能让这些东西更高效?’”

目前,还不清楚这种迭代停滞是暂时的,还是遭遇了一个更为棘手的技术瓶颈问题。但是,小型语言模型的大量涌现,仍说明了人工智能正在从科幻小说般的梦幻演示,演变成了不那么令人兴奋的商业现实。

当然,许多公司并没有完全放弃大型语言模型。苹果已宣布将在其Siri助手中加入ChatGPT,以执行撰写电子邮件等更复杂的任务。微软表示,其最新版的Windows也将集成OpenAI的最新模型。不过,两家公司都只是将OpenAI集成作为其整体人工智能方案的一部分,而显然并没有把所有的筹码都押注于此。

  2021年9月25日,新华社发布消息称,经中国政府不懈努力,当地时间9月24日,孟晚舟女士已乘坐中国政府包机离开加拿大。北京时间2021年9月25日晚,孟晚舟平安抵达深圳宝安国际机场。

  近日,北京市朝阳区宣布陆续解封符合条件的高风险区域363个,广州、昆明等地也发布了解除一些地方临时管控区的公告。各地在封控管理中积极落实“快封快解、应解尽解”要求,努力减少疫情对经济社会发展和群众生产生活的影响。

  交通银行广州支行的工作人员向记者表示,“如果审批通过了,那么宽限期肯定是1-3个月不等,最长不超过90天。如果申请的是90天宽限期,那么客户需在3个月宽限期结束后,将这3个月拖欠的房贷一次性还清,不然同样会在您的征信上显示房贷逾期。”

  狂热追星并不是饭圈最大的问题,更值得关注的是,资金流量大、成员易被煽动、缺少监管等问题使得饭圈已经成为了滋生犯罪的温床,前有朴灿烈吧原吧主卷款跑路,后有吴亦凡粉头在后援会中为其挑选年轻漂亮的女生。

  如果出现发热、咽痛、咳嗽等不适,一定不要带病上班,要做好健康监测,不要乱用抗生素,也不鼓励囤药。如果遇到老年人、慢性基础疾病患者、儿童等高危人群出现持续高烧不退、呼吸困难、厌食、精神萎靡不振等情况,要及时到医院就诊,避免疾病加重。

  经疾控部门研判,新划定潘家园街道潘家园东里13号楼,武东44号楼2单元,翌景嘉园3号楼,松榆里23号楼、26号楼、27号楼,潘东22号楼3单元,翌景嘉园1号楼,松榆东里10号楼4门,华威里翌景嘉园1号楼,松榆东里51号楼2单元,武圣东里32号楼2单元,松榆西里北小区51号楼2单元;垡头街道垡头西里40号楼2单元,垡头西里三区14号楼5单元,祈东家园社区9号楼1单元;双井街道苹果小区2号楼A座,金茂府北区9号楼1单元,和平村F区4号楼2单元,石韵浩庭小区4号楼1单元、5号楼1单元,瑞志酒店,后现代城6号楼E、F单元,天力街19号院3号楼,广渠路29号院九龙花园小区3号楼,和平村F区2号楼;香河园街道光熙门北里南社区光熙怡园长者公寓,光熙门北里北社区33号楼,西坝河西里社区19号楼3单元,柳芳北里社区21号楼2单元,永利国际公寓商场及居民区1、2、3单元;三里屯街道中纺里5号楼1单元,北三里社区南30号楼;和平街街道煤炭科技苑社区13区25号楼,格调美居(龙吉特)宾馆,和平街十三区27号楼3门,樱花园东街7号寰球大厦,西苑1号楼7单元,国典花园5号楼,西苑20号楼3单元,汇鑫龙都宾馆,麦子店街道朝阳公园西里南区1号楼,枣营南里9号楼,枣营西里二条14号楼,橡树公馆,朝阳公园西路7号院1号楼6单元;团结湖街道水碓子东里29号楼3单元,水堆子东里6号楼2单元,水碓子东里20楼6单元,水碓子东里8号楼,水碓子西里15号楼,水碓子小区6号楼2单元,水碓子小区2号楼4单元,团结湖路28号团结湖东里7号楼;朝外街道吉庆里11号楼7单元,朝阳门南大街22号楼,三丰里2号楼4单元,工体西里小区1号楼;机场街道南平里小区17号楼2单元;小关街道小关安苑东里1区17号楼1单元,惠新里小区17号楼2单元,惠新西街18号D座,小关街道惠新里小区232号楼1单元,罗马花园B座,惠新西街10号楼,北四环东路108号千鹤家园6号楼,世纪嘉园3号楼,惠新里215号楼地下室,小关东街10号楼3单元;望京街道金石美苑312号楼1单元,大西洋新城525号楼,大西洋新城105号楼2单元,金隅丽港城2号楼,橄榄城三期13号楼1单元,望京新世界百货,望京西园三区307楼,方舟苑9号楼,南湖中园221号楼5单元,南湖东园226号楼;亚运村街道华严里20号楼1单元,华严北里一号院1号楼1-5门;奥运村街道拂林园社区天朗园A座,万科星园14号楼;劲松街道东三环南路甲46号楼,农光里201楼2单元,首城国际D区23号楼2单元,海友酒店(北京国贸九龙山地铁站店),东三环南路58号富顿中心D座,农光里214号楼,磨房北里129号楼5单元;八里庄街道红庙北里41号楼1单元,八里庄西里310号楼东侧平房,八里庄西里59号楼,十里堡东里27号楼,东恒时代3期18号楼,十里堡东里122号楼;安贞街道安华西里一区,安华里二区11号楼;六里屯街道甜水园东街5号楼3单元,甜水园平房区4条1号、3号,甜水园东里11号楼3单元,水碓子北里4号楼6单元,甜水园八条北院16号,延静东里3号楼8单元,甜水园东里18号楼4单元,甜水园东里18号楼3单元,甜水园东里25号楼4单元,水碓子北里2号楼,延静里8号楼4单元,甜水园北里13号楼,延静寺13号平房;延静里3号楼1单元,延靜东里金手勺后胡同114号公寓,甜水园东里41号楼1单元,甜水园北里6号楼6单元,延静西里甲2号楼平房,延静西里3号楼,八里庄北里204号楼1单元,道家村1号楼2单元,十里堡北区8号楼3单元,甜水园东院12排29号、30号、31号,甜水园北街1号楼1单元,十里堡北区3号楼2单元;晨光家园B区326号楼5单元,延静西里4号楼,道家园13号楼,延静东里6号楼,晨光家园A区216号楼,八里庄南里2号楼;南磨房乡石门新居36号院2号楼1单元,南新园18号楼,金蝉南里6号楼,宏铁东院107B,广华新城1号院1号楼1单元,建木宿舍2号楼3单元,百子湾家园306号楼2单元,南磨房乡巡防工作站三站(物美对面平房);豆各庄乡天达路8号院11号楼1单元,天达路8号院1号楼2单元,天达路8号院13号楼3单元,凯少公寓A平房;小红门乡牌坊村67号、216号,鸿博家园二期B区5号楼2单元,小红门成寿寺路134号院4号楼,恋日绿岛小区2号楼,鸿博家园二期B区1号楼2单元,三台山周转房西五,文化传播社区凯少公寓B栋,黑庄户乡双桥农场五号井小区39号楼5单元,四合庄87号,燕保双桥家园5号楼2单元,黑庄户179号;将台乡东昌利华生活公寓B座,梵谷水郡社区3号楼、4号楼;太阳宫乡芍药居北里307号楼2单元;常营乡民族家园39号楼2单元,首开畅心园7号楼,万象新天四区415号楼,龙湖长楹天街西区4号楼1单元,丽景园2号楼2单元,万方家园16号5单元,牛王庙村五里沟106号,芍药居甲2号院6号楼1单元,芍药居2号院3号楼1单元;管庄乡管庄梦想之家;三间房乡定福庄南里1号院5号学生公寓;东风乡六里屯南街73号,八里庄北里115号楼8单元,观湖嘉园小区3号楼2单元,高庙村4号、110号,东十里居102号,观湖9号楼3单元,六里屯南街61号、88号,泰华滨河苑5号楼3单元,南十里居16号院项目工程工地,姚家园中街北院4号楼,石佛营东里小区122楼1单元,东润枫景社区东风南小区33号楼3单元,南十里居25号楼2单元,石佛营东里社区日月东华小区1号楼,石佛营西里1号楼;孙河乡龙湖景粼原著2号楼1单元,瑞榆西园1号楼,康营家园五元物流公司;来广营乡蕴实园10号楼4单元,筑华年5号楼1单元,盛海公寓;黑庄户乡大鲁店三村383号、391号-394号、405号-408号、418号-422号,大鲁店二村西临1号,万子营西村35号-40号、72号-76号、106号-108号、112号-121号、146号-151号、188号、190号-193号、208号-212号、214号、625号;王四营乡王四营观音堂甲510号及停车场南侧洗衣厂,观音堂石板房385号-396号,观音堂甲381号-384号,丽枫酒店(欢乐谷店),佳昊公寓为高风险。

袁纬萍

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有