探索世界模型之路 构建中国人自己的智能生态

来源: 大河网
2024-06-26 19:28:14

  热度不减的大模型是实现人工智能的唯一解决方法吗?每个行业都要有自己的大模型吗?对于大模型,我们自主的发展路径是什么?当预训练大模型搅动起巨大的研发、应用热潮,这些问题随之产生。

  中国计算机学会以“智启新局”为主题,于5月16-18日在浙江宁波举办了2024青年精英大会(YEF2024),1200多名来自全国各高校、科研院所、企业的青年学者、专家,集中讨论了大模型、人工智能安全、国产算力、开源芯片、脑机接口等多个前沿领域的发展问题。

  不依赖“一两个模型打天下”

  长期从事人工智能核心技术机器学习研究的周志华教授列举了大模型的多个“烦恼”。

  首先,构建大模型要先规划任务、收集数据,然后训练出模型,也就是说必须先考虑到要解决某一类任务,然后为它去收集数据做模型,这时如果有一个新任务,原来没有被考虑规划过,就没有模型可用。

  其次,大模型训练和使用的能耗、碳耗、数据消耗都很大,一般人用不起。有人预测,按照现在的趋势下去,2025年一个大模型训练产生的碳排放相当于全纽约1个月的碳排放。

  周志华教授提到,现在人们都希望先 训练一个模型,并希望在使用的过程中不断去更新它,但是目前的大模型路线,有一个问题叫“灾难性遗忘”。他以自动汽车驾驶为例,若机器学习模型在对新环境获取的数据进行学习时,会“冲掉”旧环境中得到的宝贵信息,会出现重大安全隐患。

  由于前面列举的各种问题,人们都希望大模型能够持续学习和终身学习,希望模型随着应用的不断发展,能够不断地“学”下去。周志华判断:“这件事情在今天基于神经网络,或者从基本的数学工具上还看不到解决方案。”

  “训练大模型要有大量的训练数据,但是在大数据时代,这仍然是问题。”周志华表示。此外,数据隐私和所有权问题还无法解决。

  “所以大模型的用处更应该是因地制宜,或者因任务制宜,很多的任务可能不太适用于像今天的大模型。我们有必要去尝试其他的研究路线。我们这几年在研究‘学件’(learnware),这个词也是我们造出来的。”周志华介绍,学件=模型+规约,基本思想是不依赖“一两个英雄模型打天下”,可以发挥多个模型的集成作用,以适应不同任务需求。在未经过专门训练的新任务上提供解决方案,同时强调保护用户和开发者的数据安全,实现模型之间的协同工作,以推动创新和提升问题解决能力。

  AI应用市场繁荣,但这是一座“危楼”

  中国科学院院士、清华大学教授胡事民提及,本轮人工智能发展有4驾马车:算力、框架、算法、数据,汇聚并促进了人类智慧的交融。他认为,应该更全面看待人工智能发展,不要只看应用端,要从硬件、框架、模型算法和应用4个层面来看,这四者都对人工智能的生态产生重要影响。

  胡事民院士分析了目前人工智能发展过程中,我国面临的几个不利条件。首先,从硬件来看,两种国外AI芯片占了很大的市场份额。国产芯片要融入既有生态非常难,迭代更新慢。

  其次,从框架来看,国外深度学习框架占据主导的地位,国产框架面临生态屏障。从模型与算法方面来看,比前两者要好,但需加强原始创新。

  在应用层面,我国市场大、应用场景多、落地快、市场繁荣,有许多创业公司,“但它底下的硬件和软件有问题。这是我们的现状。”

  “需要以深度学习框架为牵引,夯实我国AI生态。”胡事民院士提出,因为框架承上启下,它可以在芯片算力水平不高的情况下尽量挖掘潜力,同时把应用层支撑好。清华大学在2020年3月20日推出“计图”深度学习框架,具备两个优点:第一个好处是快; 第二个好处是对硬件的支持广泛,可以快速适配任何一款国产硬件。“希望以‘计图’框架为核心,基于国产硬件促进人工智能算法应用的创新,来推动开源开放,构建中国人工智能的生态。”

  人工智能自主发展需要汇聚青年力量

  中国工程院院士、清华大学教授郑纬民告诉中青报·中青网记者,从学术角度来看,现在有4类人在关注大模型,一是真正做大模型的,二是大模型+,做应用的,三是进行政策规范治理的研究学者,四是为大模型应用,进行基础设施建设的科研人员。

  作为大会程序委员会主席,清华大学副教授崔鹏说,我们现在整体人工智能的发展路径还是以跟随为主,其中一个很明显的现象是,OpenAI发布一个新的产品,我们赶紧奋起直追,那么中国人工智能自主发展路径在何方,希望汇聚青年精英的力量,共同去探讨和商议。

  清华大学公共管理学院教授,人工智能治理研究中心主任梁正在专题报告中指出,发展人工智能,我国在基础理论、核心软硬件和生态方面还与国际先进水平有一定差距,要平衡创新与治理、践行价值对齐的伦理思路,并吸收国际经验,探索理念开放、主体多元、对象分层、工具灵活的敏捷治理新思路,以推动我国人工智能治理的进一步发展。

  相较于大语言模型,近期以Open AI的SORA、GPT-4o,以及谷歌的Gemini为代表的世界模型,成为学术界和工业界的研究热点,被认为是通向强人工智能的关键技术路径。但是以多模态学习为基础的世界模型的路线还不清晰,未来发展有很多争议。复旦大学教授邱锡鹏教授发起的“世界模型之路在何方”的论坛,吸引了更多学者探讨世界模型的发展路线,以及在国内算力不足的条件下如何轻量化发展,如何跨模态相互理解等研究方向。

  此外,<strong>克罗塞托提出这个论调的时机也很可疑,背后很明显有美国的影子。</strong>意大利总理梅洛尼刚刚结束对美国的访问,之前就有传闻说梅洛尼可能拿退出“一带一路”倡议给美国送上“投名状”,后被证明并不属实。但梅洛尼在与拜登总统会晤后表示,意政府将在12月之前就“一带一路”倡议作出决定,强调“与北京保持建设性对话”,还透露出希望到中国访问的意愿。这也从一个侧面反映了意大利现在的两难处境:它既想得到华盛顿的政治认可,但又不愿意放弃对华经济合作这块蛋糕,它不想在其中“二选一”。

  安国市多名中药材批发零售商告诉《中国新闻周刊》,因为中药材的价格上涨,导致销量明显减少。这些卖不动的中药材,都被堆在了冷库。冷库类似于“药材银行”,当药材价格上涨就出库,价格跌落就入库。价格频繁波动时,经营者能更好地把握出售时机。

  人员解困之后,中图网也开始有余力帮助涿州受灾的其他方面。其官方社交平台已在转发其他受困人员需要援助的信息。出版业其他因涿州灾情受损的机构也陆续提出新的措施。受损图书近150万册、码洋约达1.24亿的未读图书2日发布公告称,将采取紧急加印、加急出版流程,启动短视频直播带货,寻求法律支援定损,寻找备用库房等措施应对目前的情况。

  贝壳数据显示,目前德胜门挂牌房源在160套左右,在今年二三月份的高点,该片区每月成交量接近90套,而进入4月,成交量腰斩到40套,5月则进一步跌至30套。

  从王玲家人居住的团结小区往东走一公里,是另一临水小区水尚仁佳,该小区的居民谢勇回忆,7月31日小区车库塌陷后,形成了一个大概100多平米的口子,有四五米深。

  (观察者网讯)比亚迪被曝投资10亿美元在印度合资建厂计划受阻后,恐又陷入税务风波。据路透社8月2日报道,有两名知情人士透露,印度税务机构印度税务情报局(DRI)质疑比亚迪在印度组装和销售的汽车进口零部件税额过低,正对比亚迪进行持续的税务调查。

黄佳昀

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有