如何识破大语言模型“幻觉”回答?国际最新研发出“以毒攻毒”检测方法

来源: 山东大众网
2024-06-21 13:45:30

  中新网北京6月20日电 (记者 孙自法)基于 人工智能(AI)的大语言模型(LLM)回答问题并非总是准确可靠,有时甚至极其智能地以“幻觉”方式提供胡编乱造的答案让人真假难辨,对此如何予以有效检测广受关注。

  国际著名学术期刊《自然》最新发表一篇人工智能研究论文称,研究人员开发出一种能检测大语言模型“幻觉”的方法,这种方法通过“以毒攻毒”方式,能测量生成回答的含义的不确定性,或能用于提升大语言模型输出的可靠性。

  该论文介绍,大语言模型(如ChatGPT和Gemini)是能阅读和生成自然人类语言的人工智能系统。不过,这类系统很容易产生“幻觉”,生成不准确或没有意义的内容。检测大语言模型出现“幻觉”的程度很难,因为这些回答的呈现方式可能会让它们看起来很可信。

  “冬季来临,轨腰和轨底伤损发展较快,容易导致钢轨断裂。”张一楠已在无损检测岗位从业8年,设备检修和日常保养、钢轨数据采集分析和伤损情况报告撰写等工作他早已熟稔于心。“以车为家”的他近年来行驶过重庆、贵州、四川等地近20万公里的铁路,一年行驶里程达24000公里。从2022年10月宝宝出生到现在,他只回过两次陕西咸阳的家。“现在我的徒弟有‘00后’的‘新鲜血液’,希望新的一年他们能独当一面。”完成此次探伤工作后,张一楠表示,“我的‘下一站’是与家人团聚。”

  火,国际班列运年货。钦州铁路集装箱中心站,满载越南速食面条、泰国椰汁等货品的铁海联运班列缓缓驶出,沿着西部陆海新通道,直奔重庆;西安国际港站货场,汽笛声声,中欧班列将哈萨克斯坦的1300吨面粉顺利运抵……国际班列运来各国特色产品,活跃消费,丰富市场。

  中国汽车流通协会新能源汽车分会秘书长章弘表示,当前,充电设施的铺设与实际使用率之间存在冲突,即虽然厂家和运营商愿意普及充电设施,但又担心部分场景下的利用率太低,会导致赤字运营,所以才会出现消费者抱怨充电设施太少,而厂家和运营商又不敢贸然铺设充电设施的现象。

  对经营性人力资源服务机构为广州市重点企业(产业链上下游企业、专精特新企业等)每成功介绍1人(签订劳动合同并参加社会保险1个月以上)按每人400元给予一次性职业介绍补贴,每家经营性人力资源服务机构累计申领金额不超过50万元,补贴政策实施至2023年12月31日,由市区就业补助资金安排保障。

  从GDP总量上看,广东、江苏、山东经济前三强排名仍屹然不动,2022年GDP依次为129118.58亿元、122875.6亿元和87435亿元。广东和江苏也成为唯二跻身“10万亿俱乐部”的成员。浙江、河南、四川、湖北、福建、湖南紧随其后,排名与2021年同期相比也未发生变化。

  <strong>降低门槛鼓励创新</strong>

郑伟哲

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有