如何识破大语言模型“幻觉”回答?国际最新研发出“以毒攻毒”检测方法

来源: 新华社
2024-06-20 12:17:21

  中新 网北京6月20日电 (记者 孙自法)基于人工智能(AI)的大语言模型(LLM)回答问题并非总是准确可靠,有时甚至极其智能地以“幻觉”方式提供胡编乱造的答案让人真假难辨,对此如何予以有效检测广受关注。

  国际著名学术期刊《自然》最新发表一篇人工智能研究论文称,研究人员开发出一种能检测大语言模型“幻觉”的方法,这种方法通过“以毒攻毒”方式,能测量生成回答的含义的不确定性,或能用于提升大语言模型输出的可靠性。

  该论文介绍,大语言模型(如ChatGPT和Gemini)是能阅读和生成自然人类语言的人工智能系统。不过,这类系统很容易产生“幻觉”,生成不准确或没有意义的内容。检测大语言模型出现“幻觉”的程度很难,因为这些回答的呈现方式可能会让它们看起来很可信。

  冰川是高原生态的重要一环——据科研人员估算,青藏高原及周边高山地区冰川面积约10万平方公里,常年积雪面积约30万平方公里,从储量上看,这一区域冰川的冰储量约为8850立方公里,换算成水量是约8万亿立方米。这些冰川是青藏高原生态环境的重要组成部分。它们不仅成为许多地表径流的来源,滋润着高原水系,也深刻影响着周边生态环境,滋润着广袤草场,养育着野生动植物。

  德国:经济停滞不前,军援压力大

  这种科技化的蔬菜基地正迅速在各地推广。雄安新区,新的一年,1300亩土地将被打造成未来的蔬菜基地。大棚还在建设中,500公里以外的一间实验室里,已经模拟出雄安的环境条件,为科技种菜提前“探路”。

  “这批免税品机场店急需,今早刚申请办理调拨手续,海关的同志就来了,效率真高!”仓库经理熊平竖起大拇指。

  然而,索朗群培格外喜欢待在大棚里,等员工们陆续下班后,他会仔细检查:杂草有没有除净,苗要不要再浇水,门有没有关好……“你别觉得我在做样子,我真的很珍惜这些大棚。”索朗群培由衷地说,“以前,大家外出务工,收入不稳定,对种菜也没什么概念;现在,我们不仅有技术,能在家门口就业,还有了更健康的生活方式。”

  1050万辆

黄珮瑜

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有