专给 ChatGPT“找茬”,OpenAI 训练 CriticGPT 模型以检索输出内容错误

来源: 上观新闻
2024-06-28 09:29:46

IT之家 6 月 28 日消息,当地时间 27 日,OpenAI 宣布基于 GPT-4 训练了一个名为 CriticGPT 的模型,用于查找 ChatGPT 聊天机器人输出内容中的错误。它可以撰写评论,强调 ChatGPT 生成答案中不准确的地方。

据介绍,CriticGPT 旨在协助人类 AI 训练员完成工作 —— 使用一种名为“从人类反馈中强化学习(IT之家注:Reinforcement Learning from Human Feedback,RLHF)”的技术来训练、改进 GPT-4 的回答。

然而随着 ChatGPT 的准确性日益提升,错误越来越隐蔽,导致 AI 训练员的工作越来越“难做”。OpenAI 对此解释称,这是 RLHF 的基本 局限之一 —— 模型逐渐变得比任何可以提供反馈的人都更博学,模型的协调可能也会随之变得越来越困难。

目前,当 CriticGPT 试图从 ChatGPT 的回答中发现错误时,它的一双“鹰眼”就会发挥作用。OpenAI 指出,现实世界中的错误可能遍布答案的多个部分,这是 CriticGPT 未来需要解决的问题。“我们的工作重点是可以在一个地方指出错误,但将来我们也需要解决分散的错误。”

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

  此外,也有游戏产品选择“停更不停服”,例如手游《暖暖环游世界》剧情停更,但不关闭服务器,玩家可以继续登录游玩,官方还会开启往期活动的循环返场。

  近年来,在影视剧和文化游的双重带动下,国内外一批与影视剧相关的景点,其流量与人气节节攀升。

  “新的一年,我们计划为周边村民提供菌棒和技术指导,带动更多人种植香菇,将产业做大。”赵志军表示,接下来,“西火三农”干香菇加工基地还将生产香菇酱等产品,提高附加值,带动村民增收和村集体经济发展。(完)

  “大象”转身之困,既在于企业对过去思维定势和旧有路径的依赖,也在于庞大组织结构和复杂低效流程的拖累。其实,面临赛道切换时,“既要又要”两个目标同时存在,常常使得越是成功的车企,越会显得左右为难。此前,大众汽车集团首席执行官赫伯特·迪斯也刚刚卸任。与丰田章男在电动化上的“保守”相比,迪斯虽然更加激进,但也在集团内部饱受争议。而软件开发项目进度严重滞后和预算超支,最终成为其不得不下课的导火索。

  陈美仪进一步提到,广东是改革开放的前沿阵地,高质量发展也离不开构建高水准对外开放窗口,澳门作为“中葡平台”及“一带一路”重要节点城市,加強与广东的深入合作,将为广东企业、产品、成果开拓更广阔的市场,也为澳门民营企业的发展带来更多更强的力量,同时让高质量发展路途越走越宽阔。

  根据十个工作日一调整的原则,下一轮调价窗口将于2月17日24时开启。

林婷婷

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有