专给 ChatGPT“找茬”,OpenAI 训练 CriticGPT 模型以检索输出内容错误

原标题:专给 ChatGPT“找茬”,OpenAI 训练 CriticGPT 模型以检索输出内容错误

baoyu131,51吃瓜网官网入口-6fIb2LoFlAy8JKa-专给 ChatGPT“找茬”,OpenAI 训练 CriticGPT 模型以检索输出内容错误。

IT之家 6 月 28 日消息,当地时间 27 日,OpenAI 宣布基于 GPT-4 训练了一个名为 CriticGPT 的模型,用于查找 ChatGPT 聊天机器人输出内容中的错误。它可以撰写评论,强调 ChatGPT 生成答案中不准确的地方。

据介绍,CriticGPT 旨在协助人类 AI 训练员完成工作 —— 使用一种名为“从人类反馈中强化学习(IT之家注:Reinforcement Learning from Human Feedback,RLHF)”的技术来训练、改进 GPT-4 的回答。

然而随着 ChatGPT 的准确性日益提升,错误越来越隐蔽,导致 AI 训练员的工作越来越“难做”。OpenAI 对此解释称,这是 RLHF 的基本局限之一 —— 模型逐渐变得比任何可以提供反馈的人都更博学,模型的协调可能也会随之变得越来越困难。

目前,当 CriticGPT 试图从 ChatGPT 的回答中发现错误时,它的一双“鹰眼”就会发挥作用。OpenAI 指出,现实世界中的错误可能遍布答案的多个部分,这是 CriticGPT 未来需要解决的问题。“我们的工作重点是可以在一个地方指出错误,但将来我们也需要解决分散的错误。”

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

“掌”握科技鲜闻 (微信搜索techsina 或扫描左侧二维码关注)

  天津站相关负责人介绍,今年春运,铁路方面从天津出行的热门方向,长途主要集中在长春、哈尔滨、齐齐哈尔、郑州、广州、西安、太原、呼和浩特、包头、兰州、成都等地,短途以北京、石家庄、唐山、秦皇岛为主。/index.aspx返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
发布于:伊春南岔区
阅读 ()
推荐阅读
免费获取
今日搜狐热点
今日推荐