182tv521线路EVVq6rH

专给 ChatGPT“找茬”，OpenAI 训练 CriticGPT 模型以检索输出内容错误

来源：人民网

182tv521线路もっと昔c僕がまだ若くcその記憶がずっと鮮明だったころc僕は直子について書いてみようと試みたことが何度かある。でもそのときは一行たりとも書くことができなかった。その最初の一行さえ出てくればcあとは何もかもすらすらと書いてしまえるだろうということはよくわかっていたのだけれどcその一行がどうしても出てこなかったのだ。全てがあまりにもくっきりとしすぎていてcどこから手をつければいいのかがわからなかったのだ。あまりにも克明な地図がc克明にすぎて時として役に立たないのと同じことだ。でも今はわかる。結局のところ―と僕は思う――文章という不完全な容器に盛ることができるのは不完全な記憶や不完全な想いでしかないのだ。そして直子に関する記憶が僕の中で薄らいでいけばいくほどc僕はより深く彼女を理解することができるようになったと思う。何故彼女が僕に向って「私を忘れないで」と頼んだのかcその理由も今の僕にはわかる。もちろん直子は知っていたのだ。僕の中で彼女に関する記憶がいつか薄らいでいくであろうということを。だからこそ彼女は僕に向って訴えかけねばならなかったのだ。「私のことをいつまでも忘れないで。私が存在していたことを覚えていて」と。　　二是推动数字产业创新发展。聚焦集成电路、5G、新型显示等重点领域，提升基础软硬件、核心电子元器件、关键基础材料和智能制造装备供给水平。研究制定更好发挥数据要素作用的配套政策，打造世界级数字产业集群。8RTC8Eg-8Jls48n7RKyy4vqQ2ws-专给 ChatGPT“找茬”，OpenAI 训练 CriticGPT 模型以检索输出内容错误

IT之家 6 月 28 日消息，当地时间 27 日，OpenAI 宣布基于 GPT-4 训练了一个名为 CriticGPT 的模型，用于查找 ChatGPT 聊天机器人输出内容中的错误。它可以撰写评论，强调 ChatGPT 生成答案中不准确的地方。

据介绍，CriticGPT 旨在协助人类 AI 训练员完成工作 —— 使用一种名为“从人类反馈中强化学习（IT之家注：Reinforcement Learning from Human Feedback，RLHF）”的技术来训练、改进 GPT-4 的回答。

然而随着 ChatGPT 的准确性日益提升，错误越来越隐蔽，导致 AI 训练员的工作越来越“难做”。OpenAI 对此解释称，这是 RLHF 的基本局限之一 —— 模型逐渐变得比任何可以提供反馈的人都更博学，模型的协调可能也会随之变得越来越困难。

目前，当 CriticGPT 试图从 ChatGPT 的回答中发现错误时，它的一双“鹰眼”就会发挥作用。OpenAI 指出，现实世界中的错误可能遍布答案的多个部分，这是 CriticGPT 未来需要解决的问题。“我们的工作重点是可以在一个地方指出错误，但将来我们也需要解决分散的错误。”

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

展开剩余99%

阅读 (0)