#人工智能 OpenAI 的武当梯云纵、左脚踩右脚:推出新模型 CriticGPT,专门用来查找和修正 GPT 出现的幻觉和错误,替代人工审核团队标记回答提高模型准确率。当然不是完全替代人工审核团队,而是利用 AI 的丰富知识找出细微的错误并提高效率。查看全文:https://ourl.co/104710
人工智能公司 OpenAI 今天宣布基于 GPT-4 推出新模型 CriticGPT,这个模型并不是开放的,因为它存在的意义就是帮助 OpenAI 寻找 GPT 中出现的错误。
现阶段大多数 AI 公司都有人工审核团队来检查模型输出的结果,因为模型在长期运行中总会出现幻觉和错误,这就需要人工审核团队来标记并进行修正。
然而随着 ChatGPT 这类产品变得越来越准确,即便出现错误也难以发现,这让负责训练的 AI 工程师和负责审核的人工团队力不从心,比如输出的编程代码错误。
OpenAI 称这是 RLHF 的一个根本限制,即随着技术的发展模型知识和能力逐渐超越人类,这会让对齐模型变得越来越困难。
为此该公司基于 GPT-4 系列模型训练了 CriticGPT,这个新模型也使用 RLHF 进行训练,负责分析和评价包含大量错误的输出结果。
从某种意义上说 OpenAI 这做法就是武当梯云纵、左脚踩右脚,通过人工智能来修正人工智能,当然既然梯云纵也是人工智能那也会存在错误,只不过相较于人工审核团队,CriticGPT 拥有丰富的知识并且效率更高,可以更快更准确地找出错误。
值得注意的是 CriticGPT 还将对人类故意提供的错误内容进行评判,典型案例就是人类每天需要吃几块石头,CriticGPT 将可以识别这类故意的错误内容并进行纠正,防止 GPT 直接给出错误的回答。
最后 OpenAI 也强调现实世界中的错误可能会分布在许多回答中,这是未来需要解决的问题。也就是说至少现阶段,想要彻底根除 AI 模型的错误和幻觉是不可能的。