OpenAI的武当梯云纵、左脚踩右脚：推出新模型CriticGPT修正AI错误

#人工智能 OpenAI 的武当梯云纵、左脚踩右脚：推出新模型 CriticGPT，专门用来查找和修正 GPT 出现的幻觉和错误，替代人工审核团队标记回答提高模型准确率。当然不是完全替代人工审核团队，而是利用 AI 的丰富知识找出细微的错误并提高效率。查看全文：https://ourl.co/104710

人工智能公司 OpenAI 今天宣布基于 GPT-4 推出新模型 CriticGPT，这个模型并不是开放的，因为它存在的意义就是帮助 OpenAI 寻找 GPT 中出现的错误。

现阶段大多数 AI 公司都有人工审核团队来检查模型输出的结果，因为模型在长期运行中总会出现幻觉和错误，这就需要人工审核团队来标记并进行修正。

然而随着 ChatGPT 这类产品变得越来越准确，即便出现错误也难以发现，这让负责训练的 AI 工程师和负责审核的人工团队力不从心，比如输出的编程代码错误。

OpenAI 称这是 RLHF 的一个根本限制，即随着技术的发展模型知识和能力逐渐超越人类，这会让对齐模型变得越来越困难。

为此该公司基于 GPT-4 系列模型训练了 CriticGPT，这个新模型也使用 RLHF 进行训练，负责分析和评价包含大量错误的输出结果。

从某种意义上说 OpenAI 这做法就是武当梯云纵、左脚踩右脚，通过人工智能来修正人工智能，当然既然梯云纵也是人工智能那也会存在错误，只不过相较于人工审核团队，CriticGPT 拥有丰富的知识并且效率更高，可以更快更准确地找出错误。

值得注意的是 CriticGPT 还将对人类故意提供的错误内容进行评判，典型案例就是人类每天需要吃几块石头，CriticGPT 将可以识别这类故意的错误内容并进行纠正，防止 GPT 直接给出错误的回答。

最后 OpenAI 也强调现实世界中的错误可能会分布在许多回答中，这是未来需要解决的问题。也就是说至少现阶段，想要彻底根除 AI 模型的错误和幻觉是不可能的。