非营利性人工智能研究机构 Epoch AI 的一项分析表明,人工智能行业可能在很长一段时间内都无法再从推理人工智能模型中获得巨大的性能提升。根据该报告的调查结果,推理模型的进展可能最快在一年内就会放缓。
近几个月来,OpenAI 的o3等推理模型在人工智能基准测试中取得了显著进步,尤其是在衡量数学和编程技能的基准测试中。这些模型可以对问题进行更多计算,从而提高其性能,但缺点是它们完成任务所需的时间比传统模型更长。
推理模型的开发首先需要对大量数据进行传统模型的训练,然后应用一种称为强化学习的技术,该技术可以有效地为模型提供有关其解决难题的“反馈”。
据Epoch报道,到目前为止,像OpenAI这样的前沿人工智能实验室还没有将大量的计算能力应用到推理模型训练的强化学习阶段。
这种情况正在改变。OpenAI 表示,训练 o3 所需的计算量比其前身 o1 多出约 10 倍,而 Epoch 推测其中大部分计算量都用于强化学习。OpenAI 研究员 Dan Roberts 最近透露,公司未来计划优先考虑强化学习,使用远超初始模型训练所需的计算能力。
但根据 Epoch 的说法,应用于强化学习的计算量仍然存在上限。
根据 Epoch AI 的分析,推理模型训练扩展可能会放缓图片来源: Epoch AI
Epoch 分析师兼该分析报告的作者 Josh You 解释说,标准 AI 模型训练的性能提升目前每年翻两番,而强化学习的性能提升则每 3-5 个月增长十倍。他继续说道,推理训练的进展“很可能在 2026 年与整体前沿技术趋同”。
Epoch 的分析做出了许多假设,并部分参考了人工智能公司高管的公开评论。但它也指出,除了计算能力之外,扩展推理模型可能还会面临挑战,其中包括高昂的研究成本。
“如果研究需要持续的间接成本,推理模型的扩展性可能无法达到预期,”尤写道。“快速计算扩展可能是推理模型进步中非常重要的因素,因此值得密切关注。”
任何暗示推理模型可能在不久的将来达到某种极限的迹象都可能引起人工智能行业的担忧,因为该行业已经投入了大量资源来开发此类模型。研究已经表明,推理模型的运行成本极高,并且存在严重缺陷,例如比某些传统模型更容易产生幻觉。