随着Google旗下人工智能模型 - 启用深度思考的Gemini在国际数学奥林匹克 (IMO) 上正式斩获金牌,人工智能解决难题的转折点已经到来。解决一些世界上最棘手的数学难题需要推理和逻辑,这通常需要独特的解决方案和创造性的方法。
Google DeepMind 团队已正式验证了这些结果,IMO 主席 Gregor Dolinar 教授指出:“我们可以确认,Google DeepMind 已达到人们梦寐以求的里程碑,获得了 35 分(满分 42 分)——金牌成绩。他们的解决方案在很多方面都令人惊叹。IMO 评分员认为这些解决方案清晰、精确,而且大多数都易于理解。”
虽然这看起来像是“计算机擅长数学”的时代,但两者之间存在着根本性的不同。这里使用的 Gemini 模型采用端到端的自然处理,利用问题描述的文本输入,以 IMO 评分员认为清晰、精确的方式生成数学证明。Google今年的出色表现得益于升级版的“双子座深度思考”(Gemini Deep Think),这是一个旨在解决复杂问题的增强型推理层。该设计融合了公司最新的研究成果,包括并行思维,使模型能够在得出最终答案之前同时探索和综合多种解决方案路径,从而超越单一的线性推理链。
所有这些都证明,人工智能的推理能力正在逐渐发展成为自主的数据处理能力,而这可以通过多步骤、分层的方法实现。Google的“双子座”在4.5小时内正式完成了所有这些任务,并因此获得了一项成就。
确切的计算成本尚不清楚,但运行一个模型 4.5 小时的成本可能相当高昂,尤其是在启用测试时间扩展的情况下,Google TPU 上最高端模型的参数规模高达数万亿。Google即将向 Gemini Ultra 订阅用户提供其 Deep Think 模型,该订阅用户可享受更高的使用率,每月 249.99 美元。
有帖文称“Gemini在国际数学奥林匹克竞赛中达到了金牌水平!一个高级版本能够解决6道题中的5道。”另有博主表示,“仅仅一年时间,从银牌到金牌——(其)数学推理方面的进步速度简直令人惊叹!恭喜Google DeepMind团队!”埃隆·马斯克转发并表示:“恭喜!”