OpenAI 发布推出代号为 Strawberry 的全新 AI模型 o1-preview,用于解决复杂难题

GPT452024-09-13 07:31:3112

去年,谷歌推出了 GPT-4,将其模型规模扩大到令人眼花缭乱的程度,这是该公司在人工智能领域取得的最新重大突破。该公司今天宣布了一项新进展,标志着方法的转变——该模型可以对许多难题进行逻辑“推理”,并且比现有的人工智能更聪明,而无需进行大规模扩展。

这个被称为 OpenAI o1 的新模型可以解决现有 AI 模型无法解决的问题,包括 OpenAI 现有最强大的模型GPT-4o。它不是像大型语言模型通常那样一步到位地得出答案,而是通过推理解决问题,像人一样有效地大声思考,然后得出正确的结果。

OpenAI 首席技术官Mira Murati向 WIRED 表示:“我们认为这就是这些模型中的新范式。它在处理非常复杂的推理任务方面表现得更好。”

OpenAI 内部将新模型的代号定为 Strawberry,该公司表示,它并不是 GPT-4o 的后继者,而是对它的补充。

Murati 表示,OpenAI 目前正在构建其下一个主模型 GPT-5,该模型将比其前身大得多。尽管该公司仍然相信规模将有助于从人工智能中挖掘出新的能力,但 GPT-5 很可能还会包括今天推出的推理技术。“有两种范式,”Murati 说。“扩展范式和这种新范式。我们希望将它们结合在一起。”

法学硕士通常从输入大量训练数据的大型神经网络中寻找答案。他们可以展现出非凡的语言和逻辑能力,但传统上却很难解决非常简单的问题,例如涉及推理的基本数学问题。

Murati 表示,OpenAI o1 使用强化学习,即当模型答对时给予正反馈,答错时给予负反馈,以改进其推理过程。“该模型会磨练思维,并微调其用于得出答案的策略,”她说。强化学习使计算机能够以超人的技巧玩游戏,并执行设计计算机芯片等有用的任务。该技术也是将 LLM 变成有用且行为良好的聊天机器人的关键因素。

OpenAI 研究副总裁 Mark Chen 向《连线》杂志展示了新模型,并用它解决了其前身模型 GPT-4o 无法解决的几个问题。其中包括一道高级化学题和以下一道令人费解的数学题:“如果公主的年龄是王子的两倍,而公主的年龄是王子现在年龄的一半,那么公主的年龄与王子的年龄相同。王子和公主的年龄是多少?”(正确答案是王子 30 岁,公主 40 岁)。

陈说:“新模式是学会独立思考,而不是像传统法学硕士那样试图模仿人类的思维方式。”

OpenAI 表示,其新模型在许多问题集上的表现明显更好,包括专注于编码、数学、物理、生物和化学的问题。据该公司称,在针对数学学生的美国数学邀请赛 (AIME) 中,GPT-4o 平均解决了 12% 的问题,而 o1 的正确率为 83%。

新模型比 GPT-4o 慢,OpenAI 表示它的表现并不总是更好——部分原因是,与 GPT-4o 不同,它无法搜索网络并且不是多模式的,这意味着它无法解析图像或音频。

一段时间以来,提高法学硕士的推理能力一直是研究界的热门话题。事实上,竞争对手也在进行类似的研究。7 月,谷歌宣布了AlphaProof,这是一个将语言模型与强化学习相结合以解决困难数学问题的项目。

AlphaProof 能够通过查看正确答案来学习如何推理数学问题。扩展这种学习方式的一个关键挑战是,模型可能遇到的所有问题都没有正确答案。陈说,OpenAI 已经成功建立了一个更通用的推理系统。“我确实认为我们在这方面取得了一些突破;我认为这是我们的优势之一,”陈说。“它实际上在所有领域的推理方面都相当出色。”

斯坦福大学教授诺亚·古德曼(Noah Goodman ) 曾发表过关于提高法学硕士推理能力的论文,他表示,更广泛训练的关键可能在于使用“精心提示的语言模型和手工制作的数据”进行训练。他补充说,能够始终以结果速度换取更高的准确性将是一个“不错的进步”。

麻省理工学院助理教授Yoon Kim表示,法学硕士如何解决问题目前仍有些神秘,即使它们进行逐步推理,也可能与人类智能存在关键差异。随着该技术得到更广泛的应用,这一点可能至关重要。“这些系统可能会做出影响很多人的决策,”他说。“更大的问题是,我们是否需要对计算模型如何做出决策充满信心?”

OpenAI 今天推出的技术也可能有助于确保 AI 模型表现良好。Murati 表示,新模型已经证明,通过推理其行为的结果,它可以更好地避免产生不愉快或潜在有害的结果。“如果你想教孩子,一旦他们能够推理出为什么他们要做某件事,他们就会更好地学会遵守某些规范、行为和价值观,”她说。

华盛顿大学名誉教授、著名人工智能专家Oren Etzioni表示,“让法学硕士能够参与多步骤问题解决、使用工具和解决复杂问题至关重要。”他补充道,“单纯的规模化无法实现这一点。”然而,Etzioni 表示,未来还有更多的挑战。“即使推理问题得到解决,我们仍然面临幻觉和事实性的挑战。”

OpenAI 的陈表示,该公司开发的新推理方法表明,推进人工智能并不需要耗费大量的计算能力。“这种模式令人兴奋的一点是,我们相信它将使我们能够以更低的成本交付智能,”他说,“我认为这确实是我们公司的核心使命。”



如果您想了解更多关于AI的最新动态,请点赞、转发并关注我们的公众号。我们将持续为您带来深度分析与前沿资讯!


参考:

[1] https://openai.com/index/introducing-openai-o1-preview/

[2] https://www.wired.com/story/openai-o1-strawberry-problem-reasoning/


本文链接:https://lipu365.com/gpt4_gpt5_147.html

chatgpt4.0怎么收费如何访问chatgpt4chatgpt4.0手机端怎么使用ChatGPT Plus会员ChatGPT插件商店AlphaOpenAI soraOpenAI sora官网OpenAI sora视频sora视频

相关文章