OpenAI 发布推出代号为 Strawberry 的全新 AI模型 o1-preview，用于解决复杂难题

GPT452024-09-13 07:31:31319

去年，谷歌推出了 GPT-4，将其模型规模扩大到令人眼花缭乱的程度，这是该公司在人工智能领域取得的最新重大突破。该公司今天宣布了一项新进展，标志着方法的转变——该模型可以对许多难题进行逻辑“推理”，并且比现有的人工智能更聪明，而无需进行大规模扩展。

这个被称为 OpenAI o1 的新模型可以解决现有 AI 模型无法解决的问题，包括 OpenAI 现有最强大的模型GPT-4o。它不是像大型语言模型通常那样一步到位地得出答案，而是通过推理解决问题，像人一样有效地大声思考，然后得出正确的结果。

OpenAI 首席技术官Mira Murati向 WIRED 表示：“我们认为这就是这些模型中的新范式。它在处理非常复杂的推理任务方面表现得更好。”

OpenAI 内部将新模型的代号定为 Strawberry，该公司表示，它并不是 GPT-4o 的后继者，而是对它的补充。

Murati 表示，OpenAI 目前正在构建其下一个主模型 GPT-5，该模型将比其前身大得多。尽管该公司仍然相信规模将有助于从人工智能中挖掘出新的能力，但 GPT-5 很可能还会包括今天推出的推理技术。“有两种范式，”Murati 说。“扩展范式和这种新范式。我们希望将它们结合在一起。”

法学硕士通常从输入大量训练数据的大型神经网络中寻找答案。他们可以展现出非凡的语言和逻辑能力，但传统上却很难解决非常简单的问题，例如涉及推理的基本数学问题。

Murati 表示，OpenAI o1 使用强化学习，即当模型答对时给予正反馈，答错时给予负反馈，以改进其推理过程。“该模型会磨练思维，并微调其用于得出答案的策略，”她说。强化学习使计算机能够以超人的技巧玩游戏，并执行设计计算机芯片等有用的任务。该技术也是将 LLM 变成有用且行为良好的聊天机器人的关键因素。

OpenAI 研究副总裁 Mark Chen 向《连线》杂志展示了新模型，并用它解决了其前身模型 GPT-4o 无法解决的几个问题。其中包括一道高级化学题和以下一道令人费解的数学题：“如果公主的年龄是王子的两倍，而公主的年龄是王子现在年龄的一半，那么公主的年龄与王子的年龄相同。王子和公主的年龄是多少？”（正确答案是王子 30 岁，公主 40 岁）。

陈说：“新模式是学会独立思考，而不是像传统法学硕士那样试图模仿人类的思维方式。”

OpenAI 表示，其新模型在许多问题集上的表现明显更好，包括专注于编码、数学、物理、生物和化学的问题。据该公司称，在针对数学学生的美国数学邀请赛 (AIME) 中，GPT-4o 平均解决了 12% 的问题，而 o1 的正确率为 83%。

新模型比 GPT-4o 慢，OpenAI 表示它的表现并不总是更好——部分原因是，与 GPT-4o 不同，它无法搜索网络并且不是多模式的，这意味着它无法解析图像或音频。

一段时间以来，提高法学硕士的推理能力一直是研究界的热门话题。事实上，竞争对手也在进行类似的研究。7 月，谷歌宣布了AlphaProof，这是一个将语言模型与强化学习相结合以解决困难数学问题的项目。

AlphaProof 能够通过查看正确答案来学习如何推理数学问题。扩展这种学习方式的一个关键挑战是，模型可能遇到的所有问题都没有正确答案。陈说，OpenAI 已经成功建立了一个更通用的推理系统。“我确实认为我们在这方面取得了一些突破；我认为这是我们的优势之一，”陈说。“它实际上在所有领域的推理方面都相当出色。”

斯坦福大学教授诺亚·古德曼(Noah Goodman ) 曾发表过关于提高法学硕士推理能力的论文，他表示，更广泛训练的关键可能在于使用“精心提示的语言模型和手工制作的数据”进行训练。他补充说，能够始终以结果速度换取更高的准确性将是一个“不错的进步”。

麻省理工学院助理教授Yoon Kim表示，法学硕士如何解决问题目前仍有些神秘，即使它们进行逐步推理，也可能与人类智能存在关键差异。随着该技术得到更广泛的应用，这一点可能至关重要。“这些系统可能会做出影响很多人的决策，”他说。“更大的问题是，我们是否需要对计算模型如何做出决策充满信心？”

OpenAI 今天推出的技术也可能有助于确保 AI 模型表现良好。Murati 表示，新模型已经证明，通过推理其行为的结果，它可以更好地避免产生不愉快或潜在有害的结果。“如果你想教孩子，一旦他们能够推理出为什么他们要做某件事，他们就会更好地学会遵守某些规范、行为和价值观，”她说。

华盛顿大学名誉教授、著名人工智能专家Oren Etzioni表示，“让法学硕士能够参与多步骤问题解决、使用工具和解决复杂问题至关重要。”他补充道，“单纯的规模化无法实现这一点。”然而，Etzioni 表示，未来还有更多的挑战。“即使推理问题得到解决，我们仍然面临幻觉和事实性的挑战。”

OpenAI 的陈表示，该公司开发的新推理方法表明，推进人工智能并不需要耗费大量的计算能力。“这种模式令人兴奋的一点是，我们相信它将使我们能够以更低的成本交付智能，”他说，“我认为这确实是我们公司的核心使命。”

如果您想了解更多关于AI的最新动态，请点赞、转发并关注我们的公众号。我们将持续为您带来深度分析与前沿资讯!

参考：

[1] https://openai.com/index/introducing-openai-o1-preview/

[2] https://www.wired.com/story/openai-o1-strawberry-problem-reasoning/

本文链接：https://lipu365.com/gpt4_gpt5_147.html

chatgpt4.0怎么收费如何访问chatgpt4 chatgpt4.0手机端怎么使用 ChatGPT Plus会员 ChatGPT插件商店 Alpha OpenAI sora OpenAI sora官网 OpenAI sora视频 sora视频

ChatGPT问题限制全解析，2025年5月最新避坑指南与实战技巧
2025年5月更新引言：为什么你的ChatGPT总说“抱歉”？“啊，又来了！”——这可能是很多人用ChatGPT时的内心OS，明明问得挺简单，它却突然弹出“根据政策，我无法回答这个问题”或者给出一个笼...
ChatGPT资讯2025-05-2314ChatGPT限制避坑指南实战技巧 chatgpt问题限制
2025年5月最新版，ChatGPT这么火，你真的会用吗？手把手教你玩转AI聊天神器
【2025年5月更新摘要】ChatGPT已从现象级工具发展为日常生活及工作的智能助手，但多数用户仍停留在基础问答层面，本文将手把手教你解锁高阶玩法：1. **精准提问**：通过"角色设定+具体场景+格...
ChatGPT资讯2025-05-2315ChatGPT AI聊天使用教程 chatGPT很火
识别图片中的文字
2025年5月最新教程｜零基础用Python接入ChatGPT，5分钟搞定智能对话开发引言：为什么你需要用Python玩转ChatGPT？（2025年5月更新）Hi，我是老张，一个天天和代码打交道的程...
ChatGPT资讯2025-05-2211OCR 文本识别图片转文字 python接入chatgpt
2025年5月最新版，ChatGPT 超实用指南—从新手到高手的核心技巧
2025年5月20日 · 作者：AI探索者你好呀！如果你是第一次接触ChatGPT，或者已经用过但还没完全摸透它的能力，那么这篇2025年最新版的指南就是为你准备的，别担心，我不会用一堆晦涩的术语轰炸...
ChatGPT资讯2025-05-2219ChatGPT 新手到高手核心技巧 chatgpt研发团队
2025年5月最新！用ChatGPT生成视频的保姆级教程，轻松搞定短视频创作
【2025年5月干货教程】零基础用ChatGPT生成短视频全攻略，本教程详解如何通过ChatGPT 5.0高效制作高质量短视频：第一步，用精准提示词（如“生成1分钟美食探店脚本，包含近景特写和幽默...
ChatGPT资讯2025-05-2219ChatGPT 视频生成短视频创作 chatgpt视频生成