9月13日北京时间凌晨,OpenAI正式发布了全新AI模型“o1”,被誉为是“推理领域”的突破性成果。这款模型的开发代号为“Project Strawberry”,专注于提升AI在复杂问题上的推理和解决能力,尤其是在数学、科学和编程等领域展现了强大的技术优势与其前代模型GPT-4相比,o1不仅仅是数据处理的增强版,而是利用强化学习和“思维链”方法,实现了更具类人思维方式的推理。For complex reasoning tasks this is a significant advancement and represents a new level of AI capability. Given this, we are resetting the counter back to 1 and naming this series OpenAI o1.
对于复杂推理任务来说,这是一个重要的进展,代表了人工智能能力的新水平。鉴于此,我们将计数器重置为 1,并将这一系列命名为 OpenAI o1。这次模型的强悍,甚至让OpenAI不惜推掉了过去GPT系列的命名,重新起了一个o系列。o1是该系列第一个模型,后于模型会继续发布!o1的核心优势
o1模型的最大特色在于它能应对更复杂的多步骤问题。在测试中,o1在国际数学奥林匹克竞赛的模拟考试中获得了83%的成绩,远远超过GPT-4的13%。此外,在编程竞赛中也表现突出,达到了89%的高分。它的这种“推理链”方式,使其能够像人类一样逐步分解问题,优化解决策略。OpenAI o1 在竞争性编程问题 (Codeforces) 中排名第 89%,在美国数学奥林匹克 (AIME) 预选赛中跻身美国前 500 名学生之列,并且在物理、生物学基准上超过了人类博士级别的准确度和化学问题(GPQA)。虽然使这个新模型像当前模型一样易于使用所需的工作仍在进行中,但我们正在发布该模型的早期版本 OpenAI o1-preview,以便立即在 ChatGPT 中使用并提供给受信任的 API 用户。除了数学和编程,o1还在其他技术领域展现了巨大潜力。例如,物理学家可以利用该模型来生成复杂的量子光学公式,医疗研究人员可以通过o1标注基因组数据。这些复杂任务是之前的模型难以处理的,而o1凭借其推理和学习能力填补了这一空白。虽然o1目前还没有完全覆盖像GPT-4那样广泛的知识面,但它代表着AI领域的新方向——推理能力的提升。未来的版本可能会更加广泛应用于医学、工程等行业中的复杂科学任务,并在逻辑推理上超过许多传统的AI模型。面向用户的优化体验
OpenAI此次不仅推出了标准版的o1,还发布了o1-mini这一经济版。o1-mini针对STEM领域的推理优化,帮助开发者更方便地构建和执行多步骤任务。ChatGPT Plus 和 Team 用户将能够访问 ChatGPT 中的 o1 模型。o1-preview 和 o1-mini 都可以在模型选取器中手动选择,在启动时,o1-preview 的每周速率限制为 30 条消息,o1-mini 的每周速率限制为 50 条消息。
不是哥们,这够谁用啊,按周计次了,不过还是理解万岁,期待次开放更多次数!
OpenAI o1-mini excels at STEM, especially math and coding—nearly matching the performance of OpenAI o1 on evaluation benchmarks such as AIME and Codeforces.
OpenAI o1-mini 在 STEM 方面表现出色,尤其是数学和编码,在 AIME 和 Codeforces 等评估基准上几乎与 OpenAI o1 的性能相匹配。我们预计 o1-mini 将成为一种更快、更具成本效益的模型,适用于需要推理而无需广泛的世界知识的应用程序。
OpenAi,https://openai.com/o1/#openai-o1-mini-research-blog
这种双版本的推出显示出OpenAI的战略:逐步让不同层次的用户都能享受到这一突破性技术的优势。目前,ChatGPT Plus和Team用户已经能够使用o1的预览版本,企业用户将于下周获得访问权限,最终o1-mini将面向所有免费用户开放。这标志着AI推理技术正逐步走向大众化,为开发者、学术机构和技术专家提供新的可能。1. 专门解决复杂问题:- 展示科学、编码和数学等领域的高级推理能力 - 他们接受过培训,可以花更多时间思考问题。2. 性能改进:- 在物理、化学和生物学基准任务上的表现与博士生相当 - 正确回答了 83% 的国际数学奥林匹克资格赛题目(GPT-4 为 13%) - 编码竞赛中第 89 个百分位 。3. 增强安全性:- 采用新的安全培训方法 - 显着提高了越狱抵抗能力(o1-preview 为 84 点,而 GPT-4 为 22 点)。4、供给模式:- o1-preview:主要模型 - o1-mini:小型、高速、低成本的专门用于编码的模型 。5. 可用性:- 现在可供 ChatGPT Plus 和 Team 用户使用 - 在特定条件下可供 API 开发人员使用 - 我们计划将来向 ChatGPT 免费用户提供 o1-mini。6. 未来发展:- 计划更新模型并添加功能(网页浏览、文件/图像上传等) - 继续并行开发GPT系列和OpenAI o1系列 这个新系列代表了解决需要复杂推理的问题的重大进步,代表了人工智能能力的新水平。
本文链接:https://lipu365.com/gpt4_gpt5_151.html
OpenAI o1官网OpenAI o1官网入口OpenAI o1地址OpenAI o1中文版OpenAI o1openai o1模型简介