OpenAI o1 重新定义 AI 推理

GPT452024-09-15 22:12:3410

介绍 OpenAI o1 预览版

一系列新的推理模型,用于解决难题。从9月12日开始提供。

以下是OpenAI官网对OpenAI o1的介绍

OpenAI开发了一系列新的人工智能模型,它们在回应之前会花费更多时间进行思考。它们能够通过推理解决比以往模型更复杂的任务和更难的问题,涵盖科学、编程和数学领域。

OpenAI在这个系列中首次发布了 ChatGPT 和 API。这是一个预览版,我们预计会有定期的更新和改进。随着这次发布,我们还包括了目前正在开发的下一次更新的评估。

工作原理

OpenAI训练这些模型在回应之前花费更多时间思考问题,就像一个人会做的那样。通过训练,它们学会了提炼自己的思考过程,尝试不同的策略,并认识到自己的错误。

在OpenAI的测试中,下一个模型更新在物理、化学和生物学的挑战性基准任务上的表现与博士生相当。我们还发现它在数学和编程方面表现出色。在国际数学奥林匹克竞赛(IMO)的资格赛中,GPT-4o 正确解决了13%的问题,而推理模型的得分为83%。它们的编程能力在竞赛中得到了评估,在 Codeforces 竞赛中达到了第89百分位。你可以在我们的技术研究帖子中了解更多。

作为一个早期模型,它还没有许多使 ChatGPT 有用的功能,比如浏览网页获取信息和上传文件和图片。对于许多常见情况,GPT-4o 在不久的将来会更加有能力。

但对于复杂的推理任务来说,这是一个重大的进步,代表了人工智能能力的一个新的水平。鉴于此,我们将计数器重置为1,并将这个系列命名为 OpenAI o1。

安全性

作为开发这些新模型的一部分,OpenAI提出了一种新的安全训练方法,利用它们的推理能力使它们遵守安全和对齐指南。通过能够在上下文中推理安全规则,它可以更有效地应用它们。

OpenAI我们衡量安全性的一种方式是通过测试模型在用户试图绕过它们的安全规则时(称为“越狱”)继续遵循其安全规则的程度。在最困难的越狱测试中,GPT-4o 得分为22(满分100),而我们的 o1 预览版模型得分为84。可以在系统卡片和OpenAI的研究帖子中了解更多。

为了匹配这些模型的新能力,OpenAI加强了安全工作、内部治理和联邦政府合作。这包括使用我们的准备框架(在新窗口中打开)进行严格的测试和评估,一流的红队测试,以及包括OpenAI安全与保障委员会在内的董事会级审查流程。

为了推进OpenAI对人工智能安全的承诺,OpenAI最近与美国和英国的人工智能安全研究所正式达成了协议。OpenAI已经开始实施这些协议,包括给予研究所对这种模型的研究版本的早期访问权。这是我们合作的重要第一步,帮助建立一个研究、评估和测试未来模型的过程,这些模型在公开发布之前和之后。

适用对象

这些增强的推理能力可能对解决科学、编程、数学和类似领域的复杂问题特别有用。例如,o1 可以被医疗研究人员用来注释细胞测序数据,被物理学家用来生成量子光学所需的复杂数学公式,以及被所有领域的开发人员用来构建和执行多步骤工作流程。

OpenAI o1-mini

o1 系列在准确生成和调试复杂代码方面表现出色。为了为开发者提供更高效的解决方案,OpenAI还发布了 OpenAI o1-mini,这是一个更快、更便宜的推理模型,特别擅长编程。作为一个更小的模型,o1-mini 的成本比 o1 预览版便宜 80%,使其成为需要推理但不需要广泛世界知识的应用的强大且性价比高的模型。


如何使用 OpenAI o1

ChatGPT Plus 和团队用户将能够从今天开始在 ChatGPT 中访问 o1 模型。o1 预览版和 o1-mini 都可以在模型选择器中手动选择,并且在启动时,o1 预览版的每周消息限额为 30 条,o1-mini 为 50 条。OpenAI正在努力提高这些比率,并使 ChatGPT 能够自动为给定的提示选择正确的模型。

桃桃学长也通过Dify、Cursor等测试,o1系列已经可以使用了~ChatGPT还计划为所有 ChatGPT 免费用户提供 o1-mini 的访问权限~

OpenAI作为人工智能领域的先锋,我们期望它能够持续推动技术创新,不断突破现有技术的边界,为全球用户提供更加智能、高效和安全的AI解决方案。

#Open AI #语言大模型 #人工智能


本文链接:https://lipu365.com/gpt4_gpt5_157.html

OpenAI-o1OpenAI o1OpenAI01chatgpt o1o1-minio1-previewOpenAI o1 miniOpenAI o1 previewOpenAI o1官网OpenAI o1官网入口OpenAI o1地址OpenAI o1中文版openai o1模型简介

相关文章