比来比去，GPT-4o与OpenAI o1就是文理之别

GPT452024-09-20 23:08:13263

[恩格斯曾说：“地球上的最美的花朵——思维着的精神”。思维的自由与能力，可以区分智慧高低]

最近看到许多对比GPT-4o与OpenAI o1能力异同的推文，不禁让我想到我所学专业的一场争论。

十年前，新闻与传播学界的两位大牛陈力丹与喻国明，曾讨论互联网对世界的重构力量何如。双方的立场都赞同互联网的巨大威力，但分野在于类似搜索引擎这类知识检索与体外记忆对人本身的记忆能力、推理能力或者说思维能力，有无冲击。

陈力丹不认可搜索引擎能够代替人类思维的灵动跳跃，喻国明则认为那些存在人脑的知识、记忆可以轻松为互联网检索。不管怎样，这场争论，让人认识到互联网的能力边界与价值所在。

十年后的今天，互联网接续进入AI时代，人们仍在讨论类似的话题，即AI的能力能否与人类对齐，甚至超越人类。如今有说法称，OpenAI o1大模型的迭代而生，使得AGI进入下半场。

从当前信息来看，OpenAI o1大模型通过强化学习和思维链技术，显著提升了在数学问题解决、编程任务执行以及科学推理等方面的性能。

强化学习（Reinforcement Learning, RL）
是一种让机器通过与环境的交互来学习如何做出决策的机器学习方法。在这种学习中，模型（或“智能体”）会尝试采取行动以最大化某种累积奖励。通过这种方式，模型学习如何在不同的情境下做出最优的选择。
思维链（Chain of Thought, CoT）
是指模型在给出答案之前，会模拟人类解决问题时的思考过程。这包括将复杂问题分解为更小的、更易于管理的步骤，然后逐步解决这些子问题，最终得出结论。思维链越长，模型效果越好。
小科，公众号：AI科技边界OpenAI o1大模型背后，更深层次的意义是什么

有研究人员指出这种研究路径，是因为当前语言模型预训练的范式以及瓶颈，模型Scaling边际效应递减，纯靠加参数、数据、算力的路径不再容易。

也有人指出，大模型在追求多而快的同时，应该尝试“系统2”——“慢思考”，该o1模型将推理时间计算补充至Scaling Law，这一新维度让模型多步骤地“Let's think step by step”，一步一步慢慢想、往深处想。

不管怎样，新模型OpenAIo1走了不同GPT-4o的发展路径。其实在我看来，这个模型就是一位理科生，术业有专攻，在严谨推理场景或者领域内能够扎根思考。与o1不同在于，GPT-4o是一个努力做到涉猎广泛的百科全书式人物，这与文科生很像，针对什么话题都可以侃侃而谈。