比来比去,GPT-4o与OpenAI o1就是文理之别

GPT452024-09-20 23:08:13154

[恩格斯曾说:“地球上的最美的花朵——思维着的精神”。思维的自由与能力,可以区分智慧高低]

最近看到许多对比GPT-4o与OpenAI o1能力异同的推文,不禁让我想到我所学专业的一场争论。

十年前,新闻与传播学界的两位大牛陈力丹与喻国明,曾讨论互联网对世界的重构力量何如。双方的立场都赞同互联网的巨大威力,但分野在于类似搜索引擎这类知识检索与体外记忆对人本身的记忆能力、推理能力或者说思维能力,有无冲击。

陈力丹不认可搜索引擎能够代替人类思维的灵动跳跃喻国明则认为那些存在人脑的知识、记忆可以轻松为互联网检索。不管怎样,这场争论,让人认识到互联网的能力边界与价值所在。

十年后的今天,互联网接续进入AI时代,人们仍在讨论类似的话题,即AI的能力能否与人类对齐,甚至超越人类。如今有说法称,OpenAI o1大模型的迭代而生,使得AGI进入下半场

从当前信息来看,OpenAI o1大模型通过强化学习和思维链技术,显著提升了在数学问题解决、编程任务执行以及科学推理等方面的性能

强化学习(Reinforcement Learning, RL)

是一种让机器通过与环境的交互来学习如何做出决策的机器学习方法。在这种学习中,模型(或“智能体”)会尝试采取行动以最大化某种累积奖励。通过这种方式,模型学习如何在不同的情境下做出最优的选择。

思维链(Chain of Thought, CoT)

是指模型在给出答案之前,会模拟人类解决问题时的思考过程。这包括将复杂问题分解为更小的、更易于管理的步骤,然后逐步解决这些子问题,最终得出结论。思维链越长,模型效果越好。

小科,公众号:AI科技边界OpenAI o1大模型背后,更深层次的意义是什么

有研究人员指出这种研究路径,是因为当前语言模型预训练的范式以及瓶颈,模型Scaling边际效应递减,纯靠加参数、数据、算力的路径不再容易

也有人指出,大模型在追求多而快的同时,应该尝试“系统2”——“慢思考”,该o1模型将推理时间计算补充至Scaling Law,这一新维度让模型多步骤地“Let's think step by step”,一步一步慢慢想、往深处想。

不管怎样,新模型OpenAIo1走了不同GPT-4o的发展路径。其实在我看来,这个模型就是一位理科生,术业有专攻,在严谨推理场景或者领域内能够扎根思考。与o1不同在于,GPT-4o是一个努力做到涉猎广泛的百科全书式人物,这与文科生很像,针对什么话题都可以侃侃而谈。

过去GPT-4o的训练参数达到万亿级别。这就好比写作文,看的文章多了,自然会写了。

但OpenAI o1模型被腾讯研究院一语道破,“其本身的核心价值,恰恰是一个与世界知识大幅解耦的推理模型”。o1模型不必了解太多其他参数,那些无关参数反而会成为推理过程的噪音。

如果说这种文理科生的比喻恰当,那么这两个模型之间就十分互补,不存在替代之说,因此,没必要猛吹OpenAI o1。但我心中另一种声音在告诉我,一个“思维”能力更强的智能体或者大模型必然是更令人兴奋的。

这就回到了文章初我提到的关于互联网的一段争论,如果大模型像喻国明所说,仅仅是在知识量上的积累而缺乏调用知识并推理能力,那便远远不如拥有思维能力的人类本身。


本文链接:https://lipu365.com/gpt4_gpt5_167.html

chatgptplus使用教学chatgpt4如何注册并使用复旦大学教授评chatgpt4chatgpt4.0使用chatgpt4怎么升级chatgpt4.0安装教程macchatgpt4.0手机端怎么使用chatgpt登录后显示无法使用会员ChatGPT Plus会员AI音乐工具

相关文章