GPT-4o 被泼冷水，评测结果不如 GPT-4 🤔

GPT452024-05-14 14:52:14667

OpenAI 发布全能最新模型 GPT-4o 《OpenAI 震撼发布 GPT-4o！对所有人免费！》后，好评如潮，网友们纷纷试用和发挥脑洞，并献上膜拜之情。

而Bindu Reddy (@bindureddy)，Abacus AI 的 CEO，则分享了一项关于 GPT-4o 的初步评估结果，给 GPT-4o 泼了一盆冷水。

🧑‍💼Bindu Reddy，前 AWS/Google 高管，对人类行为和开源人工通用智能（AGI）充满热情，现在正致力于利用生成性人工智能（Gen AI）构建应用型 AI 和大型语言模型（LLM）代理和系统。

📊Reddy 公布了 GPT-4o 与 GPT-4 在完成特定任务时的对比数据：

- GPT-4o 在 96 项任务中成功完成了 79 项，其中编码任务 65 项中完成了 52 项。

- 相比之下，GPT-4 在同样的 96 项任务中成功完成了 90 项，编码任务同样 65 项中完成了 60 项。

🔍Reddy 指出，尽管 GPT-4o 的处理速度更快，但在难度较高的任务上表现却明显较差，这引发了她的疑惑，并表示正在尝试调试以找出可能的共性问题或原因。

🤔此外，Reddy 还提出了一个疑问，询问是否因为基准测试的难度不够，导致了模型表现的差异。这一提问引发了与 @patmcguinness 和 @den_run_ai 的讨论。

Denis 也附议道：它在LiveCodeBench 基准上确实比 4 月份的 GPT-4 差很多，尤其是中等和困难的任务上。是多模态能力破坏了代码能力？

🔧这项评估结果的公布，不仅展示了 GPT-4o 在某些方面的进步，同时也暴露了在更复杂任务上的挑战。

评测网址：https://livecodebench.github.io/leaderboard.html

本文链接：https://lipu365.com/gpt4_gpt5_115.html

GPT-4o GPT4o gpt-4o检测人的情绪 gpt-4o多模态大模型发布 GPT-4o免费 GPT-4o官网 GPT4o官网

2025年5月最新版，ChatGPT中文版入口完全指南，轻松上手AI聊天神器！
2025年5月最新版《ChatGPT中文版入口完全指南》为您详解这款AI聊天神器的使用全流程，本指南包含最新注册方法、官方入口链接验证技巧及多终端适配方案，无论PC端还是移动端均可一键直达，文中特别强...
ChatGPT资讯2025-05-195ChatGPT中文版 AI聊天神器 2025新版指南 chatGPT中文版入口
2025年5月最新教程，3分钟找到必应ChatGPT入口，手把手教你玩转AI聊天
【2025年5月更新】3分钟快速解锁必应ChatGPT全攻略，本文提供最新版必应ChatGPT入口指南，无需复杂操作，通过电脑/手机浏览器3步即可体验：1. 访问微软必应官网并登录账户；2. 点击...
ChatGPT资讯2025-05-1810必应ChatGPT AI聊天 2025教程必应chatgpt入口
2025年5月最新版，ChatGPT电脑端超详细使用指南，新手1分钟上手！
【2025年5月更新】ChatGPT电脑端超详细使用指南发布！本文专为新手设计，仅需1分钟即可快速掌握核心操作，指南涵盖最新版界面布局、账号登录方法、基础对话技巧及高级功能入口，包括文件分析、多模态交...
ChatGPT资讯2025-05-1812ChatGPT 使用指南新手教程 chatgpt入口电脑
2025年5月最新攻略，手把手教你用国内入口玩转ChatGPT，小白也能秒上手！
朋友们好呀！我是科技爱好者小王，最近发现周围不少人还在为“ChatGPT国内入口怎么找”发愁，2025年5月）我就用最接地气的方式，分享最新鲜的实操经验，帮你绕过坑、省时间，直接和AI高效对话！为什么...
ChatGPT资讯2025-05-1716ChatGPT 国内入口新手攻略 ChatGPT国内入口
2025年5月最新！ChatGPT入口关闭？别慌，手把手教你3种备用访问方式
156字）：** ，近期有用户反映ChatGPT官方入口可能出现访问限制，但无需过度担忧，本文提供了三种可靠的备用访问方案：可通过官方API接口搭配第三方平台（如Poe或Slack）继续使用；推荐尝...
ChatGPT资讯2025-05-1722ChatGPT 访问方式备用方案 ChatGPT入口关闭