OpenAI,AI 界的“歌者文明”,正在进行一场前所未有的 AI 战略布局
笔者大胆预测,今年 3 月份,OpenAI 会正式发布 GPT-4.5 或者 GPT-5,并上线 GPTs 商店作者分润功能
在发布前,每周都会有重大更新!包括:GPT 长期记忆功能、GPT 更多的多模态功能、本机操作 AI 助手、在线任务 AI 助手、视频配音等
届时,GPT Plus 全家桶包括:GPT 为躯干+大脑 ;两个 AI 助手左膀右臂;绘图 DALL-E、视频制作 Sora 为双腿。
下面,为您详细分析。先预测 Sora的发展趋势,再分析新版 GPT 的功能,最后结合奥特曼的公开演讲,给出学习建议!
一、Sora 未来 1-2 月发展预测
这两天,OpenAI 的文本到视频 AI 模型 Sora 火得一塌糊涂
微信单日搜索破两亿次!
Sora 源自日语,有“天空”的意思,也可引申为“自由”
Sora 可以创建长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色
以下两个视频均为 Sora 生成
Sora 早在 2023 年 3 月就开始研发!
2023 年 12 月,文生视频 曾经闪现
以下抓图来自当时学习群一个同学的 GPT 对话界面
Sora 100%会集成到 GPT Plus 全家桶中!
目前,Sora 正在邀请外部专家,进行“红蓝对抗”压力测试,你可以到 OpenAI 官网申请加入红队,看能否参与内测!
从蛛丝马迹来看,在不久的将来会发布一个单行版“Sora generator”,并集成到 GPT4.5 或 GPT-5 中,应该还给最大的投资人微软一个“Copilot sora generator”
正式发布日期应该在 2024 年 3 月,GPT4 上市一周年之时!
Sora 的出现,引发了人们对 GPT-5 的遐想,人们对 GPT-5 的期望显著上升。
强如 Sora ,GPT-5 还有哪些功能?
二、GPT-5 功能分析
2024 年 3 月也许发布 GPT-5,或者发布 GPT4.5 先过渡一下,我们后文简称新版 GPT
OpenAI 武器库里堆满了神器:“智子”、“水滴”、“光粒”、“二向箔”、“黑域”
Sora 最多算个“光粒”,GPT-5 才是降维的“二向箔”,未来的 AGC 是更高阶的“黑域”!
新版 GPT 功能分析如下:
1、长期记忆
GPT 作为核心,通过支持更大的上下文窗口,具备长期记忆能力;
ChatGPT 官网 2023 年 12 月闪现过这个功能,以下是笔者当时的抓图
现在版本的 GPT4,只有一次记忆。只记得住当前的对话。
就好像你有一个很好的朋友,每天睡着后就忘了当天的一切。第二天,你和他沟通,要从猴子变人开始说。
新版 ChatGPT 从字面理解,有了长期记忆。能够在聊天中,学习并保留信息,提供更相关的回应。
新增“个性化”设置部分,允许 ChatGPT 根据用户的聊天内容改善响应。
ChatGPT 通过捕捉聊天中的细节和偏好来定制回应。
用户可以通过特定指令修改 ChatGPT 对他们的了解,例如询问“你对我了解多少?”或“我们上次项目进行到哪里了?”。
用户可以在设置中重置 ChatGPT 的记忆或关闭此功能。
2、GPTs 分润计划
去年 12 月,GPTs 商店上线,OpenAI 就官宣:
“我们计划在第一季度启动 GPT 开发者收入计划。作为首步,美国的开发者将根据用户对他们 GPTs 的参与度获得报酬。我们将在接近启动时间时提供详细的支付标准。”
关于 GPTs,入门可参看《OpenAI 正式发布 GPTs 商店和分润规划》
3、AI 助手(本机操作+在线任务)
OpenAI 不断推出更新迭代的 AI 工具,以提升效率和智能化。
OpenAI 正在研发两款 AI 新功能,一款针对计算机操作,另一款针对在线任务,旨在实现计算机操作和在线任务的自动化处理。
💻 OpenAI 正在研发针对计算机操作的 AI 助手,可自动执行各类任务,提升工作效率。
🌐 另一款 AI 专注于网络任务,如信息检索、旅行规划等,能为用户节省时间和劳力。
这些 AI 工具可能给类似服务的创业公司带来竞争压力,但也创造新商机。
详见《OpenAI 正在秘密研发两款 AI 助手》
4、视频配音
目前 Sora 很牛,但是目前做出的视频没有声音!
只有第三方 AI 音频公司 ElevenLabs 宣布,即将推出半自动 AI 配音测试
现在测试名单需要申请 https://form.typeform.com/to/gg0xzZW4
下面是 ElevenLabs 发布的为 Sora 的视频配音展示
我预计 OpenAI 很快会推出类似功能,不然,"没有声音,再好的戏也出不来!”。
功能包括有“文生音乐”,“视频生音乐”等。
5、其他功能
减少幻觉:用过 AI 的用户都知道,幻觉,是所有 AI 的通病。即生成虚假信息的情况将会减少;
提高计算效率:在保证输出质量的前提下,大幅提升计算效率;
多感知能力:可以同时处理文本、音频、视频等不同类型的输入和输出
价格合理:可能会提供更经济实惠的价格
或者不涨价,增加功能=降价!OpenAI API 将继续变得更快、更可靠、更便宜
三、 奥特曼的建议
以下是 Sam 奥特曼在 YC W24 启动会上的演讲要点:
奥特曼暗示我们可能已经非常接近实现通用人工智能(AGI)
AGI 的接近:Sam Altman 暗示我们可能已经非常接近实现通用人工智能(AGI),这将是一个重大的技术突破。
以 AGI 为前提:他建议创业者和技术开发者应该基于 AGI 的实现来规划他们的工作,而不是继续在现有技术框架内进行小幅度的改进。
GPT-5 的潜在进步:Altman 提到,尽管 GPT-4 已经领先了两年,但 GPT-5 可能会带来指数级的提升,这将对现有技术构成巨大挑战。
对初创企业和现有公司的挑战:技术的快速进步将给初创企业和现有公司带来许多问题和挑战,AGI 可能会覆盖一大批创业者的工作领域。
使用最先进的模型:他建议使用最先进的模型(State of the Art, SOTA),而不是花费太多时间进行微调和优化,因为这些努力可能会变得徒劳无功。
远见和产品构建:建议创业者设想一个“上帝般的”模型正在运作,并基于这种设想来构建最好的产品,这需要极强的远见。
OpenAI API 的改进:Altman 提到 OpenAI 的 API 将继续变得更快、更可靠、更便宜,但性能和成本之间始终存在平衡。
避免针对 GPT-4 限制的产品业务:他不推荐建立产品业务主要致力于解决当前 GPT-4 的限制,因为这些限制在 GPT-5 中可能会得到部分或全部修复。
情境优化而非行为优化:对于初创公司来说,情境优化可能比行为优化更重要。通过提供更多信息(如 RAG 等)可能比微调模型更有益。
四、如何学习 Sora,迎接 GPT-5?
1、官网注册 GPT
OpenAi 注册分两步:邮箱验证,目前只开通官方网站使用,不需要验证手机号码了
详见《一文掌握 GPT 注册》
2、开通 GPT4
《ChatGPT4 最新开通方法!不需要验证手机,不需要等待》
开通前,你需要开通支付宝开通 wildcard 支付
《保姆级教程!手把手教你用支付宝开通 ChatGPT plus!》
3、系统的学习 ChatGPT
重点学习 gpts,GPT 文章集锦如下:
《ChatGPT 文章集锦,拿走不谢》
觉得复杂,可以加入我们的学习群获取更多学习资料,提问并参与各种讨论
加入方式见文末
4、系统的学习“文生视频”软件
入门不难,包括 Pixverse,Pika,runway 等。关注sora新动向,熟悉各种提示词
点击看《文生视频》系列文章
结语:
回顾人类发展科技发展史,你会发现这种情况:
某类新技术的浪潮,会在几年之内迅速爆发,就像大自然的力量,无法阻挡,不可逆转。
人才、新发明、新产品一波一波的来,群雄争霸,高潮迭起。寂寂无名的公司凭借新科技,迅速崛起,曾经的老大却容易落入创新者的窘境。
如果你了解蒸汽、电力、内燃机、半导体、电脑等技术发展史,你就知道我在说什么。
最近两波是 2000 年左右的互联网,16 年的区块链,
而今,我们正站在另一个巨浪的起点。人工智能,这个曾经只存在于科幻小说中的概念,未来将渗透到我们生活的每一个角落。
我们也需要对 AI 的发展保持关注和学习,以确保自己在这个内卷的时代掌握这项强大的技术。
AI 的时代才刚刚开始,让我们一起期待 GPT-5 的到来,并共同推进人工智能向着有益于人类的方向发展!
GPT4 十分钟内完成泰坦尼克号生存分析
本文链接:https://lipu365.com/gpt4_gpt5_65.html
怎么使用chatgpt4.0复旦大学教授评chatgpt4chatgpt4.0使用chatgpt4本地部署chatgpt4能干啥chatgpt4.0官方下载GPT Plus充值文本到音乐生成GPTs官网ChatGPT插件