OpenAI GPT-4o实时视频功能宣布正式上线

GPT452024-12-13 15:35:4339

7个月前,OpenAI首次演示了GPT-4o的实时视频功能。然而这一鸽就是7个月......昨晚的直播中,GPT-4o实时视频功能宣布正式上线!

OpenAI GPT-4o实时视频功能宣布正式上线

通过使用ChatGPT应用程序,订阅了ChatGPT Plus、Team或Pro的用户可以将手机对准物体,ChatGPT将近乎实时地作出回应。

高级语音模式带有视觉功能,能够通过屏幕共享理解设备屏幕上的内容。例如,它可以解释各种设置菜单,或者为数学问题提供建议。

要使用带视觉的高级语音模式,只需点击ChatGPT聊天栏旁边的语音图标,然后点击左下角的视频图标,即可开始视频。要进行屏幕共享,点击三点菜单并选择“共享屏幕”。

OpenAI表示,高级语音模式的视觉功能将从现在开始逐步推出,并在接下来的一周内完成。但并非所有用户都能立即获得此功能。OpenAI表示,ChatGPT企业版和Edu用户要到明年一月才能使用。

在最近CNN的一档节目中,OpenAI总裁Greg Brockman用带视觉的高级语音模式测试了Anderson Cooper的解剖学技能。当Cooper在黑板上画出人体部位时,ChatGPT能够“理解”他的绘画。

ChatGPT的回复也相当优秀:“位置完全正确,大脑就在头部。至于形状,这是个不错的开始。大脑更像是一个椭圆。”

在同一个演示中,带视觉的高级语音模式在几何问题上出现了错误,这说明它仍然有不小的进步空间。

实时视频功能的发布可以说是AI在多模态感知和互动方面的一大进步。以前的AI主要通过文字和语音进行交流,而现在,它可以通过视觉获取更多的信息。这不仅提升了AI的实用性和灵活性,也为未来的智能化生活奠定了基础。

通过实时视频和视觉识别,AI可以在教育、医疗、技术支持、智能家居等多个领域发挥重要作用。比如说,在教育领域,AI可以帮助学生理解复杂的概念,提供个性化的学习建议;在医疗领域,AI可以辅助医生进行诊断和治疗,提高医疗效率和准确性;在智能家居领域,AI可以通过视觉识别控制家电设备,提供更加智能和便捷的家居体验。

本文链接:https://lipu365.com/gpt4_gpt5_420.html

chatgpt4.0手机版chatgpt4.0解读如何使用chatgpt4制作图片chatgpt4.0 收费chatgpt4能干啥chatgpt登录后显示无法使用会员chatgpt官方正版需要注册会员吗chatgpt会员有什么好玩的功能吗GPTsChatGPT团队计划

相关文章