今天我们将讨论~
OpenAI大幅降价并解决GPT-4“懒惰” 问题
OpenAI计划设立价值1000亿美元的芯片工厂
谷歌推出了LUMIERE,一种用于视频生成的时空扩散模型
微软正在创建更高效的对话式AI模型,即小语言模型(SLM)
OpenAI 大幅降价并解决GPT-4“懒惰” 问题
新闻 - 就在1 月 25 日,OpenAI发布了新的模型型号、GPT3.5降价、对“懒惰”的GPT-4进行修复。
对于开发者和AI爱好者来说,也许最令人兴奋的消息是 GPT-3.5 Turbo 的价格下降,这是 ChatGPT 的一个基础大语言模型。输入成本减半至0.0005 美元/1k代币(token),输出成本降至0.0015 美元/1k代币,便宜了25%。它大大降低了密集型文本任务(如分析长文档)的成本。随着开源竞争对手越来越多,OpenAI知道降低使用成本是留住用户的关键。
还有哪些更新?这次发布的新型号包括两个新的嵌入模型、一个更新版的GPT-4 Turbo preview、一个更新版的GPT-3.5 Turbo、一个更新版的文本审核模型。还承诺,默认情况下,发送到OpenAI API的数据不会用于训练或改进他们的大语言模型。
新的嵌入模型有什么不同呢?这次新引入的两个嵌入模型:一个更小且高效的text-embedding-3-small,以及一个更大、更强大的text-embedding-3-large。
将 text-embedding-ada-002 与 text-embedding-3-small 进行比较,常用的多语言检索基准 (MIRACL) 的平均得分从 31.4% 增加到 44.0%,而常用的英语任务基准 (MTEB) 的平均得分从 61.0% 增加到 62.3%,拥有更强的性能。价格与 text-embedding-ada-002 相比,text-embedding-3-small 的定价降低了 5 倍,从0.0001美元 /1k代币降至 0.00002美元 /1k代币。虽然text-embedding-3-small 价格降低了很多,性能也提升了许多,但是OpenAI并没有弃用text-embedding-ada-002模型。
新的大型文本嵌入模型,text-embedding-3-large可创建并嵌入3072个维度(即向量的长度),将 text-embedding-ada-002 与 text-embedding-3-large 进行比较,在 MIRACL 上,平均分数从 31.4% 增加到 54.9%,而在 MTEB 上,平均分数从 61.0% 增加到 64.6%。text-embedding-3-large 的价格为 0.00013 美元/1k 代币。
GPT-3.5 Tubro将更新为GPT-3.5 tubro-0125,其中请求格式响应更快更准确,还修复了导致非英语语言函数调用文本编码的错误问题。
GPT-4 Turbo preview将更新为GPT-4-0125-preview,这次升级将提升其性能减少它的“懒惰”问题。
text-moderation-007,一个免费的内容审核 API 允许开发人员识别可能有害的文本信息,据OpenAI所说,这是迄今为止最强大的审核模型。
OpenAI计划设立价值1000亿美元的芯片工厂
新闻 - OpenAI计划建立自己的芯片工厂,以满足市场对AI和AIGC相关工作负载所需芯片的需求。根据彭博社的报道,公司CEO山姆·奥尔特曼(Sam Altman)正在与几家风险投资公司和其他资金组织讨论,以筹集约1000亿美元资金,用于在全球范围内建立芯片工厂网络。芯片工厂,包括半导体制造单元,通常需要巨额投资,因为建立过程中涉及的机械和技术非常昂贵。
据报道,奥尔特曼已经与总部位于阿布扎比的AI公司G42和投资公司软银集团进行了交谈。如果这个新的芯片项目成立,它将为全球的AI工作负载提供芯片。报道援引消息人士的话称,OpenAI正寻求从G42筹集80亿至100亿美元。
2023年10月份早些时候,G42与OpenAI合作,为当地和区域市场提供基于AI的服务。
2023年12月的报道中提到,OpenAI试图筹集1000亿美元,但当时没有透露这笔新资金将用于什么目的。
面对AI技术快速发展带来的芯片需求激增,大型科技公司可能开始自行生产AI硬件,实现垂直整合。与谷歌和亚马逊网络服务(AWS)这些设计芯片但外包生产的公司不同,OpenAI似乎选择了自己生产芯片这一成本较高的路径。
谷歌推出了LUMIERE,一种用于视频生成的时空扩散模型(Space-Time Diffusion Mode)
谷歌推出了 Lumiere,这是一种用于生成高度逼真视频的突破性人工智能模型。Lumiere 很特别,因为它可以制作非常逼真的视频,并让人们对视频的外观有很大的控制权。更棒的是,它可以一次性创建整个视频,确保视频中的所有内容都匹配并且看起来很好。
功能包括根据文本生成视频和动画静态图像(GIF),以及视频修复和风格克隆。
它超越了以前依赖关键帧的方法,减少了“不稳定”。
Lumiere 使用“时空”神经网络一次性创建 5 秒视频,增强一致性。
Lumiere是一个创新的文本到视频生成模型,它通过一个名为时空U-Net的架构,能够一次性生成整个视频的连续动作。这种方法与之前先生成关键帧再进行时间上的细节增强的方法不同,后者难以实现全局时间一致性。Lumiere利用空间和时间的上下采样技术,并结合预训练的文本到图像扩散模型,能够在多个时空尺度上直接生成低分辨率的全帧率视频。它在文本到视频生成领域取得了最先进的成果,并能够支持多种内容创作和视频编辑任务,如图像转视频、视频修复和风格化生成。
视频效果
微软正在创建更高效的对话式AI模型,即小语言模型(SLM)
新闻 - 众所周知训练和部署大语言模型成本高昂,尤其是像微软那样为数百万客户提供服务。去年秋天,有报道称微软正在加强研究更小、更高效的AI模型。微软的一个新的GenAI团队负责开发更小、更便宜的对话AI。
这些所谓的“小型语言模型”(SLMs)旨在使用显著较少的计算能力来模仿大型语言模型(如OpenAI的GPT-4)的质量。SLMs可以用来处理像Bing和Windows Copilot这样的聊天机器人的简单查询,以节省计算成本。
微软已经将几位领先的AI开发者从其研究小组调至新的GenAI团队,包括Sebastien Bubeck,他也参与了微软旗舰SLM Phi-2的开发。微软今年早些时候将Phi-2作为开源发布,并表示它优于谷歌的商业SLM Gemini Nano。GenAI团队由企业副总裁Misha Bilenko领导,并向CTO Kevin Scott汇报。微软还有一个Turing团队在开发大规模语言模型。Turing模型用于Copilot产品中,有时与OpenAI模型结合使用。同样,微软的模型旨在完成较简单的工作以节省成本。
总的来说,微软开发SLM可能会为用户提供更经济、更快速的AI服务,同时也可能推动AI技术的普及。然而,这也可能带来性能和功能上的限制,以及对数据隐私和安全的新挑战。
推荐几本关于人工智能的书
《Queen of Angels》(中文名:《天使女王》)
是Greg Bear所著的一部科幻小说,首次出版于1990年。这本书设定在一个不远的未来,即2047年的洛杉矶,心理学的进步使得犯罪变得极为罕见。然而,当著名诗人Emanuel Goldsmith被发现在公寓中杀害了八个人时,这一事件震惊了整个社会。洛杉矶警察局的Mary Choy,一位通过纳米技术增强了外貌和工作能力的生物转化警察,被指派去逮捕这位杀手。同时,心理治疗的先驱Martin Burke准备探索Goldsmith的内心世界。与此同时,Goldsmith的好友和同行作家对这一消息感到震惊,而在他们之外,一个太空探测器做出了惊人的发现。
这本小说探讨了人工智能、人性以及大规模谋杀的主题,被《纽约时报书评》誉为“在几乎所有层面上都成功的”作品。它还获得了雨果奖最佳小说提名(1991年)和约翰·W·坎贝尔纪念奖最佳小说提名(1991年)。Greg Bear以其对技术、身份和意识本质的深刻探讨而著称,这部作品也不例外,它挑战了我们对完美、惩罚以及人类灵魂本质的传统观念。
《A Closed and Common Orbit》(中文名:《封闭与共同的轨道》)
是由Becky Chambers所著的科幻小说,它是《The Long Way to a Small, Angry Planet》(中文名:《通往一个愤怒小行星的漫长旅程》)的独立续集。这本书讲述了一个充满冒险和危险的银河系旅程,主要围绕着一艘名为Wayfarer的太空船及其船员的故事。
在《A Closed and Common Orbit》中,Lovelace原本只是一艘船的人工智能。在经历了一次彻底的系统关闭和重启后,她在一个新的身体中醒来,失去了之前的记忆。Lovelace在探索宇宙和发现自我的过程中,与一个名叫Pepper的工程师成为了朋友。Pepper决心帮助Lovelace学习和成长。他们一起发现,无论宇宙多么广阔,两个人可以共同填补它。
这本书适合喜欢《Firefly》(萤火虫)、Joss Whedon(乔斯·韦登)、《Mass Effect》(质量效应)和《Star Wars》(星球大战)的粉丝。Becky Chambers通过这本书展现了她对人工智能技术和伦理问题的个人看法,同时也探讨了自我意识成长的主题。这本书获得了多个奖项提名,包括雨果奖最佳系列奖,并在2017年获得了朱莉娅·维尔兰格奖。
推荐几款人工智能工具
Savey Meal-Bot 是一个由 OpenAI 技术支持的实用信息助手。它通过利用剩余食材为用户提供新的食谱,确保没有浪费。用户可以输入他们手头上的剩余食材,Savey Meal-Bot 会生成创意食谱来帮助用完这些食材。它的目标是通过提供实用和创新的烹饪解决方案,促进可持续性并减少食物浪费。
传送门:https://saveymeal-bot.co.nz/
TurboScribe-是一款由人工智能驱动的转录服务,提供无限量的音频和视频转录服务。它采用OpenAI,Whisper的技术,支持超过98种语言的高准确度转录。该服务支持多种文件格式,允许上传长达10小时、大小达5GB的文件。TurboScribe 提供三种转录模式:Cheetah(最快)、Dolphin(默认)和Whale(最准确)。此外,它还具备说话者识别功能,并能以多种格式导出转录文本。TurboScribe 的目标是以实惠的价格提供世界级的转录服务。
传送门:https://turboscribe.ai/
敬请关注原子集服务号,AI绘图和AI聊天都已集成在这个公众号内,让我们一起拥抱AI!