从山姆·奥特曼的圣诞愿望清单,看清2024年大模型发展方向

发表于 11月以前  | 总阅读数:936 次

在平安夜的清晨,就在大家还在热议GPT-4.5是否已经悄悄上线的时候,OpenAI CEO 山姆·奥特曼发布了一条推文,直接剑指GPT-5,给AI开发者和用户送了份充满充满期待的圣诞礼物。

这份清单其实起源于12月24日,奥特曼在社交媒体上发布了一条征集帖“你希望OpenAI 在2024年能做到哪些事情?”他的粉丝回复热情很高,奥特曼梳理了一份List(如图片所示),除了在AGI旁边标注了“还需要点耐心”的字样外,其它的愿望清单都没有做任何标注,我们有理由相信,也许奥特曼认为其余目标都有可能在2024年做到。

这份清单包括:

  • AGI(还需要些耐心)
  • GPT-5
  • 更好的语音模式
  • 更高的使用频率限制
  • 更好的GPTs
  • 更好的推理能力
  • 控制觉醒程度/行为
  • 视频功能
  • 个性化部署
  • 更好的浏览体验
  • 可以使用OpenAI账号登录
  • 开源项目推进

其中最引人注目的是四项内容:GPT-5、视频、开源、更好的GPTs / 个性化部署,这几项内容可能带来AI开发生态、用户体验、及产品能力上质的跃迁。“控制觉醒程度/行为”,不出意外的也出现在这个清单之中,可以看出大众对这家公司的责任担当的期待。那么,如果要完成这份清单,OpenAI可能需要解决的难题及突破重点有哪些呢?

01

想要在2024年完成GPT-5的训练,OpenAI要做的不少 OpenAI正在训练GPT-5这件事已经越来越明晰了。早在7月18日,他们已经向美国专利商标局提交了GPT-5的商标申请。到了11月14日,奥特曼接受金融时报采访时也终于承认GPT-5已经在路上了,虽然可能仅仅是开发的准备阶段。奥特曼在采访中的表述是“在我们训练这个模型之前,这对我们来说就像是一个有趣的猜谜游戏”,这说明OpenAI应该还没开始训练模型。在准备阶段他们在做的可能涉及建立训练方法、组织注释器,以及最关键的数据集管理。

数据瓶颈

数据问题一直被认为是OpenAI发布下一代大模型的主要瓶颈。因为缩放效应这种“喂的越多模型就越强”的逻辑仍然是AI能力进步的主要主导思想。但在训练GPT-4时,OpenAI已经有些捉襟见肘了。传闻称,GPT-4 的训练数据共 13T(13 万亿个)token。这一数据量级基本耗尽了现有数据:CommonCrawl 和 RefinedWeb 两个公开数据集都是 5T 个 token;据说余下部分来源 Twitter、Reddit 和 YouTube;最近沸沸扬扬的争论中,马斯克还指控OpenAI使用了来自 LibGen、SciHub 等盗版电子图书网站中的数据。

但这一问题当下也有一定的解决方法。

第一个方法就是买:对于私人或公司领域的数据,OpenAI在之前的训练中少有涉及,但这部分需付费的内容在互联网中占比是非常大的。今年OpenAI就曾表示愿意每年支付高达八位数的费用,用以获取彭博社自有的历史和持续的金融文件数据访问权限。虽然彭博没答应,而是自己搞了个Bloomberg GPT,但高价之下,总是可以买来一部分数据的。

第二个就是合成数据训练,微软开发的高质量小模型Phi-1就已经实践了利用合成数据训练模型的尝试,在3T的训练集中用了大概1.5B GPT-3.5生成的高质量合成数据,并取得了模型能力的提升。虽然1.5B看起来占比很小,但考虑到微软是用这些数据做教程用的,并非基础能力构建。如果GPT-5把遵循一定的条件限制的高质量合成数据应用在更多领域,那这一合成数据占比肯定能提升不少。

训练周期

按照Dylan Patel 泄漏的GPT-4的训练周期看,在完成训练准备后,OpenAI在大约25000个A100上训练了90到100天才完成,之后又经过了长达6个月的对齐工作才发布。整体周期需要9个月时间。考虑到GPT-5更大,更复杂这一时间长度完全有可能更长,那在2024年发布GPT-5似乎并不乐观。

但奥特曼的自信并非全无道理。GPT-4之所以训练了这么久的原因是故障过多导致GPU利用率较低,利用率仅为32%到36%之间。而每次故障都需要重新从之前的检查点开始训练。考虑到今年Gemini在训练过程中TPU的利用率应该大于50%,而且当谷歌使用模型状态的冗余内存副本,并且在任何计划外的硬件故障时,可以直接从完整的模型副本中快速恢复。有着英伟达H200加成及微软从2019年就启动的名为雅典娜的类TPU项目加持,GPT-5在训练利用率上应该会较GPT-4有很大的提升。

而对齐工作在今年的进展就更大了。首先是AI辅助自动进行对齐工作的可能性被验证有效(RLAIF),这衍生出了很多在AI参与乃至主导下的对齐研究。通过这种方式,可以大大缩短之前最费人力和时间的RLHF这一对齐步骤,提升对齐效率。但之前这种方法主要适用于用能力强的模型对齐能力弱的模型,提高其能力。但OpenAI在12月刚刚发布的弱到强泛化论文,提供了较弱AI仍然可以对齐能力更强AI的证据和方法。两种技术相结合,用GPT-4自动对齐GPT-5的逻辑和方法都有了,因此对齐时间有望被大幅缩短。

在以上条件下,有理由相信GPT-5的全部训练周期可能会短于GPT-4,这样它在2024年发布就不成问题了。

02

多模态还是必争之地,OpenAI剑指文生视频爆发元年 在这个愿望清单上,另一个值得注意的点是视频功能的支持。这一点OpenAI的竞争对手Google已经处于领先地位了。在训练Gemini的过程中,谷歌使用了多模态原生的数据,其中就包括视频。这说明Gemini已经有了对于视频的理解能力。但具体能理解到什么程度,因为Google用力过猛的演示让大家都疑虑重重。而且它还缺了生成式AI的重要一环,生成视频的能力。

实际上,在文生图,ChatBot齐头并进吸引走大家的主要注意力之时,文生视频类软件在今年也获得了巨大的进步。11月PIKA 1.0的发布就引发了相当的关注,利用这个工具我们可以随意用新的生成替换原视频,或生成视频中的任意内容。这些新进展主要归功于Animatediff这个框架,它使得一部分运镜限制下,生成视频的闪烁和连贯性都得到了有效控制。

但目前文生视频系统有三个相对重要的短板:1. 高连贯性内容长度难以超过3秒 2. 稳定内容对运镜和动作仍然限制很大 3.生成现实性内容的能力不强,需要用Midjourney等工具辅助。

但其中部分问题已经能看到被解决的曙光了。比如说时长问题,近期Google Mind 发布的新建模方法VideoPoet,它从本质上是利用支持视频的多模态,将文字和视频进行令牌化(tokenized),从而用大语言模型擅长的自回归模式去预测下一段视频的内容。这与传统的基于Diffusion(扩散)模型的文生图框架并不相同,理论上它可以生成无限长、具有高度时间一致性的视频。而在生成图像真实度方面,李飞飞的团队近期发表的模型W.A.L.T在生成拟真度上有了比较高的提升,已接近照片水准。

在Gemini发布时,业界基本预测下一代GPT-5也会是一个大一统的原生多模态模型,这就意味着用类似VideoPoet的技术GPT-5也可以实现视频生成的能力,补齐这一短板。考虑到OpenAI自身在Diffusion方面的积累和GPT-5潜在的超强能力,生成视频的质量应该也相对有保障。文生视频按目前的技术积累看,就在爆发前夜。而GPT-5也许就是引爆这一领域的产品。

03

个性化水平再提升,从知识库到工具的核心路径 在OpenAI首届开发者日上,真正的主角其实并非GPT-4 Turbo,而是GPTs。因为它第一次把个人化AI这一过去门槛颇高的产品落到个体层面,这样才能真正实现个人化的AI。而只有个人化的AI才能满足每个人最个性化的需求,成为私人助理。

但现在这个产品还存在着诸多问题,比如提供了个人数据库后,GPT的回应还是会经常呈现出它原始的表达模式,在风格模仿上能力有限。另外出于隐私保护逻辑,GPTs只支持上传内容和接入公共网络工具API,无法完全利用本地数据。这些都在很大程度上限制了个性化AI的足够“个性化”。另外GPTs目前的交互也非常依赖Prompt,缺乏UI类的支持。这类问题如果在新的一年解决,ChatGPT对于大多数人来讲可能就不再是一个只有在搜索知识时好用的产品,而是一个真正可用的万能工具了。

这条路上目前没有其他的大玩家,因为决定个性化水平的基本上是模型能力。只要OpenAI保持着模型水平的领先,这一工具化领域的优先权他们就能随时把控。对于一般用户而言,如果能在原生模型软件上完成任务,谁还会去用其他个性化工具呢?

在这篇文章发布的时候,奥特曼收集粉丝2024年愿望清单的活动还在持续:“我们将继续收集粉丝们的意见,并尽可能多地将它们纳入考虑,当然也包括许多其他让我们感到兴奋不已但尚未提及的内容。”正如奥特曼在11月接受《时代》杂志采访时所说:“这将是一个截然不同的世界。这是科幻小说长期以来向我们展示的世界。我想这是第一次,我们可以开始看到它的雏形。”在圣诞夜,我们可以一起期待,AI将在2024给我们带来什么样的惊喜。

文 / 腾讯科技

郝博阳

 相关推荐

刘强东夫妇:“移民美国”传言被驳斥

京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。

发布于:1年以前  |  808次阅读  |  详细内容 »

博主曝三大运营商,将集体采购百万台华为Mate60系列

日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。

发布于:1年以前  |  770次阅读  |  详细内容 »

ASML CEO警告:出口管制不是可行做法,不要“逼迫中国大陆创新”

据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。

发布于:1年以前  |  756次阅读  |  详细内容 »

抖音中长视频App青桃更名抖音精选,字节再发力对抗B站

今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。

发布于:1年以前  |  648次阅读  |  详细内容 »

威马CDO:中国每百户家庭仅17户有车

日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。

发布于:1年以前  |  589次阅读  |  详细内容 »

研究发现维生素 C 等抗氧化剂会刺激癌症生长和转移

近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。

发布于:1年以前  |  449次阅读  |  详细内容 »

苹果据称正引入3D打印技术,用以生产智能手表的钢质底盘

据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。

发布于:1年以前  |  446次阅读  |  详细内容 »

千万级抖音网红秀才账号被封禁

9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...

发布于:1年以前  |  445次阅读  |  详细内容 »

亚马逊股东起诉公司和贝索斯,称其在购买卫星发射服务时忽视了 SpaceX

9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。

发布于:1年以前  |  444次阅读  |  详细内容 »

苹果上线AppsbyApple网站,以推广自家应用程序

据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。

发布于:1年以前  |  442次阅读  |  详细内容 »

特斯拉美国降价引发投资者不满:“这是短期麻醉剂”

特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。

发布于:1年以前  |  441次阅读  |  详细内容 »

光刻机巨头阿斯麦:拿到许可,继续对华出口

据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。

发布于:1年以前  |  437次阅读  |  详细内容 »

马斯克与库克首次隔空合作:为苹果提供卫星服务

近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。

发布于:1年以前  |  430次阅读  |  详细内容 »

𝕏(推特)调整隐私政策,可拿用户发布的信息训练 AI 模型

据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。

发布于:1年以前  |  428次阅读  |  详细内容 »

荣耀CEO谈华为手机回归:替老同事们高兴,对行业也是好事

9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。

发布于:1年以前  |  423次阅读  |  详细内容 »

AI操控无人机能力超越人类冠军

《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。

发布于:1年以前  |  423次阅读  |  详细内容 »

AI生成的蘑菇科普书存在可致命错误

近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。

发布于:1年以前  |  420次阅读  |  详细内容 »

社交媒体平台𝕏计划收集用户生物识别数据与工作教育经历

社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”

发布于:1年以前  |  411次阅读  |  详细内容 »

国产扫地机器人热销欧洲,国产割草机器人抢占欧洲草坪

2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。

发布于:1年以前  |  406次阅读  |  详细内容 »

罗永浩吐槽iPhone15和14不会有区别,除了序列号变了

罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。

发布于:1年以前  |  398次阅读  |  详细内容 »