(重新归档不变以修复格式问题)
作者:胡晓明、佟安娜
(路透社)-像 OpenAI 这样的人工智能公司正在寻求通过开发使用更类似于人类的算法“思考”方式的训练技术来克服在追求更大的大型语言模型时出现的意外延迟和挑战。
十几位人工智能科学家、研究人员和投资者告诉路透社,他们相信 OpenAI 最近发布的 o1 模型背后的这些技术可能会重塑人工智能军备竞赛,并对人工智能公司永不满足的资源类型产生影响。能源到芯片类型。
OpenAI 拒绝对本文发表评论。两年前病毒式传播的 ChatGPT 聊天机器人发布后,估值从人工智能热潮中获益匪浅的科技公司公开坚称,通过添加更多数据和计算能力来“扩展”当前模型将持续改进人工智能模型。
但现在,一些最著名的人工智能科学家正在公开谈论这种“越大越好”哲学的局限性。
人工智能实验室 Safe Superintelligence (SSI) 和 OpenAI 的联合创始人 Ilya Sutskever 最近告诉路透社,这是扩大预训练规模的结果,即训练人工智能模型的阶段,该模型使用大量未标记的数据来理解语言模式和结构- 已趋于稳定。
Sutskever 被广泛认为是通过在预训练中使用更多数据和计算能力来实现生成式 AI 进步的巨大飞跃的早期倡导者,最终创建了 ChatGPT。 Sutskever 今年早些时候离开 OpenAI,创立了 SSI。
“2010 年代是扩展的时代,现在我们再次回到了奇迹和发现的时代。每个人都在寻找下一个目标,”苏茨克韦尔说道。 “现在,扩大正确的规模比以往任何时候都更加重要。”
Sutskever 拒绝透露有关他的团队如何解决该问题的更多细节,只是表示 SSI 正在研究扩大预训练规模的替代方法。
据三位熟悉私人事务的消息人士透露,在幕后,主要人工智能实验室的研究人员在发布一个大型语言模型的竞赛中遇到了延误和令人失望的结果,该模型的性能优于 OpenAI 的 GPT-4 模型,该模型已有近两年的历史。
通过同时运行数百个芯片,大型模型的所谓“训练运行”可能会花费数千万美元。考虑到系统的复杂性,它们更有可能出现硬件引起的故障;研究人员可能直到运行结束才知道模型的最终性能,这可能需要几个月的时间。
另一个问题是大型语言模型会吞噬大量数据,而人工智能模型已经耗尽了世界上所有易于访问的数据。电力短缺也阻碍了训练的进行,因为该过程需要大量的能源。
为了克服这些挑战,研究人员正在探索“测试时计算”,这是一种在所谓的“推理”阶段或使用模型时增强现有人工智能模型的技术。例如,模型不是立即选择单个答案,而是可以实时生成和评估多种可能性,最终选择最佳的前进路径。
这种方法允许模型将更多的处理能力用于具有挑战性的任务,例如数学或编码问题或需要类人推理和决策的复杂操作。
OpenAI 研究员诺姆·布朗 (Noam Brown) 表示:“事实证明,让机器人在扑克牌中思考 20 秒,与将模型扩大 100,000 倍并训练时间延长 100,000 倍具有相同的提升效果。” o1,上个月在旧金山举行的 TED AI 会议上。
OpenAI 在其新发布的名为“o1”的模型中采用了这项技术,该模型以前称为 Q* 和 Strawberry,路透社于 7 月首次报道。O1 模型可以以多步骤的方式“思考”问题,类似于人类它还涉及使用博士和行业专家提供的数据和反馈,o1 系列的秘密武器是在 GPT-4 等“基础”模型之上进行的另一套训练,该公司表示计划应用。这项技术有更多和更大的基础模型。
与此同时,据五位知情人士透露,来自 Anthropic、xAI 和 Google(纳斯达克:)DeepMind 等其他顶级人工智能实验室的研究人员也一直在致力于开发自己的技术版本。
OpenAI 首席产品官 Kevin Weil 在 10 月份的一次技术会议上表示:“我们看到了很多容易实现的成果,我们可以快速采摘这些成果,从而使这些模型变得更好。” “当人们追上来时,我们将努力领先三步。”
谷歌和 xAI 没有回应置评请求,Anthropic 也没有立即置评。
这些影响可能会改变人工智能硬件的竞争格局,迄今为止,人工智能硬件的竞争格局主要由对英伟达人工智能芯片永不满足的需求所主导。从红杉资本到安德森·霍洛维茨 (Andreessen Horowitz) 等知名风险资本投资者已投入数十亿美元,资助 OpenAI 和 xAI 等多个人工智能实验室昂贵的人工智能模型开发,他们正在注意到这一转变,并权衡对其昂贵赌注的影响。
红杉资本合伙人 Sonya Huang 告诉路透社:“这一转变将使我们从大规模预训练集群的世界转向推理云,推理云是分布式、基于云的推理服务器。”
对英伟达最前沿的人工智能芯片的需求推动其崛起,成为全球最有价值的公司,并于 10 月份超越苹果(纳斯达克:)。与英伟达(NASDAQ:)在训练芯片领域占据主导地位不同,这家芯片巨头可能在推理市场面临更多竞争。
当被问及对其产品需求可能产生的影响时,Nvidia 指出了最近公司关于 o1 模型背后技术重要性的演示。其首席执行官黄仁勋谈到了使用其芯片进行推理的需求不断增长。
黄上个月在印度的一次会议上表示:“我们现在发现了第二个标度律,这就是推理时的标度律……所有这些因素导致对布莱克威尔的需求非常高。” ,指的是该公司最新的AI芯片。
关键词: