索帕图像|轻火箭|盖蒂图片社
英伟达 已成为人工智能芯片领域无可争议的领导者,向全球大多数最大的科技公司出售大量芯片,市值达到 4.5 万亿美元。
Nvidia 的主要客户之一是 谷歌,它一直在芯片制造商的图形处理单元(GPU)上加载,以试图跟上云中人工智能计算能力不断飙升的需求。
虽然没有迹象表明谷歌将放慢对 Nvidia GPU 的采购,但这家互联网巨头越来越多地表明,它不仅仅是高性能芯片的买家。它也是一个开发商。
周四,谷歌宣布其迄今为止最强大的芯片 Ironwood 将在未来几周内广泛使用。它是谷歌的第七代张量处理单元(TPU),该公司的定制芯片已经研发了十多年。
TPU 是专用集成电路(ASIC),通过为特定任务提供高度专业化和高效的硬件,在人工智能中发挥着至关重要的作用。谷歌表示,Ironwood 旨在处理最繁重的人工智能工作负载,从训练大型模型到为实时聊天机器人和人工智能代理提供支持,并且速度比其前身快四倍以上。 AI 初创公司 Anthropic 计划使用多达 100 万个数据来运行其 Claude 模型。
对于谷歌来说,当所有超大规模企业都在争先恐后地建造庞大的数据中心,而人工智能处理器的制造速度却无法满足需求时,TPU 提供了竞争优势。其他云公司也在采取类似的方法,但在努力上远远落后。
Amazon Web Services 于 2019 年向客户推出了首款云 AI 芯片 Inferentia,三年后又推出了 Trainium。微软直到 2023 年底才发布其首款定制 AI 芯片 Maia。
Bernstein 半导体分析师 Stacy Rasgon 表示:“在 ASIC 厂商中,谷歌是唯一一家真正大量部署此类产品的公司。” “对于其他大型企业来说,这需要很长时间、大量努力和大量资金。他们是其他超大规模企业中走得最远的。”
谷歌没有对这篇报道发表评论。
谷歌的 TPU 最初是针对内部工作负载进行培训的,自 2018 年以来已向云客户提供。最近,Nvidia 表现出了一定程度的担忧。据《华尔街日报》报道,当 OpenAI 今年早些时候与谷歌签署第一份云合同时,这一消息促使 Nvidia 首席执行官黄仁勋开始与这家人工智能初创公司及其首席执行官 Sam Altman 进行进一步谈判。
与英伟达不同的是,谷歌并不将其芯片作为硬件出售,而是通过其云提供对 TPU 作为服务的访问,这已成为该公司的主要增长动力之一。谷歌母公司Alphabet在上周发布的第三季度财报中表示,云收入同比增长34%,达到151.5亿美元,超出了分析师的预期。该公司本季度末的业务积压金额为 1,550 亿美元。
首席执行官 Sundar Pichai 在财报电话会议上表示:“我们看到对我们的人工智能基础设施产品的巨大需求,包括基于 TPU 和 GPU 的解决方案。” “这是我们过去一年增长的关键驱动力之一,我认为在未来的基础上,我认为我们继续看到非常强劲的需求,我们正在投资来满足这一点。”
谷歌并未透露其云领域 TPU 业务的规模。 DA Davidson 的分析师在 9 月份估计,由 TPU 和谷歌 DeepMind AI 部门组成的“独立”业务的估值可能约为 9000 亿美元,高于 1 月份估计的 7170 亿美元。 Alphabet 目前的市值超过 3.4 万亿美元。
“针对性强”的芯片
定制化是谷歌的一个主要差异化因素。分析师表示,TPU 的一项关键优势是相对于竞争产品和服务为客户提供的效率。
Tech Insights 分析师詹姆斯·桑德斯 (James Sanders) 表示:“他们实际上正在制造非常严格针对其预期工作负载的芯片。”
拉斯贡表示,效率将变得越来越重要,因为对于正在建设的所有基础设施来说,“可能的瓶颈可能不是芯片供应,而是电力。”
周二,谷歌宣布推出 Suncatcher 项目,该项目探索“配备我们的张量处理单元 (TPU) AI 芯片的太阳能卫星互连网络如何充分利用太阳的能量。”
作为该项目的一部分,谷歌表示计划在 2027 年初发射两颗搭载 TPU 的太阳能卫星原型。
该公司在公告中表示:“这种方法将具有巨大的规模潜力,并且还能最大限度地减少对陆地资源的影响。” “这将在轨道上测试我们的硬件,为未来太空大规模计算时代奠定基础。”
Anthropic 联合创始人兼首席执行官达里奥·阿莫迪 (Dario Amodei) 在 2025 年世界经济论坛上的讲话。
斯特凡·沃穆斯 |彭博社 |盖蒂图片社
谷歌有史以来最大的 TPU 交易于上月底达成,当时该公司宣布大幅扩展与 OpenAI 竞争对手 Anthropic 的协议,价值数百亿美元。通过此次合作,谷歌预计将在 2026 年带来超过 10 亿瓦的在线人工智能计算能力。
谷歌云首席执行官托马斯·库里安(Thomas Kurian)在宣布这一消息时表示:“Anthropic 选择大幅扩大 TPU 的使用,反映出其团队多年来在 TPU 方面看到的强劲性价比和效率。”
谷歌已向 Anthropic 投资 30 亿美元。虽然亚马逊仍然是 Anthropic 最深入的云合作伙伴,但谷歌现在正在提供核心基础设施来支持下一代 Claude 模型。
Anthropic 首席产品官 Mike Krieger 告诉 CNBC:“对我们的模型的需求如此之大,我认为我们今年能够提供尽可能多的服务的唯一方法就是采用多芯片策略。”
该策略涵盖 TPU、Amazon Trainium 和 Nvidia GPU,使该公司能够优化成本、性能和冗余。 Krieger 表示,Anthropic 做了很多前期工作,以确保其模型能够在芯片提供商之间同样良好地运行。
克里格说:“我已经看到投资得到了回报,因为我们能够将这些大型数据中心上线并满足客户的需求。”
巨额支出即将到来
在 Anthropic 交易前两个月,谷歌与 元 价值超过 100 亿美元,但尚不清楚其中有多少涉及 TPU 的使用。尽管 OpenAI 表示,随着业务多元化,远离微软,它将开始使用谷歌的云,但该公司告诉路透社,它不会部署 GPU。
Alphabet 首席财务官阿纳特·阿什肯纳齐 (Anat Ashkenazi) 将谷歌最近一个季度的云发展势头归因于企业对谷歌完整人工智能堆栈的需求不断增长。该公司表示,2025 年前 9 个月签署的价值数十亿美元的云交易比前两年的总和还要多。
Ashkenazi 表示:“在 GCP,我们看到对企业人工智能基础设施(包括 TPU 和 GPU)的强劲需求。”他补充说,用户也纷纷涌向该公司最新的 Gemini 产品以及“网络安全和数据分析”等服务。
亚马逊报告称,上季度其市场领先的云基础设施业务增长了 20%,该公司也表达了类似的观点。
AWS 首席执行官 Matt Garman 在最近的一次采访中告诉 CNBC,该公司的 Trainium 芯片系列正在蓄势待发。他表示,“今天我们数据中心投放的每块 Trainium 2 芯片都已售出并投入使用”,他承诺通过 Trainium 3 进一步提高性能和效率。
股东已表现出接受巨额投资的意愿。
谷歌刚刚将今年资本支出预测上限从之前的 850 亿美元上调至 930 亿美元,预计 2026 年的增幅会更大。该公司股价第三季度飙升 38%,创 20 年来最佳表现,第四季度又上涨 17%。
瑞穗最近指出谷歌在 TPU 方面具有明显的成本和性能优势,并指出虽然这些芯片最初是为内部使用而设计的,但谷歌现在正在赢得外部客户和更大的工作负载。
摩根士丹利分析师在 6 月份的一份报告中写道,虽然 Nvidia 的 GPU 可能仍将是人工智能领域的主导芯片提供商,但开发人员对 TPU 的日益熟悉可能会成为谷歌云增长的重要推动力。
DA Davidson 的分析师在 9 月份表示,他们看到对 TPU 的需求如此之大,以至于谷歌应该考虑“向外部客户”出售这些系统,包括前沿人工智能实验室。
他们写道:“我们仍然相信,谷歌的 TPU 仍然是 Nvidia 的最佳替代品,两者之间的差距在过去 9-12 个月内显着缩小。” “在此期间,我们看到人们对 TPU 的积极情绪不断增长。”
手表: 亚马逊价值 110 亿美元的数据中心投入使用:以下是内部结构
关键词:互联网,Enterprise,Meta Platforms Inc,Sundar Pichai,Sundar Pichai,NVIDIA Corp,Alphabet Class A,金融科技,技术,加密货币,比特币,能源,商业新闻