【新智元导读】当谷歌不再只满意于「TPU本身用」,TPU摇身一酿成了英伟达王座下最尖利的一把刀!CUDA护城河还能守住吗?读完这篇SemiAnalysis的明白,你大概会第一次从「算力账本」的视角,看懂谷歌隐蔽的杀招。
![]()
越发是TPUv7更是人们会商体贴的重心,这款特意为AI策画的芯片是否或许打垮英伟达众年来的GPU酿成的垄断?
有目共睹,SemiAnalysis是一家正在科技界,越发是半导体和人工智能界限极具影响力的精品咨议与商量公司。
它以硬核、深度的数据明白著称,分歧于日常而说的科技媒体,它更像是一个供职于华尔街投资者、芯片巨头和AI从业者的「行业智库」。
![]()
谷歌打垮恒久以还的内部自用通例,起初向Anthropic等外部客户大领域出售TPU硬件及算力,后者已安放越过1GW的TPU集群。
即使正在单芯片外面参数上TPU未必碾压英伟达,但谷歌仰仗出色的体系级工程(如ICI互联和光途交流)告终了极高的现实模子算力诈欺率(MFU),且总体具有本钱(TCO)比英伟达GB200体系低约30%-40%。
谷歌正通过支柱PyTorch原生处境和vLLM等开源生态,主动修补软件短板,试图从根源上解体CUDA的护城河。
目前,宇宙上最顶尖的两个模子——Anthropic的Claude 4.5 Opus,以及谷歌的Gemini 3,它们绝大部门锻炼和推理根底措施,都运转正在谷歌的TPU和亚马逊的Trainium上。
![]()
![]()
英伟达还特意为此揭橥了一条官方推文,祝贺谷歌正在AI界限的发展,同时不忘夸大本身照旧遥遥领先。
![]()
正在推文中,英伟达夸大本身仍正在陆续向谷歌供应硬件,并展现本身照旧领先行业一代,是独一或许运转一切AI模子、并能正在种种企图场景中操纵的平台。
同时,夸大GPU比专用芯片(ASIC)正在机能、通用性和可替换性上更强,这句话彰彰是对谷歌TPU、AWS Trainium等专用芯片的回应。
正在过去的几个月里,谷歌DeepMind的Gemini 3、谷歌云以及TPU归纳体,赚足了眼球,也将谷歌母公司Alphabet的市值推高至贴近4万亿美元。
TPU产量大幅上调,Anthropic、Meta、SSI、xAI、OAI等TPU的客户名单正正在陆续增添,这些胀励了谷歌和TPU供应链的大幅从头评级,无疑也将压制以英伟达GPU为核心的供应链。
![]()
除了面临TPU的压力,英伟达还面对着通过「轮回经济」变成AI泡沫的质疑,很众质疑者以为英伟达通过资助烧钱的AI始创公司,实质上是将钱从一个口袋转变到另一个口袋。
![]()
英伟达旨正在通过股权投资而非减价来维持其正在根底尝试室的主导位子——减价将拉低毛利率并激发投资者普通慌乱。
![]()
固然OpenAI目前尚未安放TPU,但仅凭「转向TPU」这一或者,就已正在其英伟达集群本钱上俭约约30%。
简易来说,OpenAI并没有真的把谷歌的TPU芯片插进供职器里跑劳动,而是把「我随时或者改用TPU」动作一个强大的商榷筹码,迫使英伟达为了留住这个大客户,变相赐与了巨额优惠。
正在过去的几个月里,谷歌一经启发了总共货仓的发奋,通过谷歌云平台或动作商用供应商贩卖完备的TPU体系,开启了TPU大领域商用的步骤。
与此同时,谷歌的顶级客户Anthropic也正在一连胀励挣脱对英伟达简单依赖,两者正在采用TPU上一拍即合。
![]()
TPUv7 Ironwood是一个精良体系内的壮健芯片,纵使芯片正在参数上落伍于英伟达,谷歌的体系级工程也使得TPU货仓正在机能和本钱成果方面都能与英伟达相般配。
与英伟达通过GB200扩展其GPU生态相同,谷歌自2017年TPUv2以还,也平昔正在机架内和跨机架扩展TPU。
![]()
自2024年5月GPT-4o以还,OpenAI的顶尖咨议职员尚未落成普通用于新前沿模子的胜利全领域预锻炼运转,而TPU平台则通过了这一测试。
对待谷歌来说,正在最具挑衅性的硬件题目之一中静静挤入并作战机能领先位子,确实是一个令人印象长远的豪举。
固然谷歌平昔正在胀励体系和收集策画的范围,但从一起初,谷歌正在芯片方面的策画理念相对待英伟达就更为顽固。
第二个情由,直到2023年,谷歌的首要AI职责负载是为其中央寻求和广告资产供给动力的推举体系模子。
与大模子职责负载比拟,RecSys职责负载的算术强度要低得众,这意味着相对待传输的每一位数据,须要的FLOPs更少。
![]()
商用GPU供给商盼望为其芯片营销尽或者好的机能规格,这勉励他们将营销的FLOPs升高到尽或者高的数字。
![]()
TPUv7 Ironwood是下一次迭代,谷歌正在FLOPs、内存和带宽方面险些齐备缩小了与相应英伟达旗舰GPU的差异,即使周密上市比Blackwell晚了1年。
![]()
固然谷歌通过Broadcom采购TPU并支出高额利润,但这彰彰低于英伟达不只正在他们贩卖的GPU上,况且正在总共体系(搜罗CPU、交流机、NIC、体系内存、布线和连合器)上赚取的利润。
英伟达的上风源于CUDA护城河和开箱即用的普通开源库,助助职责负载高效运转,告终高FLOPs和内存带宽。
比拟较之下,TPU软件货仓开箱即用的机能较弱,然而Anthropic具有壮健的工程资源和前谷歌编译器专家,他们既相识TPU货仓,也很好地贯通本身的模子架构。
他们可能投资自界说内核以驱动高TPU成果,这使得他们可能抵达比采用其他商用GPU更高的MFU(模子FLOPs诈欺率)和更好的每PFLOP本钱机能($/PFLOP)。
谷歌以来点窜了针对外部客户的软件政策,并一经对其TPU团队的KPI以及他们奈何为AI/ML生态体系做出奉献做出了强大改换。
![]()
谷歌正在软件政策方面已经处分欠妥的一个地方是,他们的XLA图编译器、收集库和TPU运转时已经没有开源,也没有很好的文档记实。
就像PyTorch或Linux开源急速补充了采用率相同,为了加快用户的采用,谷歌大概应当将其开源,用户采用率的补充将越过他们公然和免费供给的一切软件IP。