一、老黄:AI需求呈抛物线增长。
AI需求呈抛物线增长,原因也很简单,智能体AI已经到来了。
主流AI已经从一次性推理过渡到逻辑推理,现在又进入了「agent智能体」阶段。
AI不再是可有可无,而是必需品。tokens现在是有利可图的。在AI时代,计算能力就是收入和利润。
正好也和谷歌IO大会披露的token消耗数据能够契合上。
这次谷歌IO大会公布了一些token消耗数据,AI从工具转向了「Agentic AI」,token消耗爆炸式增长反映多模态和大规模部署的实际落地,去年同期的token消耗量大概是480万亿,今年已经翻了7倍。
这个数据代表最下游B端和C端的用户需求有多大,增速有多快。
二、英伟达对CPU业务的重磅加码
老黄宣布:Vera CPU为英伟达打开了一个全新的、2000亿美元的市场,这是英伟达以前从未涉足过的市场。
上一次AMD的财报电话会,苏妈把CPU的TAM,也就是总潜在市场容量,提高了1200亿美金,今天老黄又再一次推高到2000亿美金。
现在的AI智能体,需要大量调用工具、浏览器,具备进行编排调度的特性,单纯的GPU已经不够了,市场需要全新的CPU架构。
Vera CPU不仅将作为Rubin GPU的配套设备销售,还将作为独立CPU、存储节点和安全节点进行出售。
这次老黄透露,今年有望看到近200亿美元的独立CPU总收入,这意味着英伟达正准备成为全球领先的CPU供应商,而非仅仅只卖GPU了。
AI agent时代,CPU需求arm的架构其实比x86架构更有优势,所以英伟达自己的Vera CPU、亚马逊、谷歌、微软的自研CPU都是用的arm架构。
三、边缘计算的重要性提高
英伟达在本次财报中,更改了报告框架,将业务划分为「数据中心」和「边缘计算」两大平台。
数据中心业务的Q1营收750亿美元,且进一步细分为超大规模云厂商和AI云、工业和企业:
其中超大规模云厂商的规模,占据数据中心约50%的份额,环比增长12%,AI云、工业和企业环比增长高达31%,AI云收入同比涨了两倍以上
边缘计算业务64亿美元,也环比增长10%,同比增长29%。
这是新独立出来的类别。边缘计算都包涵哪些呢,就是面向智能体AI和物理AI的终端设备,包括PC、游戏主机、工作站、AI-RAN基站、机器人及汽车。
四、从Q3开始启动Vera Rubin的量产出货。
黄仁勋明确表示,Vera Rubin芯片,将在2026年下半年开始发货。
Vera Rubin通过集成七个专用芯片,推理吞吐量最高可以达到Blackwell架构的35倍。这不是挤牙膏升级。
• 训练性能方面:Vera Rubin可以达到上一代Blackwell平台的3.5倍性能 • 软件性能方面:每token提升5倍推理 • 生成成本方面:新架构可以降低10倍训练MoE混合专家模型时,实际所需要GPU数量仅为原来的四分之一
Vera CPU + Rubin GPU + NVLink6 + 台积电3纳米制程 + HBM4高带宽内存
Vera Rubin将比Grace Blackwell更加成功。未来更多的客户会全面转向Vera Rubin。
英伟达,依然是AI时代的核心玩家。
#ai#人工智能#人工智能产业#英伟达#英伟达财报#AI需求增长#VeraCPU#边缘计算#VeraRubin#AI智能体#ARM架构#AI算力升级#Blackwell架构#英伟达AI布局