写在前面
2026 年 5 月 21 日清晨,英伟达交出了 2027 财年第一季度财报。一句话总结:收入、营业利润、自由现金流三项指标同时刷新历史纪录,全面 beat。但比财报数字更重要的,是这场电话会传递出来的"定性信号"。
笔者先把本次电话会最核心的三条判断摆上来:
观点一:黄仁勋明确说出"agentic AI has arrived"——智能体 AI 时代已经到来
这是本次电话会最重要的定性。AI 不再是"一次性问答"的玩具,而是能够完成有生产力、有价值的工作。在黄仁勋的总结发言里,他用了一个非常具体的词来形容当下的需求曲线——"抛物线式上升"(parabolic)。
观点二:"tokens are now profitable"——token 正在从"技术单位"变成"商业单位"
更关键的是,黄仁勋直接说出:tokens are now profitable(token 现在已经可以盈利)。这句话的含义远比它看起来重要。
过去,token 只是大模型输出的一个技术计量单位。而现在,它正在变成一个商业单位。逻辑链条是这样的:只要 token 可以盈利,模型厂商就有动力生产更多 token;只要要生产更多 token,就需要更多算力、网络、存储、电力和数据中心。这是一个会自我强化的正循环。
观点三:AI 已经从"模型训练时代"进入"token 工厂时代"
这正是笔者此前一直强调的逻辑。未来 AI 竞争的核心,不再只是模型能力本身,而是谁能够以更低成本、更高效率、更大规模地生产 token,并把 token 转化为真实收入和利润。
换句话说,模型只是起点,token 才是产能。谁能持续生产更多可盈利的 token,谁就需要更多 AI"能量公式"里的要素——人才、算力、存力、运力、电力。也正因为如此,AI 基础设施的扩张并没有结束,反而刚刚进入新的提速阶段。
下面这张示意图,就是"token 工厂时代"的核心逻辑——一个自我强化的正反馈飞轮:
这里需要插播一条新闻,它恰好为黄仁勋的判断提供了一份"财务证据"。
Anthropic 首次盈利:据公开报道,Anthropic 预计在 6 月季度营收将激增约 130%,达到 109 亿美元,并实现首次运营盈利 5.59 亿美元。要知道,此前市场普遍认为 Anthropic 可能要到 2028 年才能实现盈利。这条新闻很好地呼应了黄仁勋的判断——token 真的开始赚钱了。
所以,本次电话会真正强化的,是笔者此前一直强调的那条主线:AI 已经从"模型训练时代"进入"token 工厂时代"。下面,让我们一起回到电话会原文。
总纲:五大核心判断
1. NVIDIA FY27Q1 业绩全面 beat。总收入 820 亿美元,同比增长 85%、环比增长 20%;收入、营业利润、自由现金流三项均超越此前历史纪录。这是公司连续第三个季度同比增速加快、连续第十四个季度环比增长。
2. 数据中心是绝对引擎,毛利率稳在 75% 高位。数据中心收入 750 亿美元,同比增长 92%;其中数据中心网络收入 150 亿美元、同比增长近 3 倍。非 GAAP 毛利率 75%,环比基本持平。
3. "agentic AI 已经到来 + token 可以盈利"是本次电话会的灵魂。黄仁勋判断需求曲线已经"抛物线式上升"。AI 蛋糕的每一层——能源、芯片、基础设施、模型、应用——都在加速增长。
4. Vera CPU 打开 2000 亿美元的全新 TAM。这是英伟达此前从未进入过的市场。今年已看到接近 200 亿美元的 CPU 总收入可见性,每一家主要超大规模云厂商和系统制造商都正在与英伟达合作部署 Vera。
5. Anthropic 首次盈利,为"token 经济学"提供第一份财务证据。6 月季度营收激增约 130% 至 109 亿美元、首次运营盈利 5.59 亿美元——比市场预期的盈利时点(2028 年)大幅提前。
一、电话会的"灵魂":agentic AI 已经到来,token 可以盈利
在黄仁勋的总结发言里,他几乎是用最直白的语言把这次电话会的定性钉死了:
"这是一个非凡的季度。需求已经呈现抛物线式上升。原因很简单:agentic AI 已经到来。AI 现在可以完成有生产力、有价值的工作。Tokens 现在已经可以盈利。模型开发商正在竞相生产更多 token。在 AI 时代,计算能力就是收入和利润。"
—— 黄仁勋(Jensen Huang,NVIDIA 总裁兼 CEO)
这段话里有两个关键转变值得拆开来看。
第一个转变:AI 从"一次性推理"走到了"agentic AI"。黄仁勋在电话会中回顾了这条演进路径——自 ChatGPT 出现以来,主流 AI 从一次性推理(one-shot inference),过渡到 reasoning(推理/思考),再发展到如今的 agentic AI(智能体 AI)。他强调:"AI 不再是锦上添花。AI 已经成为提升所有行业和所有岗位生产力的必要条件。"
第二个转变:token 从"技术单位"变成"商业单位"。"计算能力就是收入和利润"——这句话翻译过来就是:在 AI 时代,谁有算力,谁就有收入;没有算力,就没有收入。正因如此,黄仁勋说,"模型开发商正在竞相生产更多 token"。这股竞赛,才是 AI 基础设施需求"抛物线式上升"的根本驱动力。
AI 蛋糕的每一层都在加速:黄仁勋特别指出,这股动能正在推动 AI 蛋糕各层收入加速增长——能源、芯片、基础设施、模型和应用。其中模型层的增长尤其惊人,"尤其是 Anthropic 和 OpenAI 的增长非常惊人,而且动能仍在继续加速"。这也是为什么下一节我们必须先看 Anthropic。
二、插播:Anthropic 首次盈利 —— token 真的开始赚钱了
如果说英伟达的电话会是从"卖铲人"的视角讲 token 经济学,那么 Anthropic 的这条新闻,就是从"淘金者"的视角给出了一份财务上的实证。
? 表 1:Anthropic 关键数据一览
这组数字的意义在于:一家最前沿的模型公司,把"营收激增"和"运营盈利"两件事同时做到了,而且比市场预期早了大约两年。它直接验证了黄仁勋那句"tokens are now profitable"——token 不只是能卖出去,而且是能赚钱地卖出去。
黄仁勋在电话会里也专门点到了这层关系。他说,英伟达"深化了与 Anthropic 的合作,并很高兴成为其战略合作伙伴,帮助其扩张计算能力"——而在此之前,英伟达对 Anthropic 的覆盖"基本为零,直到最近才开始"。这意味着,Anthropic 的高速扩张,本身就是英伟达推理市场份额提升的一个新增量。
一句话总结这一节:Anthropic 用一份提前两年到来的盈利报表,给"token 工厂时代"盖了一个戳。模型厂商赚到钱 → 有动力扩产 token → 向英伟达买更多算力——飞轮就是这样转起来的。
三、NVIDIA FY27Q1 业绩拆解:一份全面 beat 的财报
回到英伟达本身。CFO Colette Kress 在准备发言里第一句话就是:"我们交出了一个出色的季度,收入、营业利润和自由现金流均超过此前历史纪录。"下面是这份财报的关键数字。
? 表 2:NVIDIA FY2027 Q1 关键财务指标(vs. 市场一致预期)
注:"市场一致预期"为多家卖方机构预期的综合估算口径,仅供参照。本季收入、数据中心、毛利率、自由现金流及 Q2 指引均超越市场预期——这正是标题"全面 beat"的由来。
下图把本季度的收入结构一次性铺开——总收入、数据中心及其两条产品线、以及边缘计算:
几个值得划重点的细节:
需求拐点被抓住了。本季度收入环比增加 135 亿美元,创下历史纪录。Colette Kress 的原话是:"我们抓住了推理需求拐点,通过在多元化终端客户群中加速放量 Blackwell 系统实现增长。"客户覆盖超大规模云厂商、模型开发商、AI 云服务提供商以及主权客户。
网络收入"近 3 倍"是最炸裂的一个数。数据中心网络收入 150 亿美元,同比增长近 3 倍。Spectrum-X 以太网平台规模已经超过所有以太网网络同行的总和;InfiniBand 同比增长超过 4 倍,由下一代 XDR 技术部署推动。
"AI 基础设施"本身在升值。H100 的租赁价格年初至今上涨了 20%,A100 云端价格上涨近 15%。客户正在 GPU 折旧年限之后继续创造盈利性收入——这意味着英伟达硬件的"资产寿命"被实实在在拉长了。
资本配置:股息大涨 + 加码回购。公司将季度股息从每股 0.01 美元提高至 0.20 美元,并新增 800 亿美元股票回购授权(叠加现有计划剩余的 390 亿美元)。计划今年向股东返还约 50% 的自由现金流。(一个小花絮:黄仁勋在问答环节开玩笑说,Colette"本来想说的"是把股息提到 0.25 美元,"多出来的 0.05 美元对大股东来说应该意义重大"。)
英伟达最近九个季度收入轨迹:QoQ 增速的"一阶导"与"二阶导"
电话会中,CFO Colette Kress 提到,公司已按新口径在网站上公布了过去 9 个季度的收入拆分。把这份数据完整铺开,再对总收入做两层"求导",就能看清这轮增长的真实节奏。
先明确两个定义:▸ 一阶导 = QoQ 环比增速——本季收入相对上一季度的增长百分比,衡量"跑多快"。▸ 二阶导 = 环比增速的环比变化(百分点 pp)——增速本身在加快还是放缓,衡量"加速度"。二阶导为正,说明增长在加速;为负,说明增长在减速。
? 表 3:NVIDIA 九个季度收入(按市场平台 recast 口径,单位:百万美元)
注:FY27Q1 起英伟达调整了市场平台口径,可比期间已 recast。总收入 = 数据中心 + 边缘计算;数据中心 = Hyperscale + ACIE。一阶导、二阶导均由"总收入"测算。
把总收入的 QoQ 增速画出来,是一条非常清晰的"减速 → 触底 → 再加速"曲线:
① 减速段(FY25Q3 → FY26Q2):QoQ 增速从 +16.8% 一路回落到 +6.1%,二阶导连续四个季度为负——增长在持续"踩刹车"。
② 触底(FY26Q2):+6.1% 是这 9 个季度里 QoQ 增速的最低点。如果只盯着这一个数,很容易得出"AI 见顶"的结论。
③ 再加速(FY26Q3 至今):QoQ 增速骤升至 +22.0%,二阶导 +15.9pp 大幅转正;此后连续三个季度稳定在约 19.5%—22.0% 的高位环比增速,二阶导回到 0 附近并再度转正。
这恰好印证了管理层"连续第三个季度同比增速加快"的说法——从同比口径看,FY26Q3 +62.5% → FY26Q4 +73.2% → FY27Q1 +85.2%,YoY 增速确实连升三个季度。一阶导维持高位、二阶导重新转正,正是黄仁勋口中"需求抛物线式上升"在数据上的样子。
展望:公司指引 Q2 总收入 910 亿美元(±2%),环比增长主要由数据中心推动;并重申对 2025—2027 日历年期间 Blackwell 和 Rubin 收入合计达到 1 万亿美元充满信心。全年毛利率维持在 70% 中段,OPEX 同比增速预计在 40% 高位。
四、读懂新的分部披露:英伟达的"两类市场"
本次电话会,英伟达启用了一套新的报告框架。这件事看似只是"会计口径调整",实则是理解英伟达未来增长的一把钥匙。
新框架下,公司有两个市场平台:数据中心与边缘计算。而在数据中心内部,又拆成两个子市场:
? 表 4:数据中心新披露框架 —— Hyperscale vs. ACIE
边缘计算则聚焦用于 agentic AI 和 physical AI 的设备——PC、游戏主机、工作站、AI RAN 基站、机器人和汽车。其中 physical AI 过去 12 个月收入已超过 90 亿美元。
黄仁勋在回答摩根士丹利分析师 Joseph Moore 的提问时,把这套框架背后的"哲学"讲得很透。他说,之所以这样拆分,是因为"AI 是非常多元的,计算也是非常多元的"——多元的应用(语言、3D 图形、蛋白质、分子化学、物理模型……)、多元的运行位置(超大规模云、AI 原生企业、本地部署、工厂现场、边缘端)、多元的治理方式(公有云、监管云、机密计算、国家安全)。
而在回答 Melius Research 的 Ben Reitzes 时,黄仁勋把数据中心进一步"因式分解"成了两类市场,这是本次电话会信息量最大的一段:
第一类:超大规模云(Hyperscale)。客户只有"五六七家"公司。它们今年的资本开支约 1 万亿美元,并且"正在走向 3 万亿至 4 万亿美元"。黄仁勋的逻辑很硬:"计算就是收入,计算就是利润"——它们没有计算能力就没有收入,所以 CapEx 必然继续增长。
第二类:所有 AI 原生云 + 企业 + 工业 + 主权 AI。客户来自"数百、数千家公司,未来将来自数十万家公司"(全球约 25 万家企业)。这一类目前理解得还不够充分,因为公司太多、每个部署相对较小。但黄仁勋判断:第二类市场最终会更大,而且增长更快——它对应的是过去 30 年未被 IT 充分改造的、规模 50 万亿至 80 万亿美元的产业。
为什么英伟达在第二类市场几乎"独一无二"?黄仁勋的解释是:AI 原生云不会自己造芯片,也无法把彼此无关的零部件组装成 AI 工厂;它们对"首个 token 响应时间(time to first token)"的容忍度极低;它们需要一种能运行每一种模型、且容易出租、容易融资的架构。"NVIDIA 架构是全球最容易被出租的计算平台"——性能最强、最容易组装、最容易出租、TCO 最佳、最容易融资。
五、Vera CPU 与 Vera Rubin:2000 亿美元的全新 TAM
如果说数据中心是英伟达的"基本盘",那么本次电话会最大的"增量想象空间",来自它对 CPU 业务的重磅加码。
5.1 为什么 agentic AI 需要一颗全新的 CPU?
黄仁勋用了一个非常具体的解释。一个 agent,本质上就是一个 harness(执行框架)。harness 负责 IO、编排、内存管理、工具使用,以及连接各类工具(浏览器、C 编译器、Python 编译器等)。
harness 跑在 CPU 上,"思考"跑在 GPU 上。黄仁勋举例:Code Claude 本质上就是围绕 Claude / Opus 模型构建的一个 harness,OpenAI 的 Codex 是围绕其模型构建的一个 harness。harness 与工具使用运行在 CPU 上;而每当 agent 派生出 sub-agent 进行推理时,"所有思考都发生在 GPU 上"。
黄仁勋的推演是:今天世界有 10 亿人类用户,未来会有数十亿个 agent,每个 agent 都会像今天人类使用 PC 一样使用工具,并不断派生 sub-agent。这意味着,CPU 需求会随 agent 数量爆发式增长——这是一个增量市场,而非对 GPU 的蚕食。
而过去的 CPU 是为"出租核心"设计的(经济学是"每核心多少美元");agent 不租核心,它们只想让工作尽快完成。未来 AI 的经济学是"每美元多少 token"。Vera 正是为此而生的一颗"agentic CPU"。相比基于 x86 的替代方案,Vera 每核心性能最高提升 1.5 倍、每瓦性能提升 2 倍、每机架密度提升 4 倍。
5.2 Vera 的四种使用场景与 2000 亿美元 TAM
黄仁勋特别澄清:所谓 200 亿美元的 CPU 收入可见性,指的是独立 CPU,并不包含 Vera Rubin 中作为组件的 Vera。Vera 一共有四种使用方式:
? 表 5:Vera CPU 的四种使用场景
黄仁勋直言:"Vera CPU 为 NVIDIA 打开了一个全新的 2000 亿美元 TAM,这是我们此前从未进入过的市场。"每一家主要超大规模云厂商和系统制造商都正在与英伟达合作部署 Vera。他甚至预计,在 Vera Rubin 的整个生命周期里,公司都会处于供应受限状态。
5.3 Vera Rubin:35 倍推理吞吐量,Q3 开始量产出货
Vera Rubin 是英伟达年度产品节奏的下一棒。关键数据如下:
▸ 量产节奏:今年下半年、从第三季度开始量产出货▸ 架构:在 5 个加速机架中整合 7 种专用芯片▸ 推理吞吐量:较 Blackwell 最高 35 倍▸ AI 工厂收入:最高 10 倍▸ 早期采用者:Google 的 A5X 裸金属实例最多可支持跨多个站点运行 96 万颗 Rubin GPU▸ 全生命周期:Grace Blackwell 与 Vera Rubin 支持从数据处理、预训练、后训练、强化学习到推理的完整 AI 生命周期
关于爬坡节奏,CFO Colette Kress 回答 TD Cowen 分析师时说得很清楚:第三季度启动初始阶段、把各部分组合起来,第四季度爬坡继续推进,明年第一季度肯定也会非常大。"我们已经有计划中的需求,已经有采购订单,几乎所有主要客户都已经准备好。"
黄仁勋则给了一句很重的话:"到目前为止,我想不出有哪一家前沿模型公司不会从一开始就采用 Vera Rubin,而 Blackwell 当时并不是这样。"
六、Vera Rubin 机架价值量拆解:一台 $780 万的"AI 工厂"
黄仁勋口中"推理吞吐量 35 倍、AI 工厂收入 10 倍"的 Vera Rubin,落到供应链层面究竟意味着什么?摩根士丹利(Morgan Stanley)一份关于 Rubin 机架 BOM(物料清单)的拆解报告,给出了一个非常具体的答案。
6.1 三代机架 ASP:VR200 单台约 780 万美元
据摩根士丹利估算,超大规模云厂商从 ODM(代工厂)采购一台 Rubin(VR200)NVL72 机架,价格约为 780 万美元;若从 OEM(联想、华硕、技嘉、戴尔等)采购则更高。对比上两代——
从 GB300 到 VR200,单台机架价值量接近翻倍(+95%)。摩根士丹利特别指出,本轮机架成本大涨的一个重要原因是内存价格的大幅上涨——内存在 GB200 机架 BOM 中只占 5%—10%,而在 VR200 中已升至 25%—30%;这也使 GPU 在 BOM 中的占比从 GB200 的约 65% 降到 VR200 的约 51%。(若由超大规模云厂商自行采购 SOCAMM 内存,机架 ASP 将降至约 670 万美元。)
6.2 BOM 拆解:哪些零部件价值量在暴涨?
摩根士丹利的自下而上拆解显示,从 GB300 到 VR200,几乎所有零部件的单机架价值量都在上升:
? 表 6:NVL72 单机架 BOM 拆解(GB300 → VR200,美元)
顺着这张 BOM 表往下看,一个自然的问题是:Rubin 放量,除了英伟达,谁在卖"铲子"?下表把价值量大幅提升的环节,各列出 TOP5 受益标的。
? 表 7:VR200(Vera Rubin)受益的"铲子公司"—— 各环节 TOP5
注:上表为依据 Morgan Stanley 覆盖标的及公开行业信息梳理的产业链受益方向,排名不分先后,仅作产业链梳理之用,不构成任何个股推荐或投资建议。其中 ODM 顺序参考 Morgan Stanley 的偏好排序(Wiwynn > Wistron > Quanta > Hon Hai)。
剔除内存这个"超级变量"之后,在摩根士丹利覆盖的下游零部件里,价值量增幅最大的依次是:PCB(+233%)、MLCC(+182%)、ABF 载板(+82%)、电源(+32%)、散热(+12%)。
PCB 是下游零部件里弹性最大的。单机架 PCB 价值量从约 3.5 万美元跳升到约 11.7 万美元。驱动力包括:新增 ConnectX 模块、midplane PCB 等新模块;层数与材料等级升级(计算板从 22 层 HDI 升到 26 层、CCL 等级由 M7 升至 M8;交换托盘 PCB 从 24 层升到 32 层);以及计算托盘中新增的 44 层 midplane PCB。
MLCC 需求紧张的原因找到了。VR200 单机架 MLCC 价值量约 4300 美元,远高于 GB300 的约 1500 美元——这解释了为何当前高端 AI 服务器 MLCC 需求如此旺盛、ODM 都在抢着备库存,为 2H26 起的 Rubin 放量做准备。
6.3 电源与散热:单机架功率冲向 600kW
Vera Rubin 平台的标准配置是 110kW 电源架;摩根士丹利的供应链调研显示,已有一家美国 CSP 在 Vera Rubin 平台采用 HVDC 独立电源机柜。沿着这条路线图,单机架功率与电源价值量正在陡峭抬升:
? 表 8:AI 服务器电源升级路线图
大规模采用层面,摩根士丹利预计 800V DC 架构将在 2027 年下半年的 Rubin Ultra 平台落地。散热方面,Vera Rubin 机架将全面液冷、无风扇设计,单机架热管理价值量(不含 Side-car CDU)约 7.2 万美元,含 Side-car CDU 则约 12.2 万美元。
6.4 一个"反市场共识"的判断:ODM 增加值不降反升
这是摩根士丹利报告里最值得注意的一点。市场普遍预期,由于计算托盘的"标准化",ODM(代工厂)在 Rubin 上的增加值(value-added)会下降。但摩根士丹利的自下而上拆解给出了相反结论:
ODM 增加值不降反升,约 +35%—40%(约 +38%)。单机架 ODM 增加值从 GB300 的约 10.8 万美元升至 VR200 的约 15.0 万美元。增量来自计算板/计算托盘/交换板/交换托盘/散热/机架级组装的复杂度提升,以及需要组装测试的新模块。
不过,因为机架本身大幅变贵,ODM 的毛利率(GM)反而被摊薄:GB300 隐含 GM 约 2.7%,VR200 约 1.9%(若客户自购 SOCAMM、机架 ASP 降至约 670 万美元,GM 则回升至约 2.2%)。摩根士丹利的观点是——投资者应关注绝对美元利润的增长,而不是毛利率的下滑。此外,越来越多 ODM(鸿海最先提及、广达在 1Q26 也提到)开始谈论"寄售(consignment)"模式,由客户分担增加的营运资金压力。
这一节的启示:黄仁勋说"客户购买的不是 GPU,而是在建设 AI 工厂"。摩根士丹利的 BOM 拆解,正好从硬件侧印证了这句话——一台 Vera Rubin 机架,就是一座价值约 780 万美元、由 GPU、内存、网络、PCB、电源、散热层层堆叠而成的"AI 工厂"。Rubin 放量,受益的不只是英伟达,还有内存、PCB、载板、MLCC、电源、散热和 ODM 组成的一整条供应链。
七、Q&A 精华:黄仁勋问答实录
本次电话会问答环节信息密度很高。下表把八位分析师的提问与管理层核心回应做了结构化梳理:
? 表 9:电话会问答精华
其中有两段问答值得展开。
关于"CPU 数量是否会超过 GPU"。黄仁勋的核心判断是:未来会有数十亿个 agent,每个 agent 都需要 harness 跑在 CPU 上、都会派生 sub-agent 跑在 GPU 上。所以 CPU 需求是增量。他也借此解释了英伟达为何与 Cadence、Synopsys、Siemens、Adobe 等密切合作——"让全球所有工具运行在 CUDA 上",因为 agent"比人类更没有耐心,它们希望事情快速发生"。
关于推理市场份额。黄仁勋说英伟达正在"非常快速地"提升推理份额,原因有三:前沿模型公司数量增加(Cursor、Perplexity 及一些新公司);今年把 Anthropic 纳入合作伙伴体系(此前覆盖"基本为零");以及在第二类 AI 数据中心市场和 physical AI 市场,"NVIDIA 几乎是唯一能服务的公司"。
八、黄仁勋总结发言:重点强调的五件事
在电话会结尾,黄仁勋做了总结发言。他说,这是一个非凡的季度,需求已经"抛物线式上升",并重点强调了五件事:
第一,NVIDIA 是唯一能够运行每一个前沿 AI 模型的平台。随着 Anthropic 加入已有的合作伙伴体系(OpenAI、xAI、Meta、Mistral AI、Gemini 等),公司在前沿 AI 中的份额正在增长。
第二,公司进入了每一个超大规模云,既支持它们的核心数据处理与机器学习工作负载、内部 AI 服务,也支持其公有云中 NVIDIA 用户的需求。
第三,全栈完整的 AI 工厂解决方案 + 庞大的全球生态,让英伟达能够独特地服务新的 AI 数据中心细分市场、AI 原生云与主权 AI 云,以及企业和工业本地部署基础设施——这就是"第二类市场"。
第四,CUDA 一直延伸到边缘端——机器人、自动驾驶汽车、嵌入式医疗设备、AI RAN 电信基站。下一波浪潮是 physical AI,将有数十亿个自主系统在物理世界中运行。
第五,一个重大的新增长驱动因素——Vera,全球第一款专为 agentic AI 设计的 CPU,为英伟达打开了一个全新的 2000 亿美元 TAM。
"世界正在为 agentic AI 和机器人 physical AI 重构计算。我们在这一刻到来之前就建立好了架构,所以当 agentic AI 到来时,NVIDIA 已经准备好了。现在,它真的来了。"
写在最后
把这次电话会和 Anthropic 的盈利新闻放在一起看,会发现它们指向的是同一件事。
英伟达交出的是"卖铲人"的财报:收入 820 亿美元、数据中心同比 +92%、毛利率稳在 75%、Q2 指引 910 亿美元。Anthropic 给出的是"淘金者"的财报:营收激增 130%、首次运营盈利、比预期早了两年。一个证明算力在被疯抢,一个证明算力买回去之后真的在赚钱。
这两份财报合起来,讲清了一条主线:
agentic AI 已经到来 → token 可以盈利模型厂商竞相生产 token → 算力即收入、即利润AI 从"模型训练时代" → 迈入"token 工厂时代"
未来 AI 竞争的核心,不再只是模型能力本身,而是谁能够以更低成本、更高效率、更大规模地生产 token,并把它转化为真实的收入和利润。模型只是起点,token 才是产能。
谁能持续生产更多可盈利的 token,谁就需要更多 AI 能量公式里的人才、算力、存力、运力、电力。从英伟达的数据中心,到 Vera CPU 的 2000 亿美元 TAM,再到一台价值 780 万美元、由内存/PCB/载板/MLCC/电源/散热层层堆叠的 Vera Rubin 机架——AI 基础设施的扩张并没有结束,反而刚刚进入新的提速阶段。
从这一刻起,token 不再只是模型输出的技术单位,它是 AI 时代的"产能"与"货币"。
END


