报告日期:2026年5月|数据截至:2026年Q1
***
核心结论
1.当前全球AI算力严重供不应求。所有主要厂商一致报告供给约束,数据中心入住率逼近95%上限,Google CEO公开表示算力不足导致收入流失。即时需求满足率约65-75%;若纳入潜在弹性需求,满足率仅40-55%。
2.全球AI算力存量约1,650万H100等效,以每7个月翻倍的速度增长。NVIDIA占60%+,Google靠TPU贡献25%居首位。五大超级云厂商控制71%的全球AI算力。
3.算力消费端高度集中于两家公司。OpenAI和Anthropic的算力承诺合计占主要云厂商约一半的合同积压。Anthropic ARR在15个月内从$10亿增至$300亿超过OpenAI;OpenAI 2026年算力支出$500亿。能参与前沿竞争的可能只剩5个阵营:OpenAI/Microsoft、Google DeepMind、Anthropic/Amazon、Meta、xAI。
4. 1-2年(2027-2028):AI电力需求从30GW→45-68GW,超级云厂商CapEx从$7,250亿→超$1万亿/年。供给将持续追不上需求。
5. 3-5年(2029-2031):IEA基准预测数据中心总耗电翻倍至950 TWh(2030),AI专用增长3倍。2035年不确定性极大:700-1,700 TWh。
6.满足当前明确需求的上限:需在现有基础上增加约30-50%供给(+10-15 GW AI电力容量)。
7.电力是终极瓶颈。芯片和封装可在2-3年显著扩张,但电力基础设施需4-7年建设周期。仅美国到2028年就有49 GW电力缺口(Morgan Stanley)。IEA确认瓶颈正在约束激进情景的近期实现。
8.中国市场走差异化路线。面临出口管制约束,但通过DeepSeek式的算法效率优化和华为昇腾国产替代形成竞争力。2026年3月中国云厂商集体涨价(阿里最高34%、腾讯最高460%),Token消费量爆发式增长。
9.全行业在烧钱赌未来。OpenAI预计2026年亏损$140亿,盈亏平衡推迟到2030年;中国智谱b3.5年累计亏损62亿元,营收仅6.85亿元。整个前沿AI行业的收入远不能覆盖算力支出。
10.效率改善是对冲力量但远不够。推理成本每2个月减半,算法效率每年提升3x,但用户量增长3-5x和重型用例(视频生成、推理链、智能体)使总需求净增长。
***
一、分析框架说明
本报告从三个维度衡量算力:
维度 | 单位 | 用途 |
算力性能 | H100等效(H100e)/ FLOP/s | 衡量瞬时计算能力存量 |
电力容量 | GW(吉瓦)/ TWh(太瓦时) | 衡量数据中心物理承载上限与实际消耗 |
资本支出 | USD(美元) | 衡量投资规模与供给扩张速度 |
三个维度互相关联但各有局限:H100e衡量理论峰值算力但不反映实际利用率;电力容量反映物理上限但不区分训练与推理效率;CapEx反映投资意愿但受组件成本通胀影响(2026年HBM涨价导致同等CapEx买到的算力减少)。
***
二、当前全球算力现状(2025 Q4 – 2026 Q1基线)
2.1 算力存量
核心数据(Epoch AI, 2026年1月发布,数据更新至2026年3月):
全球AI芯片累积安装算力 ≈ 1,650万 H100等效(以INT8/FP8峰值性能折算)。涵盖NVIDIA GPU、Google TPU、Amazon Trainium、AMD MI系列及华为昇腾。
关键趋势指标(Epoch AI Trends Dashboard, 2026年2月更新):
指标 | 数值 | 含义 |
AI芯片总算力增速 | 3.3-3.4x/年 | 约每7个月翻倍(90% CI:6-8个月) |
前沿语言模型训练算力增速 | 5x/年 | 约每5.2个月翻倍(自2020年起) |
已知最大训练运行 | Grok 4, ~5×10²⁶ FLOP | 训练耗电b310 GWh,成本~$4.9亿 |
推理成本下降速度 | 每2个月减半 | 固定性能水平下,约每年下降100倍 |
预训练算法效率提升 | ~3x/年 | 相同性能所需算力每年减少至1/3 |
芯片所有权分布(Epoch AI Chip Owners, 2026年4月30日更新):
所有者 | H100等效算力 | 全球占比 | 关键说明 |
Google/Alphabet | ~500万 H100e | ~25% | 全球最大,主要靠TPU(~400万H100e) |
Microsoft | 排名靠前 | ~15-20% | 拥有最大的NVIDIA芯片存量 |
Amazon/AWS | — | ~15-18% | Trainium自研芯片快速增长 |
Meta | — | ~10-12% | NVIDIA + AMD MI300X + 自研MTIA |
Oracle | — | 快速增长 | 依托NVIDIA GPU |
xAI | — | 增长中 | Colossus集群200,000+ GB200 GPU |
中国客户(合计) | — | ~10-15% | 华为昇腾已超越NVIDIA成为中国AI算力的主要来源 |
五大超级云厂商合计 | — | 71%(2025 Q4) | 从2024 Q1的63%持续上升 |
关于中国: Epoch AI估计到2025年底,约有29万-160万H100e通过非正规渠道流入中国,中位数估计66万H100e,约占中国总算力的三分之一。华为在额定FLOP/s上已超越NVIDIA成为中国AI算力的最大来源,但额定性能不一定反映实际工作负载表现。 |
NVIDIA占比变化: NVIDIA芯片贡献全球AI总算力的 >60%(较此前77%下降,因Google TPU和Amazon Trainium规模快速增长)。Blackwell系列已基本取代H100/H200,B300单款已占NVIDIA AI算力销售的多数。 |
2.2 电力容量与消耗
指标 | 数据 | 来源 | 时间 |
全球AI数据中心电力容量 | ~30 GW | Epoch AI | 2025 Q4 |
全球数据中心总电力容量 | ~100 GW | IEA/S&P Global | 2024 |
全球数据中心耗电量(2024) | 415 TWh(占全球1.5%) | IEA | 2024实际 |
全球数据中心耗电量(2025) | 485 TWh(同比+17%) | IEA 2026更新 | 2025估算 |
AI专用数据中心耗电增速 | +50% YoY(2025) | IEA 2026更新 | 2025估算 |
AI专用数据中心耗电量(2025) | ~155 TWh | IEA 2026更新 | 2025估算 |
AI工厂容量增速 | 过去18个月增长超过3倍 | IEA卫星追踪 | 2026年4月 |
2.3 资本支出现状
NVIDIA财报实绩(FY2026,截至2026年1月):
季度 | 总营收 | 数据中心营收 |
FY26 Q1 (2025.04) | $441亿 | $391亿 |
FY26 Q2 (2025.07) | $467亿 | $411亿 |
FY26 Q3 (2025.10) | $570亿 | $512亿 |
FY26 Q4 (2026.01) | $681亿 | $623亿 |
FY26全年 | $2,159亿 | $1,937亿(+68% YoY) |
FY27 Q1指引 | $780亿±2% | 不含对华数据中心计算收入 |
五大超级云厂商CapEx(2026年Q1财报最新指引):
公司 | 2025年CapEx | 2026年CapEx指引 | YoY增幅 |
Amazon | ~$1,250亿 | ~$2,000亿 | +60% |
Microsoft | ~$882亿 | ~$1,900亿 | +115% |
Alphabet | ~$1,050亿 | $1,800-1,900亿 | +80% |
Meta | ~$720亿 | $1,250-1,450亿 | +80% |
Oracle | — | ~$500亿 | 大幅增长 |
四大合计(不含Oracle) | ~$4,100亿 | ~$7,250亿 | +77% |
关键信号: 所有超级云厂商均报告供给约束而非需求约束。Google CEO Sundar Pichai表示受算力约束,云收入本可更高。Meta CFO表示即便大幅扩张产能,仍低估自身算力需求。Microsoft CFO表示至少到2026年底持续容量受限。Google Cloud合同积压从2025 Q4的$2,400亿→2026 Q1的$4,600亿(单季度翻倍)。五家公司CapEx总和已超过全球石油天然气上游投资。2027年CapEx预计突破$1万亿。 |
***
三、全球AI公司算力消费格局
上一章的芯片所有权分布追踪谁拥有芯片。本章追踪谁在消费算力、以何种方式获取、规模多大。芯片归Google所有,但使用权可能被Anthropic通过长期合约锁定——同一块芯片在两个视角中分别被计入不同主体。
3.1 海外前沿AI公司
第一梯队:超大规模算力消费者
OpenAI(估值~$8,500亿 | 2026目标收入$250-300亿)
2026年算力支出$500亿(Greg Brockman法庭作证)。Stargate项目:SoftBank/Oracle合建,目标10GW,投资$5,000亿,已超额完成里程碑(90天内新增3GW+)。首站Abilene容纳40万NVIDIA芯片,另有Texas、New Mexico、Ohio、Wisconsin等站点。自研芯片Titan(Broadcom设计,TSMC 3nm,2026H2量产,优化推理)。另有CoreWeave $119亿/5年合同提供过渡期算力。预计2026年亏损$140亿,盈亏平衡推迟到2030年。
Anthropic(估值~$8,000亿 | ARR ~$300亿,2026.04)
Google $2,000亿长期云与芯片协议,主要部署从2027年开始。Amazon $1,000亿/10年AWS协议,使用Trainium芯片,锁定5GW容量。Google Cloud另提供5GW TPU容量(5年期)。与CoreWeave签署数据中心容量协议。合计锁定约11GW算力容量承诺。2026年底前将上线近1GW Trainium2/3容量。ARR 15个月内从$10亿→$300亿,增长30倍,已超OpenAI。单独占Google Cloud合同积压的40%+。预计2027年实现正向自由现金流。
Google DeepMind(内部部门)
使用Google自有基础设施,约500万H100e(全球最大,约25%份额)。其中TPU约400万H100e。Cloud季度收入$200亿,合同积压$4,600亿。Gemini系列模型,集成到Search、Cloud、YouTube等全线产品。
Meta AI(内部部门)
2026年CapEx $1,250-1,450亿,完全自建数据中心。自研MTIA推理芯片(已4代),NVIDIA + AMD MI300X组合。规划5GW单一园区。Llama开源系列,通过广告生态变现。豆包DAU $1亿的规模对标。
xAI(估值~$500亿+)
自建Colossus集群(Memphis),200,000+ GB200 GPU已运行。可同时训练b3个前沿模型。规划扩至100万GPU。Grok 4为已知最大训练运行(~5×10²⁶ FLOP)。训练Grok 4耗电b310 GWh,成本$4.9亿。
第二梯队:快速增长型
公司 | 估值 | ARR | 算力来源 | 关键特征 |
DeepSeek | ~$450-500亿 | 未公开 | 自有集群(幻方量化利润);约10K张A100/H800 | $560万训练R1颠覆行业;国家大基金洽谈投资 |
Mistral | — | ~$4亿 | 租赁云算力 | 欧洲最大AI公司 |
Cohere | — | ~$1.5亿 | 租赁云算力 | 企业搜索/RAG |
Perplexity | ~$200亿 | ~$1.5亿 | 租赁云算力 | AI搜索引擎 |
3.2 中国AI公司
互联网巨头(自有算力 + 云平台)
字节跳动/豆包(Doubao/Seed)
2026年CapEx约1,600亿元人民币,约一半用于AI芯片采购。国内API市场份额第一(IDC: 46.4%),日均Token调用超50万亿。豆包App DAU破1亿,除夕峰值每分钟推理吞吐633亿Tokens。Seed 2.0首次亮相即入围LMArena全球前十。自建数据中心,NVIDIA + 华为昇腾组合。
阿里巴巴/通义千问(Qwen)
宣布未来3年投入超3,800亿元用于云和AI,后续继续加码。国内API市场份额第二(27%),全球开源下载量超3亿。Qwen系列为全球最活跃的开源模型家族之一。2026年3月阿里云算力产品最高涨价34%。
腾讯/混元(HunYuan)
深度嵌入微信生态(10亿+用户触达),腾讯云API日调用约5亿次。元宝App月活约1,800万,春节期间发放10亿现金红包。2026年3月腾讯云部分模型涨价超460%。混元在游戏NPC、虚拟人、代码生成领域有特色应用。
百度/文心(ERNIE)
全栈AI布局:自研昆仑芯片 + 飞桨框架 + 文心模型。国内API市场份额第三(17%),文心助手App月活约4,800万。星火X2基于全国产算力训练,实现与GPT-5.2级别的能力对齐。
独立创业公司
月之暗面/Kimi
最新估值~$200亿(2026.05融资$20亿进行中),半年翻4倍。K2.5上线20天收入超2025全年,ARR突破$1亿(2026.03)。已有客户开出千万美元级预付以获取API优先供应。累计融资超376亿元人民币,大模型创企中最多。Agent Swarm架构可调度100个Agent并行处理1,500步骤。主要租赁云算力(阿里云等),正筹备港股上市。
智谱AI/GLM
港股上市,市值超3,200亿港元(~$400亿),上市43天股价涨超500%。GLM-5编程能力对齐Claude Opus 4.5,全球榜单第四、开源第一。但财务极度紧张:3.5年累计营收仅6.85亿元,累计亏损62亿元。B端MaaS为主,本地化部署收入占84.8%。已完成多款国产算力平台适配。2026 Q1 API定价提升83%,仍供不应求。
MiniMax
港股上市,市值超2,600亿港元。M2.5为全球首个Agent场景原生设计的生产级模型。C端多模态产品为主,海外收入占比超70%(情感AI/陪聊)。2024年创收仅覆盖上年训练算力投入的65%。主要租赁云算力。
DeepSeek
最新估值传闻$450-500亿(国家大基金正洽谈投资)。零外部融资路线,由幻方量化利润支持。R1训练成本仅$560万,颠覆算力至上范式。自有GPU集群(受出口管制限制规模)。开源策略在全球开发者中口碑极高。
阶跃星辰
2026年1月完成50亿元B+轮融资(腾讯等领投)。具体算力和收入数据未公开。
3.3 算力消费的结构性特征
收入远不能覆盖算力支出——整个行业在烧钱赌未来
公司 | 2026年算力支出(估) | 2026年收入(估) | 支出/收入 |
OpenAI | $500亿 | $250-300亿 | ~1.7-2x |
Anthropic | 数百亿(含长期承诺) | ~$300亿 | 视摊销而定 |
智谱 | 数十亿元 | 数亿元 | ~10x+ |
MiniMax | 数十亿元 | 覆盖率50-65% | 远超1x |
Kimi | 快速增长 | ARR刚破$1亿 | 差距巨大 |
从所有权到使用权的映射
芯片所有者 | 主要算力消费者/租户 |
Google(25%全球算力) | Anthropic($2,000亿协议,占Google Cloud积压40%+);Google DeepMind |
Microsoft(15-20%) | OpenAI(历史主要算力来源);企业客户 |
Amazon(15-18%) | Anthropic($1,000亿/10年);企业客户 |
Oracle(增长中) | OpenAI/Stargate($3,000亿+合同) |
中国云厂商 | 字节豆包、Kimi、智谱、MiniMax等租户 + 巨头自用 |
全球AI公司算力分层总览
层级 | 公司 | 年算力消费规模(估) |
T0:GW级 | OpenAI, Google DeepMind, Anthropic, Meta AI | $100亿-$500亿/年 |
T1:大规模 | xAI, 字节跳动, 阿里巴巴 | $50亿-$200亿/年 |
T2:中等 | 腾讯, 百度, DeepSeek, Amazon自身AI | $10亿-$50亿/年 |
T3:追赶型 | Kimi, 智谱, MiniMax, Mistral, Cohere, 阶跃星辰 | $1亿-$10亿/年 |
T4:效率/垂直型 | Perplexity, 各垂直AI公司 | <$1亿/年 |
分层和数字为基于公开信息的粗略估算,多数公司不披露精确算力支出。 |
***
四、算力需求预测
4.1 需求增长的底层逻辑
第一层:模型训练(Training)
前沿模型训练算力以5x/年增长(Epoch AI, 2020年至今趋势)。训练电力需求以~2.1x/年增长(芯片效率和低精度格式部分抵消)。前沿训练已突码100 MW量级,Grok 4训练峰值功率相当于一个中型城镇。但预训练不再是唯一焦点:GPT-5使用了比GPT-4更少的预训练算力,算力分配正发生结构性转移(后训练、强化学习)。xAI已可同时训练b3个前沿模型。
第二层:推理(Inference)
推理占总算力比重:2023年~33% → 2025年~50% → 2026年~66%(Deloitte)。IEA 2026:主要AI模型提供商过去一年活跃用户增长3倍,收入增长5倍。推理单次成本下降极快(每2个月减半),但视频生成、推理链、智能体等重型用例单次消耗可达简单文本查询的数百到数千倍。即使将全球所有传统搜索替换为AI文本查询,也仅消耗~4 TWh/年(不到数据中心总耗电的1%),说明推理的大头是重型任务。
第三层:企业与行业扩散
Google Cloud合同积压一季度翻倍至$4,600亿——企业从试点转向多年合同。AWS Trainium3几乎全部预订满(2026年产能)。到2030年约70%的数据中心需求将来自AI(McKinsey,较2025年的33%大幅上升)。中国市场:2026年3月Token消耗集体爆发,字节豆包调用量两月涨60%,MiniMax两月增长6倍。
4.2 需求量化预测
电力维度(GW / TWh)
时间 | AI数据中心电力容量 | 全数据中心耗电量 | 来源 |
2025(基线) | ~30 GW | 485 TWh | Epoch AI; IEA 2026 |
2027-2028 | 45-68 GW | ~650-750 TWh | RAND: 68GW(2027); IEA插值 |
2030 | 90-327 GW | ~945 TWh(IEA基准) | RAND高位327GW; McKinsey 156GW |
IEA 2026更新:数据中心电力消耗到2030年翻倍至~950 TWh(占全球3%),AI专用增长3倍。2035年区间极宽:逆风b700 TWh → 高效率b970 TWh → 基准b1,200 TWh → 起飞b1,700 TWh。 |
资本支出维度(USD)
时间 | 超级云厂商CapEx合计 | 全球AI数据中心CapEx |
2025 | ~$4,500亿 | ~$3,000-4,000亿 |
2026 | ~$7,000-7,250亿 | ~$4,000-4,500亿 |
2027 | >$1万亿 | 向$1万亿迈进 |
2030累计 | — | McKinsey ~$5.2万亿 |
算力存量维度(H100等效)
时间 | 全球AI算力存量 | vs 2025 Q4 |
2025 Q4 | ~1,650万 H100e | 1x |
2027 Q4 | ~1.5-1.8亿 H100e | ~9-11x |
2030 Q4 | ~10-40亿 H100e | ~60-240x |
以上为3.3x/年增速的外推,不代表预测。维持5年意味着增长~400倍,需多维度同步支撑,实际大概率会随瓶颈收紧而放缓。 |
***
五、满足当前明确需求的算力上限
5.1 当前明确需求信号
信号 | 规模指标 | 来源 |
Google Cloud合同积压 | $4,600亿(单季翻倍) | 2026 Q1财报 |
AWS Trainium3产能 | 2026年几乎全部预订满 | CEO Andy Jassy |
数据中心预租率 | ~80%即将上线空间已预租 | RAND |
Microsoft | 至少到2026年底持续容量受限 | CFO Amy Hood |
入住率 | 85% → 将突破95% | Goldman Sachs |
所有厂商共识 | 供给约束而非需求约束 | 2026 Q1财报 |
5.2 满足上限估算
维度 | 当前供给 | 满足当前需求所需 | 缺口 |
AI数据中心电力容量 | ~30 GW | ~40-45 GW | +10-15 GW(+33%-50%) |
AI芯片年供给 | ~$1,937亿/年(NVIDIA FY26 DC) | ~$2,500-3,000亿/年 | +$500-1,000亿/年 |
数据中心利用率 | 85-95%(过载) | 降至70%(健康) | 需增~25-35%容量 |
仅针对当前已确认需求,不含弹性需求。Goldman Sachs预测利用率2027年开始随新产能上线回落。 |
***
六、供给满足率评估
6.1 整体满足率
维度 | 满足率 | 逻辑 |
即时需求(已签约/排队) | ~65-75% | 入住率85-95%,所有厂商供不应求,Google有收入流失 |
含潜在弹性需求 | ~40-55% | 算力充裕+价格更低→企业部署加速数倍 |
前沿模型训练需求 | ~50-60% | 实验室受GPU配额限制;OpenAI需动用~50%芯片完成10²⁷ FLOP训练 |
6.2 瓶颈层次(2026 Q1)
瓶颈 | 约束程度 | 缓解时间 |
电力供应 | 终极瓶颈 | 4-7年新电力周期,2028-2030缓解 |
先进封装(CoWoS) | 严重 | TSMC扩产60%+, 2027年缓解 |
HBM/存储器 | 紧张 | Microsoft归因$250亿CapEx增加于HBM涨价 |
数据中心建设 | 中等 | 18-36个月周期 |
芯片制造 | 改善中 | 3nm替代4nm, TSMC主导 |
人才/土地/许可 | 持续性 | 不会快速缓解 |
***
七、数据来源与可信度
来源 | 类型 | 数据时效 | 可信度 |
Epoch AI | 独立研究 | Chip Sales 2026.03; Chip Owners 2026.04; Trends 2026.02 | ★★★★ 方法论最透明 |
IEA | 国际能源署 | Energy and AI 2025.04; Key Questions 2026.04 | ★★★★★ 电力最权威 |
NVIDIA财报 | SEC文件 | FY26 Q4 (2026.01), FY27 Q1指引 | ★★★★★ 收入精确 |
超级云厂商财报 | SEC文件 | 2026 Q1 (2026.04) | ★★★★★ CapEx可靠 |
RAND | 美国智库 | 2025.01 | ★★★★ 严谨但高位偏激进 |
Goldman Sachs | 投行 | 2025.02 & 2026.05 | ★★★★ 相对保守 |
Deloitte | 咨询 | 2026.02 | ★★★ 行业覆盖广 |
McKinsey | 咨询 | 2025.12 | ★★★ 高位估算 |
中国行业媒体 | 行业报道 | 2026.01-05 | ★★★ 需交叉验证 |
公司融资/招股书 | 一手文件 | 智谱/MiniMax招股书 2025 | ★★★★ 财务数据可靠 |
重要声明: 全球算力精确测量不可能。大量军事、情报、企业内部算力未公开。中国官方声称拥有230 exaflops算力但不可验证。Epoch AI走私芯片估计中位数66万H100e(29万-160万区间)。多数AI公司不披露精确算力支出。所有数字应视为数量级估算而非精确值。 |


