全球算力需求估算与供给分析报告

报告日期：2026年5月|数据截至：2026年Q1

***

核心结论

1.当前全球AI算力严重供不应求。所有主要厂商一致报告供给约束，数据中心入住率逼近95%上限，Google CEO公开表示算力不足导致收入流失。即时需求满足率约65-75%；若纳入潜在弹性需求，满足率仅40-55%。

2.全球AI算力存量约1,650万H100等效，以每7个月翻倍的速度增长。NVIDIA占60%+，Google靠TPU贡献25%居首位。五大超级云厂商控制71%的全球AI算力。

3.算力消费端高度集中于两家公司。OpenAI和Anthropic的算力承诺合计占主要云厂商约一半的合同积压。Anthropic ARR在15个月内从$10亿增至$300亿超过OpenAI；OpenAI 2026年算力支出$500亿。能参与前沿竞争的可能只剩5个阵营：OpenAI/Microsoft、Google DeepMind、Anthropic/Amazon、Meta、xAI。

4. 1-2年（2027-2028）：AI电力需求从30GW→45-68GW，超级云厂商CapEx从$7,250亿→超$1万亿/年。供给将持续追不上需求。

5. 3-5年（2029-2031）：IEA基准预测数据中心总耗电翻倍至950 TWh（2030），AI专用增长3倍。2035年不确定性极大：700-1,700 TWh。

6.满足当前明确需求的上限：需在现有基础上增加约30-50%供给（+10-15 GW AI电力容量）。

7.电力是终极瓶颈。芯片和封装可在2-3年显著扩张，但电力基础设施需4-7年建设周期。仅美国到2028年就有49 GW电力缺口（Morgan Stanley）。IEA确认瓶颈正在约束激进情景的近期实现。

8.中国市场走差异化路线。面临出口管制约束，但通过DeepSeek式的算法效率优化和华为昇腾国产替代形成竞争力。2026年3月中国云厂商集体涨价（阿里最高34%、腾讯最高460%），Token消费量爆发式增长。

9.全行业在烧钱赌未来。OpenAI预计2026年亏损$140亿，盈亏平衡推迟到2030年；中国智谱b3.5年累计亏损62亿元，营收仅6.85亿元。整个前沿AI行业的收入远不能覆盖算力支出。

10.效率改善是对冲力量但远不够。推理成本每2个月减半，算法效率每年提升3x，但用户量增长3-5x和重型用例（视频生成、推理链、智能体）使总需求净增长。

***

一、分析框架说明

本报告从三个维度衡量算力：

维度	单位	用途
算力性能	H100等效（H100e）/ FLOP/s	衡量瞬时计算能力存量
电力容量	GW（吉瓦）/ TWh（太瓦时）	衡量数据中心物理承载上限与实际消耗
资本支出	USD（美元）	衡量投资规模与供给扩张速度

三个维度互相关联但各有局限：H100e衡量理论峰值算力但不反映实际利用率；电力容量反映物理上限但不区分训练与推理效率；CapEx反映投资意愿但受组件成本通胀影响（2026年HBM涨价导致同等CapEx买到的算力减少）。

***

二、当前全球算力现状（2025 Q4 – 2026 Q1基线）

2.1 算力存量

核心数据（Epoch AI, 2026年1月发布，数据更新至2026年3月）：

全球AI芯片累积安装算力 ≈ 1,650万 H100等效（以INT8/FP8峰值性能折算）。涵盖NVIDIA GPU、Google TPU、Amazon Trainium、AMD MI系列及华为昇腾。

关键趋势指标（Epoch AI Trends Dashboard, 2026年2月更新）：

指标	数值	含义
AI芯片总算力增速	3.3-3.4x/年	约每7个月翻倍（90% CI：6-8个月）
前沿语言模型训练算力增速	5x/年	约每5.2个月翻倍（自2020年起）
已知最大训练运行	Grok 4, ~5×10²⁶ FLOP	训练耗电b310 GWh，成本~$4.9亿
推理成本下降速度	每2个月减半	固定性能水平下，约每年下降100倍
预训练算法效率提升	~3x/年	相同性能所需算力每年减少至1/3

芯片所有权分布（Epoch AI Chip Owners, 2026年4月30日更新）：

所有者	H100等效算力	全球占比	关键说明
Google/Alphabet	~500万 H100e	~25%	全球最大，主要靠TPU（~400万H100e）
Microsoft	排名靠前	~15-20%	拥有最大的NVIDIA芯片存量
Amazon/AWS	—	~15-18%	Trainium自研芯片快速增长
Meta	—	~10-12%	NVIDIA + AMD MI300X + 自研MTIA
Oracle	—	快速增长	依托NVIDIA GPU
xAI	—	增长中	Colossus集群200,000+ GB200 GPU
中国客户（合计）	—	~10-15%	华为昇腾已超越NVIDIA成为中国AI算力的主要来源
五大超级云厂商合计	—	71%（2025 Q4）	从2024 Q1的63%持续上升

关于中国： Epoch AI估计到2025年底，约有29万-160万H100e通过非正规渠道流入中国，中位数估计66万H100e，约占中国总算力的三分之一。华为在额定FLOP/s上已超越NVIDIA成为中国AI算力的最大来源，但额定性能不一定反映实际工作负载表现。

NVIDIA占比变化： NVIDIA芯片贡献全球AI总算力的 >60%（较此前77%下降，因Google TPU和Amazon Trainium规模快速增长）。Blackwell系列已基本取代H100/H200，B300单款已占NVIDIA AI算力销售的多数。

2.2 电力容量与消耗

指标	数据	来源	时间
全球AI数据中心电力容量	~30 GW	Epoch AI	2025 Q4
全球数据中心总电力容量	~100 GW	IEA/S&P Global	2024
全球数据中心耗电量（2024）	415 TWh（占全球1.5%）	IEA	2024实际
全球数据中心耗电量（2025）	485 TWh（同比+17%）	IEA 2026更新	2025估算
AI专用数据中心耗电增速	+50% YoY（2025）	IEA 2026更新	2025估算
AI专用数据中心耗电量（2025）	~155 TWh	IEA 2026更新	2025估算
AI工厂容量增速	过去18个月增长超过3倍	IEA卫星追踪	2026年4月

2.3 资本支出现状

NVIDIA财报实绩（FY2026，截至2026年1月）：

季度	总营收	数据中心营收
FY26 Q1 (2025.04)	$441亿	$391亿
FY26 Q2 (2025.07)	$467亿	$411亿
FY26 Q3 (2025.10)	$570亿	$512亿
FY26 Q4 (2026.01)	$681亿	$623亿
FY26全年	$2,159亿	$1,937亿（+68% YoY）
FY27 Q1指引	$780亿±2%	不含对华数据中心计算收入

五大超级云厂商CapEx（2026年Q1财报最新指引）：

公司	2025年CapEx	2026年CapEx指引	YoY增幅
Amazon	~$1,250亿	~$2,000亿	+60%
Microsoft	~$882亿	~$1,900亿	+115%
Alphabet	~$1,050亿	$1,800-1,900亿	+80%
Meta	~$720亿	$1,250-1,450亿	+80%
Oracle	—	~$500亿	大幅增长
四大合计（不含Oracle）	~$4,100亿	~$7,250亿	+77%

关键信号： 所有超级云厂商均报告供给约束而非需求约束。Google CEO Sundar Pichai表示受算力约束，云收入本可更高。Meta CFO表示即便大幅扩张产能，仍低估自身算力需求。Microsoft CFO表示至少到2026年底持续容量受限。Google Cloud合同积压从2025 Q4的$2,400亿→2026 Q1的$4,600亿（单季度翻倍）。五家公司CapEx总和已超过全球石油天然气上游投资。2027年CapEx预计突破$1万亿。

***

三、全球AI公司算力消费格局

上一章的芯片所有权分布追踪谁拥有芯片。本章追踪谁在消费算力、以何种方式获取、规模多大。芯片归Google所有，但使用权可能被Anthropic通过长期合约锁定——同一块芯片在两个视角中分别被计入不同主体。

3.1 海外前沿AI公司

第一梯队：超大规模算力消费者

OpenAI（估值~$8,500亿 | 2026目标收入$250-300亿）

2026年算力支出$500亿（Greg Brockman法庭作证）。Stargate项目：SoftBank/Oracle合建，目标10GW，投资$5,000亿，已超额完成里程碑（90天内新增3GW+）。首站Abilene容纳40万NVIDIA芯片，另有Texas、New Mexico、Ohio、Wisconsin等站点。自研芯片Titan（Broadcom设计，TSMC 3nm，2026H2量产，优化推理）。另有CoreWeave $119亿/5年合同提供过渡期算力。预计2026年亏损$140亿，盈亏平衡推迟到2030年。

Anthropic（估值~$8,000亿 | ARR ~$300亿，2026.04）

Google $2,000亿长期云与芯片协议，主要部署从2027年开始。Amazon $1,000亿/10年AWS协议，使用Trainium芯片，锁定5GW容量。Google Cloud另提供5GW TPU容量（5年期）。与CoreWeave签署数据中心容量协议。合计锁定约11GW算力容量承诺。2026年底前将上线近1GW Trainium2/3容量。ARR 15个月内从$10亿→$300亿，增长30倍，已超OpenAI。单独占Google Cloud合同积压的40%+。预计2027年实现正向自由现金流。

Google DeepMind（内部部门）

使用Google自有基础设施，约500万H100e（全球最大，约25%份额）。其中TPU约400万H100e。Cloud季度收入$200亿，合同积压$4,600亿。Gemini系列模型，集成到Search、Cloud、YouTube等全线产品。

Meta AI（内部部门）

2026年CapEx $1,250-1,450亿，完全自建数据中心。自研MTIA推理芯片（已4代），NVIDIA + AMD MI300X组合。规划5GW单一园区。Llama开源系列，通过广告生态变现。豆包DAU $1亿的规模对标。

xAI（估值~$500亿+）

自建Colossus集群（Memphis），200,000+ GB200 GPU已运行。可同时训练b3个前沿模型。规划扩至100万GPU。Grok 4为已知最大训练运行（~5×10²⁶ FLOP）。训练Grok 4耗电b310 GWh，成本$4.9亿。

第二梯队：快速增长型

公司	估值	ARR	算力来源	关键特征
DeepSeek	~$450-500亿	未公开	自有集群（幻方量化利润）；约10K张A100/H800	$560万训练R1颠覆行业；国家大基金洽谈投资
Mistral	—	~$4亿	租赁云算力	欧洲最大AI公司
Cohere	—	~$1.5亿	租赁云算力	企业搜索/RAG
Perplexity	~$200亿	~$1.5亿	租赁云算力	AI搜索引擎

3.2 中国AI公司

互联网巨头（自有算力 + 云平台）

字节跳动/豆包（Doubao/Seed）

2026年CapEx约1,600亿元人民币，约一半用于AI芯片采购。国内API市场份额第一（IDC: 46.4%），日均Token调用超50万亿。豆包App DAU破1亿，除夕峰值每分钟推理吞吐633亿Tokens。Seed 2.0首次亮相即入围LMArena全球前十。自建数据中心，NVIDIA + 华为昇腾组合。

阿里巴巴/通义千问（Qwen）

宣布未来3年投入超3,800亿元用于云和AI，后续继续加码。国内API市场份额第二（27%），全球开源下载量超3亿。Qwen系列为全球最活跃的开源模型家族之一。2026年3月阿里云算力产品最高涨价34%。

腾讯/混元（HunYuan）

深度嵌入微信生态（10亿+用户触达），腾讯云API日调用约5亿次。元宝App月活约1,800万，春节期间发放10亿现金红包。2026年3月腾讯云部分模型涨价超460%。混元在游戏NPC、虚拟人、代码生成领域有特色应用。

百度/文心（ERNIE）

全栈AI布局：自研昆仑芯片 + 飞桨框架 + 文心模型。国内API市场份额第三（17%），文心助手App月活约4,800万。星火X2基于全国产算力训练，实现与GPT-5.2级别的能力对齐。

独立创业公司

月之暗面/Kimi

最新估值~$200亿（2026.05融资$20亿进行中），半年翻4倍。K2.5上线20天收入超2025全年，ARR突破$1亿（2026.03）。已有客户开出千万美元级预付以获取API优先供应。累计融资超376亿元人民币，大模型创企中最多。Agent Swarm架构可调度100个Agent并行处理1,500步骤。主要租赁云算力（阿里云等），正筹备港股上市。

智谱AI/GLM

港股上市，市值超3,200亿港元（~$400亿），上市43天股价涨超500%。GLM-5编程能力对齐Claude Opus 4.5，全球榜单第四、开源第一。但财务极度紧张：3.5年累计营收仅6.85亿元，累计亏损62亿元。B端MaaS为主，本地化部署收入占84.8%。已完成多款国产算力平台适配。2026 Q1 API定价提升83%，仍供不应求。

MiniMax

港股上市，市值超2,600亿港元。M2.5为全球首个Agent场景原生设计的生产级模型。C端多模态产品为主，海外收入占比超70%（情感AI/陪聊）。2024年创收仅覆盖上年训练算力投入的65%。主要租赁云算力。

DeepSeek

最新估值传闻$450-500亿（国家大基金正洽谈投资）。零外部融资路线，由幻方量化利润支持。R1训练成本仅$560万，颠覆算力至上范式。自有GPU集群（受出口管制限制规模）。开源策略在全球开发者中口碑极高。

阶跃星辰

2026年1月完成50亿元B+轮融资（腾讯等领投）。具体算力和收入数据未公开。

3.3 算力消费的结构性特征

收入远不能覆盖算力支出——整个行业在烧钱赌未来

公司	2026年算力支出（估）	2026年收入（估）	支出/收入
OpenAI	$500亿	$250-300亿	~1.7-2x
Anthropic	数百亿（含长期承诺）	~$300亿	视摊销而定
智谱	数十亿元	数亿元	~10x+
MiniMax	数十亿元	覆盖率50-65%	远超1x
Kimi	快速增长	ARR刚破$1亿	差距巨大

从所有权到使用权的映射

芯片所有者	主要算力消费者/租户
Google（25%全球算力）	Anthropic（$2,000亿协议，占Google Cloud积压40%+）；Google DeepMind
Microsoft（15-20%）	OpenAI（历史主要算力来源）；企业客户
Amazon（15-18%）	Anthropic（$1,000亿/10年）；企业客户
Oracle（增长中）	OpenAI/Stargate（$3,000亿+合同）
中国云厂商	字节豆包、Kimi、智谱、MiniMax等租户 + 巨头自用

全球AI公司算力分层总览

层级	公司	年算力消费规模（估）
T0：GW级	OpenAI, Google DeepMind, Anthropic, Meta AI	$100亿-$500亿/年
T1：大规模	xAI, 字节跳动, 阿里巴巴	$50亿-$200亿/年
T2：中等	腾讯, 百度, DeepSeek, Amazon自身AI	$10亿-$50亿/年
T3：追赶型	Kimi, 智谱, MiniMax, Mistral, Cohere, 阶跃星辰	$1亿-$10亿/年
T4：效率/垂直型	Perplexity, 各垂直AI公司	<$1亿/年

分层和数字为基于公开信息的粗略估算，多数公司不披露精确算力支出。

***

四、算力需求预测

4.1 需求增长的底层逻辑

第一层：模型训练（Training）

前沿模型训练算力以5x/年增长（Epoch AI, 2020年至今趋势）。训练电力需求以~2.1x/年增长（芯片效率和低精度格式部分抵消）。前沿训练已突码100 MW量级，Grok 4训练峰值功率相当于一个中型城镇。但预训练不再是唯一焦点：GPT-5使用了比GPT-4更少的预训练算力，算力分配正发生结构性转移（后训练、强化学习）。xAI已可同时训练b3个前沿模型。

第二层：推理（Inference）

推理占总算力比重：2023年~33% → 2025年~50% → 2026年~66%（Deloitte）。IEA 2026：主要AI模型提供商过去一年活跃用户增长3倍，收入增长5倍。推理单次成本下降极快（每2个月减半），但视频生成、推理链、智能体等重型用例单次消耗可达简单文本查询的数百到数千倍。即使将全球所有传统搜索替换为AI文本查询，也仅消耗~4 TWh/年（不到数据中心总耗电的1%），说明推理的大头是重型任务。

第三层：企业与行业扩散

Google Cloud合同积压一季度翻倍至$4,600亿——企业从试点转向多年合同。AWS Trainium3几乎全部预订满（2026年产能）。到2030年约70%的数据中心需求将来自AI（McKinsey，较2025年的33%大幅上升）。中国市场：2026年3月Token消耗集体爆发，字节豆包调用量两月涨60%，MiniMax两月增长6倍。

4.2 需求量化预测

电力维度（GW / TWh）

时间	AI数据中心电力容量	全数据中心耗电量	来源
2025（基线）	~30 GW	485 TWh	Epoch AI; IEA 2026
2027-2028	45-68 GW	~650-750 TWh	RAND: 68GW(2027); IEA插值
2030	90-327 GW	~945 TWh（IEA基准）	RAND高位327GW; McKinsey 156GW

IEA 2026更新：数据中心电力消耗到2030年翻倍至~950 TWh（占全球3%），AI专用增长3倍。2035年区间极宽：逆风b700 TWh → 高效率b970 TWh → 基准b1,200 TWh → 起飞b1,700 TWh。

资本支出维度（USD）

时间	超级云厂商CapEx合计	全球AI数据中心CapEx
2025	~$4,500亿	~$3,000-4,000亿
2026	~$7,000-7,250亿	~$4,000-4,500亿
2027	>$1万亿	向$1万亿迈进
2030累计	—	McKinsey ~$5.2万亿

算力存量维度（H100等效）

时间	全球AI算力存量	vs 2025 Q4
2025 Q4	~1,650万 H100e	1x
2027 Q4	~1.5-1.8亿 H100e	~9-11x
2030 Q4	~10-40亿 H100e	~60-240x

以上为3.3x/年增速的外推，不代表预测。维持5年意味着增长~400倍，需多维度同步支撑，实际大概率会随瓶颈收紧而放缓。

***

五、满足当前明确需求的算力上限

5.1 当前明确需求信号

信号	规模指标	来源
Google Cloud合同积压	$4,600亿（单季翻倍）	2026 Q1财报
AWS Trainium3产能	2026年几乎全部预订满	CEO Andy Jassy
数据中心预租率	~80%即将上线空间已预租	RAND
Microsoft	至少到2026年底持续容量受限	CFO Amy Hood
入住率	85% → 将突破95%	Goldman Sachs
所有厂商共识	供给约束而非需求约束	2026 Q1财报

5.2 满足上限估算

维度	当前供给	满足当前需求所需	缺口
AI数据中心电力容量	~30 GW	~40-45 GW	+10-15 GW（+33%-50%）
AI芯片年供给	~$1,937亿/年（NVIDIA FY26 DC）	~$2,500-3,000亿/年	+$500-1,000亿/年
数据中心利用率	85-95%（过载）	降至70%（健康）	需增~25-35%容量

仅针对当前已确认需求，不含弹性需求。Goldman Sachs预测利用率2027年开始随新产能上线回落。

***

六、供给满足率评估

6.1 整体满足率

维度	满足率	逻辑
即时需求（已签约/排队）	~65-75%	入住率85-95%，所有厂商供不应求，Google有收入流失
含潜在弹性需求	~40-55%	算力充裕+价格更低→企业部署加速数倍
前沿模型训练需求	~50-60%	实验室受GPU配额限制；OpenAI需动用~50%芯片完成10²⁷ FLOP训练

6.2 瓶颈层次（2026 Q1）

瓶颈	约束程度	缓解时间
电力供应	终极瓶颈	4-7年新电力周期，2028-2030缓解
先进封装（CoWoS）	严重	TSMC扩产60%+, 2027年缓解
HBM/存储器	紧张	Microsoft归因$250亿CapEx增加于HBM涨价
数据中心建设	中等	18-36个月周期
芯片制造	改善中	3nm替代4nm, TSMC主导
人才/土地/许可	持续性	不会快速缓解

***

七、数据来源与可信度

来源	类型	数据时效	可信度
Epoch AI	独立研究	Chip Sales 2026.03; Chip Owners 2026.04; Trends 2026.02	★★★★ 方法论最透明
IEA	国际能源署	Energy and AI 2025.04; Key Questions 2026.04	★★★★★ 电力最权威
NVIDIA财报	SEC文件	FY26 Q4 (2026.01), FY27 Q1指引	★★★★★ 收入精确
超级云厂商财报	SEC文件	2026 Q1 (2026.04)	★★★★★ CapEx可靠
RAND	美国智库	2025.01	★★★★ 严谨但高位偏激进
Goldman Sachs	投行	2025.02 & 2026.05	★★★★ 相对保守
Deloitte	咨询	2026.02	★★★ 行业覆盖广
McKinsey	咨询	2025.12	★★★ 高位估算
中国行业媒体	行业报道	2026.01-05	★★★ 需交叉验证
公司融资/招股书	一手文件	智谱/MiniMax招股书 2025	★★★★ 财务数据可靠

重要声明： 全球算力精确测量不可能。大量军事、情报、企业内部算力未公开。中国官方声称拥有230 exaflops算力但不可验证。Epoch AI走私芯片估计中位数66万H100e（29万-160万区间）。多数AI公司不披露精确算力支出。所有数字应视为数量级估算而非精确值。