GPU 行业深度分析
一、GPU 基础概况
(一)发展历程
GPU 即图形处理器,1999 年英伟达推出 GeForce 256,正式定义 GPU 概念,行业由此起步。发展初期,GPU 主要负责电脑图形渲染、游戏画面加速,承接 CPU 的并行图形计算任务。2010 年前后,GPGPU(通用图形处理器)技术普及,GPU 凭借强大的并行计算能力,切入科学计算、云计算、仿真模拟领域。2016 年人工智能浪潮兴起,深度学习算法与 GPU 架构高度适配,GPU 成为 AI 训练与推理的核心算力载体。如今 GPU 早已突破传统图形应用边界,被称作 “算力石油”,是数字经济、算力网络、人工智能的核心基础设施,战略地位持续提升。(二)主流分类
✅消费级 GPU:面向 PC、游戏主机等终端,主打 2D/3D 图形渲染,代表产品:英伟达 RTX 系列、AMD Radeon 系列,市场成熟、竞争充分。✅数据中心 / AI GPU:部署于服务器、智算中心、云计算平台,聚焦高性能并行计算,服务大模型训练与云端推理,是行业增长核心,技术壁垒最高。代表产品:英伟达 H200/B200/GB200、AMD Instinct MI350 系列。✅边缘 / 嵌入式 GPU:应用在自动驾驶、工业物联网、安防终端等场景,兼顾算力、功耗与集成度,场景分散、增长潜力突出。(三)核心架构体系
架构是 GPU 的核心技术壁垒,决定芯片算力、能效与生态,目前分为国际主流架构与国产自研架构两大阵营:?英伟达:以CUDA 架构为核心,迭代路径:Kepler→Pascal→Volta→Ampere→Hopper→Blackwell→Rubin。采用海量流处理器设计,搭配张量、光追核心,CUDA 软件栈构建了全球最完善的开发者生态。?AMD:消费端采用RDNA 架构,侧重图形性能;数据中心 AI 芯片使用专属CDNA 架构,强化矩阵运算,配套 ROCm 开源生态。?英特尔:全系基于Xe 架构,细分 Xe-HPG(消费级)、Xe-HPC(高性能计算);Gaudi AI 加速卡采用异构计算架构,主打推理能效。华为昇腾:达芬奇架构,深度适配 AI 计算,配套 CANN 全栈软件平台
寒武纪:MLU 架构,针对深度学习算子优化,主打推理场景
海光信息:基于 x86 兼容架构,侧重通用计算与信创领域
壁仞科技、摩尔线程:通用 GPU 架构,兼顾 AI 计算与图形渲染
(四)行业主要玩家梯队
结合技术实力、市场份额与生态能力,全球厂商分为三大梯队:?第一梯队(全球龙头):英伟达、AMD、英特尔。掌握先进架构、顶尖制程与完整软件生态,主导全球高端 GPU 市场。?第二梯队(云厂商自研):谷歌、亚马逊、微软。自研 TPU、Trainium、Maia 等 ASIC 芯片,服务内部推理业务,持续分流传统 GPU 市场。?第三梯队(国产厂商):华为昇腾、寒武纪、海光信息、壁仞科技、摩尔线程。依托信创政策与市场机遇深耕本土,以国产替代为核心发展方向。
二、整体格局
GPU 作为 AI 算力时代的核心引擎,行业规模持续高速扩张。2025 年全球 GPU 市场规模约1500 亿美元,预计 2026 年将达到2000 亿美元,其中 AI 服务器 GPU 占比超 85%。竞争格局:英伟达一家独大,垄断全球数据中心 GPU 约 92% 的市场份额;AMD 是唯一具备实质竞争力的追赶者;英特尔基本退出高端市场。国内市场在信创与出口管制驱动下,国产 GPU 加速崛起,但综合性能、软件生态仍存在明显差距。技术主线:2026 年为英伟达 Blackwell Ultra 全面放量、Rubin 平台首发之年,Chiplet、HBM4、硅光互联成为下一代 GPU 核心技术方向。口径说明:本报告采用纯「数据中心 GPU」统计口径;若纳入 TPU/ASIC 等 AI 加速器,英伟达市占率约 75%。2026 年 Q1 全球 AI 加速卡出货中,ASIC 品类占比已达 27.8%。
三、全球竞争格局
2025 年全球数据中心 GPU 市场呈现高度集中态势,头部厂商数据如下:数据来源:Mercury Research、TrendForce,2025 年全球数据中心 GPU 总出货量约 700 万张
?英伟达:FY2026 全年总营收约 2160 亿美元,数据中心业务占比 89.7%。Blackwell 平台产品供不应求,依托 CUDA 生态坐拥全球超 500 万开发者。GB200 NVL72 整机柜采购成为主流,头部客户单笔订单规模可达数十亿美元。?AMD:MI350 系列推理性能持续对标英伟达 H200,已获得海外云厂商批量采购。2025 年 Instinct GPU 营收同比增长超 4 倍,是目前唯一能够小幅分流英伟达份额的厂商,但在大模型训练领域存在感较弱。?英特尔:Gaudi 3 主打高性价比,独显产品定位中低端,整体市场竞争力不足,仅斩获少量服务器订单。
四、中国竞争格局
受出口管制影响,国内无法采购英伟达 H200/B200 等高端 GPU,国产替代进程全面提速。2025 年中国 AI 加速卡总出货量 400 万张,其中国产产品 165 万张,出货量占比 41%;受单卡价格差距影响,国产产品销售额占比仅 22%—25%。机构预测,2026 年国产产品出货量占比有望突破 50%—55%,销售额占比提升至 35%。国内主流 GPU 厂商盘点
数据来源:企业公开披露、行业专业评测
华为昇腾为国产龙头,2025 年出货量 81.2 万张,占据国产市场近半数份额,2026 年出货目标 150—180 万张。目前国产 GPU 在集群扩展性、软件生态、功耗控制上仍有短板,国内大模型训练依旧依赖英伟达存量卡或云端算力租赁。
五、市场需求
AI 训练与推理需求保持指数级增长,算力投入成为全球云厂商核心开支。2026 年全球 AI 服务器出货量预计达253.4 万台,同比增长 37.4%,其中 GPU 服务器占比 82%。全球头部云厂商年度资本支出合计超 3000 亿美元,半数以上资金投向 GPU 及配套基础设施。当下大模型训练集群已从万卡级别升级至十万卡级别,Llama 4、GPT-5 等新一代模型,将持续撬动千亿级 GPU 采购需求。2026 年全球 GPU 出货量预测
数据来源:高盛、摩根士丹利
高端整机柜产品 GB200 NVL72 均价约 300 万美元,整机柜批量采购成为行业主流模式。
六、产能与供给
当前全球 GPU 产能存在两大核心瓶颈:台积电 CoWoS 先进封装、HBM 高带宽显存,供需紧张格局短期难以缓解。?CoWoS 先进封装:2025 年底月产能约 7 万片,2026 年底计划扩至 9—11 万片。其中英伟达锁定 75%—80% 产能,AMD 分得 15%,其余厂商份额有限。台积电规划 2027 年底将月产能提升至 17 万片,届时供给压力将边际缓解。?HBM 显存:SK 海力士、三星为主要供应商,2026 年 HBM4 实现量产,相关产能同样被英伟达优先锁定。高端 GPU 交付周期长达 6—9 个月,货源成为市场核心竞争力。?国产产能现状:国内 7nm 先进制程、高端封装能力存在短板,限制国产 GPU 大规模放量。目前国内厂商主要通过架构与电路设计优化,弥补硬件层面的不足。
七、价格走势
全球高端 AI GPU 价格持续走高,国内外市场呈现明显分化:全球官方定价:英伟达 H100 上市价约 2.5 万美元,B200 官方售价 3.5—4.5 万美元;GB200 NVL72 机柜均价超 300 万美元。预计 2026 年 Blackwell Ultra 系列再度提价 15%—25%,相关业务毛利率维持在 75% 以上。
国内现货市场:受出口管制影响,价格大幅溢价:H200 国内现货价 12—18 万元人民币,B200 有价无市。
竞品价格策略:AMD MI350 售价为英伟达同级产品的 70%—80%,但受生态制约,市场渗透有限;华为昇腾 910C 国内售价约10 万元人民币(行业市场估算),价格仅为海外同定位产品的一半,且供货稳定。
八、技术动态
海外厂商
✅英伟达:Blackwell Ultra(B300)采用 4nm + 工艺搭配 HBM4,算力密度提升 40%。全新 Rubin 平台集成自研 Vera CPU 与硅光互联,单机柜功率达 600kW,液冷成为高端服务器标配,该平台预计 2026 年 Q4 小批量出货。✅AMD:2026 年推出 MI400,基于 CDNA Next 架构,采用 Chiplet 多芯片封装,晶体管规模突破 3000 亿,重点发力推理市场。✅英特尔:Gaudi 4 转向自研制程,主打能效比,但客户生态建设进度较慢。国内厂商
华为昇腾 920 采用 6nm 国产优化工艺,算力较上一代实现翻倍;壁仞科技、寒武纪调整产品方向,聚焦高性价比推理芯片。
九、未来关注点
- 出口管制升级风险行业最大不确定性。若海外进一步限制 7nm 以下制程、HBM 显存对华出口,国产 GPU 产能将大幅萎缩,国产替代节奏或将放缓 2—3 年。
- 国产软件生态破局昇腾 CANN、寒武纪 Cambricon 等自研框架仍需打磨兼容性,能否稳定支撑千亿参数大模型训练,是 2026 年国产产业的核心看点。
- 云厂商自研芯片冲击谷歌 TPU v6、亚马逊 Trainium 3、微软 Maia 3 持续放量,ASIC 芯片长期将分流 GPU 推理需求,是英伟达远期最大威胁。
- 先进封装产能竞赛台积电 CoWoS-L、三星 I-Cube、英特尔 EMIB 多技术路线竞争,2027 年全球封装产能集中释放,将重塑高端 GPU 供给与价格格局。
- 算力结构迎来转型AI 应用全面落地后,推理算力需求将超越训练算力,市场对芯片能效、成本要求进一步提升,专用推理芯片有望迎来爆发。