【报告】芯片专题五:算力芯片行业深度研究报告:算力革命叠浪起,国产GPU奋楫笃行(附PDF下载)

华创证券：
《算力芯片行业深度研究报告：算力革命叠浪起，国产GPU奋楫笃行》

（完整版.pdf ）
以下仅展示部分内容
下载方式见文末

一、核心洞察：为什么GPU成为AI时代的"石油"？

1.1 从图形处理器到通用算力引擎的蜕变

GPU（图形处理器）正在经历一场身份革命。它不再仅仅是游戏玩家熟悉的显卡核心，而是演变为驱动人工智能发展的通用计算引擎。2007年英伟达推出CUDA架构后，GPU正式进化为GPGPU（通用图形处理器），能够处理从粒子模拟、电路仿真到计算生物学的各类复杂任务。

关键差异在于架构设计：CPU像一位精通各类事务的"瑞士军刀"，拥有少量复杂核心；而GPU则像一支"计算军团"，由数千个简单核心组成，能够同时对海量数据执行相同的简单操作。这种大规模并行处理架构使其在矩阵运算、张量计算等AI核心任务上展现出碾压性优势——训练时间从数月缩短至数天。

在服务器成本结构中，GPU已成为绝对核心。以英伟达DGX H100为例，8块GPU加4个NVSwitch基板占总成本的72.62%，远超CPU、内存等其他组件。

1.2 四种技术路线的生死竞速

当前AI计算加速芯片呈现"四足鼎立"格局：

GPU：通用性强、生态成熟，是大模型训练和推理的绝对主力
FPGA：半定制化、灵活性高，但编程门槛高、量产成本高
ASIC：专用性强、功耗低，但前期投入巨大、技术风险高
NPU：神经网络专用，但仍处于探索阶段

报告明确指出：GPU凭借通用计算性能和开发友好性，是目前大模型训练推理的最优解。相较于ASIC和FPGA，GPU在软件生态上具有不可替代的优势；相较于仍在探索的NPU，GPU技术更为成熟。

二、市场格局：全球算力竞赛进入白热化

2.1 市场规模：千亿美元赛道的爆发式增长

全球GPU市场正经历历史性扩张：

2024年全球规模：10,515.37亿元人民币
2029年预计规模：36,119.74亿元人民币
中国占比：从2024年的15.6%提升至2029年的37.8%

AI智算GPU是增长核心引擎。中国AI智算GPU市场规模从2020年的142.86亿元激增至2024年的996.72亿元，年均复合增长率高达62.5%。预计到2029年，这一细分市场将达到10,333.40亿元，占中国GPU市场总量的75%以上。

2.2 Scaling Law：大模型进化的"摩尔定律"

大语言模型的性能提升遵循Scaling Law法则——模型最终性能与计算量、模型参数量、训练数据量三者密切相关。当保持其中两个因素不变时，提升第三个因素，模型测试损失会以可预测的幂律形式下降。

这一法则意味着：算力即生产力。随着AI大模型向多模态、强推理、数据合成等方向演进，算力需求将持续呈指数级增长。OpenAI的研究证实，训练阶段的Scaling Law已得到充分验证；而在推理阶段，类似的缩放规律同样成立。

三、海外巨头：英伟达的"算力帝国"如何筑成？

3.1 资本开支狂潮：科技巨头的"军备竞赛"

2025年，北美科技巨头的AI投资进入闭环验证期——大模型应用落地带来收入回报，进而反哺基础设施投资：

谷歌：月度Token调用量从2025年5月的480万亿飙升至10月的1300万亿，增幅近3倍。Gemini 2.5、Nona Banana等产品更新直接拉动算力消耗。2025年资本开支达910-930亿美元，同比增长73%-77%。

Meta：预计2025年资本开支700-720亿美元，同比增长88%-93%，并宣布未来数年将投入数千亿美元建设AI基础设施。

亚马逊：2025年资本开支指引高达1250亿美元，同比增长50.6%。

微软：与英伟达深度绑定，在Azure云平台大规模部署NVIDIA DGX SuperPOD架构。

2025年前三季度，Meta、亚马逊、谷歌、微软四大云厂商资本开支总和达2574.2亿美元，已超过2024年全年总和。

3.2 英伟达的"护城河"：硬件+生态的双重壁垒

市场地位：在数据中心GPU市场，英伟达占据90%以上份额；在PC独立显卡市场，2025年二季度份额达94%。

产品迭代速度惊人：

GB200：训练性能是H100的4倍，推理性能是H100的30倍，节能效果是H100的25倍
GB300：专为扩展推理与AI推理任务设计，采用Blackwell Ultra GPU，密集FP4 Tensor核心FLOPS高出1.5倍

CUDA生态的锁定效应：自2007年发布以来，CUDA只能在英伟达平台上使用。它连接主机端和设备端，让开发者无需编写底层硬件控制代码，直接使用C++等高级语言编程。这种软件粘性构成了比硬件更难逾越的壁垒——开发者一旦习惯CUDA，迁移成本极高。

四、国产突围：在美国封锁下寻找生机

4.1 出口管制：危机中的历史机遇

美国多次修订出口管制规则，限制中国进口先进AI处理器。虽然特朗普政府曾允许英伟达向中国出售H200，但更高阶的GB200、GB300仍被严格限制。这种"卡脖子"困境反而加速了国产GPU自主可控的紧迫性。

政策强力支撑：2025年8月，国务院出台《关于深入实施"人工智能+"行动的意见》，明确提出"强化智能算力统筹，支持人工智能芯片攻坚创新"；《电子信息制造业2025-2026年稳增长行动方案》要求"加强CPU、高性能人工智能服务器攻关"。

4.2 四大国产GPU厂商的差异化突围

华为昇腾：全栈自主的"国家队"

基于达芬奇架构，昇腾910B采用7nm+EUV工艺与32核自研架构，支撑千亿参数大模型训练，已实现规模化落地。华为构建的Atlas人工智能计算解决方案，覆盖"端、边、云"全场景，是目前国产化程度最高的AI基础设施方案。

寒武纪：AI芯片的"专精特新"

成立于2016年，核心团队来自中科院计算所。思元590基于7nm工艺，具备314 TFLOPS（FP16）峰值算力、80GB显存和2TB/s带宽，在分布式计算和大规模模型训练中表现突出。2024年11月推出MLU370-X4，主打高性价比AI加速方案。

商业化进展：2025年前三季度营收46.07亿元，同比增长2386.38%；2024年Q4实现单季度转盈，2025年Q1-Q3均实现单季度盈利，净利率达34.81%。客户集中度较高（前五大客户收入占比94.63%），互联网客户验证通过后快速放量。

海光信息：CPU+DCU的双轮驱动

成立于2014年，核心高管多来自中科曙光。海光DCU（深度计算处理器）基于通用图形处理器设计理念，兼容CUDA生态，具备全精度支撑能力。深算三号进展顺利，已与互联网、金融、电信等行业广泛适配。

业绩表现：2025年前三季度营收94.90亿元，同比增长54.65%；营业利润28.40亿元，同比增长31.51%。2021年已实现全年转盈，是目前国产GPU厂商中盈利最稳健的企业。

摩尔线程：全功能GPU的"全能选手"

成立于2020年，创始团队来自英伟达。拥有完整的GPU产品矩阵，覆盖AI智算、专业图形加速、桌面级图形加速、智能SoC四大领域。2024年推出第四代架构"平湖"，最大频率2.0GHz，Tensor核心数量512个，支持FP8精度，显存容量80GB。

特色优势：自研MUSA架构统一底层，支持PyTorch、PaddlePaddle等主流AI框架，以及DirectX、OpenGL等图形API。2025年前三季度营收7.85亿元，同比增长181.99%，预计2027年实现合并报表盈利。

沐曦股份：全栈开发的"后来者"

成立于2020年，创始团队多来自AMD。坚持全栈式GPU产品开发，拥有训推一体GPU（曦云C系列）、智算推理GPU（曦思N系列）、图形渲染GPU（曦彩G系列）完整产品线。曦云C500已实现量产，采用自研XCORE 1.0架构，显存64GB，支持千亿参数大模型训练。

软件生态：自研MXMACA软件栈在API层面实现对CUDA生态的高度兼容。2025年前三季度营收12.36亿元，同比增长453.52%，预计2026年实现盈亏平衡。

4.3 盈利路径分化：谁将率先突围？

国产GPU厂商呈现明显的盈利节奏差异：

海光信息：2021年已全年转盈，CPU业务贡献稳定现金流，DCU业务高速增长
寒武纪：2024年Q4单季度转盈，2025年持续盈利，互联网客户放量是关键
沐曦股份：预计2026年实现盈亏平衡，产品验证和生态适配是重点
摩尔线程：预计2027年实现合并报表盈利，全功能GPU矩阵需要更长培育期

这种分化源于技术路线选择和商业策略差异：寒武纪聚焦AI芯片，通过大客户战略快速起量；海光信息依托CPU业务输血，DCU稳步推进；摩尔线程和沐曦股份布局全功能GPU，应用场景更广但商业化周期更长。

五、产业链价值重构：从设计到代工的机会地图

5.1 GPU产业链的"微笑曲线"

GPU产业链呈现明显的中游高附加值特征：

上游：EDA软件、IP模块、高纯度硅晶圆、光刻胶等材料设备。ASML的EUV光刻机近乎垄断高端GPU制造。

中游：设计和制造是价值核心。设计端英伟达凭借CUDA生态构筑极高壁垒；制造端台积电、三星Foundry占据技术优势，日月光等封测企业提供先进封装。

下游：系统制造商将GPU集成至终端产品，应用于云计算、数据中心、智能汽车、科研等领域。

5.2 国产代工的崛起机遇

中芯国际：2025年Q3产能利用率提升至95.8%，正式迈入百万片级别（折合8英寸）。AI市场需求强劲，消费电子需求回暖，特色工艺平台（超低功耗28纳米、CIS与ISP工艺、车规级MCU等）持续完善。

华虹公司/华虹半导体：2025年Q3产能利用率达109.5%，8寸产能满载，12寸九厂一期持续爬坡。拟收购华力微97.5%股权，强化12寸产能与制程覆盖，预计2026年40nm工艺平台进入量产窗口。

六、投资逻辑与风险提示

6.1 核心投资主线

主线一：算力芯片设计

寒武纪：AI芯片龙头，互联网客户放量驱动业绩爆发
海光信息：CPU+DCU双轮驱动，盈利确定性最强
摩尔线程：全功能GPU矩阵，长期成长空间大
沐曦股份：全栈开发能力，CUDA兼容降低迁移成本

主线二：算力芯片代工

中芯国际：大陆代工龙头，AI需求+国产替代双轮驱动
华虹公司/华虹半导体：特色工艺领先，产能释放带来弹性

6.2 三大风险警示

下游需求不及预期：GPU需求与宏观经济、AI应用落地进度高度相关。若大模型商业化进展放缓，或云厂商资本开支收缩，将直接导致行业需求波动。

国产替代进展不及预期：国内GPU产品与英伟达仍存在代际差距，若产品验证和导入进度不及预期，可能影响相关公司业绩。

代工供应风险：国内GPU厂商晶圆代工仍部分依赖海外供应商，若美国进一步扩大贸易限制，可能对生产经营产生影响。

结语：算力即权力，国产当自强

这份报告描绘了一幅清晰的产业图景：在全球AI算力竞赛中，GPU已成为不可替代的战略资源。英伟达凭借硬件性能和CUDA生态构建了难以撼动的壁垒，但美国出口管制为中国厂商打开了历史性的窗口期。

国产GPU厂商正沿着差异化路径突围：寒武纪聚焦AI芯片实现快速起量，海光信息依托CPU业务稳健发展，摩尔线程和沐曦股份布局全功能GPU争夺长期制高点。在政策强力支持、资本持续投入、技术快速迭代的共振下，2025-2027年将成为国产GPU商业化落地的关键验证期。

算力革命的大幕刚刚拉开，国产GPU的"奋楫笃行"正在书写中国半导体产业的新篇章。

☟☟☟

☞人工智能产业链联盟筹备组征集公告☜

☝

精选报告推荐：

11份清华大学的DeepSeek教程，全都给你打包好了，直接领取：

【清华第一版】DeepSeek从入门到精通

【清华第二版】DeepSeek如何赋能职场应用？

【清华第三版】普通人如何抓住DeepSeek红利？

【清华第四版】DeepSeek+DeepResearch让科研像聊天一样简单？

【清华第五版】DeepSeek与AI幻觉

【清华第六版】DeepSeek赋能家庭教育

【清华第七版】文科生零基础AI编程：快速提升想象力和实操能力

【清华第八版】DeepSeek政务场景应用与解决方案

【清华第九版】迈向未来的AI教学实验

【清华第十版】DeepSeek赋能品牌传播与营销

【清华第十一版】2025AI赋能教育：高考志愿填报工具使用指南

10份北京大学的DeepSeek教程

【北京大学第一版】DeepSeek与AIGC应用

【北京大学第二版】DeepSeek提示词工程和落地场景

【北京大学第三版】Deepseek 私有化部署和一体机

【北京大学第四版】DeepSeek原理与落地应用

【北京大学第五版】Deepseek应用场景中需要关注的十个安全问题和防范措施

【北京大学第六版】DeepSeek与新媒体运营

【北京大学第七版】DeepSeek原理与教育场景应用报告

【北京大学第八版】AI工具深度测评与选型指南

【北京大学第九版】AI+Agent与Agentic+AI的原理和应用洞察与未来展望

【北京大学第十版】DeepSeek在教育和学术领域的应用场景与案例(上中下合集)

8份浙江大学的DeepSeek专题系列教程

浙江大学DeepSeek专题系列一--吴飞：DeepSeek-回望AI三大主义与加强通识教育

浙江大学DeepSeek专题系列二--陈文智：Chatting or Acting-DeepSeek的突破边界与浙大先生的未来图景

浙江大学DeepSeek专题系列三--孙凌云：DeepSeek：智能时代的全面到来和人机协作的新常态

浙江大学DeepSeek专题系列四--王则可：DeepSeek模型优势：算力、成本角度解读

浙江大学DeepSeek专题系列五--陈静远：语言解码双生花：人类经验与AI算法的镜像之旅

浙江大学DeepSeek专题系列六--吴超：走向数字社会：从Deepseek到群体智慧

浙江大学DeepSeek专题系列七--朱朝阳：DeepSeek之火，可以燎原

浙江大学DeepSeek专题系列八--陈建海：DeepSeek的本地化部署与AI通识教育之未来

4份51CTO的《DeepSeek入门宝典》

51CTO：《DeepSeek入门宝典》：第1册-技术解析篇

51CTO：《DeepSeek入门宝典》：第2册-开发实战篇

51CTO：《DeepSeek入门宝典》：第3册-行业应用篇

51CTO：《DeepSeek入门宝典》：第4册-个人使用篇

5份厦门大学的DeepSeek教程

【厦门大学第一版】DeepSeek大模型概念、技术与应用实践

【厦门大学第二版】DeepSeek大模型赋能高校教学和科研

【厦门大学第三版】DeepSeek大模型及其企业应用实践

【厦门大学第四版】DeepSeek大模型赋能政府数字化转型

【厦门大学第五版】DeepSeek等大模型工具使用手册-实战篇

10份浙江大学的DeepSeek公开课第二季专题系列教程

【精选报告】浙江大学公开课第二季：《DeepSeek技术溯源及前沿探索》（附PDF下载）

【精选报告】浙江大学公开课第二季：2025从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例（附PDF下载）

【精选报告】浙江大学公开课第二季：智能金融——AI驱动的金融变革（附PDF下载）

【精选报告】浙江大学公开课第二季：人工智能重塑科学与工程研究（附PDF下载）

【精选报告】浙江大学公开课第二季：生成式人工智能赋能智慧司法及相关思考(附PDF下载）

【精选报告】浙江大学公开课第二季：AI大模型如何破局传统医疗（附PDF下载）

【精选报告】浙江大学公开课第二季：2025年大模型：从单词接龙到行业落地报告（附PDF下载）

【精选报告】浙江大学公开课第二季：2025大小模型端云协同赋能人机交互报告（附PDF下载）

【精选报告】浙江大学公开课第二季：DeepSeek时代：让AI更懂中国文化的美与善（附PDF下载）

【精选报告】浙江大学公开课第二季：智能音乐生成：理解·反馈·融合（附PDF下载）

6份浙江大学的DeepSeek公开课第三季专题系列教程

【精选报告】浙江大学公开课第三季：走进海洋人工智能的未来（附PDF下载）

【精选报告】浙江大学公开课第三季：当艺术遇见AI：科艺融合的新探索（附PDF下载）

【精选报告】浙江大学公开课第三季：AI+BME，迈向智慧医疗健康——浙大的探索与实践（附PDF下载）

【精选报告】浙江大学公开课第三季：心理学与人工智能（附PDF下载）

【精选报告】浙江大学公开课第三季：人工智能赋能交通运输系统——关键技术与应用（附PDF下载）

【精选报告】浙江大学公开课第三季：人工智能与道德进步（附PDF下载）

篇幅有限，部分展示
加入会员，任意下载
资料下载方式
Download method of report materials
关注公众号后回复：SD260303
即可领取完整版资料
荐：
【中国风动漫】《姜子牙》刷屏背后，藏着中国动画100年内幕！
【中国风动漫】除了《哪吒》，这些良心国产动画也应该被更多人知道！
【中国风动漫】《雾山五行》大火，却很少人知道它的前身《岁城璃心》一个拿着十米大刀的男主夭折！
如需获取更多报告
扫码加入
“人工智能产业链联盟”
知识星球，任意下载相关报告！
报告部分截图
声明
来源：华创证券，人工智能产业链union（ID:aiyuexingqiu）推荐阅读，不代表人工智能产业链union立场，转载请注明，如涉及作品版权问题，请联系我们删除或做相关处理！
编辑：Zero
文末福利
1.赠送800G人工智能资源。
获取方式：关注本公众号，回复“人工智能”。
2.「超级公开课NVIDIA专场」免费下载
获取方式：关注本公众号，回复“公开课”。
3.免费微信交流群：
人工智能行业研究报告分享群、
人工智能知识分享群、
智能机器人交流论坛、
人工智能厂家交流群、
AI产业链服务交流群、
STEAM创客教育交流群、
人工智能技术论坛、
人工智能未来发展论坛、
AI企业家交流俱乐部
雄安企业家交流俱乐部
细分领域交流群：
【智能家居系统论坛】【智慧城市系统论坛】【智能医疗养老论坛】【自动驾驶产业论坛】【智慧金融交流论坛】【智慧农业交流论坛】【无人飞行器产业论坛】【人工智能大数据论坛】【人工智能※区块链论坛】【人工智能＆物联网论坛】【青少年教育机器人论坛】【人工智能智能制造论坛】【AI/AR/VR/MR畅享畅聊】【机械自动化交流论坛】【工业互联网交流论坛】
入群方式：关注本公众号，回复“入群”
戳“阅读原文”下载报告。