
华创证券: 《算力芯片行业深度研究报告:算力革命叠浪起,国产GPU奋楫笃行》
(完整版.pdf ) 以下仅展示部分内容 下载方式见文末
一、核心洞察:为什么GPU成为AI时代的"石油"?
1.1 从图形处理器到通用算力引擎的蜕变
GPU(图形处理器)正在经历一场身份革命。它不再仅仅是游戏玩家熟悉的显卡核心,而是演变为驱动人工智能发展的通用计算引擎。2007年英伟达推出CUDA架构后,GPU正式进化为GPGPU(通用图形处理器),能够处理从粒子模拟、电路仿真到计算生物学的各类复杂任务。
关键差异在于架构设计:CPU像一位精通各类事务的"瑞士军刀",拥有少量复杂核心;而GPU则像一支"计算军团",由数千个简单核心组成,能够同时对海量数据执行相同的简单操作。这种大规模并行处理架构使其在矩阵运算、张量计算等AI核心任务上展现出碾压性优势——训练时间从数月缩短至数天。
在服务器成本结构中,GPU已成为绝对核心。以英伟达DGX H100为例,8块GPU加4个NVSwitch基板占总成本的72.62%,远超CPU、内存等其他组件。
1.2 四种技术路线的生死竞速
当前AI计算加速芯片呈现"四足鼎立"格局:
GPU:通用性强、生态成熟,是大模型训练和推理的绝对主力
FPGA:半定制化、灵活性高,但编程门槛高、量产成本高
ASIC:专用性强、功耗低,但前期投入巨大、技术风险高
NPU:神经网络专用,但仍处于探索阶段
报告明确指出:GPU凭借通用计算性能和开发友好性,是目前大模型训练推理的最优解。相较于ASIC和FPGA,GPU在软件生态上具有不可替代的优势;相较于仍在探索的NPU,GPU技术更为成熟。
二、市场格局:全球算力竞赛进入白热化
2.1 市场规模:千亿美元赛道的爆发式增长
全球GPU市场正经历历史性扩张:
2024年全球规模:10,515.37亿元人民币
2029年预计规模:36,119.74亿元人民币
中国占比:从2024年的15.6%提升至2029年的37.8%
AI智算GPU是增长核心引擎。中国AI智算GPU市场规模从2020年的142.86亿元激增至2024年的996.72亿元,年均复合增长率高达62.5%。预计到2029年,这一细分市场将达到10,333.40亿元,占中国GPU市场总量的75%以上。
2.2 Scaling Law:大模型进化的"摩尔定律"
大语言模型的性能提升遵循Scaling Law法则——模型最终性能与计算量、模型参数量、训练数据量三者密切相关。当保持其中两个因素不变时,提升第三个因素,模型测试损失会以可预测的幂律形式下降。
这一法则意味着:算力即生产力。随着AI大模型向多模态、强推理、数据合成等方向演进,算力需求将持续呈指数级增长。OpenAI的研究证实,训练阶段的Scaling Law已得到充分验证;而在推理阶段,类似的缩放规律同样成立。
三、海外巨头:英伟达的"算力帝国"如何筑成?
3.1 资本开支狂潮:科技巨头的"军备竞赛"
2025年,北美科技巨头的AI投资进入闭环验证期——大模型应用落地带来收入回报,进而反哺基础设施投资:
谷歌:月度Token调用量从2025年5月的480万亿飙升至10月的1300万亿,增幅近3倍。Gemini 2.5、Nona Banana等产品更新直接拉动算力消耗。2025年资本开支达910-930亿美元,同比增长73%-77%。
Meta:预计2025年资本开支700-720亿美元,同比增长88%-93%,并宣布未来数年将投入数千亿美元建设AI基础设施。
亚马逊:2025年资本开支指引高达1250亿美元,同比增长50.6%。
微软:与英伟达深度绑定,在Azure云平台大规模部署NVIDIA DGX SuperPOD架构。
2025年前三季度,Meta、亚马逊、谷歌、微软四大云厂商资本开支总和达2574.2亿美元,已超过2024年全年总和。
3.2 英伟达的"护城河":硬件+生态的双重壁垒
市场地位:在数据中心GPU市场,英伟达占据90%以上份额;在PC独立显卡市场,2025年二季度份额达94%。
产品迭代速度惊人:
GB200:训练性能是H100的4倍,推理性能是H100的30倍,节能效果是H100的25倍
GB300:专为扩展推理与AI推理任务设计,采用Blackwell Ultra GPU,密集FP4 Tensor核心FLOPS高出1.5倍
CUDA生态的锁定效应:自2007年发布以来,CUDA只能在英伟达平台上使用。它连接主机端和设备端,让开发者无需编写底层硬件控制代码,直接使用C++等高级语言编程。这种软件粘性构成了比硬件更难逾越的壁垒——开发者一旦习惯CUDA,迁移成本极高。
四、国产突围:在美国封锁下寻找生机
4.1 出口管制:危机中的历史机遇
美国多次修订出口管制规则,限制中国进口先进AI处理器。虽然特朗普政府曾允许英伟达向中国出售H200,但更高阶的GB200、GB300仍被严格限制。这种"卡脖子"困境反而加速了国产GPU自主可控的紧迫性。
政策强力支撑:2025年8月,国务院出台《关于深入实施"人工智能+"行动的意见》,明确提出"强化智能算力统筹,支持人工智能芯片攻坚创新";《电子信息制造业2025-2026年稳增长行动方案》要求"加强CPU、高性能人工智能服务器攻关"。
4.2 四大国产GPU厂商的差异化突围
华为昇腾:全栈自主的"国家队"
基于达芬奇架构,昇腾910B采用7nm+EUV工艺与32核自研架构,支撑千亿参数大模型训练,已实现规模化落地。华为构建的Atlas人工智能计算解决方案,覆盖"端、边、云"全场景,是目前国产化程度最高的AI基础设施方案。
寒武纪:AI芯片的"专精特新"
成立于2016年,核心团队来自中科院计算所。思元590基于7nm工艺,具备314 TFLOPS(FP16)峰值算力、80GB显存和2TB/s带宽,在分布式计算和大规模模型训练中表现突出。2024年11月推出MLU370-X4,主打高性价比AI加速方案。
商业化进展:2025年前三季度营收46.07亿元,同比增长2386.38%;2024年Q4实现单季度转盈,2025年Q1-Q3均实现单季度盈利,净利率达34.81%。客户集中度较高(前五大客户收入占比94.63%),互联网客户验证通过后快速放量。
海光信息:CPU+DCU的双轮驱动
成立于2014年,核心高管多来自中科曙光。海光DCU(深度计算处理器)基于通用图形处理器设计理念,兼容CUDA生态,具备全精度支撑能力。深算三号进展顺利,已与互联网、金融、电信等行业广泛适配。
业绩表现:2025年前三季度营收94.90亿元,同比增长54.65%;营业利润28.40亿元,同比增长31.51%。2021年已实现全年转盈,是目前国产GPU厂商中盈利最稳健的企业。
摩尔线程:全功能GPU的"全能选手"
成立于2020年,创始团队来自英伟达。拥有完整的GPU产品矩阵,覆盖AI智算、专业图形加速、桌面级图形加速、智能SoC四大领域。2024年推出第四代架构"平湖",最大频率2.0GHz,Tensor核心数量512个,支持FP8精度,显存容量80GB。
特色优势:自研MUSA架构统一底层,支持PyTorch、PaddlePaddle等主流AI框架,以及DirectX、OpenGL等图形API。2025年前三季度营收7.85亿元,同比增长181.99%,预计2027年实现合并报表盈利。
沐曦股份:全栈开发的"后来者"
成立于2020年,创始团队多来自AMD。坚持全栈式GPU产品开发,拥有训推一体GPU(曦云C系列)、智算推理GPU(曦思N系列)、图形渲染GPU(曦彩G系列)完整产品线。曦云C500已实现量产,采用自研XCORE 1.0架构,显存64GB,支持千亿参数大模型训练。
软件生态:自研MXMACA软件栈在API层面实现对CUDA生态的高度兼容。2025年前三季度营收12.36亿元,同比增长453.52%,预计2026年实现盈亏平衡。
4.3 盈利路径分化:谁将率先突围?
国产GPU厂商呈现明显的盈利节奏差异:
海光信息:2021年已全年转盈,CPU业务贡献稳定现金流,DCU业务高速增长
寒武纪:2024年Q4单季度转盈,2025年持续盈利,互联网客户放量是关键
沐曦股份:预计2026年实现盈亏平衡,产品验证和生态适配是重点
摩尔线程:预计2027年实现合并报表盈利,全功能GPU矩阵需要更长培育期
这种分化源于技术路线选择和商业策略差异:寒武纪聚焦AI芯片,通过大客户战略快速起量;海光信息依托CPU业务输血,DCU稳步推进;摩尔线程和沐曦股份布局全功能GPU,应用场景更广但商业化周期更长。
五、产业链价值重构:从设计到代工的机会地图
5.1 GPU产业链的"微笑曲线"
GPU产业链呈现明显的中游高附加值特征:
上游:EDA软件、IP模块、高纯度硅晶圆、光刻胶等材料设备。ASML的EUV光刻机近乎垄断高端GPU制造。
中游:设计和制造是价值核心。设计端英伟达凭借CUDA生态构筑极高壁垒;制造端台积电、三星Foundry占据技术优势,日月光等封测企业提供先进封装。
下游:系统制造商将GPU集成至终端产品,应用于云计算、数据中心、智能汽车、科研等领域。
5.2 国产代工的崛起机遇
中芯国际:2025年Q3产能利用率提升至95.8%,正式迈入百万片级别(折合8英寸)。AI市场需求强劲,消费电子需求回暖,特色工艺平台(超低功耗28纳米、CIS与ISP工艺、车规级MCU等)持续完善。
华虹公司/华虹半导体:2025年Q3产能利用率达109.5%,8寸产能满载,12寸九厂一期持续爬坡。拟收购华力微97.5%股权,强化12寸产能与制程覆盖,预计2026年40nm工艺平台进入量产窗口。
六、投资逻辑与风险提示
6.1 核心投资主线
主线一:算力芯片设计
寒武纪:AI芯片龙头,互联网客户放量驱动业绩爆发
海光信息:CPU+DCU双轮驱动,盈利确定性最强
摩尔线程:全功能GPU矩阵,长期成长空间大
沐曦股份:全栈开发能力,CUDA兼容降低迁移成本
主线二:算力芯片代工
中芯国际:大陆代工龙头,AI需求+国产替代双轮驱动
华虹公司/华虹半导体:特色工艺领先,产能释放带来弹性
6.2 三大风险警示
下游需求不及预期:GPU需求与宏观经济、AI应用落地进度高度相关。若大模型商业化进展放缓,或云厂商资本开支收缩,将直接导致行业需求波动。
国产替代进展不及预期:国内GPU产品与英伟达仍存在代际差距,若产品验证和导入进度不及预期,可能影响相关公司业绩。
代工供应风险:国内GPU厂商晶圆代工仍部分依赖海外供应商,若美国进一步扩大贸易限制,可能对生产经营产生影响。
结语:算力即权力,国产当自强
这份报告描绘了一幅清晰的产业图景:在全球AI算力竞赛中,GPU已成为不可替代的战略资源。英伟达凭借硬件性能和CUDA生态构建了难以撼动的壁垒,但美国出口管制为中国厂商打开了历史性的窗口期。
国产GPU厂商正沿着差异化路径突围:寒武纪聚焦AI芯片实现快速起量,海光信息依托CPU业务稳健发展,摩尔线程和沐曦股份布局全功能GPU争夺长期制高点。在政策强力支持、资本持续投入、技术快速迭代的共振下,2025-2027年将成为国产GPU商业化落地的关键验证期。
算力革命的大幕刚刚拉开,国产GPU的"奋楫笃行"正在书写中国半导体产业的新篇章。



☟☟☟
☞人工智能产业链联盟筹备组征集公告☜
☝
精选报告推荐:
11份清华大学的DeepSeek教程,全都给你打包好了,直接领取:
【清华第四版】DeepSeek+DeepResearch让科研像聊天一样简单?
【清华第七版】文科生零基础AI编程:快速提升想象力和实操能力
【清华第十一版】2025AI赋能教育:高考志愿填报工具使用指南
10份北京大学的DeepSeek教程
【北京大学第五版】Deepseek应用场景中需要关注的十个安全问题和防范措施
【北京大学第九版】AI+Agent与Agentic+AI的原理和应用洞察与未来展望
【北京大学第十版】DeepSeek在教育和学术领域的应用场景与案例(上中下合集)
8份浙江大学的DeepSeek专题系列教程
浙江大学DeepSeek专题系列一--吴飞:DeepSeek-回望AI三大主义与加强通识教育
浙江大学DeepSeek专题系列二--陈文智:Chatting or Acting-DeepSeek的突破边界与浙大先生的未来图景
浙江大学DeepSeek专题系列三--孙凌云:DeepSeek:智能时代的全面到来和人机协作的新常态
浙江大学DeepSeek专题系列四--王则可:DeepSeek模型优势:算力、成本角度解读
浙江大学DeepSeek专题系列五--陈静远:语言解码双生花:人类经验与AI算法的镜像之旅
浙江大学DeepSeek专题系列六--吴超:走向数字社会:从Deepseek到群体智慧
浙江大学DeepSeek专题系列七--朱朝阳:DeepSeek之火,可以燎原
浙江大学DeepSeek专题系列八--陈建海:DeepSeek的本地化部署与AI通识教育之未来
4份51CTO的《DeepSeek入门宝典》
51CTO:《DeepSeek入门宝典》:第1册-技术解析篇
51CTO:《DeepSeek入门宝典》:第2册-开发实战篇
51CTO:《DeepSeek入门宝典》:第3册-行业应用篇
51CTO:《DeepSeek入门宝典》:第4册-个人使用篇
5份厦门大学的DeepSeek教程
【厦门大学第一版】DeepSeek大模型概念、技术与应用实践
【厦门大学第五版】DeepSeek等大模型工具使用手册-实战篇
10份浙江大学的DeepSeek公开课第二季专题系列教程
【精选报告】浙江大学公开课第二季:《DeepSeek技术溯源及前沿探索》(附PDF下载)
【精选报告】浙江大学公开课第二季:2025从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例(附PDF下载)
【精选报告】浙江大学公开课第二季:智能金融——AI驱动的金融变革(附PDF下载)
【精选报告】浙江大学公开课第二季:人工智能重塑科学与工程研究(附PDF下载)
【精选报告】浙江大学公开课第二季:生成式人工智能赋能智慧司法及相关思考(附PDF下载)
【精选报告】浙江大学公开课第二季:AI大模型如何破局传统医疗(附PDF下载)
【精选报告】浙江大学公开课第二季:2025年大模型:从单词接龙到行业落地报告(附PDF下载)
【精选报告】浙江大学公开课第二季:2025大小模型端云协同赋能人机交互报告(附PDF下载)
【精选报告】浙江大学公开课第二季:DeepSeek时代:让AI更懂中国文化的美与善(附PDF下载)
【精选报告】浙江大学公开课第二季:智能音乐生成:理解·反馈·融合(附PDF下载)
6份浙江大学的DeepSeek公开课第三季专题系列教程
【精选报告】浙江大学公开课第三季:走进海洋人工智能的未来(附PDF下载)
【精选报告】浙江大学公开课第三季:当艺术遇见AI:科艺融合的新探索(附PDF下载)
【精选报告】浙江大学公开课第三季:AI+BME,迈向智慧医疗健康——浙大的探索与实践(附PDF下载)
【精选报告】浙江大学公开课第三季:心理学与人工智能(附PDF下载)
篇幅有限,部分展示 加入会员,任意下载 资料下载方式
Download method of report materials
关注公众号后回复:SD260303 即可领取完整版资料 
荐: 【中国风动漫】《姜子牙》刷屏背后,藏着中国动画100年内幕! 【中国风动漫】除了《哪吒》,这些良心国产动画也应该被更多人知道! 【中国风动漫】《雾山五行》大火,却很少人知道它的前身《岁城璃心》一个拿着十米大刀的男主夭折!

如需获取更多报告
扫码加入 “人工智能产业链联盟” 知识星球,任意下载相关报告! 报告部分截图

声明 来源:华创证券,人工智能产业链union(ID:aiyuexingqiu)推荐阅读,不代表人工智能产业链union立场,转载请注明,如涉及作品版权问题,请联系我们删除或做相关处理! 编辑:Zero

文末福利
1.赠送800G人工智能资源。
获取方式:关注本公众号,回复“人工智能”。
2.「超级公开课NVIDIA专场」免费下载
获取方式:关注本公众号,回复“公开课”。
3.免费微信交流群:
人工智能行业研究报告分享群、
人工智能知识分享群、
智能机器人交流论坛、
人工智能厂家交流群、
AI产业链服务交流群、
STEAM创客教育交流群、
人工智能技术论坛、
人工智能未来发展论坛、
AI企业家交流俱乐部
雄安企业家交流俱乐部
细分领域交流群:
【智能家居系统论坛】【智慧城市系统论坛】【智能医疗养老论坛】【自动驾驶产业论坛】【智慧金融交流论坛】【智慧农业交流论坛】【无人飞行器产业论坛】【人工智能大数据论坛】【人工智能※区块链论坛】【人工智能&物联网论坛】【青少年教育机器人论坛】【人工智能智能制造论坛】【AI/AR/VR/MR畅享畅聊】【机械自动化交流论坛】【工业互联网交流论坛】
入群方式:关注本公众号,回复“入群”

戳“阅读原文”下载报告。




