第一章 宏观战略与市场格局:全球半导体地缘政治下的“双循环”重构
1.1 全球AI芯片市场的二元分化与总量扩张
2025年,全球半导体产业正式步入了一个前所未有的二元分化时代。根据Coherent Market Insights发布的权威数据,全球AI芯片市场规模在2025年预计达到838亿美元,并呈现出惊人的爆发力,预计以27.5%的复合年增长率(CAGR)在2032年攀升至4590亿美元。与此同时,MarketsandMarkets的数据模型给出了更为激进的预测,认为到2032年该市场规模将突破5648.7亿美元。这种增长并非简单的线性外推,而是由生成式AI(Generative AI)对算力需求的指数级膨胀所驱动。Deloitte的分析进一步指出,仅生成式AI芯片这一细分领域,在2025年的市场价值就将超过1500亿美元,占据了行业增长的核心动能。
然而,这一繁荣景象的背后,是一道日益深邃的“硅幕”。以英伟达(NVIDIA)、AMD为代表的西方技术阵营,通过H100、Blackwell等先进制程产品牢牢把控着全球高端算力的制高点;而以中国为核心的东方市场,在经历了2022-2024年的“休克式”技术封锁后,已在2025年逐步构建起一套基于本土供应链的内循环生态系统。IDC的报告显示,尽管面临外部压力,2025年亚太地区(以中国为主导)的IC设计市场仍将保持15%的强劲增长,显示出中国市场在“去美化”进程中的强大韧性。
对于中国而言,2025年不仅是市场规模的扩张期,更是“生存模式”向“发展模式”转型的关键节点。随着美国商务部工业与安全局(BIS)对华半导体出口管制的常态化与精细化——不仅限制了先进制程逻辑芯片(如H100/H200),更收紧了对高带宽内存(HBM)、先进封装(CoWoS)及EDA工具的供应——中国AI芯片产业面临着“存量耗尽、增量受阻”的严峻现实。TrendForce的深度观察指出,这种极限施压反而成为了催化剂,迫使字节跳动、百度、阿里巴巴、腾讯等互联网巨头,以及华为、寒武纪等芯片厂商,加速了自研芯片的部署与迭代。2025年的中国市场,已不再单纯追求PPT上的性能对标,而是进入了以“生产良率”、“供应链安全”和“大规模集群可用性”为核心指标的残酷淘汰赛。
1.2 政策顶层设计的范式转移:从“制造为王”到“应用牵引”
2025年标志着中国半导体产业政策逻辑的重大转折。过去十年以“中国制造2025”为纲领的追赶模式,重点在于解决“造得出来”的问题。尽管在28nm以上成熟制程和刻蚀、清洗等细分设备领域取得了显著突破,但在EUV光刻机等核心环节,距离70%自给率的宏大目标仍有差距。
面对物理制程的瓶颈,工信部在2025年发布的《AI+制造》实施指南,宣告了政策重心向“应用牵引”和“系统优化”的转移。该指南不仅是一份技术文档,更是一份产业动员令,明确提出到2027年,重点行业的AI应用渗透率要超过70%。这意味着国产AI芯片的评价标准发生了质的变化:不再执着于单点算力是否超越英伟达,而是看能否在工业自动化、智能检测、自动驾驶等具体场景中,通过软硬协同实现系统级的高效能。
与此同时,资本层面的“国家队”在2025年展现出了前所未有的精准打击能力。国家集成电路产业投资基金三期(“大基金三期”)正式运行,注册资本高达3440亿元人民币(约475亿美元),其体量远超前两期。与以往“撒胡椒面”式的广泛投资不同,三期的投资策略具有极强的针对性,核心聚焦于三大“卡脖子”领域:
高带宽内存(HBM):全力扶持长鑫存储(CXMT)等企业,突破AI训练芯片的内存墙。
先进封装(Advanced Packaging):重点投资通富微电、长电科技,通过Chiplet技术绕过先进制程限制。
核心设备零部件:支持光刻机光源、物镜系统等上游产业链的国产化。
1.3 资本市场的“硬科技”狂欢与风险
2025年下半年至2026年初,中国资本市场迎来了一波AI芯片企业的上市热潮。这并非偶然,而是产业资本需求与国家金融战略共振的结果。由于先进制程研发成本动辄数十亿美元,且传统美元基金退潮,二级市场成为了维持这些高科技企业生命线的关键。
企业名称 | 上市地点 | 上市时间/状态 | 关键市场表现与募资用途 |
壁仞科技 (Biren) | 香港联交所 | 2026年1月2日 | 首日暴涨82.1%,市值突破469亿港元。募资主要用于BR20X研发。 |
摩尔线程 (Moore Threads) | 上海/Pre-IPO | 2025年12月完成IPO | 募资11亿美元,股价飙升。被称为“中国英伟达”,主打全功能GPU。 |
天数智芯 (Iluvatar CoreX) | 香港联交所 | 2026年1月8日(拟) | 计划全球发售2543万股,主打7nm云端训练芯片量产。 |
长鑫存储 (CXMT) | 上海科创板 | 筹备中 (2025/2026) | 计划募资42亿美元,估值极高。资金用于HBM产线扩建。 |
这波IPO浪潮的背后,隐含着市场对“国产替代”确定性的极度认可。投资者普遍认为,在地缘政治摩擦常态化的背景下,这些获得政府背书的芯片企业将获得垄断性的国内市场份额。然而,高估值也伴随着高风险:绝大多数企业尚未实现盈利,且供应链极其脆弱,任何一项关键原材料(如光刻胶、特种气体)的断供都可能导致生产停摆。
第二章 云端训练与推理芯片:巨头的突围与新贵的崛起
2.1 华为海思:构建“第二选择”的算力底座
在2025年的中国AI芯片版图上,华为不仅仅是一家芯片设计公司,它是整个国产半导体产业链的“链主”。面对英伟达的绝对统治,华为正在构建一个从底层晶圆制造到上层软件框架的完整替代方案。
2.1.1 Ascend 910C:技术妥协与工程奇迹
2025年推出的Ascend 910C,是华为应对英伟达H100封锁的核心武器。根据多方技术情报汇总,910C在FP16精度下的算力约为800 TFLOPS,理论性能达到英伟达H100的80%左右。
架构创新与制造挑战:
由于无法获得ASML的EUV光刻机,910C采取了更为激进的Chiplet设计。它通过CoWoS类先进封装技术(可能由通富微电或华为自建产线提供),将两颗基于昇腾910B架构的逻辑裸片(Die)进行互连。这种“双芯合璧”的方案虽然增加了功耗和封装难度,但在现有7nm工艺条件下,是提升单卡算力的唯一可行路径。
供应链的隐秘角落:
尽管华为对外宣称自主可控,但拆解报告揭示了初期量产的复杂性。部分早期批次的910C被发现仍使用了制裁生效前囤积的台积电(TSMC)晶圆和三星/SK海力士的HBM内存。SemiAnalysis的深度调查显示,华为曾通过中间商Sophgo(算能)囤积了约290万颗TSMC代工的芯片,这批库存支撑了910C早期的出货。然而,随着这批“绝版”库存的耗尽,华为在2025年下半年正加速将产线完全切换至中芯国际(SMIC)的N+2/N+3工艺(等效7nm)以及长鑫存储(CXMT)的国产HBM供应体系。这一切换过程极为痛苦,受限于国产HBM的产能爬坡,910C的实际出货量在2025年受到严重制约,原定的80.5万颗年产能目标面临巨大挑战。
2.1.2 软件生态的破局:CANN 8.0与DeepSeek效应
硬件的物理差距需要通过软件来弥补。在HUAWEI CONNECT 2025上,华为发布了CANN 8.0(Compute Architecture for Neural Networks),并承诺在2025年底前实现底层完全开源。CANN 8.0不仅仅是一个驱动包,它对标的是英伟达的CUDA核心库,旨在通过编译器层面的深度优化,释放NPU的极限性能。
DeepSeek的战略协同:
2025年中国AI产业最显著的事件之一,是顶级AI研究机构DeepSeek与华为的深度绑定。DeepSeek发布的V3模型原生支持昇腾架构,其开源的V3.2-Exp模型在昇腾NPU上实现了高效运行。CANN团队针对DeepSeek模型中的MoE(混合专家)架构和稀疏注意力机制进行了定制化的算子开发,使得在国产硬件上的训练效率大幅提升。这种“算法定义硬件”的模式,极大缓解了国产算力不足的焦虑,证明了在软件优化得当的情况下,国产芯片完全可以承载世界级大模型的训练任务。
2.2 寒武纪(Cambricon):从专用加速到通用生态
作为中国AI芯片的“老牌”独角兽,寒武纪在2025年展现出了极强的生存能力。TrendForce数据显示,寒武纪在2025年前三季度营收达到46亿元人民币,这一数字是其他初创公司营收总和的数倍,确立了其在国内市场的领先地位。
思元590(Siyuan 590):作为2025年的主力出货产品,思元590采用了MLU-Link片间互连技术,专注于解决多卡并行的通信瓶颈。这使得它在构建千卡级别的中小规模集群时具有较高的性价比。
思元690(Siyuan 690):备受瞩目的下一代旗舰,目前正处于紧张的测试阶段。受限于中芯国际先进制程产能的挤压(优先保供华为),思元690的大规模量产时间表被推迟到了2026年下半年。
医疗影像领域的隐形冠军:除了通用计算,寒武纪在医疗AI领域取得了突破性进展。随着数百种AI医疗工具获得监管批准,寒武纪的芯片凭借高能效比,被大量集成在国产高端CT、MRI设备中,用于实时的影像分析和辅助诊断,成为医疗新基建的重要算力支撑。
2.3 壁仞科技(Biren):绝境求生与架构重塑
壁仞科技曾因BR100系列在参数上硬刚英伟达H100而名噪一时,但也因此遭遇了美国的定点打击。2025年是壁仞完成供应链重组的关键之年。
产品策略调整:失去台积电代工资格后,壁仞调整了产品路线。BR104作为降级版产品,通过使用国产成熟工艺或存量晶圆,主要服务于推理市场。而下一代旗舰BR20X计划于2026年发布,该芯片将全面拥抱Chiplet架构,试图通过异构集成的方式,用相对落后的工艺实现高性能计算。
软件短板与IPO输血:尽管BR100在FP32单精度计算上表现出色(256 TFLOPS),但其缺乏FP64双精度支持,且软件栈成熟度远不及CUDA,导致在科学计算和复杂大模型训练中推广困难。壁仞在香港IPO募集的巨额资金,将主要用于填补这一软件生态的鸿沟,以及支付昂贵的流片费用。
2.4 摩尔线程(Moore Threads):全功能GPU的孤勇者
与大多数专注于AI加速器(ASIC/GPGPU)的厂商不同,摩尔线程坚持走“全功能GPU”路线,即一颗芯片同时具备3D图形渲染和AI计算能力。这使其在商业模式上更接近英伟达。
MUSA架构与夸娥(Kuafu)集群:2025年发布的“花港”(Huagang)架构支持从FP4到FP64的全精度计算,计算密度较前代提升50%。其推出的MTT S5000/S4000系列显卡,不仅能进行AI训练,还能支持云游戏、数字孪生等图形密集型应用。
万卡集群能力:摩尔线程展示了基于MTLink 4.0互连技术的万卡集群,宣称能高效运行DeepSeek R1等超大参数模型。这种架构的灵活性使其在算力中心建设中具有独特优势:白天进行AI推理,晚上进行图形渲染或模型训练,大幅提升了硬件的利用率。
2.5 海光信息(Hygon):x86生态的兼容利器
海光基于AMD Zen 1架构授权发展而来,其DCU(Deep Computing Unit)系列(Z100/Z200)本质上是兼容ROCm生态的GPGPU。
生态兼容性优势:海光DCU的最大护城河在于其“类CUDA”的生态兼容性。由于ROCm与CUDA的高度相似性,海光芯片能够以极低的成本迁移英伟达平台上的代码。2025年,海光实现了对DeepSeek V3.2-Exp模型的“零等待”部署,这对于拥有大量存量CUDA代码资产的金融、电信客户极具吸引力。
关键行业统治力:尽管Z100的绝对性能仅为A100的30%-50%,但在对供应链安全极其敏感的“信创”市场(金融、能源、政务),海光DCU几乎是唯一选择。2025年,海光宣布继续推进与服务器巨头中科曙光(Sugon)的深度业务整合,虽然资本层面的合并受阻,但双方在超算基础设施上的协同效应依然显著。
第三章 供应链的“七寸”与突围:制造、存储与封装
中国AI芯片产业的阿喀琉斯之踵,依然在于制造链的自主可控。2025年,在光刻机、存储器和先进封装三大核心环节,中国产业界进行了一场惊心动魄的突围战。
3.1 光刻机:SMEE的迷雾与多重曝光的现实
上海微电子(SMEE)在2025年成为了舆论和产业关注的焦点。关于其28nm光刻机的进展,市场上充斥着各种传闻与真相的博弈。
28nm光刻机(SSA/800-10W)的真相:尽管早在2023年就有即将交付的传闻,但直到2025年底,经过多方验证的招标信息显示,SMEE中标的SSC800/10机型实为KrF光源(248nm),分辨率为110nm,主要用于厚胶工艺或成熟制程,而非此前市场热切期盼的28nm浸没式ArF光刻机。这一事实表明,国产28nm光刻机在光源稳定性、双工件台精度等核心指标上,仍未达到大规模工业量产的标准。
SAQP技术续命:在无法获得EUV甚至先进DUV光刻机的情况下,中芯国际(SMIC)不得不依赖现有的ASML DUV设备,通过SAQP(自对准四重曝光)技术来生产7nm芯片。这是一种在物理极限边缘试探的工艺——通过四次曝光来刻画一条电路,虽然实现了制程微缩,但导致生产成本激增50%,且良率仅能维持在30%-50%的低位。这种“不计成本”的生产方式,完全依赖于国家战略层面的输血,而非商业逻辑。
EUV的遥远曙光:2025年,华为与深圳SiCarrier(新凯来)合作的EUV光源原型机取得了物理层面的验证突破,证明了国产技术路线的可行性。但这距离真正的工业化量产(预计2028-2030年)仍有漫长的工程化道路要走。
3.2 HBM内存:突破封锁的关键战役
AI芯片的性能瓶颈在于内存带宽(Memory Wall)。随着三星和SK海力士在2025年彻底切断对华HBM供应,国产化成为了生死攸关的必选项。
长鑫存储(CXMT)的战略地位:2025年,CXMT成为了中国AI芯片产业的“救命稻草”。公司计划在2025年将产能大幅提升至30万片晶圆/月,并开始向华为等客户供应HBM2/HBM3样品。虽然在技术指标上,CXMT的HBM2E/HBM3落后国际巨头(HBM3E/HBM4)两代,且良率较低,但“有”和“无”的区别决定了国产AI芯片能否持续出货。
产业链协同突围:HBM的生产需要DRAM制造与先进封装的紧密配合。CXMT负责DRAM颗粒的制造,而通富微电(Tongfu Microelectronics)则承担了关键的CoWoS类先进封装任务,将HBM颗粒与GPU逻辑Die进行3D堆叠。通富微电在2025年开始试产HBM2封装,成为华为Ascend 910C能够量产的最重要合作伙伴。
3.3 先进封装与Chiplet标准
面对先进制程的物理封锁,Chiplet(小芯片)技术成为中国提升芯片性能的主要手段。
ACC 1.0标准:为了解决国内封装和基板供应链分散的问题,中国在2025年发布了自主的Chiplet互连接口标准ACC 1.0。该标准旨在统一接口协议,降低不同厂商芯片间的集成难度和成本,推动国产IP的复用。
长电科技(JCET)的XDFOI:长电科技的XDFOI高密度扇出型封装技术在2025年实现了大规模量产。该技术提供了一种不依赖台积电CoWoS的高性能封装替代方案,被广泛应用于国产高性能计算芯片中。
第四章 边缘、汽车与AIoT:百花齐放的增量市场
相较于云端训练芯片面临的严酷封锁,边缘计算和端侧AI市场则呈现出蓬勃发展的态势,中国企业在这一领域甚至开始对外输出技术。
4.1 地平线(Horizon Robotics):智能驾驶的算力霸主
在汽车智能驾驶芯片领域,地平线已成为中国市场的绝对领导者。2025年,其征程(Journey)系列芯片累计出货量突破1000万片,这一里程碑标志着国产智驾芯片的全面成熟。
产品系列 | 市场定位 | 2025年状态 | 关键客户 |
征程6P (Journey 6P) | 高阶城市NOA,旗舰级 | 2025年全面量产 | 理想汽车、比亚迪、奇瑞 |
征程6M/6E | 中阶高速NOA,性价比 | 大规模出货 | 大众汽车(及合资品牌)、上汽 |
征程6B | 低阶ADAS,前视一体机 | 入门级首选 | 博世、电装等Tier 1供应商 |
地平线的成功证明了在特定垂直领域,国产芯片完全可以凭借算法优化(BPU架构)和本土化服务响应速度,击败Mobileye和英伟达Orin等国际巨头。
4.2 瑞芯微(Rockchip):高端边缘计算的接棒者
随着海思麒麟芯片在公开市场的缺位,瑞芯微RK3688在2025年顺势成为了高端边缘计算市场的首选。作为RK3588的继任者,RK3688集成了更强大的NPU(32 TOPS),采用4-5nm工艺(大概率由三星或中芯国际N+2工艺代工)。它被广泛应用于高端边缘计算盒、工业机器人、智能座舱等领域,填补了高性能通用ARM SoC的市场空白。
4.3 云天励飞(Intellifusion)与乐鑫科技(Espressif)
云天励飞:2025年申请港股IPO,其主打产品DeepEdge10系列芯片在智慧城市和安防领域表现抢眼。利用自研的NNP400T神经网络处理器,云天励飞推出了售价仅1000元人民币(约140美元)的48 TOPS算力AI盒子,以极致的性价比横扫边缘推理市场。
乐鑫科技:在AIoT领域,乐鑫推出了ESP32-C61等新品,开始在RISC-V架构的MCU上集成轻量级AI加速单元。这使得端侧设备(如智能家电)能够进行本地语音唤醒和手势识别,无需上传云端,极大地提升了响应速度和隐私安全性。
第五章 软件生态:从CUDA兼容到自主定义的“软战争”
2025年,中国AI芯片厂商深刻意识到,仅有硬件的堆砌是无法赢得战争的。软件生态的建设呈现出两条截然不同的路线,并在实战中接受检验。
5.1 兼容路线:海光与摩尔线程的务实选择
海光的DTK和摩尔线程的MUSA都致力于最大程度兼容CUDA代码。摩尔线程甚至开发了自动化的代码迁移工具,能够将原本为英伟达GPU编写的CUDA代码,无缝转换为MUSA运行。这种策略在短期内极其有效,特别是对于拥有大量历史代码资产(Legacy Code)的金融、电信等行业客户,极大地降低了迁移门槛。
5.2 自主路线:华为CANN与DeepSeek效应
华为走的是一条更艰难但更彻底的道路。CANN不寻求兼容CUDA,而是建立自己的编程范式。
DeepSeek效应:2025年,DeepSeek V3/R1模型的成功不仅仅是算法的胜利,更是国产算力生态的里程碑。DeepSeek团队通过极致的算法优化——例如大规模采用W8A8(8位权重、8位激活)量化技术、稀疏注意力机制——证明了在算力受限的国产硬件(如昇腾910B/C)上,依然可以训练出世界级的模型。
这一事件极大地提振了市场对国产芯片的信心,打破了“非英伟达不可”的神话。它标志着中国AI产业开始进入“软件定义硬件”的新阶段:通过算法的巧妙设计,来弥补硬件制程上的物理短板。
第六章 资本市场的博弈:估值泡沫与长期价值
6.1 IPO新浪潮的逻辑
2025年至2026年初的芯片企业IPO潮,是技术、政策与资本三重因素叠加的产物。
壁仞科技和摩尔线程的上市,标志着国产GPU企业正式接受公开市场的定价。
长鑫存储的巨额IPO,则是为了支撑其在HBM和DRAM领域天文数字般的资本开支。
6.2 估值与风险
投资者给予这些企业高估值,核心逻辑在于“国产替代”的确定性。在中国这个全球最大的芯片消费市场,只要能做出来,就不愁卖不掉。然而,风险同样巨大:
盈利能力:大多数AI芯片企业(除海光、寒武纪外)仍处于亏损状态,巨额的研发投入和流片成本吞噬了现金流。
地缘政治:美国制裁的进一步升级(如将制裁范围扩大到成熟制程或更多设备)仍是悬在头顶的达摩克利斯之剑。
第七章 结论与2030年展望:曙光与挑战并存
7.1 核心结论
市场格局:2025年,中国AI芯片市场在制裁中逆势增长,成功构建了一个独立的内循环生态。虽然在高端训练算力上与国际顶尖水平(Nvidia Blackwell)存在代差,但在推理、边缘计算和中端训练场景已实现“可用”乃至“好用”的替代。
供应链重构:“华为(设计)+ 中芯国际(制造)+ 长鑫存储(内存)+ 通富微电(封装)”构成了中国AI芯片的“铁四角”。这一链条虽然在成本和良率上暂不具商业优势,但在国家资本的支持下,具备了极强的生存韧性。
应用驱动:汽车(地平线)和工业制造(AI+制造)成为国产芯片大规模落地的最成功场景,这得益于中国庞大的实体经济腹地。
7.2 未来展望(2026-2030)
HBM产能危机(2026):2026年将是生死攸关的一年。随着华为等厂商囤积的海外HBM库存彻底耗尽,长鑫存储能否按期、保质地量产HBM3,将直接决定国产AI芯片的性能上限。
光刻机突围(2027-2028):预计到2027-2028年,国产浸没式光刻机有望实现真正的产线跑通,从而缓解7nm/5nm制程的高昂成本。而EUV的工业化应用可能要等到2030年。
生态分化(2030):全球AI生态将进一步分裂为“CUDA生态”和“CANN/国产联盟生态”。跨国企业在中国开展业务将不得不适配两套系统,这将催生一个巨大的中间件和兼容层市场。
综上所述,2025年的中国人工智能芯片产业,正处于从“被动应对”向“主动构建”转型的关键十字路口。虽然前路依然布满技术封锁的荆棘,但一条基于举国体制、庞大应用市场和资本助力的自主可控之路已清晰可见。


