一、市场格局:推理芯片批量出货,梯队化竞争格局清晰
(一)一线厂商:昇腾、寒武纪、海光主导,出货量占比超 50%
昇腾(华为):
绝对龙头,2025 年芯片总出货约 52 万颗,集中在 Q2-Q3,Q4 出货偏弱;2026 年 Q1 已锁定 15 万张 910 系列卡订单,全年目标出货 120 万颗。产品迭代清晰,950 下半年批量部署,960 系列 2027 年量产,届时可切入大模型训练场景。
寒武纪(688256):
推理芯片标杆,思元 690 为国内唯一采用 CoWoS-L 封装的产品,性能对标英伟达 H20,客户测试反馈优异;2026 年受先进制程与封装产能约束,规模仍偏小。
海光信息(688041):
CPU+DCU 双轮驱动,深算系列 DCU 兼容 CUDA 生态,适配 365 款主流大模型,是国产大模型核心供应商;2026 年推理芯片出货量稳居一线梯队。
(二)二线厂商:沐曦、壁仞等快速起量,昆仑芯卡位互联网场景
沐曦、壁仞:
二线核心力量,2026 年推理芯片合计出货近 100 万张,聚焦中高端推理场景,性能与性价比平衡。
昆仑芯(百度):
深耕互联网核心业务,2026 年出货 30 多万张,深度适配搜索、chatbot 等场景,与百度文心一言生态高度协同。
(三)互联网大厂自研:阿里领先,字节蓄力
阿里平头哥:
进度领跑,自研芯片性能接近英伟达 H20,2026 年出货 40-50 万张,主打性价比,支撑阿里云 MaaS 业务。
字节自研:
2026 年仅小几万张出货,2027 年实现规模化商用,聚焦内部 AI 场景适配。
二、技术现状:硬件差距缩小,软件生态与先进封装成核心短板
(一)硬件:仅落后海外 1-2 代,特定场景性能超英伟达
性能优势:
深度适配特定模型后,寒武纪、昇腾等头部产品性能可超越英伟达 H20,且具备成本优势;
通用短板:
通用模型 Token 成本无优势,训练场景仍高度依赖英伟达,2027 年前难以大规模替代。
(二)软件:生态差距显著,长期难追赶
适配难度:
国产芯片需逐一适配主流大模型,研发周期长、成本高;
算力利用率:
国产芯片高效使用期约 5 年,前 3 年算力达成率 70%,3-5 年降至 60%,5 年后仅 45%-50%,后期运营成本大幅攀升。
(三)封装:2.5D 成刚需,CoWoS 产能紧张制约出货
主流路线:
昇腾 910B/910C/950、海光、沐曦等均采用 CoWoS-S 过渡,960 系列将升级为 CoWoS-L;
产能瓶颈:
CoWoS-S 产能紧张源于前期需求预判保守、扩产滞后;CoWoS-L 核心供应商为长电科技、通富微电、汇成股份,良率与量产进度决定芯片出货上限。
三、增量逻辑:四大驱动支撑高增,2027 年迎训练替代拐点
(一)核心驱动:需求全面爆发
办公场景渗透:
编程辅助、chatbot 等应用成熟,带动推理芯片刚需;
端侧算力升级:
AIPC/AIPhone 普及,端侧 AI 算力需求向云端传导;
文生视频普及:
AI 视频应用落地,带动高算力推理芯片需求;
训练替代开启:
2027 年末昇腾 960 系列规模量产,有望切入大模型训练场景,海光、壁仞等落后半代至一代。
(二)政策加持:国产替代确定性增强
进口受限:
英伟达 H200 进口仍受限,2026 年或有限放开,但不会大规模准入;
数据合规:
数据出境受限,政策未来或要求国内模型必须国内训练,海外算力无法承接核心业务,为国产训练芯片留出市场空间。