智谱AI(02513.HK,港股“大模型第一股”)于2026年3月31日发布上市后首份年度业绩报告(2025财年,截至2025年12月31日),标题为“探索AGI智能上界”。 这是国内独立大模型厂商首次披露完整年度财报,整体呈现“高增长+高亏损+强商业化信号”的典型AI特征,市场反应强烈(4月1日股价最高涨超30%,市值一度突破4000亿港元)。
营收7.24亿元人民币,同比增长131.9%(成为国内收入规模最大的独立大模型公司)。
其中
本地化部署(On-prem):5.34亿元,占比73.7%,同比增长102.3%(仍是主力,但占比下降)。
云端部署/API(MaaS):1.90亿元,占比26.3%,同比增长292.6%(高速增长引擎)。
本地化(On-prem):成本主要是交付人力+定制化适配(为满足客户多样硬件/安全需求,项目制投入大)。边际成本较高,毛利率48.8%(下降主因)。优势是客单价高,一次性收入大。
云端(API/MaaS):成本主要是共享推理算力(第三方GPU租赁+优化)。规模越大、推理效率越高,边际成本越低。2025年毛利率从3.3%大幅提升至18.9%(提升近5倍),得益于模型优化、规模效应和涨价。
转型中,云端占比从15.5%升至26.3%,拉低综合毛利率,但长期更具杠杆。
企业(尤其是政企、金融等数据安全敏感客户)不会简单下载开源模型自己跑,而是付费让智谱提供完整的一站式部署服务:模型在客户自有服务器/机房安装(支持40+款国产芯片适配);定制化适配(性能调优、安全合规、与现有系统集成);配套培训、技术支持、后续维护/升级。这属于高客单价项目制,收入主要来自部署许可费+服务费(2025年本地化收入5.34亿元,占比73.7%)。毛利率虽从2024年的66%降至48.8%,但仍是高毛利业务,只是“重交付”导致交付资源投入大(客户需求多样化,个性化工作量多)。
毛利与毛利率:毛利2.97亿元,同比增长68.7%;综合毛利率41.0%(较2024年56.3%下降,主要因云端业务占比提升,云端毛利率虽从3.3%大幅升至18.9%,但本地部署毛利率从66%降至48.8%)。API业务毛利率提升近5倍,显示规模效应和推理优化成效。
亏损:年内净亏损47.18亿元(同比扩大59.5%);经调整净亏损31.82亿元(同比扩大29.1%)。主要因研发持续高投入。
研发投入:31.8亿元,同比增长44.9%,占营收超4倍(累计研发近60亿元),体现“烧钱换技术”的AGI战略。
最大亮点——MaaS API平台:年度经常性收入(ARR)约17亿元,同比提升60倍!这是财报中最超预期的确定性增长信号,付费开发者达24.2万(GLM Coding Plan),平台注册企业/用户超400万,服务218个国家和地区。
整体解读:营收翻倍+API爆发验证了商业化落地,但亏损扩大反映行业共性(高研发+规模扩张)。毛利率41%已高于行业平均,API毛利率改善明显,显示从“项目制本地部署”向“标准化云端API”转型成功。市场视其为国产大模型“打破价格战、转向价值定价”的积极信号。
3月31日业绩发布会及后续媒体交流中,张鹏(CEO)多次对标Anthropic(Claude母公司),强调“技术驱动商业”的第一性原理,拒绝价格战,聚焦长期AGI路径。以下是需要重点知道的看点(直接来自张鹏表态):
AGI商业化的“第一性原理”:
智谱自2019年创立唯一战略就是“让机器像人一样思考”。AGI时代商业价值公式 = 智能上界 × Token消耗规模。
智能上界决定定价权(核心壁垒);Token消耗规模决定价值体量。
提出全新概念 Token架构能力(TAC):TAC = 智能调用量 × 智能质量 × 经济转化效率。未来衡量个人/组织价值的标准不再是“掌握信息多少”,而是作为“Token架构师”,在给定预算下构建复杂Agent系统、驱动大模型自主完成长程任务。智谱目标是成为提升全社会TAC的基础设施,让“每一滴Token”转化为可交付的经济增量。
API才是最好的商业模式(对标Anthropic):
“当模型足够强,API本身就是最好的商业模式。” Anthropic ARR从2024年底10亿美元暴增至2025年底90亿美元,80%来自企业级API调用。智谱正在复制这条路径:以最强模型为核心,通过Token(API)交付智能,直接参与企业经济价值创造。
涨价83%后调用量仍暴增400%——定价权已确立:
2026年Q1 API价格较前代平均上调83%(累计多次提价),但市场供不应求、调用量不降反升。原因:算力瓶颈存在,但客户优先选“效果最好的模型”。张鹏强调:长期价格由“单位Token创造的价值”决定,而非短期供给。生产级企业客户看的是“能否替代人力、提高效率”,智能上界强就有底气拒绝价格战。
2026年智能范式演进与增长预期:
AI能力从“可用、可玩”转向“真正解决复杂重要问题”。 2026年将从轻量编程(Vibe Coding)演进到工业级智能体工程(Agentic Engineering),最终实现具备自主规划、环境感知、自我迭代的“数字工程师”,完成长程任务闭环(Long-horizon Task)。这将带来Token调用指数级增长。公司预计2027年实现盈亏平衡,全年收入有望突破50亿元。