推广 热搜: 采购方式  甲带  滤芯  带式称重给煤机  气动隔膜泵  减速机型号  链式给煤机  无级变速机  减速机  履带 

涨价83%后token卖爆,智谱的财报藏着一个行业拐点

   日期:2026-04-01 00:43:57     来源:网络整理    作者:本站编辑    评论:0    
涨价83%后token卖爆,智谱的财报藏着一个行业拐点

2026年2月的第三周,全球最大AI模型API聚合平台OpenRouter上出现了一组历史性数据:中国大模型的周Token调用量攀升至5.16万亿,首次超越同期美国模型的2.7万亿。全球调用量排名前五的模型中,中国占据四席。

一年前,这个平台上的格局完全是另一个故事。Anthropic一家独占42%的Token份额,中国模型几乎不在牌桌上。

就在这个逆转发生的同一周,智谱发布GLM-5的同时,宣布API涨价83%。在价格战仍是行业主旋律的背景下,这是国产大模型的第一张涨价牌——而且涨完之后,市场依旧愿意为智谱买单。

3月31日,智谱(02513.HK)发布上市后首份年度业绩报告。2025全年收入7.24亿人民币,同比增长131.9%,继续保持国内收入规模最大的独立大模型公司的位置。智谱CEO张鹏在业绩发布会上把公司的增长逻辑归结为一句话:“当模型足够强,API本身就是最好的商业模式。”他进一步判断:“智能的质量创造定价权,企业和用户的深度使用创造增长的Scaling。

这份财报的核心看点不是某个具体的收入数字,而是Anthropic一般的商业模式与增长,正在智谱身上发生提供的是一个国内大模型行业坐标系级别的参照点。

中国大模型商业化的拐点时刻

2024年下半年到2025年初,中国大模型行业打了一场惨烈的价格战。

字节豆包把推理输入价格打到0.0008元/千tokens,阿里通义千问对GPT-4级主力模型降价97%,智谱自己也曾宣布GLM-4-Plus降价90%。那个阶段,几乎所有玩家都在做同一件事:用补贴换生态,用低价换调用量。供给过剩,抢占用户才是首要的事

价格战确实完成了它的历史使命。Token足够便宜之后,个人开发者企业的使用习惯被培养了,调用量的基本盘建立起来了。

但价格战的终局不是谁更便宜,而是谁先让客户觉得贵得值。

2026年2月12日,转折来了。GLM-5发布当天,智谱同步宣布Coding Plan价格体系进行结构性调整,整体涨幅自30%起2026年一季度,智谱API涨价幅度高达83%。市场的反应不是流失,而是抢购——售罄、限售、道歉,一条龙。

为什么涨价反而卖断货?

Coding不是聊天,而是实在的生产力场景GLM-5在SWE-bench Verified等核心编程榜单中稳居开源第一,能以极少的人工干预自主完成后端重构、深度调试等系统工程任务。开发者为这样一位工程师付费,和为聊天机器人付费是完全不同的决策。149元/月的Pro套餐,对程序员来说不是支出,是投资省下的时间直接换算成交付效率。

张鹏在业绩发布会上说得直接:“开发者是感知智能上界最敏锐的群体。”智谱2025年在国内第一家推出编程套餐GLM Coding Plan,付费开发者规模快速突破24.2万,Token调用量6个月涨了15倍。

收入结构来看,这份财报展示出一幅与市场旧印象截然不同的画面:API调用爆发式增长,私有化收入占比大幅收缩。如今,API经常性收入成了智谱业绩的主引擎,增长不再靠签约驱动,而是用量自己涨。

当模型只是陪聊工具时,价格是成本变量;当模型能交付一个完整系统时,价格是生产力变量。前者的天花板是用户的耐心,后者的天花板是用户省下的人力成本。

这个变化直接改写了市场给智谱的定价。项目制公司看PE,平台公司看ARR——两套完全不同的估值逻辑。今天市场看来,智谱早已再按项目收钱,而是按调用收租。前者是劳动密集型生意,后者是平台经济。

张鹏把定价权的逻辑归结为一个公式:AGI时代的商业价值 = 智能上界 × Token消耗规模。“智能上界决定定价权,Token消耗规模决定价值体量。”他进一步判断:“当模型足够强,API本身就是最好的商业模式。智能的质量创造定价权,企业和用户的深度使用创造增长的Scaling。”

涨价83%后调用量不降反升,正是这个判断的第一次实战验证。Anthropic在大洋彼岸走出了同一条路——2025年底ARR 90亿美元,Claude Code单品9个月做到25亿美元。

当编程从写代码片段升格为完成系统工程,Token消耗量和单价可以同步上升。智谱正在中国复现这条路径。

“中国Anthropic”进入爆发期

进一步理解智谱这份财报的分量,需要先看一组来自大洋彼岸的数字。

Anthropic用15个月完成了一次史无前例的增长:ARR从2024年底的10亿美元,冲到2026年3月的190亿美元。它的用户量只有ChatGPT的5%,收入却做到OpenAI的40%以上,单用户货币化效率是后者的8倍。Anthropic约80%的收入来自企业级API调用服务,Fortune 100中70%是Claude客户。

Anthropic的启示不在于它有多大,而在于它证明了一件事:用户数是规模指标,调用深度能成为真金白银。

张鹏在业绩发布会上明确把智谱放进了这个坐标系他直言公司将“继续沿着中国的Anthropic这条商业路径,以模型智能为根基,以API平台为引擎”。

数据在兑现这个判断。智谱2025年全年收入7.24亿人民币,同比增长131.9%,超出公司年初设定的目标;全年综合毛利率41%,远超行业水准MaaS API平台ARR约17亿元,过去12个月提升60倍。MaaS平台毛利率提升近5倍至18.9%

但比财务数字更能说明飞轮运转状态的,是“被集成”的密度。

中国前十大互联网公司中,已有9家每天深度调用GLM模型。GLM每一代模型发布后24小时内,即获得字节跳动TRAE/扣子Coze、阿里巴巴Qoder、腾讯CodeBuddy、美团CatPaw、快手万擎、百度智能云及WPS Office等头部平台产品的官方接入。

往长尾看,超过400万企业用户及开发者在真实生产环境中持续调用,覆盖全球超218个国家和地区。GLM已成为Windsurf、OpenCode等国际Coding平台的默认模型,OpenRouter付费模型排名第一。

被集成的密度,就是不可替代性的密度。

飞轮能转起来,起点是模型效果。GLM系列持续保持全球开源模型第一、中国模型第一,在全球所有模型中紧跟GPT、Claude和Gemini,稳定进入全球AI第一梯队。

GLM-5登场的方式本身就是一次定位宣言。它以Pony Alpha”的匿名身份登上OpenRouter热度榜首,硅谷开发者纷纷猜测它是Claude Sonnet 5或DeepSeek-V4——揭晓后上线首日即处理40亿Token、20.6万请求。

毛利率的改善也在印证飞轮效率的提升。通过软硬协同的co-design以及理侧,动态稀疏注意力机制将部署成本降至原来的50%且性能无损;客户侧,涨价起到了正向筛选作用愿意为效果付费的客户,留存率和调用深度反而更高。

张鹏把这个正循环描述为:“智能上界的突破推动Token消耗量的指数级增加——模型越强、使用场景越深度、Token调用量越大。”“商业上的正反馈支撑我们投入更大的算力和研发,进一步抬升智能上界,这一飞轮已经转动起来。

Token经济学的下一个爆发点

2月26日,英伟达CEO黄仁勋在财报电话会上反复向市场强调一个判断:“计算即收入,推理即收入。”没有算力,就无法生成Token;没有Token,就无法带来收入增长。

全球数据印证这个观点。过去一年,OpenRouter前十大模型的周Token调用量从1.24万亿暴增至近14万亿,增幅超10倍。不只是用户在增长,还有单用户的Token消耗深度在跃升Agent每完成一个任务都要多步骤、多工具调用,Token消耗按步骤累加。

联网时代免费是王道,因为流量的边际成本趋近于零。AI时代完全不同每一次推理都在烧算力,Token天然带价格。这意味着AI公司从第一天起就坐在一个按量收费的商业模型上。

张鹏给出了他的判断框架:2025年智谱的关键词是“智能上界”,2026年的关键词是“Token量”。“以OpenClaw为代表的应用引爆Token消耗狂潮。我们将继续加大投入,将推理性能压榨至极限不是为了短期盈利,而是为了支撑那条不断上扬的、高质量Token消耗的指数曲线。”

智谱过去一年五代模型迭代讲的就是Token消耗量如何被持续放大的故事。

张鹏拆解了这条范式路径:AI coding阶段,模型学会写代码但本质是辅助者;Vibe coding阶段,Code is cheap,Idea才值钱;Agentic engineering阶段,AI像工程师一样自主理解需求、制定计划、编写、测试并迭代修复;到了long horizon阶段,AI要像资深专家一样在更长时间尺度上持续工作、交付成果。

每一次跃迁,单任务的Token消耗都是上一阶段的倍数级放大。据悉,即将正式发布的GLM-5.1围绕long horizon task做系统性优化,指向的正是下一个台阶。

OpenClaw的爆发让这个趋势从理论变成了现实。2026年3月智谱推出Claw Plan,上线两天订阅用户即破10万,20天突破40万。AI Agent 7×24小时自主运行,每一个实例都是持续燃烧Token的“数字员工”。

需求在炸开,供给端不能掉链子。GLM-5已完成与华为昇腾、摩尔线程、寒武纪等7家国产芯片平台的深度推理适配。张鹏说,GLM系列在国产芯片上已经跑出了比肩国际顶级芯片的推理效率。算力自主可控,Token产能不会被卡脖子。

智谱把这整套逻辑浓缩为一个概念:TAC(Token Architecture Capability),Token架构力TAC = 智能调用量 智能质量 经济转化效率

张鹏认为未来衡量价值的标准,不再是掌握了多少信息,而是作为Token架构师,驱动大模型Agent成复杂任务的能力。智谱的目标是成为提升全社会TAC的基础设施,让每一滴Token都能转化为可交付的经济增量。”

Anthropic用同样的逻辑拿到了3800亿美元估值和190亿美元ARR。中国MaaS模式的天花板在哪,这份财报是第一个正式的坐标点。

在大模型行业,“供不应求”这四个字比任何财报数字都有说服力。当一家公司开始为“卖断货”而道歉,关于定价权的一切争论都可以结束了。


*以上内容不构成投资建议,不代表刊登平台之观点,市场有风险,投资需谨慎,请独立判断和决策。

 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON