推广 热搜: 采购方式  甲带  滤芯  气动隔膜泵  带式称重给煤机  减速机型号  无级变速机  链式给煤机  履带  减速机 

Coding Plan 深度研究报告:算力饥荒年代的诞生、爆发与阵痛

   日期:2026-04-18 13:27:52     来源:网络整理    作者:本站编辑    评论:0    
Coding Plan 深度研究报告:算力饥荒年代的诞生、爆发与阵痛

Coding Plan 深度研究报告:算力饥荒年代的诞生、爆发与阵痛

翻开Coding Plan这一年的历史账本,最让我震撼的不是某家公司的技术突破,也不是某次涨价引发的舆论风暴,而是一个简单到容易被忽略的事实:

中国日均Token调用量从2024年初的1000亿飙升至2026年3月的140万亿。

两年,一千四百倍。

这个数字背后藏着一个残酷的真相:AI编程这件事,我们不是「想用」,是「已经离不开了」。而一旦离不开,算力就从技术问题变成了政治经济学问题——谁有芯片、谁有产能、谁能把成本压到别人扛不住的点——这些才是终局的关键变量。

「Coding Plan」这个概念,2025年下半年才正式进入中国开发者的视野。短短不到一年,它从一个前沿产品形态演变为一场席卷整个AI编程领域的产业浪潮。

本质上,它是大模型厂商面向编程场景推出的订阅制API服务,以「固定月费+调用配额」取代传统的按Token计费模式,让开发者可以在Claude Code、Cursor、Cline等主流编程工具中以可控成本调用大模型能力。

但这场浪潮的源头,要追溯到更早的海外探索。而它的演进轨迹,深刻揭示了AI商业化的核心矛盾:算力成本的高企与用户需求的指数级增长之间的永恒张力。

这篇文章将沿着时间轴完整还原Coding Plan从概念萌芽到全球博弈的全过程,剖开2026年4月这个时间切面上的竞争格局,并在最后给出我的判断。

全文约17000字,建议收藏后阅读。

01 史前时代:订阅制AI编程的海外探索

问题的提出:按量付费的「账单焦虑」

在Coding Plan出现之前,开发者使用AI编程助手的主流方式是API按量付费。2024年至2025年上半年,随着Claude Code、Cursor、Cline等工具迅速普及,一个尖锐的问题浮出水面——API账单失控。

开发者很快发现,在Claude Code或Cline中,一次看似简单的用户prompt,背后会触发5到30次API请求,每次请求又可能携带数万到数十万Token的上下文。

按量付费模式下,一个月下来的账单轻松突破千元,重度使用者甚至达到数千美元。硅谷的开发者社区里开始流传各种「天价账单」的截图,有人惊呼「我这个月烧掉了一台MacBook Pro」。

这种「用多少付多少」的模式虽然理论上公平,却带来了极大的成本不确定性和心理负担。开发者不敢放开使用AI能力,每次调用都在心里默默计算「这句话又烧了多少钱」。

更糟糕的是,API账单是按月结算的——这意味着你可能在月底收到一张远超预期的账单,而你对此毫无准备。

Claude Code:订阅制的第一个实验场

面对API账单失控的困境,开发者们开始寻找替代方案。一个「取巧」的用法悄然流传:

将Claude的通用订阅账号通过第三方框架接入编程工具。

Claude Pro套餐定价20美元/月,Max套餐100-200美元/月。如果能够通过订阅方式无限调用Claude Code,成本将大幅低于API按量付费。

这并非Anthropic最初的设计意图。Claude的订阅制是为轻度用户设计的——用户偶尔问问问题、写写代码,消耗是可控的。订阅制的核心经济模型是「轻度用户补贴重度用户」,大多数人的平均用量不会太高,整体盈亏平衡。

但第三方框架的介入彻底改变了这个等式。

以OpenClaw为代表的工具可以将Agent 7×24小时运行,无限循环调用,同时跑多个任务。更致命的是,第三方框架的上下文管理和缓存效率极差。

小米MiMo大模型负责人罗福莉在分析中指出:OpenClaw在单次用户查询中会触发多轮低价值工具调用,每轮作为独立API请求发出,每个请求携带的上下文窗口往往超过100K tokens,实际请求次数是Claude Code原生框架的数倍。

折算成API定价,真实成本大约是订阅价格的数十倍。

用通俗的话说:这就好比花200元进了自助餐厅,却直接把厨房里的龙虾池搬空了。

Anthropic的订阅制在这种「薅羊毛」式使用下,变成了一桩持续失血的赔本买卖。

2025年7月,Anthropic首次对Claude Code引入每周用量限制,2025年8月28日正式生效,预计影响不到5%的用户。这一动作,是AI订阅制历史上第一次因为算力压力而「关门」的信号。

OpenAI Codex:另一条路径的探索

在大洋彼岸的另一边,OpenAI也在探索AI编程的商业化路径。

2025年5月,OpenAI正式推出基于云的软件工程Agent——Codex,由codex-1模型(o3针对软件工程优化的版本)提供支持。此后Codex被整合进ChatGPT Plus订阅(20美元/月),并逐步形成了从20美元到200美元的多档订阅体系。

与Anthropic不同的是,OpenAI选择了一条更为开放的路线。

2026年2月,OpenAI直接聘请了OpenClaw的创始人,释放出截然不同的信号。Codex工程负责人Thibault Sottiaux明确表示,AI公司即将进入「供不应求」的阶段:

「谁拥有更多算力,谁的模型更高效,谁就能在这场竞赛中胜出——而我们两者都有。」

这两种截然不同的态度——Anthropic的「堵」与OpenAI的「疏」——为后来Coding Plan的全球博弈埋下了伏笔。

02 国内诞生:智谱GLM Coding Plan的定义者之路

智谱的战略抉择:bet on Coding

如果说海外订阅制AI编程还停留在「用户自发的薅羊毛行为」阶段,那么智谱则是第一个将其系统化、产品化为商业模式的公司。

这一决策背后,是智谱对AI竞争格局的深刻判断。

2025年,中国大模型赛道已进入白热化竞争阶段。智谱CEO唐杰在内部明确提出:「Chat之战已结束。」

他认为,单纯比拼对话能力的时代已经过去,下一个战略高地是AI与现实世界的交互能力——而编程,正是AI与现实世界交互最直接、最可验证的场景。

基于这一认知,智谱团队决定bet on Coding。

2025年7月28日,智谱推出了新一代旗舰模型GLM-4.5,首次在单个模型中实现推理、编码和智能体能力的原生融合。这一技术架构的选择意义深远:它不是为了做一个「会写代码的聊天机器人」,而是为了打造一个能真正完成复杂编程任务的智能体。

Coding+Agentic+Reasoning三位一体的范式,成为后来GLM Coding Plan的技术底座。

为什么是智谱来做这件事?

第一,智谱自2023年以来持续在开源社区和开发者生态中投入,积累了庞大的开发者用户基础。

第二,智谱作为「AI六小龙」中首家冲刺IPO的公司,迫切需要找到差异化的商业化路径——通用聊天赛道已经挤满了对手,价格战打得昏天黑地,必须找到一个新的增长引擎。

第三,智谱在GLM-4.5和GLM-4.6上实现的编程能力突破,为其提供了产品化的技术底气——手里的模型真的能打了。

2025年9月:GLM Coding Plan正式上线

2025年9月,智谱正式推出GLM Coding Plan,成为国内首个将AI编程能力打包为订阅套餐的产品。

初始定价极富攻击性:最低20元/月。智谱的宣传口号是:

「以1/7价格享受到Claude的9/10智商。」

这个定价背后是一个清晰的市场策略:以极致性价比迅速占领开发者心智。

在当时,Claude Pro的20美元/月(约140元人民币)对于国内开发者而言门槛较高,而智谱以不到其1/7的价格提供接近的性能,直接击穿了价格心理防线。

这一策略的效果立竿见影。大量国内开发者涌入注册,海外用户也开始关注。

早期促销阶段加上季度折扣,GLM Coding Plan海外版每月最低能做到3美元,一度被海外媒体称为「3美元版Claude Code」。在Reddit和Twitter上,开始出现教海外用户如何注册中国账号、用支付宝支付的教程。

智谱的这个定价决策,在当时看起来是完美的增长引擎。但它同时也埋下了一个深远的伏笔——当你的起点太低,用户的价格预期就被锁死在那个数字上了。后来每一次涨价引发的反弹,根源都在这里。

2025年10月:企业版上线与IPO冲刺

上线仅一个月后,2025年10月21日,智谱迅速推出GLM Coding Plan企业版,基于GLM-4.6模型,提供更安全、更高效、更低成本的企业级智能编程解决方案。

这一动作的时间节点并非巧合。

此时智谱正处于冲刺IPO的关键阶段。2025年12月,智谱通过港交所聆讯,成为「AI六小龙」中首家冲刺「全球大模型第一股」的企业。

在IPO前密集推出商业化产品,既是向资本市场展示收入增长潜力的必要动作,也是在为上市后的持续增长铺路。

招股书里需要一个能讲出增长故事的产品,Coding Plan就是这个故事的主角。

03 爆发与危机:从蓝海到红海

1月:算力危机的第一声警钟

进入2026年,GLM Coding Plan的用户增长远超预期。

1月,随着GLM-4.7上线,用户数量出现新一轮井喷,部分用户在高峰期开始遭遇并发限流和响应速度变慢的问题。

1月21日,智谱发布限售公告,宣布自1月23日起每日可销售量调整为原20%,原因是「用户数量增长导致算力资源阶段性紧张」。

这是Coding Plan历史上第一次「限量抢购」事件,也宣告了「低价无限供应」时代的终结。

限售公告背后的真实情况是什么?

答案在于AI算力的供给刚性。AI芯片产能高度集中于英伟达、台积电等少数企业,无法在短期内扩张。英伟达的H100和B100系列芯片交付周期长达数月,而国产GPU的性能和生态还在追赶中。

当用户量呈指数级增长时,算力供给根本跟不上。智谱做出限售决策,本质上是「两害相权取其轻」——与其让所有用户都体验差、响应慢,不如限制新增用户数量,优先保障现有用户体验。

2月12日:GLM-5发布与首次大规模提价

2月12日,智谱发布了新一代旗舰模型GLM-5。官方宣称其编程能力实现了对Claude Opus 4.5的「对齐」。在多个编程基准测试中,GLM-5的表现首次与Claude的旗舰模型站在了同一水平线上。

同步发布的还有一条重磅消息:GLM Coding Plan套餐价格进行结构性调整,取消首购优惠,整体涨幅30%起。

这是国产AI大模型的第一次大规模涨价,标志着「价格战」阶段正式结束。

涨价的原因,智谱在价格调整函中明确表述为「市场需求持续强劲增长,用户规模与调用量快速提升」,公司同步加大算力与模型优化投入以保障高负载下的服务稳定性。

资本市场对这一信号的解读极为正面。涨价公告发布后,智谱股价连续上涨,2月20日更是迎来爆发式上涨,单日涨幅超42%,市值一举达到3232亿港元。

投资者用真金白银投了票:能涨价,说明有定价权;有定价权,说明产品真的有人愿意买单。

然而,好消息之下隐藏着危机。GLM-5发布后,Coding Plan需求远超预期,上线即售罄——这在行业中颇为罕见。大量用户涌向购买页面,却发现根本买不到。社交媒体上开始出现「智谱耍猴」的调侃。

2月21日:「挨打要立正」——智谱致歉信

需求的火爆最终导致了用户体验的崩塌。大量用户在社交媒体上表达不满,核心问题集中在三个方面:

  1. 1. 规则透明度不够——用户搞不清自己买到的到底是什么
  2. 2. GLM-5灰度节奏太慢——Lite用户迟迟等不到新模型开放
  3. 3. 老用户升级机制设计粗糙——Pro用户觉得自己的权益被稀释了

2月21日晚,智谱发布了一封震动业界的致歉信,承认存在三大问题,并直言「挨打要立正」,同时公布处理和补偿方案。

致歉信发布次日(2月23日),市场给出了残酷的回应——智谱股价盘中重挫逾20%,市值蒸发近700亿港元。

涨价后限流引发用户大规模不满,让资本市场重新审视大模型企业的估值逻辑。投资者的逻辑很简单:如果涨价是用牺牲用户体验换来的,这种增长是不可持续的。

这一事件揭示了Coding Plan商业模式的一个核心矛盾:

订阅制的经济模型依赖「用户不会用满额度」的前提,但当模型能力足够强、用户真的把额度用满时,算力成本就会击穿定价。

智谱在GLM-5发布前显然低估了需求弹性——定价提了30%,用户数量反而更猛了,因为GLM-5的能力提升带来的边际价值远超价格涨幅。

用户算的是「值不值」,不是「贵不贵」。

2月中下旬:阿里、百度、腾讯、字节密集入局

就在智谱经历剧烈震荡的同时,国内其他大厂看到了巨大的市场机会,纷纷跑步入场。

2月11-12日,百度千帆推出Coding Plan,Lite版40元/月,新用户首月仅需9.9元。

2月25日,阿里云百炼推出Coding Plan,最低7.9元/月起,打包了千问Qwen3.5、智谱GLM5、Kimi K2.5、MiniMax M2.5四大国产旗舰编程模型,以「百亿补贴」式的姿态杀入市场。

同期,火山方舟(字节跳动)推出Lite 40元/月、Pro 200元/月两档套餐,首月8.91元特惠;腾讯云推出Lite 40元/月、Pro 200元/月套餐,新用户首月7.9元;MiniMax推出29元/月起的多档套餐。

短短一个月内,国内几乎所有主流AI厂商都推出了自己的Coding Plan。从智谱的一家独大,到群雄并起,市场格局发生了根本性变化。

各家的入局策略高度相似:

  • • 首月低价(7.9-9.9元)吸引用户
  • • 多模型整合降低用户迁移成本
  • • 兼容主流编程工具减少生态壁垒

这种「趋同」策略的背后逻辑很简单——先抢用户,再谈盈利。在算力还没有贵到今天这个程度之前,用户规模就是最大的护城河。

04 涨价潮与算力危机

3月:从「抢用户」到「抢算力」

进入3月,市场风向急转直下。所有厂商都发现了一个残酷的事实:

低价策略吸引来的用户太多了,多到算力根本撑不住。

3月中旬起,各家密集调整策略:

  • 腾讯云改为每天上午10点限量开放抢购,40元Lite套餐秒光
  • 阿里云3月20日停止Lite版新购,只保留200元Pro版且持续售罄,改为每天9:30限量补货。Lite版从上线到下架仅用了48天,堪称Coding Plan历史上最短命的套餐
  • 百度千帆同期售罄
  • • 3月18日,阿里云宣布AI算力和存储产品全线涨价,涨幅5%-34%
  • • 3月23日,MiniMax将Coding Plan全面升级为全球首个全模态Token Plan,变相提价

这一阶段,各家厂商的决策核心从「抢用户」彻底转向「抢算力」。

底层原因在于:中国日均Token调用量从2024年初的1000亿飙升至2026年3月的140万亿,两年增长超千倍。而AI芯片产能的扩张速度远远跟不上需求增速。

高带宽内存(HBM)存储与高端芯片处于绝对卖方市场,2026年第一季度存储价格翻倍,硬件采购及运维成本高企。

斯坦福大学发布的《2026年AI指数报告》指出,中美AI模型性能差距已基本消失,截至2026年3月美国顶尖模型仅领先中国2.7%。但算力基础设施的差距依然显著——美国拥有全球约60%的高端AI芯片部署量。

4月:第二轮提价与价格倒挂

4月8日,智谱发布GLM-5.1,同时宣布第三次提价10%。这是继2月涨30%、3月涨20%之后的第三次提价,智谱在不到两个月内完成三次调价。

与此同时,一个戏剧性的现象出现了——

智谱海外版Max套餐达160美元/月,而国内版仅469元/月(约68美元),差价超一倍。

海外开发者开始疯狂研究怎么注册微信/支付宝,来购买国区Coding Plan。Reddit上出现了详细的中文账号注册教程,评论区最高赞的回复是:

「这是我见过最离谱的价格歧视——但我是受益方。」

「价格倒挂」现象引发全球关注。在正常情况下,由于购买力差异,中国市场的定价应该低于欧美市场,但差价超过一倍的情况极为罕见。

这标志着中国AI服务在国际市场上拥有了前所未有的定价权——不是因为中国的东西便宜,而是因为中国的模型真的够好了。

4月9日,腾讯云公告将于5月9日起对AI算力相关产品调价5%。更值得注意的是,腾讯混元大模型API最高涨幅达463%,远超同期的其他厂商。这一涨幅在行业内引发震动——463%不是涨价,是重新定价。

4月13日,阿里云进一步收紧政策,连老用户的Lite套餐续费也不再接受。40元/月的入门套餐就此成为历史。

05 海外变局:订阅制的「关门」与生态博弈

Anthropic的「四个月止血」

在国内涨价潮如火如荼的同时,大洋彼岸的Anthropic也在经历一场深刻的产品路线调整。

从2026年1月到4月,Anthropic用了四个月时间,完成了对第三方工具通过订阅方式调用Claude的彻底封堵:

  • 1月,限制订阅OAuth token的外部使用,从技术层面堵住后门
  • 2月,更新服务条款,明确规定订阅账号不得用于第三方自动化工具
  • 3月,推出并强化Claude Code,用产品替代OpenClaw的核心能力
  • 4月,发邮件正式通知,彻底不允许订阅额度供给第三方工具

这场「关门」行动的核心逻辑在于:订阅制从来不是为第三方工具设计的。

罗福莉在分析中指出,订阅制能够成立的隐藏前提是「用户使用的是Anthropic自己的框架」,因为只有原生框架才能实现高效的缓存管理和上下文优化。第三方框架的低效调用,使得订阅制的成本结构彻底坍塌。

Anthropic为这场「关门」付出了代价——向订阅者提供一次性等额月费积分作为补偿,甚至允许全额退款。但公司显然认为,不封的代价更大。

用一位分析师的话说:「赔本买卖,餐厅能一直做下去才怪。」

OpenAI的反向操作:聘请OpenClaw创始人

与Anthropic截然不同,OpenAI选择了另一条路。

2026年2月,OpenAI直接聘请了OpenClaw的创始人,将其技术能力和生态资源整合进Codex体系。

4月10日,OpenAI推出100美元/月的ChatGPT Pro套餐,填补20美元与200美元之间的空档,直接对标Claude Code。

两家公司的分歧体现了两种商业模式哲学:

  • Anthropic走的是「精细化成本控制」路线——关闭一切低效的调用通道,确保订阅制经济模型的可持续性
  • OpenAI走的是「规模化扩张」路线——承接被Anthropic「赶走」的开发者需求,用更大规模的算力投入换取市场份额

用军事术语类比:Anthropic在收缩防线,OpenAI在扩张战线。

中国企业的窗口期

Anthropic的「关门」为中国AI企业打开了一个历史性的窗口期。

中国企业恰好具备更低的价格、更宽松的调用限制和更适合高频调用的API。当Anthropic开始限制使用,而OpenAI选择承接需求时,中国Coding Plan的「价格倒挂」优势就变得更加突出。

小米MiMo Token Plan的推出就是这一窗口期的典型产物。

4月3日,小米正式推出国内首家硬件厂商的订阅服务,39元/月起,无5小时限额,统一Credit体系。

硬件厂商的入场,标志着Coding Plan竞争进入了新阶段——从纯软件服务延伸到软硬一体化。小米有手机、有汽车、有米家生态,AI能力可以嵌入到硬件中,这是纯软件厂商不具备的想象空间。

06 横向对比:五家核心厂商的「活法」

当前Coding Plan赛道的主要参与者:

海外玩家(3家):Anthropic Claude Code、OpenAI ChatGPT Pro/Codex、GitHub Copilot

国内核心玩家(10家):智谱GLM、阿里云百炼、腾讯云、火山方舟、百度千帆、MiniMax、Kimi、京东云、无问芯穹、小米MiMo

以下选取五家最具代表性的厂商进行深入分析。

智谱GLM:品类定义者的「过山车之旅」

当前定价(2026年4月):国内版Lite ¥49/月、Pro ¥149/月、Max ¥469/月;海外版Max $160/月,差价超一倍。

核心优势:技术先发,GLM-5对齐Claude Opus 4.5;MCP生态优势;品牌认知锚定「品类开创者」。

核心短板:供不应求持续危机;致歉信后用户信任受损;海外版「杀熟」。

用户口碑

V2EX和知乎上大量用户抱怨「买不到」「用不上」「升级机制反人类」。一位用户评论:

「智谱做了一辆法拉利,但是加油站门口天天排长队,而且只有Max用户能优先加油。」

我的判断:智谱的困境本质上是「技术领先」与「规模化运营能力」之间的张力。从科研基因起家的公司,在模型能力上做到了极致,但在大规模商业化运营的精细化程度上明显捉襟见肘。

阿里云百炼:云计算巨头的「百亿补贴」逻辑

当前定价:Pro版原价¥200/月,新用户首购¥39.9/月,次月¥100/月,第三个月起恢复原价。Lite版已停售。

核心优势:唯一可在同一套餐内自由切换Qwen、GLM、Kimi、MiniMax四大旗舰模型;云生态协同;100+ TPS并发能力。

核心短板:运营政策混乱——取消存量用户续费权限、续费入口消失、客服推诿;平台体验参差不齐。

用户口碑

呈现出「两极撕裂」。有用户表示购买的Pro套餐「基本上处于不可用的状态」。V2EX上有用户直言:

「文档和控制台评价就是五坨屎堆一块儿了。」

我的判断:阿里云的核心竞争力在于「一个套餐用多个模型」的便利性。但最大风险是「渠道化」——如果只是「低价通道」,自身模型价值难以体现。

火山方舟:产品经理的降维打击

当前定价:Lite版¥40/月,首月¥8.91;Pro版¥200/月,首月¥49.9。

核心优势:ArkClaw工具生态闭环——唯一将自研工具与Coding Plan深度绑定的厂商;多模型聚合+Auto智能选模;兼容Anthropic原生协议。

核心短板:品牌认知滞后;文档和生态支持待完善;自研模型能力不突出。

用户口碑

总体偏向正面。一位用户写道:

「火山方舟的ArkClaw是我用过的上手最快的OpenClaw方案,从注册到跑通第一个任务只用了15分钟。」

我的判断:火山方舟不是在「卖模型」,而是在「卖解决方案」。工具捆绑创造的迁移成本,比任何价格差都更能锁定用户。时间是火山方舟的朋友。

MiniMax Token Plan:全模态的「差异化突围」

当前定价:多档套餐体系,Plus及以上套餐额外获赠视频、语音、音乐、图像等多模态模型调用额度。

核心优势:所有厂商中唯一提供全模态能力;M2系列模型TPS稳定在100+;国内外统一定价。

核心短板:模型能力不稳定,复杂任务存在「降智」问题;多模态在编程场景的刚需性存疑;生态整合度不足。

用户口碑

呈现出「性价比党最爱」的特征。一位用户评价:

「MiniMax这个价位就当是蜜雪冰城了,简单任务交给他处理就完事了。」

我的判断:MiniMax没有在「谁的代码写得好」这个维度上硬碰硬,而是通过拓展能力边界实现错位竞争。风险在于全模态是否真的是开发者的刚需。

Kimi Code:万亿参数模型的「封闭生态豪赌」

当前定价:四档会员体系,Andante ¥49/月到Allegro ¥699/月。

核心优势:国内首个万亿参数级别编程大模型;原生多模态+Agent集群方案;无5小时滚动窗口限制。

核心短板:客户端白名单限制——无法在OpenClaw、OpenCode等通用框架中使用,这是最严重的短板;客服与退款政策不友好;生态整合薄弱。

用户口碑

呈现出「模型能力强、使用体验糟」的撕裂状态。一位用户总结:

「Kimi做了一辆跑车,但告诉你只能在我们自己的赛道上开。关键是买车前不告诉你有这个限制。」

我的判断:这是典型的「苹果式豪赌」——赌的是模型能力的持续领先能否抵消工具链封闭带来的不满。如果模型优势缩小,封闭生态将成为致命弱点。

07 横纵交汇:五条路径,一个宿命

把五家厂商的起源路径放在时间线上对比,一条有趣的规律浮现出来:

智谱是「模型能力溢出→催生商业模式」。基因是「模型公司」——核心资产是技术。

阿里云是「渠道能力溢出→接入模型变现」。基因是「渠道公司」——核心资产是通道。

火山方舟是「产品能力溢出→捆绑模型服务」。基因是「解决方案公司」——核心资产是工具链。

MiniMax是「模型能力不占优→差异化突围」。基因是「场景公司」——核心资产是特定场景的适配能力。

Kimi是「模型能力极强→封闭生态锁客」。基因是「产品公司」——核心资产是模型本身。

这五条不同的起源路径,决定了今天各自的优劣势结构,也决定了它们在面对「算力饥荒」这个共同宿命时的不同挣扎方式。

智谱:先行者为什么总是最疼的那个

智谱今天在牌桌上的位置很微妙。论技术,GLM-5确实对齐了Claude Opus 4.5;论品牌,是「大模型第一股」。但论处境,从限售、致歉到三次涨价,智谱像是那个最先冲过终点线、却发现领奖台还没搭好的运动员。

答案要回到2025年9月那个定价决策。

当智谱决定以「20元/月、1/7价格、9/10智商」切入市场时,它做了一个在当时无比正确的选择。但同一个决策,在算力成本爆炸的今天变成了枷锁。

这里有一个关键机制被严重低估了:包月模式会彻底改变用户行为。

API按量付费时,开发者每次调用都在心里算账。但订阅制把边际成本降到了零,用户会毫无节制地调用。智谱在定价时可能用的是「API调用量×某个系数」来估算成本,但真实情况是「API调用量×N倍」——这个N,就是行为弹性带来的乘数效应。

更致命的是,低价锚定一旦形成,用户的价格预期就被锁死了。

「你本来卖20块,现在卖469块,凭什么?」——这种反弹不是因为469块真的贵,是因为起点太低了。

所以智谱今天的困境,是技术先行者必然撞上的算力之墙。第一个吃螃蟹的人定义了市场的价格基准,也第一个承受了价格基准被成本击穿的反噬。

阿里云:平台基因的诅咒

阿里云百炼最突出的标签是「多模型聚合」。这个定位太阿里云了。

阿里云从诞生第一天起做的就是基础设施,核心能力是调度资源、整合生态、提供通道。所以当它决定进Coding Plan赛道时,最自然的姿势就是:把各家模型接进来,我当收费站。

这个姿势在商业上极其舒服。但舒服的姿势往往藏着未来的隐患。

Lite版48天下架、续费入口消失、客服推诿——这些不是偶然的执行失误,而是平台思维与订阅服务逻辑的结构性冲突。

平台思维追求规则统一、批量处理;但Coding Plan这种高粘性订阅服务,用户要的是灵活的政策解释和个性化的问题解决。

当阿里云用平台思维处理「要不要给老用户续费Lite版」时,系统逻辑说「产品已下架,自动关闭续费入口」,但用户的感受是「单方违约、店大欺客」。

阿里云没有做错任何一个SOP步骤,但整体效果是灾难性的。这是大厂做精细化服务的经典困境——流程是对的,结果是错的。

火山方舟:产品经理的降维打击

火山方舟最核心的差异化是ArkClaw。这个功能在2月刚推出时看起来只是个小便利,但放到4月的竞争格局里看,它已经变成了火山方舟最坚固的护城河。

为什么?因为工具捆绑创造的不是价格优势(价格随时可以被模仿),不是技术优势(模型差距迟早会被追平),而是迁移成本。

一个用惯了ArkClaw+火山方舟的开发者,要迁移到另一个平台,不只是换个订阅套餐——要重新学习工具链,重新配置开发环境,重新适应工作流。

这种迁移成本,比任何价格差都更能锁定用户。

字节的基因在这里发挥了关键作用。当其他厂商都在卷「我的模型比你强」「我的价格比你低」时,火山方舟的产品经理问了一个不同的问题:用户用Coding Plan最大的障碍是什么?

答案是部署太麻烦。于是ArkClaw应运而生。

这不是惊天动地的技术创新,这是产品思维对技术思维和渠道思维的降维打击。

08 三个剧本

基于横纵交汇的判断,未来3-6个月有三个可能的剧本。

剧本一:算力决定论(最可能,概率约60%)

Coding Plan的竞争最终会收敛到「谁有算力谁说话」。

阿里云、腾讯云这些云计算厂商会逐渐占据主导——它们可以在算力采购上获得规模优势,可以用其他业务的利润补贴价格战。

独立模型厂商将面临持续的算力成本压力。选择只有两个:被收购,或转型为纯模型提供商。

剧本二:信任崩塌(最危险,概率约25%)

如果各厂商继续在涨价、限购、停售、客服推诿上透支用户信任,Coding Plan可能重蹈共享单车的覆辙——用户对整个品类本身失去信心。

危险信号已经在闪烁:智谱的致歉信、阿里云的续费风波、Kimi的零消耗不退款。

当用户形成「反正买不到/买到了也用不爽/用爽了也会涨价」的集体认知时,他们会退回按量付费的API,或降低AI依赖。

剧本三:差异化共生(最乐观,概率约15%)

如果算力供给在下半年得到改善,各厂商有余力深耕差异化,Coding Plan市场可能形成多个定位共存的生态——

智谱守住高端开发者,阿里云/腾讯云成为企业级标配,火山方舟成为工具生态代名词,MiniMax在多模态场景建立壁垒,Kimi成为「Coding Plan中的苹果」。

这个剧本的前提是算力不再稀缺。只要算力还卡着脖子,差异化就是奢侈品。

终局猜想

横纵交汇之后,一个更深层的判断浮现出来:

Coding Plan赛道的终局,不取决于哪家的模型更强、哪家的价格更低、哪家的运营更精细,而取决于一个结构性的矛盾——AI算力的指数级需求增长与线性供给扩张之间的根本张力。

只要这个矛盾不解开,所有厂商都将在「涨价-用户反弹-限购-用户流失」的循环里打转。

涨价是止血,反弹是放血,限购是截肢。没有一家能全身而退。

想起石油工业早期的一个细节:19世纪末,洛克菲勒的标准石油公司最核心的竞争力不是炼油技术,是对铁路运力的控制。谁能把石油从油田运到炼油厂,谁就掌握了定价权。

今天的算力,就是AI时代的铁路。

真正决定Coding Plan未来的,不是产品经理的微创新,不是营销团队的定价策略,不是CEO的公开信,而是那些发生在台积电的晶圆厂、英伟达的封装产线、阿里云的数据中心里的缓慢而坚实的变化。

当算力不再稀缺,今天的种种荒诞——秒杀抢购、价格倒挂、朝令夕改——都会成为未来开发者茶余饭后的笑谈。

而在那之前,我们能做的,就是在这片算力饥渴的土地上,继续见证Coding Plan的阵痛与进化。

历史不会重复,但会押韵。这次的韵脚,叫算力。

本文基于公开信息和行业报告撰写,数据截至2026年4月。文中引用的用户评论来自V2EX、知乎、Reddit等公开社区。部分早期时间节点(如Claude Code 2025年6月纳入Pro计划)标注为「待进一步核实」,欢迎知情读者指正。

 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON