Coding Plan 深度研究报告:算力饥荒年代的诞生、爆发与阵痛

Coding Plan 深度研究报告：算力饥荒年代的诞生、爆发与阵痛

翻开Coding Plan这一年的历史账本，最让我震撼的不是某家公司的技术突破，也不是某次涨价引发的舆论风暴，而是一个简单到容易被忽略的事实：

中国日均Token调用量从2024年初的1000亿飙升至2026年3月的140万亿。

两年，一千四百倍。

这个数字背后藏着一个残酷的真相：AI编程这件事，我们不是「想用」，是「已经离不开了」。而一旦离不开，算力就从技术问题变成了政治经济学问题——谁有芯片、谁有产能、谁能把成本压到别人扛不住的点——这些才是终局的关键变量。

「Coding Plan」这个概念，2025年下半年才正式进入中国开发者的视野。短短不到一年，它从一个前沿产品形态演变为一场席卷整个AI编程领域的产业浪潮。

本质上，它是大模型厂商面向编程场景推出的订阅制API服务，以「固定月费+调用配额」取代传统的按Token计费模式，让开发者可以在Claude Code、Cursor、Cline等主流编程工具中以可控成本调用大模型能力。

但这场浪潮的源头，要追溯到更早的海外探索。而它的演进轨迹，深刻揭示了AI商业化的核心矛盾：算力成本的高企与用户需求的指数级增长之间的永恒张力。

这篇文章将沿着时间轴完整还原Coding Plan从概念萌芽到全球博弈的全过程，剖开2026年4月这个时间切面上的竞争格局，并在最后给出我的判断。

全文约17000字，建议收藏后阅读。

01 史前时代：订阅制AI编程的海外探索

问题的提出：按量付费的「账单焦虑」

在Coding Plan出现之前，开发者使用AI编程助手的主流方式是API按量付费。2024年至2025年上半年，随着Claude Code、Cursor、Cline等工具迅速普及，一个尖锐的问题浮出水面——API账单失控。

开发者很快发现，在Claude Code或Cline中，一次看似简单的用户prompt，背后会触发5到30次API请求，每次请求又可能携带数万到数十万Token的上下文。

按量付费模式下，一个月下来的账单轻松突破千元，重度使用者甚至达到数千美元。硅谷的开发者社区里开始流传各种「天价账单」的截图，有人惊呼「我这个月烧掉了一台MacBook Pro」。

这种「用多少付多少」的模式虽然理论上公平，却带来了极大的成本不确定性和心理负担。开发者不敢放开使用AI能力，每次调用都在心里默默计算「这句话又烧了多少钱」。

更糟糕的是，API账单是按月结算的——这意味着你可能在月底收到一张远超预期的账单，而你对此毫无准备。

Claude Code：订阅制的第一个实验场

面对API账单失控的困境，开发者们开始寻找替代方案。一个「取巧」的用法悄然流传：

将Claude的通用订阅账号通过第三方框架接入编程工具。

Claude Pro套餐定价20美元/月，Max套餐100-200美元/月。如果能够通过订阅方式无限调用Claude Code，成本将大幅低于API按量付费。

这并非Anthropic最初的设计意图。Claude的订阅制是为轻度用户设计的——用户偶尔问问问题、写写代码，消耗是可控的。订阅制的核心经济模型是「轻度用户补贴重度用户」，大多数人的平均用量不会太高，整体盈亏平衡。

但第三方框架的介入彻底改变了这个等式。

以OpenClaw为代表的工具可以将Agent 7×24小时运行，无限循环调用，同时跑多个任务。更致命的是，第三方框架的上下文管理和缓存效率极差。

小米MiMo大模型负责人罗福莉在分析中指出：OpenClaw在单次用户查询中会触发多轮低价值工具调用，每轮作为独立API请求发出，每个请求携带的上下文窗口往往超过100K tokens，实际请求次数是Claude Code原生框架的数倍。

折算成API定价，真实成本大约是订阅价格的数十倍。

用通俗的话说：这就好比花200元进了自助餐厅，却直接把厨房里的龙虾池搬空了。

Anthropic的订阅制在这种「薅羊毛」式使用下，变成了一桩持续失血的赔本买卖。

2025年7月，Anthropic首次对Claude Code引入每周用量限制，2025年8月28日正式生效，预计影响不到5%的用户。这一动作，是AI订阅制历史上第一次因为算力压力而「关门」的信号。

OpenAI Codex：另一条路径的探索

在大洋彼岸的另一边，OpenAI也在探索AI编程的商业化路径。

2025年5月，OpenAI正式推出基于云的软件工程Agent——Codex，由codex-1模型（o3针对软件工程优化的版本）提供支持。此后Codex被整合进ChatGPT Plus订阅（20美元/月），并逐步形成了从20美元到200美元的多档订阅体系。

与Anthropic不同的是，OpenAI选择了一条更为开放的路线。

2026年2月，OpenAI直接聘请了OpenClaw的创始人，释放出截然不同的信号。Codex工程负责人Thibault Sottiaux明确表示，AI公司即将进入「供不应求」的阶段：

「谁拥有更多算力，谁的模型更高效，谁就能在这场竞赛中胜出——而我们两者都有。」

这两种截然不同的态度——Anthropic的「堵」与OpenAI的「疏」——为后来Coding Plan的全球博弈埋下了伏笔。

02 国内诞生：智谱GLM Coding Plan的定义者之路

智谱的战略抉择：bet on Coding

如果说海外订阅制AI编程还停留在「用户自发的薅羊毛行为」阶段，那么智谱则是第一个将其系统化、产品化为商业模式的公司。

这一决策背后，是智谱对AI竞争格局的深刻判断。

2025年，中国大模型赛道已进入白热化竞争阶段。智谱CEO唐杰在内部明确提出：「Chat之战已结束。」

他认为，单纯比拼对话能力的时代已经过去，下一个战略高地是AI与现实世界的交互能力——而编程，正是AI与现实世界交互最直接、最可验证的场景。

基于这一认知，智谱团队决定bet on Coding。

2025年7月28日，智谱推出了新一代旗舰模型GLM-4.5，首次在单个模型中实现推理、编码和智能体能力的原生融合。这一技术架构的选择意义深远：它不是为了做一个「会写代码的聊天机器人」，而是为了打造一个能真正完成复杂编程任务的智能体。

Coding+Agentic+Reasoning三位一体的范式，成为后来GLM Coding Plan的技术底座。

为什么是智谱来做这件事？

第一，智谱自2023年以来持续在开源社区和开发者生态中投入，积累了庞大的开发者用户基础。

第二，智谱作为「AI六小龙」中首家冲刺IPO的公司，迫切需要找到差异化的商业化路径——通用聊天赛道已经挤满了对手，价格战打得昏天黑地，必须找到一个新的增长引擎。

第三，智谱在GLM-4.5和GLM-4.6上实现的编程能力突破，为其提供了产品化的技术底气——手里的模型真的能打了。

2025年9月：GLM Coding Plan正式上线

2025年9月，智谱正式推出GLM Coding Plan，成为国内首个将AI编程能力打包为订阅套餐的产品。

初始定价极富攻击性：最低20元/月。智谱的宣传口号是：

「以1/7价格享受到Claude的9/10智商。」

这个定价背后是一个清晰的市场策略：以极致性价比迅速占领开发者心智。

在当时，Claude Pro的20美元/月（约140元人民币）对于国内开发者而言门槛较高，而智谱以不到其1/7的价格提供接近的性能，直接击穿了价格心理防线。

这一策略的效果立竿见影。大量国内开发者涌入注册，海外用户也开始关注。

早期促销阶段加上季度折扣，GLM Coding Plan海外版每月最低能做到3美元，一度被海外媒体称为「3美元版Claude Code」。在Reddit和Twitter上，开始出现教海外用户如何注册中国账号、用支付宝支付的教程。

智谱的这个定价决策，在当时看起来是完美的增长引擎。但它同时也埋下了一个深远的伏笔——当你的起点太低，用户的价格预期就被锁死在那个数字上了。后来每一次涨价引发的反弹，根源都在这里。

2025年10月：企业版上线与IPO冲刺

上线仅一个月后，2025年10月21日，智谱迅速推出GLM Coding Plan企业版，基于GLM-4.6模型，提供更安全、更高效、更低成本的企业级智能编程解决方案。

这一动作的时间节点并非巧合。

此时智谱正处于冲刺IPO的关键阶段。2025年12月，智谱通过港交所聆讯，成为「AI六小龙」中首家冲刺「全球大模型第一股」的企业。

在IPO前密集推出商业化产品，既是向资本市场展示收入增长潜力的必要动作，也是在为上市后的持续增长铺路。

招股书里需要一个能讲出增长故事的产品，Coding Plan就是这个故事的主角。

03 爆发与危机：从蓝海到红海

1月：算力危机的第一声警钟

进入2026年，GLM Coding Plan的用户增长远超预期。

1月，随着GLM-4.7上线，用户数量出现新一轮井喷，部分用户在高峰期开始遭遇并发限流和响应速度变慢的问题。

1月21日，智谱发布限售公告，宣布自1月23日起每日可销售量调整为原20%，原因是「用户数量增长导致算力资源阶段性紧张」。

这是Coding Plan历史上第一次「限量抢购」事件，也宣告了「低价无限供应」时代的终结。

限售公告背后的真实情况是什么？

答案在于AI算力的供给刚性。AI芯片产能高度集中于英伟达、台积电等少数企业，无法在短期内扩张。英伟达的H100和B100系列芯片交付周期长达数月，而国产GPU的性能和生态还在追赶中。

当用户量呈指数级增长时，算力供给根本跟不上。智谱做出限售决策，本质上是「两害相权取其轻」——与其让所有用户都体验差、响应慢，不如限制新增用户数量，优先保障现有用户体验。

2月12日：GLM-5发布与首次大规模提价

2月12日，智谱发布了新一代旗舰模型GLM-5。官方宣称其编程能力实现了对Claude Opus 4.5的「对齐」。在多个编程基准测试中，GLM-5的表现首次与Claude的旗舰模型站在了同一水平线上。

同步发布的还有一条重磅消息：GLM Coding Plan套餐价格进行结构性调整，取消首购优惠，整体涨幅30%起。

这是国产AI大模型的第一次大规模涨价，标志着「价格战」阶段正式结束。

涨价的原因，智谱在价格调整函中明确表述为「市场需求持续强劲增长，用户规模与调用量快速提升」，公司同步加大算力与模型优化投入以保障高负载下的服务稳定性。

资本市场对这一信号的解读极为正面。涨价公告发布后，智谱股价连续上涨，2月20日更是迎来爆发式上涨，单日涨幅超42%，市值一举达到3232亿港元。

投资者用真金白银投了票：能涨价，说明有定价权；有定价权，说明产品真的有人愿意买单。

然而，好消息之下隐藏着危机。GLM-5发布后，Coding Plan需求远超预期，上线即售罄——这在行业中颇为罕见。大量用户涌向购买页面，却发现根本买不到。社交媒体上开始出现「智谱耍猴」的调侃。

2月21日：「挨打要立正」——智谱致歉信

需求的火爆最终导致了用户体验的崩塌。大量用户在社交媒体上表达不满，核心问题集中在三个方面：

1. 规则透明度不够——用户搞不清自己买到的到底是什么
2. GLM-5灰度节奏太慢——Lite用户迟迟等不到新模型开放
3. 老用户升级机制设计粗糙——Pro用户觉得自己的权益被稀释了

2月21日晚，智谱发布了一封震动业界的致歉信，承认存在三大问题，并直言「挨打要立正」，同时公布处理和补偿方案。

致歉信发布次日（2月23日），市场给出了残酷的回应——智谱股价盘中重挫逾20%，市值蒸发近700亿港元。

涨价后限流引发用户大规模不满，让资本市场重新审视大模型企业的估值逻辑。投资者的逻辑很简单：如果涨价是用牺牲用户体验换来的，这种增长是不可持续的。

这一事件揭示了Coding Plan商业模式的一个核心矛盾：

订阅制的经济模型依赖「用户不会用满额度」的前提，但当模型能力足够强、用户真的把额度用满时，算力成本就会击穿定价。

智谱在GLM-5发布前显然低估了需求弹性——定价提了30%，用户数量反而更猛了，因为GLM-5的能力提升带来的边际价值远超价格涨幅。

用户算的是「值不值」，不是「贵不贵」。

2月中下旬：阿里、百度、腾讯、字节密集入局

就在智谱经历剧烈震荡的同时，国内其他大厂看到了巨大的市场机会，纷纷跑步入场。

2月11-12日，百度千帆推出Coding Plan，Lite版40元/月，新用户首月仅需9.9元。

2月25日，阿里云百炼推出Coding Plan，最低7.9元/月起，打包了千问Qwen3.5、智谱GLM5、Kimi K2.5、MiniMax M2.5四大国产旗舰编程模型，以「百亿补贴」式的姿态杀入市场。

同期，火山方舟（字节跳动）推出Lite 40元/月、Pro 200元/月两档套餐，首月8.91元特惠；腾讯云推出Lite 40元/月、Pro 200元/月套餐，新用户首月7.9元；MiniMax推出29元/月起的多档套餐。

短短一个月内，国内几乎所有主流AI厂商都推出了自己的Coding Plan。从智谱的一家独大，到群雄并起，市场格局发生了根本性变化。

各家的入局策略高度相似：

• 首月低价（7.9-9.9元）吸引用户
• 多模型整合降低用户迁移成本
• 兼容主流编程工具减少生态壁垒

这种「趋同」策略的背后逻辑很简单——先抢用户，再谈盈利。在算力还没有贵到今天这个程度之前，用户规模就是最大的护城河。

04 涨价潮与算力危机

3月：从「抢用户」到「抢算力」

进入3月，市场风向急转直下。所有厂商都发现了一个残酷的事实：

低价策略吸引来的用户太多了，多到算力根本撑不住。

3月中旬起，各家密集调整策略：

•腾讯云改为每天上午10点限量开放抢购，40元Lite套餐秒光
•阿里云3月20日停止Lite版新购，只保留200元Pro版且持续售罄，改为每天9:30限量补货。Lite版从上线到下架仅用了48天，堪称Coding Plan历史上最短命的套餐
•百度千帆同期售罄
• 3月18日，阿里云宣布AI算力和存储产品全线涨价，涨幅5%-34%
• 3月23日，MiniMax将Coding Plan全面升级为全球首个全模态Token Plan，变相提价

这一阶段，各家厂商的决策核心从「抢用户」彻底转向「抢算力」。

底层原因在于：中国日均Token调用量从2024年初的1000亿飙升至2026年3月的140万亿，两年增长超千倍。而AI芯片产能的扩张速度远远跟不上需求增速。

高带宽内存（HBM）存储与高端芯片处于绝对卖方市场，2026年第一季度存储价格翻倍，硬件采购及运维成本高企。

斯坦福大学发布的《2026年AI指数报告》指出，中美AI模型性能差距已基本消失，截至2026年3月美国顶尖模型仅领先中国2.7%。但算力基础设施的差距依然显著——美国拥有全球约60%的高端AI芯片部署量。

4月：第二轮提价与价格倒挂

4月8日，智谱发布GLM-5.1，同时宣布第三次提价10%。这是继2月涨30%、3月涨20%之后的第三次提价，智谱在不到两个月内完成三次调价。

与此同时，一个戏剧性的现象出现了——

智谱海外版Max套餐达160美元/月，而国内版仅469元/月（约68美元），差价超一倍。

海外开发者开始疯狂研究怎么注册微信/支付宝，来购买国区Coding Plan。Reddit上出现了详细的中文账号注册教程，评论区最高赞的回复是：

「这是我见过最离谱的价格歧视——但我是受益方。」

「价格倒挂」现象引发全球关注。在正常情况下，由于购买力差异，中国市场的定价应该低于欧美市场，但差价超过一倍的情况极为罕见。

这标志着中国AI服务在国际市场上拥有了前所未有的定价权——不是因为中国的东西便宜，而是因为中国的模型真的够好了。

4月9日，腾讯云公告将于5月9日起对AI算力相关产品调价5%。更值得注意的是，腾讯混元大模型API最高涨幅达463%，远超同期的其他厂商。这一涨幅在行业内引发震动——463%不是涨价，是重新定价。

4月13日，阿里云进一步收紧政策，连老用户的Lite套餐续费也不再接受。40元/月的入门套餐就此成为历史。

05 海外变局：订阅制的「关门」与生态博弈

Anthropic的「四个月止血」

在国内涨价潮如火如荼的同时，大洋彼岸的Anthropic也在经历一场深刻的产品路线调整。

从2026年1月到4月，Anthropic用了四个月时间，完成了对第三方工具通过订阅方式调用Claude的彻底封堵：

•1月，限制订阅OAuth token的外部使用，从技术层面堵住后门
•2月，更新服务条款，明确规定订阅账号不得用于第三方自动化工具
•3月，推出并强化Claude Code，用产品替代OpenClaw的核心能力
•4月，发邮件正式通知，彻底不允许订阅额度供给第三方工具

这场「关门」行动的核心逻辑在于：订阅制从来不是为第三方工具设计的。

罗福莉在分析中指出，订阅制能够成立的隐藏前提是「用户使用的是Anthropic自己的框架」，因为只有原生框架才能实现高效的缓存管理和上下文优化。第三方框架的低效调用，使得订阅制的成本结构彻底坍塌。

Anthropic为这场「关门」付出了代价——向订阅者提供一次性等额月费积分作为补偿，甚至允许全额退款。但公司显然认为，不封的代价更大。

用一位分析师的话说：「赔本买卖，餐厅能一直做下去才怪。」

OpenAI的反向操作：聘请OpenClaw创始人

与Anthropic截然不同，OpenAI选择了另一条路。

2026年2月，OpenAI直接聘请了OpenClaw的创始人，将其技术能力和生态资源整合进Codex体系。

4月10日，OpenAI推出100美元/月的ChatGPT Pro套餐，填补20美元与200美元之间的空档，直接对标Claude Code。

两家公司的分歧体现了两种商业模式哲学：

•Anthropic走的是「精细化成本控制」路线——关闭一切低效的调用通道，确保订阅制经济模型的可持续性
•OpenAI走的是「规模化扩张」路线——承接被Anthropic「赶走」的开发者需求，用更大规模的算力投入换取市场份额

用军事术语类比：Anthropic在收缩防线，OpenAI在扩张战线。

中国企业的窗口期

Anthropic的「关门」为中国AI企业打开了一个历史性的窗口期。

中国企业恰好具备更低的价格、更宽松的调用限制和更适合高频调用的API。当Anthropic开始限制使用，而OpenAI选择承接需求时，中国Coding Plan的「价格倒挂」优势就变得更加突出。

小米MiMo Token Plan的推出就是这一窗口期的典型产物。

4月3日，小米正式推出国内首家硬件厂商的订阅服务，39元/月起，无5小时限额，统一Credit体系。

硬件厂商的入场，标志着Coding Plan竞争进入了新阶段——从纯软件服务延伸到软硬一体化。小米有手机、有汽车、有米家生态，AI能力可以嵌入到硬件中，这是纯软件厂商不具备的想象空间。

06 横向对比：五家核心厂商的「活法」

当前Coding Plan赛道的主要参与者：

海外玩家（3家）：Anthropic Claude Code、OpenAI ChatGPT Pro/Codex、GitHub Copilot

国内核心玩家（10家）：智谱GLM、阿里云百炼、腾讯云、火山方舟、百度千帆、MiniMax、Kimi、京东云、无问芯穹、小米MiMo

以下选取五家最具代表性的厂商进行深入分析。

智谱GLM：品类定义者的「过山车之旅」

当前定价（2026年4月）：国内版Lite ¥49/月、Pro ¥149/月、Max ¥469/月；海外版Max $160/月，差价超一倍。

核心优势：技术先发，GLM-5对齐Claude Opus 4.5；MCP生态优势；品牌认知锚定「品类开创者」。

核心短板：供不应求持续危机；致歉信后用户信任受损；海外版「杀熟」。

用户口碑：

V2EX和知乎上大量用户抱怨「买不到」「用不上」「升级机制反人类」。一位用户评论：

「智谱做了一辆法拉利，但是加油站门口天天排长队，而且只有Max用户能优先加油。」

我的判断：智谱的困境本质上是「技术领先」与「规模化运营能力」之间的张力。从科研基因起家的公司，在模型能力上做到了极致，但在大规模商业化运营的精细化程度上明显捉襟见肘。

阿里云百炼：云计算巨头的「百亿补贴」逻辑

当前定价：Pro版原价¥200/月，新用户首购¥39.9/月，次月¥100/月，第三个月起恢复原价。Lite版已停售。

核心优势：唯一可在同一套餐内自由切换Qwen、GLM、Kimi、MiniMax四大旗舰模型；云生态协同；100+ TPS并发能力。

核心短板：运营政策混乱——取消存量用户续费权限、续费入口消失、客服推诿；平台体验参差不齐。

用户口碑：

呈现出「两极撕裂」。有用户表示购买的Pro套餐「基本上处于不可用的状态」。V2EX上有用户直言：

「文档和控制台评价就是五坨屎堆一块儿了。」

我的判断：阿里云的核心竞争力在于「一个套餐用多个模型」的便利性。但最大风险是「渠道化」——如果只是「低价通道」，自身模型价值难以体现。

火山方舟：产品经理的降维打击

当前定价：Lite版¥40/月，首月¥8.91；Pro版¥200/月，首月¥49.9。

核心优势：ArkClaw工具生态闭环——唯一将自研工具与Coding Plan深度绑定的厂商；多模型聚合+Auto智能选模；兼容Anthropic原生协议。

核心短板：品牌认知滞后；文档和生态支持待完善；自研模型能力不突出。

用户口碑：

总体偏向正面。一位用户写道：

「火山方舟的ArkClaw是我用过的上手最快的OpenClaw方案，从注册到跑通第一个任务只用了15分钟。」

我的判断：火山方舟不是在「卖模型」，而是在「卖解决方案」。工具捆绑创造的迁移成本，比任何价格差都更能锁定用户。时间是火山方舟的朋友。

MiniMax Token Plan：全模态的「差异化突围」

当前定价：多档套餐体系，Plus及以上套餐额外获赠视频、语音、音乐、图像等多模态模型调用额度。

核心优势：所有厂商中唯一提供全模态能力；M2系列模型TPS稳定在100+；国内外统一定价。

核心短板：模型能力不稳定，复杂任务存在「降智」问题；多模态在编程场景的刚需性存疑；生态整合度不足。

用户口碑：

呈现出「性价比党最爱」的特征。一位用户评价：

「MiniMax这个价位就当是蜜雪冰城了，简单任务交给他处理就完事了。」

我的判断：MiniMax没有在「谁的代码写得好」这个维度上硬碰硬，而是通过拓展能力边界实现错位竞争。风险在于全模态是否真的是开发者的刚需。

Kimi Code：万亿参数模型的「封闭生态豪赌」

当前定价：四档会员体系，Andante ¥49/月到Allegro ¥699/月。

核心优势：国内首个万亿参数级别编程大模型；原生多模态+Agent集群方案；无5小时滚动窗口限制。

核心短板：客户端白名单限制——无法在OpenClaw、OpenCode等通用框架中使用，这是最严重的短板；客服与退款政策不友好；生态整合薄弱。

用户口碑：

呈现出「模型能力强、使用体验糟」的撕裂状态。一位用户总结：

「Kimi做了一辆跑车，但告诉你只能在我们自己的赛道上开。关键是买车前不告诉你有这个限制。」

我的判断：这是典型的「苹果式豪赌」——赌的是模型能力的持续领先能否抵消工具链封闭带来的不满。如果模型优势缩小，封闭生态将成为致命弱点。

07 横纵交汇：五条路径，一个宿命

把五家厂商的起源路径放在时间线上对比，一条有趣的规律浮现出来：

智谱是「模型能力溢出→催生商业模式」。基因是「模型公司」——核心资产是技术。

阿里云是「渠道能力溢出→接入模型变现」。基因是「渠道公司」——核心资产是通道。

火山方舟是「产品能力溢出→捆绑模型服务」。基因是「解决方案公司」——核心资产是工具链。

MiniMax是「模型能力不占优→差异化突围」。基因是「场景公司」——核心资产是特定场景的适配能力。

Kimi是「模型能力极强→封闭生态锁客」。基因是「产品公司」——核心资产是模型本身。

这五条不同的起源路径，决定了今天各自的优劣势结构，也决定了它们在面对「算力饥荒」这个共同宿命时的不同挣扎方式。

智谱：先行者为什么总是最疼的那个

智谱今天在牌桌上的位置很微妙。论技术，GLM-5确实对齐了Claude Opus 4.5；论品牌，是「大模型第一股」。但论处境，从限售、致歉到三次涨价，智谱像是那个最先冲过终点线、却发现领奖台还没搭好的运动员。

答案要回到2025年9月那个定价决策。

当智谱决定以「20元/月、1/7价格、9/10智商」切入市场时，它做了一个在当时无比正确的选择。但同一个决策，在算力成本爆炸的今天变成了枷锁。

这里有一个关键机制被严重低估了：包月模式会彻底改变用户行为。

API按量付费时，开发者每次调用都在心里算账。但订阅制把边际成本降到了零，用户会毫无节制地调用。智谱在定价时可能用的是「API调用量×某个系数」来估算成本，但真实情况是「API调用量×N倍」——这个N，就是行为弹性带来的乘数效应。

更致命的是，低价锚定一旦形成，用户的价格预期就被锁死了。

「你本来卖20块，现在卖469块，凭什么？」——这种反弹不是因为469块真的贵，是因为起点太低了。

所以智谱今天的困境，是技术先行者必然撞上的算力之墙。第一个吃螃蟹的人定义了市场的价格基准，也第一个承受了价格基准被成本击穿的反噬。

阿里云：平台基因的诅咒

阿里云百炼最突出的标签是「多模型聚合」。这个定位太阿里云了。

阿里云从诞生第一天起做的就是基础设施，核心能力是调度资源、整合生态、提供通道。所以当它决定进Coding Plan赛道时，最自然的姿势就是：把各家模型接进来，我当收费站。

这个姿势在商业上极其舒服。但舒服的姿势往往藏着未来的隐患。

Lite版48天下架、续费入口消失、客服推诿——这些不是偶然的执行失误，而是平台思维与订阅服务逻辑的结构性冲突。

平台思维追求规则统一、批量处理；但Coding Plan这种高粘性订阅服务，用户要的是灵活的政策解释和个性化的问题解决。

当阿里云用平台思维处理「要不要给老用户续费Lite版」时，系统逻辑说「产品已下架，自动关闭续费入口」，但用户的感受是「单方违约、店大欺客」。

阿里云没有做错任何一个SOP步骤，但整体效果是灾难性的。这是大厂做精细化服务的经典困境——流程是对的，结果是错的。

火山方舟：产品经理的降维打击

火山方舟最核心的差异化是ArkClaw。这个功能在2月刚推出时看起来只是个小便利，但放到4月的竞争格局里看，它已经变成了火山方舟最坚固的护城河。

为什么？因为工具捆绑创造的不是价格优势（价格随时可以被模仿），不是技术优势（模型差距迟早会被追平），而是迁移成本。

一个用惯了ArkClaw+火山方舟的开发者，要迁移到另一个平台，不只是换个订阅套餐——要重新学习工具链，重新配置开发环境，重新适应工作流。

这种迁移成本，比任何价格差都更能锁定用户。

字节的基因在这里发挥了关键作用。当其他厂商都在卷「我的模型比你强」「我的价格比你低」时，火山方舟的产品经理问了一个不同的问题：用户用Coding Plan最大的障碍是什么？

答案是部署太麻烦。于是ArkClaw应运而生。

这不是惊天动地的技术创新，这是产品思维对技术思维和渠道思维的降维打击。

08 三个剧本

基于横纵交汇的判断，未来3-6个月有三个可能的剧本。

剧本一：算力决定论（最可能，概率约60%）

Coding Plan的竞争最终会收敛到「谁有算力谁说话」。

阿里云、腾讯云这些云计算厂商会逐渐占据主导——它们可以在算力采购上获得规模优势，可以用其他业务的利润补贴价格战。

独立模型厂商将面临持续的算力成本压力。选择只有两个：被收购，或转型为纯模型提供商。

剧本二：信任崩塌（最危险，概率约25%）

如果各厂商继续在涨价、限购、停售、客服推诿上透支用户信任，Coding Plan可能重蹈共享单车的覆辙——用户对整个品类本身失去信心。

危险信号已经在闪烁：智谱的致歉信、阿里云的续费风波、Kimi的零消耗不退款。

当用户形成「反正买不到/买到了也用不爽/用爽了也会涨价」的集体认知时，他们会退回按量付费的API，或降低AI依赖。

剧本三：差异化共生（最乐观，概率约15%）

如果算力供给在下半年得到改善，各厂商有余力深耕差异化，Coding Plan市场可能形成多个定位共存的生态——

智谱守住高端开发者，阿里云/腾讯云成为企业级标配，火山方舟成为工具生态代名词，MiniMax在多模态场景建立壁垒，Kimi成为「Coding Plan中的苹果」。

这个剧本的前提是算力不再稀缺。只要算力还卡着脖子，差异化就是奢侈品。

终局猜想

横纵交汇之后，一个更深层的判断浮现出来：

Coding Plan赛道的终局，不取决于哪家的模型更强、哪家的价格更低、哪家的运营更精细，而取决于一个结构性的矛盾——AI算力的指数级需求增长与线性供给扩张之间的根本张力。

只要这个矛盾不解开，所有厂商都将在「涨价-用户反弹-限购-用户流失」的循环里打转。

涨价是止血，反弹是放血，限购是截肢。没有一家能全身而退。

想起石油工业早期的一个细节：19世纪末，洛克菲勒的标准石油公司最核心的竞争力不是炼油技术，是对铁路运力的控制。谁能把石油从油田运到炼油厂，谁就掌握了定价权。

今天的算力，就是AI时代的铁路。

真正决定Coding Plan未来的，不是产品经理的微创新，不是营销团队的定价策略，不是CEO的公开信，而是那些发生在台积电的晶圆厂、英伟达的封装产线、阿里云的数据中心里的缓慢而坚实的变化。

当算力不再稀缺，今天的种种荒诞——秒杀抢购、价格倒挂、朝令夕改——都会成为未来开发者茶余饭后的笑谈。

而在那之前，我们能做的，就是在这片算力饥渴的土地上，继续见证Coding Plan的阵痛与进化。

历史不会重复，但会押韵。这次的韵脚，叫算力。

本文基于公开信息和行业报告撰写，数据截至2026年4月。文中引用的用户评论来自V2EX、知乎、Reddit等公开社区。部分早期时间节点（如Claude Code 2025年6月纳入Pro计划）标注为「待进一步核实」，欢迎知情读者指正。