
有一种短缺,不是因为没人造,而是因为造出来的,全被提前订走了。
先把数字摆出来。
美光科技2026财年第三财季营收414.6亿美元,同比增长345.72%;管理层重申2026年全年HBM产能已全部售罄。
美光透露,公司仅能满足客户50%至66%的HBM需求——这是行业历史上最严重的结构性供需缺口。
卖光了,还不够。
哪怕产能全部释放,也只能满足一半多一点的真实需求。
这不是一次性的供给紧张,是一种结构性的、短期内无法逆转的物理短缺。
为什么是HBM,不是别的芯片?
GPU负责计算,但计算结果需要存储和读取——HBM就是GPU的"工作内存",直接焊在芯片旁边,负责高速数据吞吐。
没有足够的HBM,再强的GPU算力也跑不起来——就像一个跑车装了顶级发动机,但油箱小得可怜,跑不远。
全球能生产HBM的厂商只有三家:SK海力士、三星、美光——这是一个寡头垄断市场,竞争对手数量极少,扩产周期极长。
三家公司,决定着全球AI算力能不能真正变现。

大模型工厂在做什么?
正常的供应链流程是:芯片厂商生产芯片,卖给服务器代工厂,代工厂组装成整机,再卖给云厂商和AI公司。
但这一次,秩序被打破了。
美光透露,已与16家战略客户签订多年期供货协议,这些客户直接锁定未来数年的产能和价格,跳过了传统的"现货采购"模式。
这意味着,OpenAI、微软、谷歌这样的大模型工厂,不再等服务器代工厂去采购HBM,而是直接绕过中间环节,用现金预付款的方式,向美光锁定未来几年的物理出货权。
这是一种"越级抢购"——大模型工厂直接走到供应链最上游,把自己的需求,用真金白银焊死在芯片厂的产能计划表里。
谁先签约,谁先锁定份额。后来者,哪怕拿着同样多的钱,也只能排队等下一批产能释放。
这套"买断"逻辑,背后是什么算计?
大模型工厂为什么愿意花这么大力气,提前几年锁定原材料?
答案藏在一个词里:ROI确定性。
训练一个顶级大模型,需要几万张GPU、持续运转数月,投入动辄几十亿美元。
如果GPU到货了,但配套的HBM供应不上,那这几十亿美元的GPU集群,只能闲置——这是比"买不到芯片"更可怕的浪费:钱花了,资产买了,但因为一个看似次要的零部件缺货,整套系统跑不起来。
对大模型工厂来说,HBM短缺的风险,已经超过了GPU短缺的风险——因为GPU有多个供应商可以分散押注,但HBM只有三家,而且产能已经被锁定了大半。
提前锁定HBM,本质上是在为自己几十亿美元的算力投资,买一份"确保能用上"的保险。
这场买断潮,正在淘汰谁?
第一批被淘汰的:传统服务器代工厂的议价权。
过去,服务器代工厂是连接芯片厂商和云厂商的中间商,靠采购规模和长期关系拿到优惠价格,再加价卖给下游。
现在,下游客户直接绕过代工厂去和芯片厂签约——代工厂的角色,正在被压缩成"组装服务提供商",失去了对核心物料的议价权和库存管理权。
第二批被淘汰的:缺乏长期协议的二线存储厂商。
美光2026财年资本支出预计约270亿美元,主要投向HBM、先进DRAM及先进封装产能建设;爱达荷州、纽约州新建晶圆厂要到2027年以后才能投产。
当三大巨头都在拼命扩产、并且优先满足已签约的头部客户时,那些没有能力签下大额长协的二三线存储厂商,会面临双重困境:拿不到足够的原材料配额,也拿不到稳定的客户订单。
它们的产品,会被推向价格更敏感、利润更薄的中低端市场,逐渐失去在AI高端供应链里的位置。
最后说一句最冷峻的判断。
这场围绕HBM的买断潮,揭示了AI产业链一个正在快速固化的格局:
算力不是稀缺资源,物理产能才是。
GPU可以靠资本砸出更多产能,模型可以靠算法迭代更聪明,但HBM的扩产,受制于晶圆厂建设周期、原材料供应链、技术良品率——这些是物理世界的硬约束,不是靠多砸钱就能加速的。
谁能提前锁定这条物理供应链上最稀缺的那个环节,谁就拿到了整个AI竞赛里最确定的入场券。
没有签下长协的玩家,不是输在算法上,是输在了一份没有及时签出去的采购合同上。
