AI存储(HBM)万字研究报告

2026-06-29 23:35

AI存储(HBM)万字研究报告

深度研究prompt：分享一个我用了2年的深度研究Prompt，半小时帮你搞懂任何陌生领域。

写在前面

如果你只能记住一句话，记住这句：

AI 时代，算力的瓶颈不是算力本身，而是把数据搬到算力面前的那条"管道"。HBM 就是那条管道。

GPU（图形处理器，AI 算力的核心芯片）的算力每两年翻 3 倍，但内存带宽每两年只翻 1.5 倍——这个剪刀差，就是"内存墙"（算力增长快于内存带宽增长导致的瓶颈）。谁能造出更宽的"管道"，谁就卡住了整个 AI 产业的脖子。而全球能造这条管道的工厂，只有三家：SK 海力士、三星、美光。

这不是一份单纯的技术科普，而是一个关于"一个被冷落了十年的技术，如何在 ChatGPT 之后的一夜之间变成全球最稀缺的战略资源"的故事。它涉及技术赌注、公司命运、地缘博弈，以及一个经典的商业悖论——领先者困境（你因为领先而获得的优势，恰恰成为限制你下一步行动的枷锁）。

第一部分：纵向分析——HBM 的十年暗夜与一朝封神

一、起源：一个为 GPU 而生、却无人问津的技术（2011-2015）

HBM 的故事，要从一个反直觉的事实讲起：它最初根本不是为 AI 设计的。

2011 年前后，AMD 的 GPU 架构团队面临一个棘手的问题。当时的高端显卡用的是 GDDR5（第五代图形显存，当时显卡的主流内存）显存，带宽约 160-200 GB/s，但 GPU 的计算单元已经快到"喂不饱"——大量的算力在等待数据从显存搬运过来。这就是最早的"内存墙"雏形，只不过那时候没人想到 AI，大家想的是怎么让游戏跑得更顺、怎么让图形渲染更快。

AMD 找到了 SK 海力士。当时的 SK 海力士在 DRAM（动态随机存取存储器，即电脑和手机里的主流内存芯片）市场是个"老二/老三"的角色，长期被三星压着打。三星占全球 DRAM 市场约 40%，SK 海力士约 25-30%。对一个"千年老二"来说，找到一个能弯道超车的技术方向，是战略级的机会。

两边一拍即合：AMD 出架构设计，SK 海力士出制造工艺，联合开发一种全新的内存形态——把多层 DRAM 芯片像三明治一样垂直堆叠起来，用硅通孔（TSV，Through-Silicon Via，在芯片层间打垂直导电通道的工艺）在层间打通数千个数据通道，再和 GPU 封装在同一块基板上。

这就是 HBM。

2013 年，HBM1 标准正式发布。2015 年，AMD 推出搭载 HBM1 的 Fury 系列显卡——这是历史上第一款消费级 HBM 产品。HBM1 单颗栈（stack）带宽约 128 GB/s，AMD Fury X 搭载 4 颗 HBM1 栈，整卡总带宽约 512 GB/s，相比 GDDR5 翻了一倍。

但市场反应冷淡。

原因很简单：HBM1 太贵了。GDDR5 是成熟的大宗商品，产业链完善，成本低；HBM1 需要全新的封装工艺（CoWoS，Chip on Wafer on Substrate，台积电的先进封装技术，把 GPU 和内存芯片整合到同一块基板上），良率低，产能小，成本是 GDDR5 的好几倍。对游戏玩家来说，多花一倍的钱换来翻倍的带宽，游戏帧数提升却有限——因为游戏并不像 AI 训练那样需要海量数据反复搬运。

更尴尬的是，AMD 自己在 GPU 市场被英伟达压制，Fury 系列销量平平。HBM1 看起来像是一个"技术上很酷、商业上没人要"的典型。

这是 HBM 故事的第一个关键节点：它诞生了，但世界还没准备好需要它。

二、暗夜：英伟达接棒，但仍是小众产品（2016-2021）

2016 年，英伟达做了一件改变 HBM 命运的事：Tesla P100 GPU 采用了 HBM2。

这背后是黄仁勋的一个判断——GPU 的未来不在游戏，在数据中心（集中部署大量服务器的场所，AI 训练都在这里跑）。而数据中心的工作负载，当时的深度学习训练，即让 AI 模型通过海量数据学习的过程，对内存带宽的渴求，远超游戏。P100 配 16GB HBM2（4 颗栈），单栈带宽约 256 GB/s，整卡总带宽约 720 GB/s，是 HBM1 的近 6 倍。

2017 年的 V100、2020 年的 A100，依次采用 HBM2、HBM2E。A100 单卡配 80GB HBM2E（5 颗栈），单栈带宽约 460 GB/s，整卡总带宽约 2 TB/s。

但在 2022 年之前，HBM 始终是一个"小众且昂贵"的产品。

原因有二：

第一，AI 还没"出圈"。2016-2021 年的深度学习，主要是学术界和大公司的内部项目，算力需求虽然有增长，但没有爆发。GPU 卖给云厂商和研究院所，量是稳定的，但谈不上"疯抢"。

第二，HBM 的商业模式对厂商不友好。如前所述，HBM 高度定制化、代际周期短（每代 2-3 年）、固定资产摊薄压力大（建一条产线投资百亿级，要靠多年的产出来分摊成本）。SK 海力士虽然技术领先，但 HBM 在公司营收里的占比长期只有个位数百分比。华尔街甚至有分析师质疑："为什么要在这么个小众市场上持续投入？"

这段时间，SK 海力士做了一个看似"不理性"的决定：持续押注 HBM。 即使没有爆发性需求，即使三星在某些节点上有竞争，即使短期内看不到回报，他们依然保持着每一代 HBM 的研发节奏和产能投入。

后来的事实证明，这是 SK 海力士公司史上最重要的一个战略赌注。但在当时，没有人知道这个赌什么时候会兑现。

三、转折：ChatGPT 与一夜封神（2022 年 11 月-2023 年）

2022 年 11 月 30 日，ChatGPT 发布。

这个日期不仅是 AI 史上的分水岭，也是 HBM 史上的分水岭。只不过当时没人意识到。

ChatGPT 引爆了大模型竞赛。2023 年开始，OpenAI、Google、Meta、微软、亚马逊、Anthropic（Claude 的开发公司）……所有有野心的公司都在疯狂囤积 GPU 来训练更大的模型。英伟达 H100 成为史上最抢手的芯片，一卡难求，黄牛价炒到原价的数倍。

但很快，所有人都发现了一个问题：买得到 GPU，买不到足够的 HBM。

H100 每块配 80GB HBM3（6 颗栈），单栈带宽约 819 GB/s，整卡总带宽约 3.35 TB/s。而全球能稳定供货 HBM3 的，只有 SK 海力士一家。三星的 HBM3 良率没过关，英伟达拒绝收货；美光那时还没切入 HBM3。

于是出现了一个极其罕见的市场结构：SK 海力士的 HBM 产能被英伟达一家吃掉了 70% 以上，剩下 30% 被 Google TPU（谷歌自研的 AI 芯片）、AMD MI300（AMD 的 AI 加速卡）瓜分。其他客户排着队也拿不到货。

2023 年，SK 海力士 HBM 营收占比从个位数飙升到 20% 以上，股价一年翻倍。这是"十年暗夜"的回报——他们用十年的持续投入，换来了一个"结构性垄断"的地位。

在这里，我们能看到一个商业史上反复出现的模式：长期主义的回报是非线性的。 SK 海力士在 2015-2021 年投入的 HBM 研发，在 2023 年迎来了爆发性兑现。但反过来，如果 ChatGPT 晚来 3 年，或者 AI 的方向拐去别的技术路线（比如存算一体，把计算单元直接做到存储芯片里，省去数据搬运），这个赌注可能就打水漂了。

长期主义是"对的"，但它也需要运气。

四、分化：三巨头的命运分野（2024-2025）

2024-2025 年，HBM 市场进入"需求爆炸 + 产能扩张"的狂热阶段。英伟达 H200、GB200（Blackwell 架构，英伟达的 GPU 代际代号）相继发布，单卡 HBM 容量从 80GB 跳到 141GB、192GB。需求端的乘法效应开始显现。

但三巨头的命运开始分化。

SK 海力士：从垄断到领先。 美光在 2024 年初通过 HBM3E 认证，吃掉了一部分份额，SK 海力士的 HBM 市占率从 2024 年早期的 70%+ 回落到 2026 Q1 的 58%（Counterpoint 数据）。但它依然是英伟达的主供应商，HBM3E 产能被长期协议锁定，并率先完成 HBM4 开发（10 Gbps、效率较 HBM3E 提升约 40%）。2025 年，HBM 营收占比突破 30%。

美光：后来者的逆袭。 美光是这场竞赛里变化最积极的选手。它入场最晚（2024 年才通过 HBM3E 认证），但份额提升最快——从 2024 年的个位数，到 2025 年 Q2 达到 21% 首次超过三星（当时三星 17%），再到 2026 Q1 稳定在 21%，与三星基本持平。更关键的是，美光在 2026 Q1 已开始批量出货 HBM4 36GB 12 层模块，专为 NVIDIA Vera Rubin 设计——这是 HBM4 代际里第一个实质量产的节点，比 SK 海力士和三星都快了一拍。对那些不希望过度依赖 SK 海力士的云厂商来说，美光是一个天然的"第二供应商"。

三星：巨人的失足。 这是故事里最具戏剧性的一章。作为全球最大的 DRAM 厂商，三星在 HBM3 一代出现了严重的良率问题。据报道，三星 HBM3 的良率显著低于 SK 海力士，导致英伟达在 H100 批量供货阶段拒绝收货。一个拥有全球最先进晶圆产能、最大 DRAM 市场份额的巨人，在 AI 时代最核心的内存产品上被客户拒之门外。

这件事的象征意义极大。它说明：在 AI 时代，"大"不再是护城河，"专精"才是。 HBM 的核心难点不是晶圆（硅片，制造芯片的基板）制造，而是 TSV 钻孔精度、多层堆叠的热管理、堆叠后的电性测试良率——这些是 SK 海力士用十年积累出来的"工艺 know-how"，不是砸钱就能短期补上的。

三星直到 2025 年底才通过英伟达 12 层 HBM3E 认证（此前因散热/功耗问题多次认证失败，被迫重新设计 DRAM 核心），份额从 2025 年 Q1 的 13% 恢复到 2026 Q1 的 21%，但仍与美光持平、远低于 SK 海力士。HBM4 方面，三星以第六代 10nm 级 DRAM 工艺（制程节点，数字越小越先进，决定芯片能做多密）作为跳板，节奏相对保守，预计 2026 下半年到 2027 年才能实质供货。

五、当下：HBM4 前夜与"领先者困境"（2026）

进入 2026 年，HBM 市场站在一个新的代际切换窗口。

HBM3E 仍是出货主力，HBM4 正在爬坡。TrendForce Q1 2026 报告指出，HBM 营收大部分仍来自 HBM3E，HBM4 出货预计在 2026 下半年才实质性放量（具体 HBM3E/HBM4 全年出货占比为基于爬坡曲线的估算，非已确认数据）。HBM4 的关键升级是：接口宽度翻倍到 2048 bit，带宽目标超过 2.5 TB/s（单栈），单颗容量可达 64GB，堆叠层数从 8 层提升到 12 层甚至 16 层。

技术说明：JEDEC HBM4 标准规定单栈带宽超过 2 TB/s（基于 8 Gb/s 数据速率），实际产品带宽可达 2.5-2.8 TB/s（基于 10-11 Gb/s 数据速率）。本报告后续数据采用实际产品性能数据。

三巨头的 HBM4 节奏（已修正至 2026 年 6 月时点可验证信息）：

厂商	HBM4 进度	英伟达 HBM4 配额
SK 海力士	已完成 HBM4 开发（10 Gbps、效率较 HBM3E 提升约 40%），量产待客户认证完成	主供，中位 50%+
美光	2026 Q1 已开始批量出货 HBM4 36GB 12 层模块，专为 NVIDIA Vera Rubin（英伟达下一代 GPU 平台）设计	约 20%
三星	6 代 10nm 级 DRAM 工艺作为 HBM4 跳板，平泽 P5 厂（三星在韩国平泽的第五条内存产线）恢复建设，节奏相对保守	恢复位，非领导位

但比技术代际更值得关注的，是 SK 海力士面临的"领先者困境"，详见紧绷中的 SK 海力士，AI 时代领先者的结构性困局。

一方面，SK 海力士必须优先保障英伟达的庞大订单，HBM 产能几乎被完全锁定，难以推动客户结构多元化（Google、微软等云厂商自研的 AI 芯片）。客户集中度极高，一旦英伟达采购节奏或规格要求变化，业绩弹性直接受冲击。

另一方面，如果 SK 海力士试图通过激进扩产或价格策略争夺其他客户、主动优化客户结构，就必然要投入更多资源做定制化开发和产能分配。这不仅会进一步强化 HBM 业务的弱规模效应，还会影响边际利润。在当前高利润率环境下，任何影响稼动率（产能利用率，即产线实际产出占理论产能的比例）的行为都可能导致整体利润率明显回落。

这是"赢家的枷锁"：你因为领先而获得的优势，恰恰成为了限制你下一步行动的约束。

第二部分：横向分析——三巨头的生态位与替代路线

场景判断：竞品充分（场景 C）

HBM 赛道有 3 个主要玩家（SK 海力士、三星、美光），属于"竞品充分"的场景。我们逐一深入对比，并补充分析替代路线（苹果统一内存、CXL、国内 DRAM）。

一、SK 海力士：被英伟达"加冕"的新霸主

它活成了什么样

SK 海力士现在的状态，可以用一个比喻来形容：一个被最大客户"包养"的顶级工匠。

它的工艺是全世界最好的，它的产能是最稳定的，它的客户关系是最深的——但这一切都建立在"英伟达持续下单"这个前提上。FY2025（2025 财年），HBM 营收占总营收比例超过 30%，且仍在快速上升。英伟达一家的需求就消耗了全球 HBM 产能的 50-60%，而 SK 海力士又是英伟达的主供。

核心优势

1. 工艺积累（十年 know-how）：TSV 钻孔、层间连接、热管理是 HBM 生产的核心难点。SK 海力士量产 HBM 已近十年，良率和一致性控制远高于后来者。这不是砸钱能短期补上的。
2. 客户关系（深度绑定）：英伟达长期依赖 SK 海力士作为主供，供应链切换成本极高。重新认证一个新供应商需要 1-2 年，期间产能风险巨大。
3. 封装产能绑定（CoWoS）：SK 海力士与台积电 CoWoS 产能深度绑定，而台积电 CoWoS 是目前最成熟的 HBM 封装方案，产能稀缺。

明显短板

1. 客户集中度过高：英伟达占其 HBM 营收的绝大部分，多元化空间被产能锁定挤压。
2. 地缘风险：SK 海力士是韩国公司，但核心封装依赖台积电（中国台湾），且面临美国出口管制对中国市场的限制。
3. "领先者困境"：如前所述，保英伟达 vs 多元化，两难。

用户/客户视角

从英伟达的角度看，SK 海力士是"不可替代但必须制衡"的供应商。英伟达一直在主动扶持美光和三星作为第二、第三供应商，就是为了避免被 SK 海力士反向"卡脖子"。这是一种经典的"客户制衡供应商"策略——和苹果同时用台积电和三星（虽然台积电拿大头）是同一个逻辑。

二、美光：美股唯一的纯 HBM 受益标的

它活成了什么样

美光是这场竞赛里"姿势最难看但跑得最快"的选手。它入场最晚（2024 年才通过 HBM3E 认证），但份额提升最快——2025 年 Q2 首次以 21% 超过三星（17%），到 2026 Q1 与三星持平（各 21%）。更关键的是，美光在 2026 Q1 已开始批量出货 HBM4 36GB 12 层模块，专为 NVIDIA Vera Rubin 设计——这是 HBM4 代际里第一个实质量产的节点。

核心优势

1. "第二供应商"红利：所有不希望过度依赖 SK 海力士的客户，天然会选美光。这是结构性的需求。
2. 美股流动性：美光（MU，美股代码）是美股中唯一纯 HBM 直接受益标的。每次 AI 算力需求超预期，MU 往往有直接的估值弹性（股价对利好消息的敏感度，利好一来涨得多）。这对投资者来说是一个独特属性。
3. 自有封装产能：美光在爱达荷州有自有晶圆厂，部分封装可自给。

明显短板

1. HBM 毛利率低于 SK 海力士：良率和规模效应仍有差距。
2. CoWoS 依赖：核心封装仍需台积电，封装产能分配是其追赶的核心约束。
3. DRAM 周期底部压力：美光的产品线更分散，DRAM 周期下行时现金流压力比 SK 海力士更明显（SK 海力士有 HBM 高毛利业务缓冲）。

用户/客户视角

云厂商自研芯片项目（Google TPU、Amazon Trainium、Meta MTIA）对美光有特殊偏好——因为这些项目本身就是在"去英伟达化"，自然也不希望内存供应商和英伟达绑得太紧。美光的"独立性"反而成了卖点。

三、三星：巨人的艰难复盘

它活成了什么样

三星的 HBM 故事，是"大公司如何在新时代掉队"的教科书案例。作为全球最大的 DRAM 厂商，它在 AI 时代最核心的内存产品上被客户拒之门外，HBM3 良率问题导致的信任裂痕，至今未完全修复。

核心优势

1. 资金实力：三星集团的家底足以支撑长期投入，HBM4 研发不会因为短期亏损而中断。
2. 全产业链布局：三星同时有晶圆代工（替别人代工制造芯片）、DRAM、NAND（闪存，用于存储数据，和 DRAM 并列的两大内存类型）三大板块，可以在内部协同上做文章。
3. 产能规模：一旦良率突破，三星的产能爬坡速度可能最快。

明显短板

1. 良率阴影：HBM3 的良率问题不仅是技术问题，更是信任问题。英伟达对三星的重新认证异常谨慎。
2. HBM4 时间表相对保守：预计不早于 2026 年下半年，比 SK 海力士晚半年以上。
3. 两线承压：HBM 失位 + 代工业务被台积电压制，三星半导体的估值折价严重（估值折价：市场给的估值比同类公司低，因为看不到增长故事）。

用户/客户视角

对英伟达来说，三星是"必须存在但不能依赖"的第三供应商。它的存在价值主要是制衡 SK 海力士和美光的定价权——只要三星还在场上，前两者就不敢把价格抬得太离谱。这是经典的"备胎战略价值"。

四、横向对比总览

维度	SK 海力士	美光	三星
HBM 份额（2026 Q1）	58%	21%	21%
HBM4 节奏	已完成开发，待认证量产	已 Q1 2026 量产（Rubin 主供之一）	2026H2-2027
核心客户	英伟达（主供）	云厂商自研芯片 + 英伟达 Rubin	英伟达（恢复中）
毛利率	最高	中	受良率拖累
资本市场	韩股	美股（纯 HBM 标的）	韩股
最大风险	客户集中度 / 领先者困境	CoWoS 产能分配	良率 / 信任修复
生态位	不可替代的霸主	制衡者 / HBM4 先发	备胎 / 产能储备

五、替代路线分析

替代路线 1：苹果的统一内存（Unified Memory）

苹果走了一条完全不同的路。它没有用 HBM，而是用 LPDDR（Low Power DDR，低功耗内存，主要用于手机）+ 统一内存架构，让 CPU（中央处理器，电脑主芯片）、GPU、NPU（神经网络处理器，专门跑 AI 任务的芯片单元）共享同一块内存池。M 系列芯片的统一内存带宽约 400-800 GB/s，虽不及 HBM3E 的 1.2 TB/s（单栈），但对端侧 AI 推理（在手机/电脑本地跑 AI，不依赖云端）已经够用。

苹果的逻辑是"不参与云端 AI 训练的军备竞赛，而是做端侧 AI 推理的体验之王"。 它不需要 HBM 的极致带宽，但需要低功耗、高集成度、规模化出货来摊薄成本。这是一条"通用性强、规模效应好"的路线，和 HBM 的"定制化、弱规模效应"正好相反。

这也是为什么苹果在 AI 时代的定位是"个人 AI 超级计算机"，而不是"AI 训练基础设施"——它选择了一个不同的战场。

替代路线 2：CXL 内存池化

CXL（Compute Express Link）是一种让多个服务器共享内存池的协议。它的思路是：与其在每个 GPU 旁边堆 HBM，不如把内存集中起来，按需分配。这可以缓解 HBM 产能紧缺带来的压力。

但 CXL 目前更多是 HBM 的"补充"而非"替代"——它解决的是"内存容量不够"的问题，而 HBM 解决的是"内存带宽不够"的问题。两者不在同一维度。

替代路线 3：国内 DRAM（长鑫存储）

长鑫存储（CXMT，长鑫存储的英文缩写）是国内最接近先进 DRAM 技术的厂商，目前量产约在 DDR4/LPDDR5 级别（主流内存标准代际），距 HBM3E 主流工艺节点（需要 10nm 级以下 DRAM + TSV 封装）仍有 2-3 代差距。短期无法切入 HBM 主流供应链。

但国内 AI 服务器受出口管制影响，大量使用 H20（英伟达为应对美国出口管制、专供中国市场的降级版 AI 芯片）等降级版本（HBM 规格缩水），反而给国内 DRAM 厂商留出了"非主流 HBM"的生态位。只是这个市场的量级，和全球 HBM 主流市场不在一个量级。

第三部分：横纵交汇——AI存储的当下判断与未来走向

一、纵向脉络告诉我们什么

回看 HBM 的十年，有三条因果链特别清晰：

第一，技术赌注的非线性回报。 SK 海力士在 2011-2021 年的持续投入，在 2023 年迎来了爆发性兑现。但这个兑现的触发点（ChatGPT）是外生的、不可预测的。长期主义是对的，但长期主义的成功需要运气——这是商业史反复验证的规律。

第二，"专精"在 AI 时代压倒"大而全"。 三星的失足证明：在 AI 时代，拥有最大的产能、最多的钱、最全的产业链，不等于能赢。HBM 的核心壁垒是"工艺 know-how"，这是时间积累出来的，不是资本能买到的。这和西门子医疗在医疗器械行业的"深耕"逻辑一致——在一个领域深耕十年的人，比什么都做一点的巨人更有竞争力。

第三，代际切换是供应商格局的重置键。 每一次 HBM 代际切换（HBM2→HBM2E→HBM3→HBM3E→HBM4），都重新洗牌过供应商格局。HBM3 时代 SK 海力士一家独大，HBM3E 时代美光切入，HBM4 时代三星能否翻盘仍是悬念。这意味着：当前的格局不是终局，下一代的竞争已经开始。

二、横向格局告诉我们什么

横向对比揭示了三个结构性判断：

第一，HBM 是一个"寡头 + 高壁垒"的市场，且壁垒在加固。 三家玩家的份额此消彼长，但没有第四家能进场（寡头：少数几家厂商垄断市场的结构）。TSV 工艺、CoWoS 封装、客户认证周期，构成了三重护城河（竞争壁垒，对手难以逾越的优势）。新进入者（包括国内厂商）短期无法撼动。

第二，"领先者困境"是 SK 海力士的核心矛盾，但短期内不可解。 客户集中度高是结构性的，多元化又会损害利润率。这个困境会持续存在，直到出现以下三种情况之一：(a) 英伟达份额被云厂商自研芯片稀释；(b) HBM 需求增速放缓，产能不再紧缺；(c) 出现新的内存技术替代 HBM。短期内三者都不会发生。

第三，美光是当前格局里"性价比最高"的玩家。 它不需要赢，只需要"不被甩下"。作为第二供应商，它能吃到结构性红利（所有去英伟达化的客户都会选它），又不需要承担"霸主"的客户集中度风险。这是"老二哲学"的胜利。

三、综合判断：AI存储的三个走向

走向 1：HBM4 爬坡已启动，但 2026 年供需矛盾仍未缓解

美光已在 2026 Q1 启动 HBM4 量产（面向 Rubin），SK 海力士和三星预计下半年跟上。但 Blackwell Ultra（英伟达 Blackwell 架构的升级版 GPU）需求已提前锁定了绝大部分 HBM3E 产能，HBM4 爬坡初期产能仍远低于需求。整个 2026 年，AI 算力的最大供应链瓶颈仍然是 HBM——不是 GPU 算力本身，而是封装 HBM 的内存和封装产能。

判断（推测）：谁锁定了 2027 年的 HBM4 产能配额，谁就锁定了 Rubin 时代的 GPU 供应链地位。英伟达每年与 HBM 供应商签署的长期产能预购协议，是比任何季度财报更关键的先行指标（提前反映趋势的信号）。

走向 2："领先者困境"将倒逼 SK 海力士做出战略选择

2026-2027 年，SK 海力士必须回答一个问题：是继续做"英伟达的专属工匠"，还是做"全行业的内存供应商"？

如果选前者，它要接受客户集中度的风险，并主动配合英伟达的技术路线（包括为 Rubin 定制 HBM4 规格）。如果选后者，它要在产能分配上向 Google、微软等倾斜，但这会激怒英伟达，并可能触发英伟达扶持三星/美光的"报复"。

推测：SK 海力士大概率会选择"以英伟达为主、缓慢渗透其他客户"的折中路线。因为在当前高利润率环境下，保住英伟达的订单是短期收益最大化的选择。多元化是长期正确的事，但短期会被利润率压力压制。这是"正确的事"和"容易的事"的冲突。

走向 3：内存技术路线将出现分化——云端 HBM vs 端侧统一内存

AI 存储不会收敛到单一技术路线。云端训练（英伟达 GPU + HBM）追求极致带宽，端侧推理（苹果 M 系列 + 统一内存）追求低功耗和高集成度。两条路线的商业模式也完全不同：

• HBM 路线：定制化、短周期、高毛利、弱规模效应——"高级定制裁缝"
• 统一内存路线：通用化、长周期、低毛利、强规模效应——"开超市"

苹果选择后者，是因为它的优势在端侧规模和生态整合，而不在云端算力。这两条路线将长期并存，且互相不能替代。

四、小结

HBM 的十年，是一个关于"长期主义 + 运气"的故事；

HBM 的当下，是一个关于"领先者困境"的案例；

HBM 的未来，是一场关于"谁能在下一代代际切换中锁定产能"的竞赛。

而对所有身处 AI 浪潮的人来说，HBM 提供的更深的启示是：

在最热闹的赛道里，最值钱的往往不是最显眼的那个环节。

GPU 是聚光灯下的主角，但 HBM 是幕后真正卡脖子的人。

写在最后

这份报告的起点很普通，和朋友吃饭聊到最近大火的 AI 存储，我发现自己对这块完全不了解。出于兴趣，我用「卡神的横纵分析法」试着做了一次完整拆解，从 HBM 的十年暗夜，一路追到 2026 年的代际切换。

关于数据：报告里的关键数据点是经过了三轮验证（TrendForce、Counterpoint、Micron 官方公告等）。但我不是半导体行业的从业者，肯定存在理解偏差或时点滞后，请以厂商官方发布和权威研报为准。

关于判断：文中的前瞻性内容（例如"推测""预计""判断"的部分）是基于公开信息和大模型的推演，仅供参考。不是投资建议，你读的时候也别据此下注。市场会变，AI也会犯错。

如果你是行业里的人，发现哪里写得不对，欢迎留言拍砖～

附：关键数据速查表

HBM 代际演进

代际	上市年份	单栈带宽	单栈容量	代表应用
HBM1	2015	~128 GB/s	4-8 GB	AMD Fiji
HBM2	2016-2018	~256 GB/s	8-16 GB	NVIDIA V100
HBM2E	2019-2021	~460 GB/s	16-24 GB	NVIDIA A100
HBM3	2022-2023	~819 GB/s	24 GB	NVIDIA H100
HBM3E	2024-2026	~1.2 TB/s	24-36 GB	NVIDIA H200/GB200
HBM4	2026-2027E	>2.5 TB/s	32-64 GB	NVIDIA GB300+/Rubin

数据说明：
1. HBM4 带宽数据已更新：JEDEC 标准基准值为 >2 TB/s（基于 8 Gb/s 数据速率），实际产品性能可达 >2.5 TB/s（基于 10-11 Gb/s 数据速率）。本表采用实际产品性能数据。
2. 所有"带宽"数据如无特别说明，均指"单颗 HBM 栈（stack）"的带宽。
3. 整卡总带宽 = 单栈带宽 × 栈数量

2026 Q1 市场份额快照（Counterpoint Research）

厂商	HBM 份额	整体 DRAM 份额	HBM4 进度	趋势
SK 海力士	58%	29%	已完成开发，待量产	↓ 从 69% 回落但仍领先
三星	21%	38%	2026H2-2027	↑ 从 13% 恢复
美光	21%	22%	2026 Q1 已量产（Rubin）	↑ 与三星持平

注：HBM 份额与整体 DRAM 份额差异显著——三星在整体 DRAM 市场（含普通 DDR）仍是第一（38%），但在 HBM 市场仅排第二/第三（21%）。

英伟达 GPU 的 HBM 用量演进

GPU	架构	HBM 类型	单卡 HBM 容量	单卡总带宽	HBM 栈数量	量产时间
H100	Hopper	HBM3	80 GB	~3.35 TB/s	6	2022-2023
H200	Hopper+	HBM3E	141 GB	~4.8 TB/s	6	2024
GB200	Blackwell	HBM3E	192 GB	~8 TB/s	8	2025-2026
GB300	Blackwell Ultra	HBM3E	288 GB	~8 TB/s+	8	2026-2027
Vera Rubin	Rubin	HBM4	288 GB	>22 TB/s	8	2026-2027

数据说明：
1. "单卡总带宽" = 单栈带宽 × HBM 栈数量
2. Vera Rubin 于 GTC 2026（英伟达年度技术大会）发布，单卡 288GB HBM4、22TB/s 总带宽、3360 亿晶体管、50 PFLOPS（每秒千万亿次浮点运算，算力单位，1 PFLOPS = 每秒 1000 万亿次运算）
3. 美光已确认 Q1 2026 向 Rubin 平台批量出货 HBM4 36GB 12 层模块

参考文献

市场份额与行业数据

1. Counterpoint Research — Memory Tracker and Forecast Insights Report, Q1 2026（2026-06 发布）

• HBM 份额：SK hynix 58%、Samsung 21%、Micron 21%（Q1 2026）
• 整体 DRAM 份额：Samsung 38%、SK hynix 29%、Micron 22%、CXMT 8%
• 链接：https://www.counterpointresearch.com/en/insights/global-dram-and-hbm-market-share

2. TrendForce — HBM Industry Analysis, 1Q26（2026-02-04）

• HBM3E 仍是出货主力，HBM4 出货预计 2026 下半年实质性放量
• SK hynix 保持领先，Samsung 通过 HBM4 恢复份额，Micron 激进扩张
• 链接：https://www.trendforce.com/research/download/RP260204DA3（注：此链接为付费报告下载链接）

3. Astute Group — "SK hynix holds 62% of HBM, Micron overtakes Samsung"（2025-09-24，引用 Chosun Biz / Counterpoint）

• Q2 2025 份额：SK hynix 62%、Micron 21%、Samsung 17%（美光首次超过三星）
• Samsung HBM4 预计 2026 进入全规模供货
• 链接：https://astutegroup.com/news/general/sk-hynix-holds-62-of-hbm-micron-overtakes-samsung-2026-battle-pivots-to-hbm4

4. Presenc AI — HBM Market Share 2026（2026-05 更新）

• 综合多源数据，提供 HBM3E vs HBM4 代际混合估算
• 链接：https://presenc.ai/research/hbm-market-share-samsung-skhynix-micron-2026

5. DRAMWatch（2026-05-30 更新）

• HBM 和 DRAM 合约价、市场份额、供需、HBM4 路线图
• 链接：https://dramwatch.com

HBM4 与 Rubin GPU 规格

1. Micron Technology — "Micron in High-Volume Production of HBM4 Designed for NVIDIA Vera Rubin"（2026-03-17，官方投资者公告）

• 2026 Q1 开始批量出货 HBM4 36GB 12 层模块
• 专为 NVIDIA Vera Rubin 设计
• 链接：https://investors.micron.com/news-releases/news-release-details/micron-high-volume-production-hbm4-designed-nvidia-vera-rubin

2. NVIDIA GTC 2026 — Vera Rubin GPU 发布

• 3360 亿晶体管、288GB HBM4、22TB/s 带宽、50 PFLOPS
• 分析来源：https://tech-insider.org/nvidia-gtc-2026-rubin-gpu-analysis（2026-03-16）
• 中文拆解：https://lucy.suiyan.cc/blog/2026-06-01_nvidia-vera-rubin-gpu

SK 海力士 HBM4 进度

1. Tom's Hardware — "SK hynix completes development of HBM4"

• 2048-bit 接口、10 Gbps 数据率、效率较 HBM3E 提升约 40%
• 量产待客户认证完成
• 链接：https://www.tomshardware.com/pc-components/ram/sk-hynix-completes-development-of-hbm4（引用自 astutegroup.com 报告）

三星 HBM 恢复

1. Reuters Breakingviews — "Samsung has fighting shot to close AI marathon gap"（2025-09-23）

• 三星平泽 P5 厂恢复建设
• 第六代 10nm 级 DRAM 工艺作为 HBM4 跳板
• 链接：https://www.reuters.com/commentary/breakingviews/samsung-has-fighting-shot-close-ai-marathon-gap-2025-09-23

产业链与客户结构

1. 雪球 — "SK海力士HBM、SSD订单排期全梳理"（2026-05-16）

• 2026 年全年 HBM 产能 100% 售罄，常规订单排至 2027 Q1
• 头部长约客户：英伟达、微软、谷歌
• 链接：https://xueqiu.com/9809844929/389262483

打赏