展会资讯
AI存储(HBM)万字研究报告
2026-06-29 23:35
AI存储(HBM)万字研究报告
深度研究prompt:分享一个我用了2年的深度研究Prompt,半小时帮你搞懂任何陌生领域。

写在前面

如果你只能记住一句话,记住这句:

AI 时代,算力的瓶颈不是算力本身,而是把数据搬到算力面前的那条"管道"。HBM 就是那条管道。

GPU(图形处理器,AI 算力的核心芯片)的算力每两年翻 3 倍,但内存带宽每两年只翻 1.5 倍——这个剪刀差,就是"内存墙"(算力增长快于内存带宽增长导致的瓶颈)。谁能造出更宽的"管道",谁就卡住了整个 AI 产业的脖子。而全球能造这条管道的工厂,只有三家:SK 海力士、三星、美光。

这不是一份单纯的技术科普,而是一个关于"一个被冷落了十年的技术,如何在 ChatGPT 之后的一夜之间变成全球最稀缺的战略资源"的故事。它涉及技术赌注、公司命运、地缘博弈,以及一个经典的商业悖论——领先者困境(你因为领先而获得的优势,恰恰成为限制你下一步行动的枷锁)。


第一部分:纵向分析——HBM 的十年暗夜与一朝封神

一、起源:一个为 GPU 而生、却无人问津的技术(2011-2015)

HBM 的故事,要从一个反直觉的事实讲起:它最初根本不是为 AI 设计的。

2011 年前后,AMD 的 GPU 架构团队面临一个棘手的问题。当时的高端显卡用的是 GDDR5(第五代图形显存,当时显卡的主流内存)显存,带宽约 160-200 GB/s,但 GPU 的计算单元已经快到"喂不饱"——大量的算力在等待数据从显存搬运过来。这就是最早的"内存墙"雏形,只不过那时候没人想到 AI,大家想的是怎么让游戏跑得更顺、怎么让图形渲染更快。

AMD 找到了 SK 海力士。当时的 SK 海力士在 DRAM(动态随机存取存储器,即电脑和手机里的主流内存芯片)市场是个"老二/老三"的角色,长期被三星压着打。三星占全球 DRAM 市场约 40%,SK 海力士约 25-30%。对一个"千年老二"来说,找到一个能弯道超车的技术方向,是战略级的机会。

两边一拍即合:AMD 出架构设计,SK 海力士出制造工艺,联合开发一种全新的内存形态——把多层 DRAM 芯片像三明治一样垂直堆叠起来,用硅通孔(TSV,Through-Silicon Via,在芯片层间打垂直导电通道的工艺)在层间打通数千个数据通道,再和 GPU 封装在同一块基板上。

这就是 HBM。

2013 年,HBM1 标准正式发布。2015 年,AMD 推出搭载 HBM1 的 Fury 系列显卡——这是历史上第一款消费级 HBM 产品。HBM1 单颗栈(stack)带宽约 128 GB/s,AMD Fury X 搭载 4 颗 HBM1 栈,整卡总带宽约 512 GB/s,相比 GDDR5 翻了一倍。

但市场反应冷淡。

原因很简单:HBM1 太贵了。GDDR5 是成熟的大宗商品,产业链完善,成本低;HBM1 需要全新的封装工艺(CoWoS,Chip on Wafer on Substrate,台积电的先进封装技术,把 GPU 和内存芯片整合到同一块基板上),良率低,产能小,成本是 GDDR5 的好几倍。对游戏玩家来说,多花一倍的钱换来翻倍的带宽,游戏帧数提升却有限——因为游戏并不像 AI 训练那样需要海量数据反复搬运。

更尴尬的是,AMD 自己在 GPU 市场被英伟达压制,Fury 系列销量平平。HBM1 看起来像是一个"技术上很酷、商业上没人要"的典型。

这是 HBM 故事的第一个关键节点:它诞生了,但世界还没准备好需要它。

二、暗夜:英伟达接棒,但仍是小众产品(2016-2021)

2016 年,英伟达做了一件改变 HBM 命运的事:Tesla P100 GPU 采用了 HBM2。

这背后是黄仁勋的一个判断——GPU 的未来不在游戏,在数据中心(集中部署大量服务器的场所,AI 训练都在这里跑)。而数据中心的工作负载,当时的深度学习训练,即让 AI 模型通过海量数据学习的过程,对内存带宽的渴求,远超游戏。P100 配 16GB HBM2(4 颗栈),单栈带宽约 256 GB/s,整卡总带宽约 720 GB/s,是 HBM1 的近 6 倍。

2017 年的 V100、2020 年的 A100,依次采用 HBM2、HBM2E。A100 单卡配 80GB HBM2E(5 颗栈),单栈带宽约 460 GB/s,整卡总带宽约 2 TB/s

但在 2022 年之前,HBM 始终是一个"小众且昂贵"的产品。

原因有二:

第一,AI 还没"出圈"。2016-2021 年的深度学习,主要是学术界和大公司的内部项目,算力需求虽然有增长,但没有爆发。GPU 卖给云厂商和研究院所,量是稳定的,但谈不上"疯抢"。

第二,HBM 的商业模式对厂商不友好。如前所述,HBM 高度定制化、代际周期短(每代 2-3 年)、固定资产摊薄压力大(建一条产线投资百亿级,要靠多年的产出来分摊成本)。SK 海力士虽然技术领先,但 HBM 在公司营收里的占比长期只有个位数百分比。华尔街甚至有分析师质疑:"为什么要在这么个小众市场上持续投入?"

这段时间,SK 海力士做了一个看似"不理性"的决定:持续押注 HBM。 即使没有爆发性需求,即使三星在某些节点上有竞争,即使短期内看不到回报,他们依然保持着每一代 HBM 的研发节奏和产能投入。

后来的事实证明,这是 SK 海力士公司史上最重要的一个战略赌注。但在当时,没有人知道这个赌什么时候会兑现。

三、转折:ChatGPT 与一夜封神(2022 年 11 月-2023 年)

2022 年 11 月 30 日,ChatGPT 发布。

这个日期不仅是 AI 史上的分水岭,也是 HBM 史上的分水岭。只不过当时没人意识到。

ChatGPT 引爆了大模型竞赛。2023 年开始,OpenAI、Google、Meta、微软、亚马逊、Anthropic(Claude 的开发公司)……所有有野心的公司都在疯狂囤积 GPU 来训练更大的模型。英伟达 H100 成为史上最抢手的芯片,一卡难求,黄牛价炒到原价的数倍。

但很快,所有人都发现了一个问题:买得到 GPU,买不到足够的 HBM。

H100 每块配 80GB HBM3(6 颗栈),单栈带宽约 819 GB/s,整卡总带宽约 3.35 TB/s。而全球能稳定供货 HBM3 的,只有 SK 海力士一家。三星的 HBM3 良率没过关,英伟达拒绝收货;美光那时还没切入 HBM3。

于是出现了一个极其罕见的市场结构:SK 海力士的 HBM 产能被英伟达一家吃掉了 70% 以上,剩下 30% 被 Google TPU(谷歌自研的 AI 芯片)、AMD MI300(AMD 的 AI 加速卡)瓜分。其他客户排着队也拿不到货。

2023 年,SK 海力士 HBM 营收占比从个位数飙升到 20% 以上,股价一年翻倍。这是"十年暗夜"的回报——他们用十年的持续投入,换来了一个"结构性垄断"的地位。

在这里,我们能看到一个商业史上反复出现的模式:长期主义的回报是非线性的。 SK 海力士在 2015-2021 年投入的 HBM 研发,在 2023 年迎来了爆发性兑现。但反过来,如果 ChatGPT 晚来 3 年,或者 AI 的方向拐去别的技术路线(比如存算一体,把计算单元直接做到存储芯片里,省去数据搬运),这个赌注可能就打水漂了。

长期主义是"对的",但它也需要运气。

四、分化:三巨头的命运分野(2024-2025)

2024-2025 年,HBM 市场进入"需求爆炸 + 产能扩张"的狂热阶段。英伟达 H200、GB200(Blackwell 架构,英伟达的 GPU 代际代号)相继发布,单卡 HBM 容量从 80GB 跳到 141GB、192GB。需求端的乘法效应开始显现。

但三巨头的命运开始分化。

SK 海力士:从垄断到领先。 美光在 2024 年初通过 HBM3E 认证,吃掉了一部分份额,SK 海力士的 HBM 市占率从 2024 年早期的 70%+ 回落到 2026 Q1 的 58%(Counterpoint 数据)。但它依然是英伟达的主供应商,HBM3E 产能被长期协议锁定,并率先完成 HBM4 开发(10 Gbps、效率较 HBM3E 提升约 40%)。2025 年,HBM 营收占比突破 30%。

美光:后来者的逆袭。 美光是这场竞赛里变化最积极的选手。它入场最晚(2024 年才通过 HBM3E 认证),但份额提升最快——从 2024 年的个位数,到 2025 年 Q2 达到 21% 首次超过三星(当时三星 17%),再到 2026 Q1 稳定在 21%,与三星基本持平。更关键的是,美光在 2026 Q1 已开始批量出货 HBM4 36GB 12 层模块,专为 NVIDIA Vera Rubin 设计——这是 HBM4 代际里第一个实质量产的节点,比 SK 海力士和三星都快了一拍。对那些不希望过度依赖 SK 海力士的云厂商来说,美光是一个天然的"第二供应商"。

三星:巨人的失足。 这是故事里最具戏剧性的一章。作为全球最大的 DRAM 厂商,三星在 HBM3 一代出现了严重的良率问题。据报道,三星 HBM3 的良率显著低于 SK 海力士,导致英伟达在 H100 批量供货阶段拒绝收货。一个拥有全球最先进晶圆产能、最大 DRAM 市场份额的巨人,在 AI 时代最核心的内存产品上被客户拒之门外。

这件事的象征意义极大。它说明:在 AI 时代,"大"不再是护城河,"专精"才是。 HBM 的核心难点不是晶圆(硅片,制造芯片的基板)制造,而是 TSV 钻孔精度、多层堆叠的热管理、堆叠后的电性测试良率——这些是 SK 海力士用十年积累出来的"工艺 know-how",不是砸钱就能短期补上的。

三星直到 2025 年底才通过英伟达 12 层 HBM3E 认证(此前因散热/功耗问题多次认证失败,被迫重新设计 DRAM 核心),份额从 2025 年 Q1 的 13% 恢复到 2026 Q1 的 21%,但仍与美光持平、远低于 SK 海力士。HBM4 方面,三星以第六代 10nm 级 DRAM 工艺(制程节点,数字越小越先进,决定芯片能做多密)作为跳板,节奏相对保守,预计 2026 下半年到 2027 年才能实质供货。

五、当下:HBM4 前夜与"领先者困境"(2026)

进入 2026 年,HBM 市场站在一个新的代际切换窗口。

HBM3E 仍是出货主力,HBM4 正在爬坡。TrendForce Q1 2026 报告指出,HBM 营收大部分仍来自 HBM3E,HBM4 出货预计在 2026 下半年才实质性放量(具体 HBM3E/HBM4 全年出货占比为基于爬坡曲线的估算,非已确认数据)。HBM4 的关键升级是:接口宽度翻倍到 2048 bit,带宽目标超过 2.5 TB/s(单栈),单颗容量可达 64GB,堆叠层数从 8 层提升到 12 层甚至 16 层。

技术说明:JEDEC HBM4 标准规定单栈带宽超过 2 TB/s(基于 8 Gb/s 数据速率),实际产品带宽可达 2.5-2.8 TB/s(基于 10-11 Gb/s 数据速率)。本报告后续数据采用实际产品性能数据。

三巨头的 HBM4 节奏(已修正至 2026 年 6 月时点可验证信息):

厂商
HBM4 进度
英伟达 HBM4 配额
SK 海力士
已完成 HBM4 开发(10 Gbps、效率较 HBM3E 提升约 40%),量产待客户认证完成
主供,中位 50%+
美光
2026 Q1 已开始批量出货 HBM4 36GB 12 层模块
,专为 NVIDIA Vera Rubin(英伟达下一代 GPU 平台)设计
约 20%
三星
6 代 10nm 级 DRAM 工艺作为 HBM4 跳板,平泽 P5 厂(三星在韩国平泽的第五条内存产线)恢复建设,节奏相对保守
恢复位,非领导位

但比技术代际更值得关注的,是 SK 海力士面临的"领先者困境",详见紧绷中的 SK 海力士,AI 时代领先者的结构性困局

一方面,SK 海力士必须优先保障英伟达的庞大订单,HBM 产能几乎被完全锁定,难以推动客户结构多元化(Google、微软等云厂商自研的 AI 芯片)。客户集中度极高,一旦英伟达采购节奏或规格要求变化,业绩弹性直接受冲击。

另一方面,如果 SK 海力士试图通过激进扩产或价格策略争夺其他客户、主动优化客户结构,就必然要投入更多资源做定制化开发和产能分配。这不仅会进一步强化 HBM 业务的弱规模效应,还会影响边际利润。在当前高利润率环境下,任何影响稼动率(产能利用率,即产线实际产出占理论产能的比例)的行为都可能导致整体利润率明显回落。

这是"赢家的枷锁":你因为领先而获得的优势,恰恰成为了限制你下一步行动的约束。


第二部分:横向分析——三巨头的生态位与替代路线

场景判断:竞品充分(场景 C)

HBM 赛道有 3 个主要玩家(SK 海力士、三星、美光),属于"竞品充分"的场景。我们逐一深入对比,并补充分析替代路线(苹果统一内存、CXL、国内 DRAM)。

一、SK 海力士:被英伟达"加冕"的新霸主

它活成了什么样

SK 海力士现在的状态,可以用一个比喻来形容:一个被最大客户"包养"的顶级工匠。

它的工艺是全世界最好的,它的产能是最稳定的,它的客户关系是最深的——但这一切都建立在"英伟达持续下单"这个前提上。FY2025(2025 财年),HBM 营收占总营收比例超过 30%,且仍在快速上升。英伟达一家的需求就消耗了全球 HBM 产能的 50-60%,而 SK 海力士又是英伟达的主供。

核心优势

  1. 1. 工艺积累(十年 know-how):TSV 钻孔、层间连接、热管理是 HBM 生产的核心难点。SK 海力士量产 HBM 已近十年,良率和一致性控制远高于后来者。这不是砸钱能短期补上的。
  2. 2. 客户关系(深度绑定):英伟达长期依赖 SK 海力士作为主供,供应链切换成本极高。重新认证一个新供应商需要 1-2 年,期间产能风险巨大。
  3. 3. 封装产能绑定(CoWoS):SK 海力士与台积电 CoWoS 产能深度绑定,而台积电 CoWoS 是目前最成熟的 HBM 封装方案,产能稀缺。

明显短板

  1. 1. 客户集中度过高:英伟达占其 HBM 营收的绝大部分,多元化空间被产能锁定挤压。
  2. 2. 地缘风险:SK 海力士是韩国公司,但核心封装依赖台积电(中国台湾),且面临美国出口管制对中国市场的限制。
  3. 3. "领先者困境":如前所述,保英伟达 vs 多元化,两难。

用户/客户视角

从英伟达的角度看,SK 海力士是"不可替代但必须制衡"的供应商。英伟达一直在主动扶持美光和三星作为第二、第三供应商,就是为了避免被 SK 海力士反向"卡脖子"。这是一种经典的"客户制衡供应商"策略——和苹果同时用台积电和三星(虽然台积电拿大头)是同一个逻辑。

二、美光:美股唯一的纯 HBM 受益标的

它活成了什么样

美光是这场竞赛里"姿势最难看但跑得最快"的选手。它入场最晚(2024 年才通过 HBM3E 认证),但份额提升最快——2025 年 Q2 首次以 21% 超过三星(17%),到 2026 Q1 与三星持平(各 21%)。更关键的是,美光在 2026 Q1 已开始批量出货 HBM4 36GB 12 层模块,专为 NVIDIA Vera Rubin 设计——这是 HBM4 代际里第一个实质量产的节点。

核心优势

  1. 1. "第二供应商"红利:所有不希望过度依赖 SK 海力士的客户,天然会选美光。这是结构性的需求。
  2. 2. 美股流动性:美光(MU,美股代码)是美股中唯一纯 HBM 直接受益标的。每次 AI 算力需求超预期,MU 往往有直接的估值弹性(股价对利好消息的敏感度,利好一来涨得多)。这对投资者来说是一个独特属性。
  3. 3. 自有封装产能:美光在爱达荷州有自有晶圆厂,部分封装可自给。

明显短板

  1. 1. HBM 毛利率低于 SK 海力士:良率和规模效应仍有差距。
  2. 2. CoWoS 依赖:核心封装仍需台积电,封装产能分配是其追赶的核心约束。
  3. 3. DRAM 周期底部压力:美光的产品线更分散,DRAM 周期下行时现金流压力比 SK 海力士更明显(SK 海力士有 HBM 高毛利业务缓冲)。

用户/客户视角

云厂商自研芯片项目(Google TPU、Amazon Trainium、Meta MTIA)对美光有特殊偏好——因为这些项目本身就是在"去英伟达化",自然也不希望内存供应商和英伟达绑得太紧。美光的"独立性"反而成了卖点。

三、三星:巨人的艰难复盘

它活成了什么样

三星的 HBM 故事,是"大公司如何在新时代掉队"的教科书案例。作为全球最大的 DRAM 厂商,它在 AI 时代最核心的内存产品上被客户拒之门外,HBM3 良率问题导致的信任裂痕,至今未完全修复。

核心优势

  1. 1. 资金实力:三星集团的家底足以支撑长期投入,HBM4 研发不会因为短期亏损而中断。
  2. 2. 全产业链布局:三星同时有晶圆代工(替别人代工制造芯片)、DRAM、NAND(闪存,用于存储数据,和 DRAM 并列的两大内存类型)三大板块,可以在内部协同上做文章。
  3. 3. 产能规模:一旦良率突破,三星的产能爬坡速度可能最快。

明显短板

  1. 1. 良率阴影:HBM3 的良率问题不仅是技术问题,更是信任问题。英伟达对三星的重新认证异常谨慎。
  2. 2. HBM4 时间表相对保守:预计不早于 2026 年下半年,比 SK 海力士晚半年以上。
  3. 3. 两线承压:HBM 失位 + 代工业务被台积电压制,三星半导体的估值折价严重(估值折价:市场给的估值比同类公司低,因为看不到增长故事)。

用户/客户视角

对英伟达来说,三星是"必须存在但不能依赖"的第三供应商。它的存在价值主要是制衡 SK 海力士和美光的定价权——只要三星还在场上,前两者就不敢把价格抬得太离谱。这是经典的"备胎战略价值"。

四、横向对比总览

维度
SK 海力士
美光
三星
HBM 份额(2026 Q1)
58%
21%
21%
HBM4 节奏
已完成开发,待认证量产
已 Q1 2026 量产(Rubin 主供之一)
2026H2-2027
核心客户
英伟达(主供)
云厂商自研芯片 + 英伟达 Rubin
英伟达(恢复中)
毛利率
最高
受良率拖累
资本市场
韩股
美股(纯 HBM 标的)
韩股
最大风险
客户集中度 / 领先者困境
CoWoS 产能分配
良率 / 信任修复
生态位
不可替代的霸主
制衡者 / HBM4 先发
备胎 / 产能储备

五、替代路线分析

替代路线 1:苹果的统一内存(Unified Memory)

苹果走了一条完全不同的路。它没有用 HBM,而是用 LPDDR(Low Power DDR,低功耗内存,主要用于手机)+ 统一内存架构,让 CPU(中央处理器,电脑主芯片)、GPU、NPU(神经网络处理器,专门跑 AI 任务的芯片单元)共享同一块内存池。M 系列芯片的统一内存带宽约 400-800 GB/s,虽不及 HBM3E 的 1.2 TB/s(单栈),但对端侧 AI 推理(在手机/电脑本地跑 AI,不依赖云端)已经够用。

苹果的逻辑是"不参与云端 AI 训练的军备竞赛,而是做端侧 AI 推理的体验之王"。 它不需要 HBM 的极致带宽,但需要低功耗、高集成度、规模化出货来摊薄成本。这是一条"通用性强、规模效应好"的路线,和 HBM 的"定制化、弱规模效应"正好相反。

这也是为什么苹果在 AI 时代的定位是"个人 AI 超级计算机",而不是"AI 训练基础设施"——它选择了一个不同的战场。

替代路线 2:CXL 内存池化

CXL(Compute Express Link)是一种让多个服务器共享内存池的协议。它的思路是:与其在每个 GPU 旁边堆 HBM,不如把内存集中起来,按需分配。这可以缓解 HBM 产能紧缺带来的压力。

但 CXL 目前更多是 HBM 的"补充"而非"替代"——它解决的是"内存容量不够"的问题,而 HBM 解决的是"内存带宽不够"的问题。两者不在同一维度。

替代路线 3:国内 DRAM(长鑫存储)

长鑫存储(CXMT,长鑫存储的英文缩写)是国内最接近先进 DRAM 技术的厂商,目前量产约在 DDR4/LPDDR5 级别(主流内存标准代际),距 HBM3E 主流工艺节点(需要 10nm 级以下 DRAM + TSV 封装)仍有 2-3 代差距。短期无法切入 HBM 主流供应链。

但国内 AI 服务器受出口管制影响,大量使用 H20(英伟达为应对美国出口管制、专供中国市场的降级版 AI 芯片)等降级版本(HBM 规格缩水),反而给国内 DRAM 厂商留出了"非主流 HBM"的生态位。只是这个市场的量级,和全球 HBM 主流市场不在一个量级。


第三部分:横纵交汇——AI存储的当下判断与未来走向

一、纵向脉络告诉我们什么

回看 HBM 的十年,有三条因果链特别清晰:

第一,技术赌注的非线性回报。 SK 海力士在 2011-2021 年的持续投入,在 2023 年迎来了爆发性兑现。但这个兑现的触发点(ChatGPT)是外生的、不可预测的。长期主义是对的,但长期主义的成功需要运气——这是商业史反复验证的规律。

第二,"专精"在 AI 时代压倒"大而全"。 三星的失足证明:在 AI 时代,拥有最大的产能、最多的钱、最全的产业链,不等于能赢。HBM 的核心壁垒是"工艺 know-how",这是时间积累出来的,不是资本能买到的。这和西门子医疗在医疗器械行业的"深耕"逻辑一致——在一个领域深耕十年的人,比什么都做一点的巨人更有竞争力。

第三,代际切换是供应商格局的重置键。 每一次 HBM 代际切换(HBM2→HBM2E→HBM3→HBM3E→HBM4),都重新洗牌过供应商格局。HBM3 时代 SK 海力士一家独大,HBM3E 时代美光切入,HBM4 时代三星能否翻盘仍是悬念。这意味着:当前的格局不是终局,下一代的竞争已经开始。

二、横向格局告诉我们什么

横向对比揭示了三个结构性判断:

第一,HBM 是一个"寡头 + 高壁垒"的市场,且壁垒在加固。 三家玩家的份额此消彼长,但没有第四家能进场(寡头:少数几家厂商垄断市场的结构)。TSV 工艺、CoWoS 封装、客户认证周期,构成了三重护城河(竞争壁垒,对手难以逾越的优势)。新进入者(包括国内厂商)短期无法撼动。

第二,"领先者困境"是 SK 海力士的核心矛盾,但短期内不可解。 客户集中度高是结构性的,多元化又会损害利润率。这个困境会持续存在,直到出现以下三种情况之一:(a) 英伟达份额被云厂商自研芯片稀释;(b) HBM 需求增速放缓,产能不再紧缺;(c) 出现新的内存技术替代 HBM。短期内三者都不会发生。

第三,美光是当前格局里"性价比最高"的玩家。 它不需要赢,只需要"不被甩下"。作为第二供应商,它能吃到结构性红利(所有去英伟达化的客户都会选它),又不需要承担"霸主"的客户集中度风险。这是"老二哲学"的胜利。

三、综合判断:AI存储的三个走向

走向 1:HBM4 爬坡已启动,但 2026 年供需矛盾仍未缓解

美光已在 2026 Q1 启动 HBM4 量产(面向 Rubin),SK 海力士和三星预计下半年跟上。但 Blackwell Ultra(英伟达 Blackwell 架构的升级版 GPU)需求已提前锁定了绝大部分 HBM3E 产能,HBM4 爬坡初期产能仍远低于需求。整个 2026 年,AI 算力的最大供应链瓶颈仍然是 HBM——不是 GPU 算力本身,而是封装 HBM 的内存和封装产能。

判断(推测):谁锁定了 2027 年的 HBM4 产能配额,谁就锁定了 Rubin 时代的 GPU 供应链地位。英伟达每年与 HBM 供应商签署的长期产能预购协议,是比任何季度财报更关键的先行指标(提前反映趋势的信号)。

走向 2:"领先者困境"将倒逼 SK 海力士做出战略选择

2026-2027 年,SK 海力士必须回答一个问题:是继续做"英伟达的专属工匠",还是做"全行业的内存供应商"?

如果选前者,它要接受客户集中度的风险,并主动配合英伟达的技术路线(包括为 Rubin 定制 HBM4 规格)。如果选后者,它要在产能分配上向 Google、微软等倾斜,但这会激怒英伟达,并可能触发英伟达扶持三星/美光的"报复"。

推测:SK 海力士大概率会选择"以英伟达为主、缓慢渗透其他客户"的折中路线。因为在当前高利润率环境下,保住英伟达的订单是短期收益最大化的选择。多元化是长期正确的事,但短期会被利润率压力压制。这是"正确的事"和"容易的事"的冲突。

走向 3:内存技术路线将出现分化——云端 HBM vs 端侧统一内存

AI 存储不会收敛到单一技术路线。云端训练(英伟达 GPU + HBM)追求极致带宽,端侧推理(苹果 M 系列 + 统一内存)追求低功耗和高集成度。两条路线的商业模式也完全不同

  • • HBM 路线:定制化、短周期、高毛利、弱规模效应——"高级定制裁缝"
  • • 统一内存路线:通用化、长周期、低毛利、强规模效应——"开超市"

苹果选择后者,是因为它的优势在端侧规模和生态整合,而不在云端算力。这两条路线将长期并存,且互相不能替代。

四、小结

HBM 的十年,是一个关于"长期主义 + 运气"的故事;

HBM 的当下,是一个关于"领先者困境"的案例;

HBM 的未来,是一场关于"谁能在下一代代际切换中锁定产能"的竞赛。

而对所有身处 AI 浪潮的人来说,HBM 提供的更深的启示是:

在最热闹的赛道里,最值钱的往往不是最显眼的那个环节。

GPU 是聚光灯下的主角,但 HBM 是幕后真正卡脖子的人。

写在最后

这份报告的起点很普通,和朋友吃饭聊到最近大火的 AI 存储,我发现自己对这块完全不了解。出于兴趣,我用「卡神的横纵分析法」试着做了一次完整拆解,从 HBM 的十年暗夜,一路追到 2026 年的代际切换。

关于数据:报告里的关键数据点是经过了三轮验证(TrendForce、Counterpoint、Micron 官方公告等)。但我不是半导体行业的从业者,肯定存在理解偏差或时点滞后,请以厂商官方发布和权威研报为准。

关于判断:文中的前瞻性内容(例如"推测""预计""判断"的部分)是基于公开信息和大模型的推演,仅供参考。不是投资建议,你读的时候也别据此下注。市场会变,AI也会犯错。

如果你是行业里的人,发现哪里写得不对,欢迎留言拍砖~


附:关键数据速查表

HBM 代际演进

代际
上市年份
单栈带宽
单栈容量
代表应用
HBM1
2015
~128 GB/s
4-8 GB
AMD Fiji
HBM2
2016-2018
~256 GB/s
8-16 GB
NVIDIA V100
HBM2E
2019-2021
~460 GB/s
16-24 GB
NVIDIA A100
HBM3
2022-2023
~819 GB/s
24 GB
NVIDIA H100
HBM3E
2024-2026
~1.2 TB/s
24-36 GB
NVIDIA H200/GB200
HBM4
2026-2027E
>2.5 TB/s
32-64 GB
NVIDIA GB300+/Rubin

数据说明

  1. 1. HBM4 带宽数据已更新:JEDEC 标准基准值为 >2 TB/s(基于 8 Gb/s 数据速率),实际产品性能可达 >2.5 TB/s(基于 10-11 Gb/s 数据速率)。本表采用实际产品性能数据。
  2. 2. 所有"带宽"数据如无特别说明,均指"单颗 HBM 栈(stack)"的带宽。
  3. 3. 整卡总带宽 = 单栈带宽 × 栈数量

2026 Q1 市场份额快照(Counterpoint Research)

厂商
HBM 份额
整体 DRAM 份额
HBM4 进度
趋势
SK 海力士
58%
29%
已完成开发,待量产
↓ 从 69% 回落但仍领先
三星
21%
38%
2026H2-2027
↑ 从 13% 恢复
美光
21%
22%
2026 Q1 已量产(Rubin)
↑ 与三星持平

注:HBM 份额与整体 DRAM 份额差异显著——三星在整体 DRAM 市场(含普通 DDR)仍是第一(38%),但在 HBM 市场仅排第二/第三(21%)。

英伟达 GPU 的 HBM 用量演进

GPU
架构
HBM 类型
单卡 HBM 容量
单卡总带宽
HBM 栈数量
量产时间
H100
Hopper
HBM3
80 GB
~3.35 TB/s
6
2022-2023
H200
Hopper+
HBM3E
141 GB
~4.8 TB/s
6
2024
GB200
Blackwell
HBM3E
192 GB
~8 TB/s
8
2025-2026
GB300
Blackwell Ultra
HBM3E
288 GB
~8 TB/s+
8
2026-2027
Vera Rubin
Rubin
HBM4
288 GB>22 TB/s
8
2026-2027

数据说明

  1. 1. "单卡总带宽" = 单栈带宽 × HBM 栈数量
  2. 2. Vera Rubin 于 GTC 2026(英伟达年度技术大会)发布,单卡 288GB HBM4、22TB/s 总带宽、3360 亿晶体管、50 PFLOPS(每秒千万亿次浮点运算,算力单位,1 PFLOPS = 每秒 1000 万亿次运算)
  3. 3. 美光已确认 Q1 2026 向 Rubin 平台批量出货 HBM4 36GB 12 层模块

参考文献

市场份额与行业数据

  1. 1. Counterpoint Research — Memory Tracker and Forecast Insights Report, Q1 2026(2026-06 发布)
  • • HBM 份额:SK hynix 58%、Samsung 21%、Micron 21%(Q1 2026)
  • • 整体 DRAM 份额:Samsung 38%、SK hynix 29%、Micron 22%、CXMT 8%
  • • 链接:https://www.counterpointresearch.com/en/insights/global-dram-and-hbm-market-share
  1. 2. TrendForce — HBM Industry Analysis, 1Q26(2026-02-04)
  • • HBM3E 仍是出货主力,HBM4 出货预计 2026 下半年实质性放量
  • • SK hynix 保持领先,Samsung 通过 HBM4 恢复份额,Micron 激进扩张
  • • 链接:https://www.trendforce.com/research/download/RP260204DA3(注:此链接为付费报告下载链接)
  1. 3. Astute Group — "SK hynix holds 62% of HBM, Micron overtakes Samsung"(2025-09-24,引用 Chosun Biz / Counterpoint)
  • • Q2 2025 份额:SK hynix 62%、Micron 21%、Samsung 17%(美光首次超过三星)
  • • Samsung HBM4 预计 2026 进入全规模供货
  • • 链接:https://astutegroup.com/news/general/sk-hynix-holds-62-of-hbm-micron-overtakes-samsung-2026-battle-pivots-to-hbm4
  1. 4. Presenc AI — HBM Market Share 2026(2026-05 更新)
  • • 综合多源数据,提供 HBM3E vs HBM4 代际混合估算
  • • 链接:https://presenc.ai/research/hbm-market-share-samsung-skhynix-micron-2026
  1. 5. DRAMWatch(2026-05-30 更新)
  • • HBM 和 DRAM 合约价、市场份额、供需、HBM4 路线图
  • • 链接:https://dramwatch.com

HBM4 与 Rubin GPU 规格

  1. 1. Micron Technology — "Micron in High-Volume Production of HBM4 Designed for NVIDIA Vera Rubin"(2026-03-17,官方投资者公告)
  • • 2026 Q1 开始批量出货 HBM4 36GB 12 层模块
  • • 专为 NVIDIA Vera Rubin 设计
  • • 链接:https://investors.micron.com/news-releases/news-release-details/micron-high-volume-production-hbm4-designed-nvidia-vera-rubin
  1. 2. NVIDIA GTC 2026 — Vera Rubin GPU 发布
  • • 3360 亿晶体管、288GB HBM4、22TB/s 带宽、50 PFLOPS
  • • 分析来源:https://tech-insider.org/nvidia-gtc-2026-rubin-gpu-analysis(2026-03-16)
  • • 中文拆解:https://lucy.suiyan.cc/blog/2026-06-01_nvidia-vera-rubin-gpu

SK 海力士 HBM4 进度

  1. 1. Tom's Hardware — "SK hynix completes development of HBM4"
  • • 2048-bit 接口、10 Gbps 数据率、效率较 HBM3E 提升约 40%
  • • 量产待客户认证完成
  • • 链接:https://www.tomshardware.com/pc-components/ram/sk-hynix-completes-development-of-hbm4(引用自 astutegroup.com 报告)

三星 HBM 恢复

  1. 1. Reuters Breakingviews — "Samsung has fighting shot to close AI marathon gap"(2025-09-23)
  • • 三星平泽 P5 厂恢复建设
  • • 第六代 10nm 级 DRAM 工艺作为 HBM4 跳板
  • • 链接:https://www.reuters.com/commentary/breakingviews/samsung-has-fighting-shot-close-ai-marathon-gap-2025-09-23

产业链与客户结构

  1. 1. 雪球 — "SK海力士HBM、SSD订单排期全梳理"(2026-05-16)
  • • 2026 年全年 HBM 产能 100% 售罄,常规订单排至 2027 Q1
  • • 头部长约客户:英伟达、微软、谷歌
  • • 链接:https://xueqiu.com/9809844929/389262483

发表评论
0评