
半导体研究机构SemiAnalysis进去发布报告指出,英伟达正在将其最新的Rubin NVL72系统的SOCAMM DRAM容量从每机架约55TB削减至约28TB,降幅约50%。

报告称大多数Rubin系统预计将使用96GB的SOCAMM模块,而非192GB模块。
这一容量调整带来的成本变化是:每机架估计成本从760万美元降至680万美元,每GPU每小时的总拥有成本(TCO)从4.16美元降至3.90美元。
需要回顾的是英伟达此前表示SOCAMM是一个3000亿美元的潜在市场(TAM)。
在当前内存供应短缺的背景下,英伟达调整系统内存配置规格,是一个值得关注的产业动作。
01
SOCAMM容量削减50%
SemiAnalysis报告的核心是英伟达对Rubin NVL72系统SOCAMM DRAM容量的削减。
SOCAMM-System on Chip Advanced Memory Module先进内存模块是英伟达专为其Vera CPU设计的下一代内存模块,采用LPDDR5X内存。

据此前披露,Rubin NVL72也称VR200 NVL72原本配置54TB的LPDDR5X内存,相比上一代GB200 NVL72的17TB增长约三倍。
每颗Vera CPU可寻址高达1.5TB的SOCAMM LPDDR5X内存,提供高达1.2TB/s的内存带宽。
SemiAnalysis报告指出,英伟达正在将SOCAMM DRAM容量从约55TB削减至约28TB,降幅约50%。
实现这一削减的方式是大多数Rubin系统将使用96GB的SOCAMM模块,而非192GB模块。换言之通过将单模块容量从192GB降至96GB,整机架的SOCAMM总容量相应减半。
它反映出英伟达在内存供应紧张的背景下对系统内存配置进行的优化。
当LPDDR5X价格大幅上涨、SOCAMM2模块制造和测试成本高昂时,削减SOCAMM容量是英伟达控制系统成本的一种方式。
02
成本变化
机架成本降至680万美元
SOCAMM容量削减带来的直接结果是Rubin NVL72系统成本的下降。SemiAnalysis报告指出,这一容量调整使每机架估计成本从760万美元降至680万美元下降约80万美元。

同时每GPU每小时的总拥有成本(TCO)从4.16美元降至3.90美元下降约6%。
这一成本变化需要放在Rubin NVL72整体成本结构中理解。据摩根士丹利此前测算,VR200 NVL72机架的BOM成本约780万美元,部分配置高达880万美元,相比上一代GB300 NVL72约400万美元接近翻倍。

其中内存成本暴涨485%,内存相关组件占整机架成本的约25%至30%,单机架内存价值达约200万美元。
在内存成本占比如此之高的背景下,削减SOCAMM容量50%能够显著降低系统成本。据SemiAnalysis此前数据英伟达在2026年第一季度为LPDDR5X支付约8美元/GB
这一价格随着需求上升和SOCAMM2模块的高制造测试成本,可能在未来季度进一步上涨。在这种情况下削减SOCAMM容量是英伟达应对内存价格上涨、控制系统成本的合理举措。
TCO的下降,从4.16美元降至3.90美元/小时/GPU,对超大规模云厂商具有直接价值。AI数据中心的运营成本很大程度上取决于每GPU的TCO。
TCO下降约6%意味着云厂商运营Rubin系统的成本相应降低,这有助于提升AI算力的经济性。
03
SOCAMM:3000亿美元TAM
理解英伟达调整SOCAMM容量的逻辑,需要先理解SOCAMM的市场规模和战略地位。英伟达此前表示,SOCAMM是一个3000亿美元的潜在市场(TAM)。
这一规模反映出SOCAMM在AI数据中心内存中的重要地位。SOCAMM作为英伟达Vera CPU专用的内存模块,其需求将随Vera CPU的部署规模而增长。
据韩国KIS此前测算仅英伟达独立Vera CPU销售一项,就可能消耗全球三大DRAM厂商的SOCAMM全年供应量。

如果叠加VR NVL72系统的SOCAMM需求,CY2027 SOCAMM总需求可能突破800亿Gb,相当于全球智能手机LPDDR5的年TAM总和。
在SOCAMM需求如此庞大、而内存供应又紧张的背景下,英伟达调整SOCAMM容量配置,是管理其庞大内存需求的一种方式。
正如SemiAnalysis报告所暗示的,鉴于内存短缺,英伟达管理(调整)系统规格是合理的举措。
这一调整也反映出英伟达在系统设计上的灵活性,英伟达可以根据内存供应和成本情况,调整系统的内存配置规格,以在性能、成本、供应之间取得平衡。
容量削减的影响:性能与成本的权衡
04
这一削减对系统性能有何影响?
SOCAMM LPDDR5X是连接到Vera CPU的系统内存,主要用于AI智能体工作负载的数据编排、上下文管理、工具调用等任务,而非GPU的核心计算
后者由HBM承担。SOCAMM容量的削减意味着每机架可用于这些CPU侧任务的系统内存减少。
对于不同的工作负载SOCAMM容量削减的影响可能不同。对于内存密集型的AI智能体工作负载,需要大量系统内存来管理长上下文、多任务编排,SOCAMM容量削减可能带来一定的性能约束。
而对于内存需求相对较低的工作负载96GB模块可能已经足够。
英伟达选择大多数Rubin系统使用96GB模块,反映出其判断:对于大多数工作负载,96GB的SOCAMM配置能够满足需求,同时显著降低系统成本。
这是一种性能与成本的权衡,在内存供应紧张、价格高昂的背景下,英伟达选择了更经济的内存配置。
值得注意的是这一调整是大多数Rubin系统的配置,而非全部。
这意味着对于需要更大系统内存的特定工作负载,英伟达仍可能提供192GB模块的配置选项。这种灵活的配置策略使英伟达能够根据不同客户的需求提供差异化的系统配置。
05
对内存供应链的影响
第一是对LPDDR5X需求的影响。SOCAMM采用LPDDR5X内存,SOCAMM容量削减50%,意味着每机架的LPDDR5X需求相应减少。
这在一定程度上缓解了Rubin系统对LPDDR5X的需求压力。不过考虑到Rubin系统的部署规模庞大,以及LPDDR5X在其他AI数据中心CPU中的应用,LPDDR5X的整体需求仍将保持强劲。
第二是对内存厂商的影响。SK海力士、三星、美光是SOCAMM的主要供应商。SOCAMM容量削减,意味着每机架的SOCAMM采购量减少,这在短期内可能略微影响内存厂商的SOCAMM销售。

但考虑到SOCAMM 3000亿美元的TAM和Rubin系统的庞大部署规模,SOCAMM仍将是内存厂商的重要增长来源。
第三是对系统成本结构的影响。SOCAMM容量削减使Rubin系统成本下降,这有助于提升AI算力的经济性。
对于超大规模云厂商而言,更低的系统成本和TCO,意味着部署AI算力的经济性提升,这可能促进AI算力的更广泛部署。
06
英伟达的内存管理策略
当前内存供应链处于全面紧张状态,DRAM、NAND、HBM、LPDDR5X价格均大幅上涨。在这种背景下英伟达作为内存的最大采购方之一,需要管理其庞大的内存需求和成本。
英伟达的内存管理策略包括多个方面:
调整系统内存配置规格,如本次SOCAMM容量削减,在性能与成本之间取得平衡
锁定长期内存供应,英伟达已与SK海力士等签订新的HBM供应协议
通过系统设计优化降低内存成本,如使用更经济的内存模块。
黄仁勋此前在SK海力士展台留下Please Make More请多生产一些的留言,直观反映出英伟达对内存供应的旺盛需求。
在内存供应无法完全满足需求的背景下,英伟达通过调整系统内存配置来管理需求和成本,是一种务实的应对策略。
07
对全球AI算力产业链的多重意义
SemiAnalysis关于Rubin SOCAMM容量削减的报告,对全球AI算力产业链具有多层次意义。
第一是内存成为AI系统成本的核心变量。Rubin系统内存成本占比达25%至30%、单机架内存价值约200万美元,内存已经成为AI系统成本的核心变量。
英伟达通过调整SOCAMM容量来管理系统成本,反映出内存在AI系统成本结构中的关键地位。
第二是系统设计的灵活性。英伟达根据内存供应和成本情况调整系统内存配置,反映出其在系统设计上的灵活性。这种灵活性使英伟达能够在内存供应紧张的背景下,仍能控制系统成本、维持AI算力的经济性。
第三是TCO的优化。SOCAMM容量削减使每GPU的TCO从4.16美元降至3.90美元,这对超大规模云厂商运营AI算力的经济性具有直接价值。在AI算力大规模部署的背景下,TCO的优化有助于提升AI算力的整体经济性。
第四是内存供应紧张的产业现实。英伟达削减SOCAMM容量这一动作本身,反映出内存供应紧张的产业现实。正如SemiAnalysis报告所暗示的鉴于内存短缺,英伟达管理系统规格是合理的。这印证了本月以来内存供应全面紧张的产业判断。
第五是AI算力成本的下降趋势。尽管Rubin系统成本相比上一代大幅上升,但通过SOCAMM容量削减等优化措施,英伟达正在努力控制系统成本。

这与英伟达每Token成本降低的产品定位一致,通过系统优化英伟达致力于降低AI算力的单位成本。
从SOCAMM DRAM容量从55TB削减至28TB,到机架成本从760万降至680万美元、TCO从4.16美元降至3.90美元/小时/GPU,再到SOCAMM 3000亿美元TAM的背景
SemiAnalysis的这份报告清晰地展示了英伟达在内存供应紧张背景下的系统成本管理策略。这一调整的核心是在内存价格高昂、供应紧张的背景下,通过使用更经济的内存模块来降低系统成本、优化TCO。
这一调整反映出内存已成为AI系统成本的核心变量,以及英伟达在系统设计上的灵活性。这一策略能否在控制成本的同时维持系统性能,将取决于不同工作负载对系统内存的实际需求。
但从这一调整来看内存供应紧张的产业现实,以及内存在AI系统成本中的关键地位,都得到了进一步确认。
数据来源:SemiAnalysis、Tom's Hardware、摩根士丹利、VideoCardz、StorageReview、Guru3D、HashrateIndex本文内容仅供参考,不构成任何投资建议
请在微信客户端打开





