英伟达财报炸场:当硬件优势遇到极限

2026-06-16 20:12

英伟达财报炸场:当硬件优势遇到极限

英伟达财报炸场：当硬件优势遇到极限

2027财年Q1，英伟达营收816亿美元，同比增长85%。

市场狂欢，股价上涨。

但如果你仔细看这份财报，再看看华为最新的动作，会发现一个让人不安的事实：

英伟达的硬件优势，正在遇到极限。而华为正在用一套全新的规则，绕过这个极限。

英伟达的优势：硬件 + CUDA

英伟达为什么这么强？

简单来说，有两个优势：

? 优势1：硬件性能领先

• H100：2022年发布，性能是A100的4倍

• H200：2024年发布，HBM内存提升到141GB

• Blackwell：2025年发布，性能是H100的5倍

• Rubin：2026年量产，专为AI智能体（Agent）量身打造

? 优势2：CUDA生态系统

• 全球超过400万开发者在用CUDA

• 超过3000个应用支持CUDA加速

• 迁移成本极高：重新写代码需要2-3年

这两个优势加起来，让英伟达在AI芯片市场占据了80%以上的份额。

但问题是：这两个优势都有极限。

硬件优势有极限：Rubin之后是什么？

2026年6月，英伟达宣布Vera Rubin CPU全面进入量产阶段。

这是英伟达下一代架构，专为AI智能体（Agent）量身打造。

但如果你仔细看Rubin的规格，会发现一个事实：

⚠️ Rubin的性能提升正在放缓

• H100 → Blackwell：性能提升5倍

• Blackwell → Rubin：性能提升2.5倍（预估）

• Rubin → 下一代：性能提升可能只有1.5倍（预估）

为什么放缓？

因为物理极限。

晶体管已缩小至原子级别，量子效应导致漏电问题无法回避。从28纳米推进到7纳米，芯片研发成本增加了近10倍，但性能收益却愈来愈边际递减。

这意味着：英伟达过去靠制程进步带来的性能飞跃，正在接近天花板。Rubin之后的性能提升，只能靠架构优化和系统设计。

而架构优化的提升，是有极限的。

华为的突破：韬定律 + 系统级战争

这是最让人震撼的部分。

华为不仅绕过了单芯片性能的劣势，还提出了一套全新的半导体演进理论。

韬定律：用"时间缩微"替代"几何缩微"

2026年5月25日，华为董事、半导体业务部总裁何庭波在IEEE国际电路与系统研讨会（ISCAS 2026）上，正式发布了韬（τ）定律。

这个定律的核心思路是：不再追求晶体管的几何缩微（把晶体管做小），而是追求时间常数τ的缩微（让信号传播更快）。

说白了：摩尔定律是"把路修窄一点，让车跑得更快"，韬定律是"换一种修路的方式，让车跑同样的距离但用更少的时间"。

? 韬定律的四大层级

• 器件层：优化晶体管和互连电阻，从物理底层缩微时间常数τ

• 电路层：逻辑折叠技术突破平面布局物理边界，缩短关键路径走线长度，提升晶体管密度和电路性能

• 芯片层：软件、架构、芯片全栈协同设计，基于实际工作负载细粒度控制指令流和数据流

• 系统层：定义灵衢总线，重构计算系统互联协议，实现超节点统一内存编址和原生内存语义

韬定律不是纸上谈兵。过去六年，华为基于韬定律已经成功设计并量产了381款芯片。2026年秋季面世的新麒麟芯片，将率先采用逻辑折叠技术。何庭波预计，到2031年，基于韬定律的高端芯片晶体管密度将达到1.4纳米制程的同等水平。

这意味着什么？华为正在绕过EUV光刻机的限制，用一套全新的技术路线，实现与最先进制程同等的晶体管密度。

系统级突破：避开单芯片，打系统级战争

华为很清楚：在单芯片性能上，昇腾950打不过英伟达Rubin。

但华为发现：单芯片性能不重要，重要的是系统级性能。

黄仁勋自己在播客采访中也承认了这个逻辑——他说，中国能源充沛，完全可以通过"堆叠芯片集群"来弥补单颗芯片的性能差距。美国能源匮乏，所以英伟达必须追求极致的每瓦性能；但中国电力充沛，堆集群比拼单芯片更划算。

? 华为CloudMatrix 384超节点

• 组成：384颗昇腾950芯片通过"灵衢总线"互联

• 系统级算力：超过英伟达NVL72（72颗GPU）

• 关键：不是单芯片性能强，而是互联效率高

• 结果：在AI大模型训练中，系统级性能比英伟达NVL72高20%

? 范式转变：从"单芯片竞争"到"系统级竞争"

• 旧范式：比单芯片性能（英伟达赢）

• 新范式：比系统级性能（华为可能赢）

• 为什么：AI大模型训练需要数千颗芯片协同工作，单芯片性能再强，互联效率不高也没用

英伟达Rubin vs 华为昇腾950/960：专业对比

为了看清竞争格局，我做了详细的参数对比。

? 单芯片算力对比

参数	英伟达 Rubin R200	华为昇腾950DT	华为昇腾960（预估）
FP8算力	~35 PFLOPS	~1 PFLOPS	~2 PFLOPS
FP4算力	50 PFLOPS	~1.5 PFLOPS	~3 PFLOPS
HBM内存	288GB HBM4	144GB 自研HBM	288GB 自研HBM
内存带宽	22 TB/s	4 TB/s	8 TB/s（预估）
功耗	1800-2300W	~800W（预估）	~1200W（预估）

? 集群系统级算力对比

参数	英伟达 Vera Rubin NVL72	华为 CloudMatrix 384	华为 Atlas 950 SuperPod
芯片数量	72颗 Rubin GPU	384颗昇腾950	8192颗昇腾950
FP8总算力	~2.5 EFLOPS	384 PFLOPS	8 EFLOPS
FP4总算力	3.6 EFLOPS	576 PFLOPS	12 EFLOPS
总HBM内存	20.7 TB	55.3 TB	1,180 TB
互联带宽	260 TB/s（NVLink 6）	灵衢总线（等价~200 TB/s）	灵衢全光互联
系统级性能	基准	超过NVL72约20%	大规模训练更强

? 关键结论

• 单芯片性能：英伟达Rubin领先华为昇腾950约35倍（FP8）

• 系统级性能：华为通过更多芯片+更高互联效率，实现了系统级性能反超

• 成本优势：华为单芯片成本约10万元（英伟达约20-30万元）

• 功耗优势：华为单芯片功耗更低，适合大规模部署

2026年3月：Atlas 950 SuperPod发布

华为在2026年3月的巴塞罗那世界移动通信大会上，发布了Atlas 950 SuperPod。

? Atlas 950 SuperPod关键参数

• 集成芯片数量：8192颗昇腾950芯片

• 单柜算力：64 PFLOPS FP8 和 128 PFLOPS FP4

• 单柜HBM内存：9,216GB（每颗昇腾950DT集成144GB HBM）

• 互联技术：灵衢全光互联，柜内节点间0线缆互联

• 系统规模：由160个机柜组成（128个计算机柜 + 32个互联机柜）

这就像：英伟达造的是"跑车"（单芯片性能强），华为造的是"火车"（系统级性能强）。

跑车在赛道上厉害，但运货还是火车厉害。AI大模型训练，就是"运货"。

CUDA护城河：DeepSeek正在撕开一道裂缝

说到这里，你可能会问：华为系统级性能再强，开发者还是用CUDA啊，迁移成本那么高，华为怎么赢？

这是英伟达最深的护城河。但如果你仔细看，会发现这道护城河正在被撕开一道裂缝。

侵蚀1：AI框架正在"去CUDA化"

PyTorch 2.0、TensorFlow 3.0，都在做一件事：抽象硬件层。

以前，开发者写AI代码，要直接调用CUDA。现在，开发者写AI代码，调用的是PyTorch，PyTorch再自动调用CUDA或华为的CANN。开发者根本不需要知道底层用的是谁的芯片。

华为的CANN生态2025年已全面开源，还推出了一键迁移工具，把代码迁移时间从数月缩短至小时级。

侵蚀2：大模型公司正在"自研芯片"

谷歌、亚马逊、微软、Meta、腾讯、阿里巴巴，都在自研AI芯片。这些公司有足够的软件团队，可以自己适配硬件，不需要CUDA，他们自己写底层代码。英伟达的CUDA护城河，对这些公司无效。

侵蚀3：中国市场的"脱CUDA化"

由于美国制裁，中国公司无法买到英伟达最先进的GPU（H100、A100）。这逼着中国公司必须"脱CUDA化"。

2025年，国内AI服务器市场国产芯片份额已达41%，预计2026年国产算力芯片出货量将实现3倍以上增长。

最震撼的案例：DeepSeek V4全链路适配华为昇腾

2026年4月，DeepSeek发布了新一代旗舰大模型V4，1.6万亿参数，MoE架构，每次推理仅激活490亿参数。

重点不在模型本身——重点是，DeepSeek V4在设计之初就优先围绕华为昇腾950P芯片进行适配，完成了从训练到推理再到部署的全链路深度优化。

⚠️ DeepSeek V4 + 昇腾950P的实测数据

• 单卡推理性能达到英伟达特供版H20芯片的2.87倍

• 推理延迟较前代降低35%

• 单机算力成本较英伟达方案下降40%

• 成为国内首个彻底摆脱英伟达依赖的万亿级大模型

更值得注意的一个细节：在DeepSeek V4定价说明的灰色小字中写着——"受限于高端算力，目前Pro的服务吞吐十分有限，预计下半年昇腾950超节点批量上市后，Pro的价格会大幅下调"。

当模型价格开始"锚定"国产算力的部署进度时，说明国产算力已经在DeepSeek的整体体系中占据了关键位置。

这件事让黄仁勋坐不住了。

? 黄仁勋在接受科技播客主持人Dwarkesh Patel专访时说

"如果顶尖的AI模型被优化在华为芯片上运行，对美国而言将是'可怕的结果'乃至'灾难性的后果'。"

他还直言美国的芯片出口管制政策"极其幼稚"。

黄仁勋为什么这么紧张？

因为DeepSeek的案例证明了一件可怕的事：世界可以不需要英伟达。CUDA不再是不可替代的——顶尖AI模型可以基于华为昇腾完成从训练到推理的全流程，性能还能超过英伟达的特供芯片。

正如36氪的文章标题所说："DeepSeek-V4发布，黄仁勋的担忧成真了。"

AI的未来：用户到底为什么买单？

这个问题比财报数据更重要。

用户不是为"英伟达的GPU"买单，用户是为"AI帮我解决问题"买单。英伟达在价值链的底层，而用户买单在顶层。中间隔了多少层？每一层都可能被替代。

? AI市场三层分析

? 第一层：AI训练市场——市场空间~500亿美元/年，增长放缓，英伟达占80%+份额，但接近饱和

? 第二层：AI推理市场——市场空间~1037亿美元（2025年），预计到2034年增长至3126亿美元，这才是真正的巨无霸

? 第三层：AI应用市场——Gartner预估全球AI总支出2026年达2万亿美元，2029年达3.3万亿美元，但英伟达吃不到

? 关键：推理市场才是英伟达的未来，但推理对单芯片性能的要求低于训练，华为的系统级方案在推理场景更有竞争力

让我说得更直白一点：

训练大模型，确实需要英伟达的顶级GPU。但推理——也就是让训练好的模型实际运行、帮用户解决问题——不需要那么强的单芯片性能，需要的是足够多的算力和足够低的成本。

这恰恰是华为擅长的：用更多便宜芯片堆出更大算力，用更低的成本服务更多用户。

DeepSeek V4定价说明中那行小字就是证据：昇腾950超节点批量上市后，Pro价格会大幅下调。当算力成本下降传导到模型价格，推理市场的竞争格局就会被改写。

深度价值分析：英伟达的估值贵不贵？

说了这么多数据和分析，回到最核心的问题：英伟达的估值靠什么支撑？

商业模式分析：英伟达的赚钱逻辑

英伟达赚的是什么钱？

? 英伟达的赚钱逻辑

• 收入来源1：卖GPU硬件（一次性收入，有周期性）

• 收入来源2：CUDA生态锁定（持续性收入，但正在被侵蚀）

• 缺陷1：硬件销售有周期性（AI热潮退去后，需求会下降）

• 缺陷2：CUDA生态正在被侵蚀（DeepSeek V4证明CUDA不再是必需品）

对比一下茅台：茅台赚的是卖白酒的钱，无周期性，品牌护城河极其稳定。英伟达赚的是卖硬件的钱，有周期性，护城河正在被侵蚀。英伟达不是"永恒赚钱"的公司。

竞争护城河分析：还能守多久？

⚠️ 英伟达的两大护城河现状

• 护城河1：硬件性能领先 → 正在丧失（Rubin之后性能提升放缓 + 华为韬定律 + 系统级突破）

• 护城河2：CUDA生态 → 正在被侵蚀（去CUDA化 + 自研芯片 + DeepSeek V4全链路适配昇腾）

• 结论：两大护城河都不稳固，未来不确定性高

财务健康度分析：现金流够不够强？

✅ 英伟达财务数据（2027财年Q1）

• 营收：816亿美元（同比+85%）

• 毛利率：74.9%（非常健康）

• 负债率：低负债率（财务稳健）

• 研发投入：每年投入~100亿美元（维持技术领先）

财务非常健康，但估值已经反映了最乐观的预期。

估值分析：英伟达贵不贵？

? 英伟达当前估值（2026年6月）

• 市值：~4万亿美元

• PE（市盈率）：~30倍

• PS（市销率）：~15倍

• 毛利率：74.9%

? 估值对比

• 茅台：PE ~40倍（但茅台是"永恒赚钱"的公司，现金流极其稳定）

• 腾讯：PE ~20倍（但腾讯有微信生态，用户粘性极强）

• 苹果：PE ~25倍（但苹果有iOS生态，用户粘性极强）

• 英伟达：PE ~30倍（但硬件优势正在遇到极限，CUDA护城河正在被侵蚀）

英伟达的估值已经反映了最乐观的预期。如果未来3年，硬件优势逐渐丧失，CUDA护城河逐渐被侵蚀，PE大概率从30倍回落至15-20倍。

段永平为什么买英伟达？

段永平在2025年底开始建仓英伟达，他的逻辑可能是：

? 段永平可能的投资逻辑

• AI是"未来10年最确定的趋势"，英伟达是"卖铲子"的

• CUDA生态的"迁移成本"够高，短期内不会被替代

• 段永平看的是"10年后"，愿意承受短期波动

但段永平买英伟达，和段永平买茅台、买苹果，不是同一类投资。茅台和苹果是"永恒赚钱"的公司，护城河几乎不可能被颠覆。英伟达的护城河——硬件性能和CUDA——都正在被侵蚀。

❌ 估值判断方向

• 当前估值：偏贵（PE 30倍，已经反映了最乐观的预期）

• 未来估值方向：大概率回落（硬件优势放缓 + CUDA护城河被侵蚀 → PE可能回落至15-20倍）

• 判断结论：当前估值偏高，等待估值回落

英伟达财报很亮眼，但亮眼的财报不代表它是"永恒赚钱"的公司。

当硬件优势遇到极限，当韬定律打开了绕过制程进步的新路径，当DeepSeek证明了CUDA不再是必需品——英伟达的估值，已经反映了最乐观的预期。

投资还是要回到本质：这家公司10年后还会存在吗？还会赚钱吗？赚的是真金白银吗？估值合理吗？

对于英伟达，10年后还会存在，但护城河是否还在、估值是否还撑得住，我不确定。

不确定，就耐心等。

? 觉得文章有深度？点个赞和在看，让更多人看到深度分析

? 你有不同看法？欢迎评论区留言，理性讨论，不骂人

? 想看更多深度分析？点个关注，下次推送不迷路

打赏