展会资讯
英伟达财报炸场:当硬件优势遇到极限
2026-06-16 20:12
英伟达财报炸场:当硬件优势遇到极限

英伟达财报炸场:当硬件优势遇到极限

2027财年Q1,英伟达营收816亿美元,同比增长85%

市场狂欢,股价上涨。

但如果你仔细看这份财报,再看看华为最新的动作,会发现一个让人不安的事实

英伟达的硬件优势,正在遇到极限。而华为正在用一套全新的规则,绕过这个极限。


英伟达的优势:硬件 + CUDA

英伟达为什么这么强?

简单来说,有两个优势:

优势1:硬件性能领先

• H100:2022年发布,性能是A100的4倍

• H200:2024年发布,HBM内存提升到141GB

• Blackwell:2025年发布,性能是H100的5倍

• Rubin:2026年量产,专为AI智能体(Agent)量身打造

优势2:CUDA生态系统

• 全球超过400万开发者在用CUDA

• 超过3000个应用支持CUDA加速

• 迁移成本极高:重新写代码需要2-3年

这两个优势加起来,让英伟达在AI芯片市场占据了80%以上的份额。

但问题是:这两个优势都有极限


硬件优势有极限:Rubin之后是什么?

2026年6月,英伟达宣布Vera Rubin CPU全面进入量产阶段

这是英伟达下一代架构,专为AI智能体(Agent)量身打造。

但如果你仔细看Rubin的规格,会发现一个事实:

⚠️ Rubin的性能提升正在放缓

• H100 → Blackwell:性能提升5倍

• Blackwell → Rubin:性能提升2.5倍(预估)

• Rubin → 下一代:性能提升可能只有1.5倍(预估)

为什么放缓?

因为物理极限

晶体管已缩小至原子级别,量子效应导致漏电问题无法回避。从28纳米推进到7纳米,芯片研发成本增加了近10倍,但性能收益却愈来愈边际递减。

这意味着:英伟达过去靠制程进步带来的性能飞跃,正在接近天花板。Rubin之后的性能提升,只能靠架构优化和系统设计。

而架构优化的提升,是有极限的。


华为的突破:韬定律 + 系统级战争

这是最让人震撼的部分。

华为不仅绕过了单芯片性能的劣势,还提出了一套全新的半导体演进理论

韬定律:用"时间缩微"替代"几何缩微"

2026年5月25日,华为董事、半导体业务部总裁何庭波在IEEE国际电路与系统研讨会(ISCAS 2026)上,正式发布了韬(τ)定律

这个定律的核心思路是:不再追求晶体管的几何缩微(把晶体管做小),而是追求时间常数τ的缩微(让信号传播更快)

说白了:摩尔定律是"把路修窄一点,让车跑得更快",韬定律是"换一种修路的方式,让车跑同样的距离但用更少的时间"。

韬定律的四大层级

• 器件层:优化晶体管和互连电阻,从物理底层缩微时间常数τ

• 电路层逻辑折叠技术突破平面布局物理边界,缩短关键路径走线长度,提升晶体管密度和电路性能

• 芯片层:软件、架构、芯片全栈协同设计,基于实际工作负载细粒度控制指令流和数据流

• 系统层:定义灵衢总线,重构计算系统互联协议,实现超节点统一内存编址和原生内存语义

韬定律不是纸上谈兵。过去六年,华为基于韬定律已经成功设计并量产了381款芯片。2026年秋季面世的新麒麟芯片,将率先采用逻辑折叠技术。何庭波预计,到2031年,基于韬定律的高端芯片晶体管密度将达到1.4纳米制程的同等水平

这意味着什么?华为正在绕过EUV光刻机的限制,用一套全新的技术路线,实现与最先进制程同等的晶体管密度。

系统级突破:避开单芯片,打系统级战争

华为很清楚:在单芯片性能上,昇腾950打不过英伟达Rubin。

但华为发现:单芯片性能不重要,重要的是系统级性能

黄仁勋自己在播客采访中也承认了这个逻辑——他说,中国能源充沛,完全可以通过"堆叠芯片集群"来弥补单颗芯片的性能差距。美国能源匮乏,所以英伟达必须追求极致的每瓦性能;但中国电力充沛,堆集群比拼单芯片更划算

华为CloudMatrix 384超节点

• 组成:384颗昇腾950芯片通过"灵衢总线"互联

• 系统级算力:超过英伟达NVL72(72颗GPU)

• 关键:不是单芯片性能强,而是互联效率高

• 结果:在AI大模型训练中,系统级性能比英伟达NVL72高20%

范式转变:从"单芯片竞争"到"系统级竞争"

• 旧范式:比单芯片性能(英伟达赢)

• 新范式:比系统级性能(华为可能赢)

• 为什么:AI大模型训练需要数千颗芯片协同工作,单芯片性能再强,互联效率不高也没用

英伟达Rubin vs 华为昇腾950/960:专业对比

为了看清竞争格局,我做了详细的参数对比。

? 单芯片算力对比

参数
英伟达 Rubin R200
华为昇腾950DT
华为昇腾960(预估)
FP8算力
~35 PFLOPS
~1 PFLOPS
~2 PFLOPS
FP4算力
50 PFLOPS
~1.5 PFLOPS
~3 PFLOPS
HBM内存
288GB HBM4
144GB 自研HBM
288GB 自研HBM
内存带宽
22 TB/s
4 TB/s
8 TB/s(预估)
功耗
1800-2300W
~800W(预估)
~1200W(预估)

? 集群系统级算力对比

参数
英伟达 Vera Rubin NVL72
华为 CloudMatrix 384
华为 Atlas 950 SuperPod
芯片数量
72颗 Rubin GPU
384颗昇腾950
8192颗昇腾950
FP8总算力
~2.5 EFLOPS
384 PFLOPS
8 EFLOPS
FP4总算力
3.6 EFLOPS
576 PFLOPS
12 EFLOPS
总HBM内存
20.7 TB
55.3 TB
1,180 TB
互联带宽
260 TB/s(NVLink 6)
灵衢总线(等价~200 TB/s)
灵衢全光互联
系统级性能
基准
超过NVL72约20%
大规模训练更强

关键结论

• 单芯片性能:英伟达Rubin领先华为昇腾950约35倍(FP8)

• 系统级性能:华为通过更多芯片+更高互联效率,实现了系统级性能反超

• 成本优势:华为单芯片成本约10万元(英伟达约20-30万元

• 功耗优势:华为单芯片功耗更低,适合大规模部署

2026年3月:Atlas 950 SuperPod发布

华为在2026年3月的巴塞罗那世界移动通信大会上,发布了Atlas 950 SuperPod

Atlas 950 SuperPod关键参数

• 集成芯片数量:8192颗昇腾950芯片

• 单柜算力:64 PFLOPS FP8 和 128 PFLOPS FP4

• 单柜HBM内存:9,216GB(每颗昇腾950DT集成144GB HBM)

• 互联技术:灵衢全光互联,柜内节点间0线缆互联

• 系统规模:由160个机柜组成(128个计算机柜 + 32个互联机柜)

这就像:英伟达造的是"跑车"(单芯片性能强),华为造的是"火车"(系统级性能强)。

跑车在赛道上厉害,但运货还是火车厉害。AI大模型训练,就是"运货"。


CUDA护城河:DeepSeek正在撕开一道裂缝

说到这里,你可能会问:华为系统级性能再强,开发者还是用CUDA啊,迁移成本那么高,华为怎么赢?

这是英伟达最深的护城河。但如果你仔细看,会发现这道护城河正在被撕开一道裂缝

侵蚀1:AI框架正在"去CUDA化"

PyTorch 2.0、TensorFlow 3.0,都在做一件事:抽象硬件层

以前,开发者写AI代码,要直接调用CUDA。现在,开发者写AI代码,调用的是PyTorch,PyTorch再自动调用CUDA或华为的CANN。开发者根本不需要知道底层用的是谁的芯片。

华为的CANN生态2025年已全面开源,还推出了一键迁移工具,把代码迁移时间从数月缩短至小时级。

侵蚀2:大模型公司正在"自研芯片"

谷歌、亚马逊、微软、Meta、腾讯、阿里巴巴,都在自研AI芯片。这些公司有足够的软件团队,可以自己适配硬件,不需要CUDA,他们自己写底层代码。英伟达的CUDA护城河,对这些公司无效。

侵蚀3:中国市场的"脱CUDA化"

由于美国制裁,中国公司无法买到英伟达最先进的GPU(H100、A100)。这逼着中国公司必须"脱CUDA化"

2025年,国内AI服务器市场国产芯片份额已达41%,预计2026年国产算力芯片出货量将实现3倍以上增长。

最震撼的案例:DeepSeek V4全链路适配华为昇腾

2026年4月,DeepSeek发布了新一代旗舰大模型V4,1.6万亿参数,MoE架构,每次推理仅激活490亿参数。

重点不在模型本身——重点是,DeepSeek V4在设计之初就优先围绕华为昇腾950P芯片进行适配,完成了从训练到推理再到部署的全链路深度优化

⚠️ DeepSeek V4 + 昇腾950P的实测数据

• 单卡推理性能达到英伟达特供版H20芯片的2.87倍

• 推理延迟较前代降低35%

• 单机算力成本较英伟达方案下降40%

• 成为国内首个彻底摆脱英伟达依赖的万亿级大模型

更值得注意的一个细节:在DeepSeek V4定价说明的灰色小字中写着——"受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调"。

当模型价格开始"锚定"国产算力的部署进度时,说明国产算力已经在DeepSeek的整体体系中占据了关键位置

这件事让黄仁勋坐不住了。

黄仁勋在接受科技播客主持人Dwarkesh Patel专访时说

"如果顶尖的AI模型被优化在华为芯片上运行,对美国而言将是'可怕的结果'乃至'灾难性的后果'。"

他还直言美国的芯片出口管制政策"极其幼稚"。

黄仁勋为什么这么紧张?

因为DeepSeek的案例证明了一件可怕的事:世界可以不需要英伟达。CUDA不再是不可替代的——顶尖AI模型可以基于华为昇腾完成从训练到推理的全流程,性能还能超过英伟达的特供芯片。

正如36氪的文章标题所说:"DeepSeek-V4发布,黄仁勋的担忧成真了。"


AI的未来:用户到底为什么买单?

这个问题比财报数据更重要。

用户不是为"英伟达的GPU"买单,用户是为"AI帮我解决问题"买单。英伟达在价值链的底层,而用户买单在顶层。中间隔了多少层?每一层都可能被替代。

AI市场三层分析

第一层:AI训练市场——市场空间~500亿美元/年,增长放缓,英伟达占80%+份额,但接近饱和

第二层:AI推理市场——市场空间~1037亿美元(2025年),预计到2034年增长至3126亿美元,这才是真正的巨无霸

第三层:AI应用市场——Gartner预估全球AI总支出2026年达2万亿美元,2029年达3.3万亿美元,但英伟达吃不到

关键:推理市场才是英伟达的未来,但推理对单芯片性能的要求低于训练,华为的系统级方案在推理场景更有竞争力

让我说得更直白一点:

训练大模型,确实需要英伟达的顶级GPU。但推理——也就是让训练好的模型实际运行、帮用户解决问题——不需要那么强的单芯片性能,需要的是足够多的算力和足够低的成本

这恰恰是华为擅长的:用更多便宜芯片堆出更大算力,用更低的成本服务更多用户。

DeepSeek V4定价说明中那行小字就是证据:昇腾950超节点批量上市后,Pro价格会大幅下调。当算力成本下降传导到模型价格,推理市场的竞争格局就会被改写


深度价值分析:英伟达的估值贵不贵?

说了这么多数据和分析,回到最核心的问题:英伟达的估值靠什么支撑?

商业模式分析:英伟达的赚钱逻辑

英伟达赚的是什么钱?

英伟达的赚钱逻辑

• 收入来源1:卖GPU硬件(一次性收入,有周期性)

• 收入来源2:CUDA生态锁定(持续性收入,但正在被侵蚀)

• 缺陷1:硬件销售有周期性(AI热潮退去后,需求会下降)

• 缺陷2:CUDA生态正在被侵蚀(DeepSeek V4证明CUDA不再是必需品)

对比一下茅台:茅台赚的是卖白酒的钱,无周期性,品牌护城河极其稳定。英伟达赚的是卖硬件的钱,有周期性,护城河正在被侵蚀。英伟达不是"永恒赚钱"的公司

竞争护城河分析:还能守多久?

⚠️ 英伟达的两大护城河现状

• 护城河1:硬件性能领先 → 正在丧失(Rubin之后性能提升放缓 + 华为韬定律 + 系统级突破)

• 护城河2:CUDA生态 → 正在被侵蚀(去CUDA化 + 自研芯片 + DeepSeek V4全链路适配昇腾)

• 结论:两大护城河都不稳固,未来不确定性高

财务健康度分析:现金流够不够强?

✅ 英伟达财务数据(2027财年Q1)

• 营收:816亿美元(同比+85%)

• 毛利率:74.9%(非常健康)

• 负债率:低负债率(财务稳健)

• 研发投入:每年投入~100亿美元(维持技术领先)

财务非常健康,但估值已经反映了最乐观的预期

估值分析:英伟达贵不贵?

英伟达当前估值(2026年6月)

• 市值:~4万亿美元

• PE(市盈率):~30倍

• PS(市销率):~15倍

• 毛利率:74.9%

估值对比

• 茅台:PE ~40倍(但茅台是"永恒赚钱"的公司,现金流极其稳定)

• 腾讯:PE ~20倍(但腾讯有微信生态,用户粘性极强)

• 苹果:PE ~25倍(但苹果有iOS生态,用户粘性极强)

• 英伟达:PE ~30倍(但硬件优势正在遇到极限,CUDA护城河正在被侵蚀)

英伟达的估值已经反映了最乐观的预期。如果未来3年,硬件优势逐渐丧失,CUDA护城河逐渐被侵蚀,PE大概率从30倍回落至15-20倍。

段永平为什么买英伟达?

段永平在2025年底开始建仓英伟达,他的逻辑可能是:

段永平可能的投资逻辑

• AI是"未来10年最确定的趋势",英伟达是"卖铲子"的

• CUDA生态的"迁移成本"够高,短期内不会被替代

• 段永平看的是"10年后",愿意承受短期波动

但段永平买英伟达,和段永平买茅台、买苹果,不是同一类投资。茅台和苹果是"永恒赚钱"的公司,护城河几乎不可能被颠覆。英伟达的护城河——硬件性能和CUDA——都正在被侵蚀。

❌ 估值判断方向

• 当前估值:偏贵(PE 30倍,已经反映了最乐观的预期)

• 未来估值方向:大概率回落(硬件优势放缓 + CUDA护城河被侵蚀 → PE可能回落至15-20倍)

• 判断结论当前估值偏高,等待估值回落


英伟达财报很亮眼,但亮眼的财报不代表它是"永恒赚钱"的公司。

当硬件优势遇到极限,当韬定律打开了绕过制程进步的新路径,当DeepSeek证明了CUDA不再是必需品——英伟达的估值,已经反映了最乐观的预期。

投资还是要回到本质:这家公司10年后还会存在吗?还会赚钱吗?赚的是真金白银吗?估值合理吗?

对于英伟达,10年后还会存在,但护城河是否还在、估值是否还撑得住,我不确定。

不确定,就耐心等。

觉得文章有深度?点个在看,让更多人看到深度分析


你有不同看法?欢迎评论区留言,理性讨论,不骂人


想看更多深度分析?点个关注,下次推送不迷路

发表评论
0评