英伟达财报炸场:当硬件优势遇到极限
2027财年Q1,英伟达营收816亿美元,同比增长85%。
市场狂欢,股价上涨。
但如果你仔细看这份财报,再看看华为最新的动作,会发现一个让人不安的事实:
英伟达的硬件优势,正在遇到极限。而华为正在用一套全新的规则,绕过这个极限。
英伟达的优势:硬件 + CUDA
英伟达为什么这么强?
简单来说,有两个优势:
? 优势1:硬件性能领先
• H100:2022年发布,性能是A100的4倍
• H200:2024年发布,HBM内存提升到141GB
• Blackwell:2025年发布,性能是H100的5倍
• Rubin:2026年量产,专为AI智能体(Agent)量身打造
? 优势2:CUDA生态系统
• 全球超过400万开发者在用CUDA
• 超过3000个应用支持CUDA加速
• 迁移成本极高:重新写代码需要2-3年
这两个优势加起来,让英伟达在AI芯片市场占据了80%以上的份额。
但问题是:这两个优势都有极限。
硬件优势有极限:Rubin之后是什么?
2026年6月,英伟达宣布Vera Rubin CPU全面进入量产阶段。
这是英伟达下一代架构,专为AI智能体(Agent)量身打造。
但如果你仔细看Rubin的规格,会发现一个事实:
⚠️ Rubin的性能提升正在放缓
• H100 → Blackwell:性能提升5倍
• Blackwell → Rubin:性能提升2.5倍(预估)
• Rubin → 下一代:性能提升可能只有1.5倍(预估)
为什么放缓?
因为物理极限。
晶体管已缩小至原子级别,量子效应导致漏电问题无法回避。从28纳米推进到7纳米,芯片研发成本增加了近10倍,但性能收益却愈来愈边际递减。
这意味着:英伟达过去靠制程进步带来的性能飞跃,正在接近天花板。Rubin之后的性能提升,只能靠架构优化和系统设计。
而架构优化的提升,是有极限的。
华为的突破:韬定律 + 系统级战争
这是最让人震撼的部分。
华为不仅绕过了单芯片性能的劣势,还提出了一套全新的半导体演进理论。
韬定律:用"时间缩微"替代"几何缩微"
2026年5月25日,华为董事、半导体业务部总裁何庭波在IEEE国际电路与系统研讨会(ISCAS 2026)上,正式发布了韬(τ)定律。
这个定律的核心思路是:不再追求晶体管的几何缩微(把晶体管做小),而是追求时间常数τ的缩微(让信号传播更快)。
说白了:摩尔定律是"把路修窄一点,让车跑得更快",韬定律是"换一种修路的方式,让车跑同样的距离但用更少的时间"。
? 韬定律的四大层级
• 器件层:优化晶体管和互连电阻,从物理底层缩微时间常数τ
• 电路层:逻辑折叠技术突破平面布局物理边界,缩短关键路径走线长度,提升晶体管密度和电路性能
• 芯片层:软件、架构、芯片全栈协同设计,基于实际工作负载细粒度控制指令流和数据流
• 系统层:定义灵衢总线,重构计算系统互联协议,实现超节点统一内存编址和原生内存语义
韬定律不是纸上谈兵。过去六年,华为基于韬定律已经成功设计并量产了381款芯片。2026年秋季面世的新麒麟芯片,将率先采用逻辑折叠技术。何庭波预计,到2031年,基于韬定律的高端芯片晶体管密度将达到1.4纳米制程的同等水平。
这意味着什么?华为正在绕过EUV光刻机的限制,用一套全新的技术路线,实现与最先进制程同等的晶体管密度。
系统级突破:避开单芯片,打系统级战争
华为很清楚:在单芯片性能上,昇腾950打不过英伟达Rubin。
但华为发现:单芯片性能不重要,重要的是系统级性能。
黄仁勋自己在播客采访中也承认了这个逻辑——他说,中国能源充沛,完全可以通过"堆叠芯片集群"来弥补单颗芯片的性能差距。美国能源匮乏,所以英伟达必须追求极致的每瓦性能;但中国电力充沛,堆集群比拼单芯片更划算。
? 华为CloudMatrix 384超节点
• 组成:384颗昇腾950芯片通过"灵衢总线"互联
• 系统级算力:超过英伟达NVL72(72颗GPU)
• 关键:不是单芯片性能强,而是互联效率高
• 结果:在AI大模型训练中,系统级性能比英伟达NVL72高20%
? 范式转变:从"单芯片竞争"到"系统级竞争"
• 旧范式:比单芯片性能(英伟达赢)
• 新范式:比系统级性能(华为可能赢)
• 为什么:AI大模型训练需要数千颗芯片协同工作,单芯片性能再强,互联效率不高也没用
英伟达Rubin vs 华为昇腾950/960:专业对比
为了看清竞争格局,我做了详细的参数对比。
? 单芯片算力对比
? 集群系统级算力对比
| 超过NVL72约20% |
? 关键结论
• 单芯片性能:英伟达Rubin领先华为昇腾950约35倍(FP8)
• 系统级性能:华为通过更多芯片+更高互联效率,实现了系统级性能反超
• 成本优势:华为单芯片成本约10万元(英伟达约20-30万元)
• 功耗优势:华为单芯片功耗更低,适合大规模部署
2026年3月:Atlas 950 SuperPod发布
华为在2026年3月的巴塞罗那世界移动通信大会上,发布了Atlas 950 SuperPod。
? Atlas 950 SuperPod关键参数
• 集成芯片数量:8192颗昇腾950芯片
• 单柜算力:64 PFLOPS FP8 和 128 PFLOPS FP4
• 单柜HBM内存:9,216GB(每颗昇腾950DT集成144GB HBM)
• 互联技术:灵衢全光互联,柜内节点间0线缆互联
• 系统规模:由160个机柜组成(128个计算机柜 + 32个互联机柜)
这就像:英伟达造的是"跑车"(单芯片性能强),华为造的是"火车"(系统级性能强)。
跑车在赛道上厉害,但运货还是火车厉害。AI大模型训练,就是"运货"。
CUDA护城河:DeepSeek正在撕开一道裂缝
说到这里,你可能会问:华为系统级性能再强,开发者还是用CUDA啊,迁移成本那么高,华为怎么赢?
这是英伟达最深的护城河。但如果你仔细看,会发现这道护城河正在被撕开一道裂缝。
侵蚀1:AI框架正在"去CUDA化"
PyTorch 2.0、TensorFlow 3.0,都在做一件事:抽象硬件层。
以前,开发者写AI代码,要直接调用CUDA。现在,开发者写AI代码,调用的是PyTorch,PyTorch再自动调用CUDA或华为的CANN。开发者根本不需要知道底层用的是谁的芯片。
华为的CANN生态2025年已全面开源,还推出了一键迁移工具,把代码迁移时间从数月缩短至小时级。
侵蚀2:大模型公司正在"自研芯片"
谷歌、亚马逊、微软、Meta、腾讯、阿里巴巴,都在自研AI芯片。这些公司有足够的软件团队,可以自己适配硬件,不需要CUDA,他们自己写底层代码。英伟达的CUDA护城河,对这些公司无效。
侵蚀3:中国市场的"脱CUDA化"
由于美国制裁,中国公司无法买到英伟达最先进的GPU(H100、A100)。这逼着中国公司必须"脱CUDA化"。
2025年,国内AI服务器市场国产芯片份额已达41%,预计2026年国产算力芯片出货量将实现3倍以上增长。
最震撼的案例:DeepSeek V4全链路适配华为昇腾
2026年4月,DeepSeek发布了新一代旗舰大模型V4,1.6万亿参数,MoE架构,每次推理仅激活490亿参数。
重点不在模型本身——重点是,DeepSeek V4在设计之初就优先围绕华为昇腾950P芯片进行适配,完成了从训练到推理再到部署的全链路深度优化。
⚠️ DeepSeek V4 + 昇腾950P的实测数据
• 单卡推理性能达到英伟达特供版H20芯片的2.87倍
• 推理延迟较前代降低35%
• 单机算力成本较英伟达方案下降40%
• 成为国内首个彻底摆脱英伟达依赖的万亿级大模型
更值得注意的一个细节:在DeepSeek V4定价说明的灰色小字中写着——"受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调"。
当模型价格开始"锚定"国产算力的部署进度时,说明国产算力已经在DeepSeek的整体体系中占据了关键位置。
这件事让黄仁勋坐不住了。
? 黄仁勋在接受科技播客主持人Dwarkesh Patel专访时说
"如果顶尖的AI模型被优化在华为芯片上运行,对美国而言将是'可怕的结果'乃至'灾难性的后果'。"
他还直言美国的芯片出口管制政策"极其幼稚"。
黄仁勋为什么这么紧张?
因为DeepSeek的案例证明了一件可怕的事:世界可以不需要英伟达。CUDA不再是不可替代的——顶尖AI模型可以基于华为昇腾完成从训练到推理的全流程,性能还能超过英伟达的特供芯片。
正如36氪的文章标题所说:"DeepSeek-V4发布,黄仁勋的担忧成真了。"
AI的未来:用户到底为什么买单?
这个问题比财报数据更重要。
用户不是为"英伟达的GPU"买单,用户是为"AI帮我解决问题"买单。英伟达在价值链的底层,而用户买单在顶层。中间隔了多少层?每一层都可能被替代。
? AI市场三层分析
? 第一层:AI训练市场——市场空间~500亿美元/年,增长放缓,英伟达占80%+份额,但接近饱和
? 第二层:AI推理市场——市场空间~1037亿美元(2025年),预计到2034年增长至3126亿美元,这才是真正的巨无霸
? 第三层:AI应用市场——Gartner预估全球AI总支出2026年达2万亿美元,2029年达3.3万亿美元,但英伟达吃不到
? 关键:推理市场才是英伟达的未来,但推理对单芯片性能的要求低于训练,华为的系统级方案在推理场景更有竞争力
让我说得更直白一点:
训练大模型,确实需要英伟达的顶级GPU。但推理——也就是让训练好的模型实际运行、帮用户解决问题——不需要那么强的单芯片性能,需要的是足够多的算力和足够低的成本。
这恰恰是华为擅长的:用更多便宜芯片堆出更大算力,用更低的成本服务更多用户。
DeepSeek V4定价说明中那行小字就是证据:昇腾950超节点批量上市后,Pro价格会大幅下调。当算力成本下降传导到模型价格,推理市场的竞争格局就会被改写。
深度价值分析:英伟达的估值贵不贵?
说了这么多数据和分析,回到最核心的问题:英伟达的估值靠什么支撑?
商业模式分析:英伟达的赚钱逻辑
英伟达赚的是什么钱?
? 英伟达的赚钱逻辑
• 收入来源1:卖GPU硬件(一次性收入,有周期性)
• 收入来源2:CUDA生态锁定(持续性收入,但正在被侵蚀)
• 缺陷1:硬件销售有周期性(AI热潮退去后,需求会下降)
• 缺陷2:CUDA生态正在被侵蚀(DeepSeek V4证明CUDA不再是必需品)
对比一下茅台:茅台赚的是卖白酒的钱,无周期性,品牌护城河极其稳定。英伟达赚的是卖硬件的钱,有周期性,护城河正在被侵蚀。英伟达不是"永恒赚钱"的公司。
竞争护城河分析:还能守多久?
⚠️ 英伟达的两大护城河现状
• 护城河1:硬件性能领先 → 正在丧失(Rubin之后性能提升放缓 + 华为韬定律 + 系统级突破)
• 护城河2:CUDA生态 → 正在被侵蚀(去CUDA化 + 自研芯片 + DeepSeek V4全链路适配昇腾)
• 结论:两大护城河都不稳固,未来不确定性高
财务健康度分析:现金流够不够强?
✅ 英伟达财务数据(2027财年Q1)
• 营收:816亿美元(同比+85%)
• 毛利率:74.9%(非常健康)
• 负债率:低负债率(财务稳健)
• 研发投入:每年投入~100亿美元(维持技术领先)
财务非常健康,但估值已经反映了最乐观的预期。
估值分析:英伟达贵不贵?
? 英伟达当前估值(2026年6月)
• 市值:~4万亿美元
• PE(市盈率):~30倍
• PS(市销率):~15倍
• 毛利率:74.9%
? 估值对比
• 茅台:PE ~40倍(但茅台是"永恒赚钱"的公司,现金流极其稳定)
• 腾讯:PE ~20倍(但腾讯有微信生态,用户粘性极强)
• 苹果:PE ~25倍(但苹果有iOS生态,用户粘性极强)
• 英伟达:PE ~30倍(但硬件优势正在遇到极限,CUDA护城河正在被侵蚀)
英伟达的估值已经反映了最乐观的预期。如果未来3年,硬件优势逐渐丧失,CUDA护城河逐渐被侵蚀,PE大概率从30倍回落至15-20倍。
段永平为什么买英伟达?
段永平在2025年底开始建仓英伟达,他的逻辑可能是:
? 段永平可能的投资逻辑
• AI是"未来10年最确定的趋势",英伟达是"卖铲子"的
• CUDA生态的"迁移成本"够高,短期内不会被替代
• 段永平看的是"10年后",愿意承受短期波动
但段永平买英伟达,和段永平买茅台、买苹果,不是同一类投资。茅台和苹果是"永恒赚钱"的公司,护城河几乎不可能被颠覆。英伟达的护城河——硬件性能和CUDA——都正在被侵蚀。
❌ 估值判断方向
• 当前估值:偏贵(PE 30倍,已经反映了最乐观的预期)
• 未来估值方向:大概率回落(硬件优势放缓 + CUDA护城河被侵蚀 → PE可能回落至15-20倍)
• 判断结论:当前估值偏高,等待估值回落
英伟达财报很亮眼,但亮眼的财报不代表它是"永恒赚钱"的公司。
当硬件优势遇到极限,当韬定律打开了绕过制程进步的新路径,当DeepSeek证明了CUDA不再是必需品——英伟达的估值,已经反映了最乐观的预期。
投资还是要回到本质:这家公司10年后还会存在吗?还会赚钱吗?赚的是真金白银吗?估值合理吗?
对于英伟达,10年后还会存在,但护城河是否还在、估值是否还撑得住,我不确定。
不确定,就耐心等。
? 觉得文章有深度?点个赞和在看,让更多人看到深度分析
? 你有不同看法?欢迎评论区留言,理性讨论,不骂人
? 想看更多深度分析?点个关注,下次推送不迷路