社会热点
行业洞察 | 国产GPU的7月:昇腾910C到底走到了哪一步?
2026-07-02 09:16
行业洞察 | 国产GPU的7月:昇腾910C到底走到了哪一步?

行业洞察 | 2026年7月2日 周四 早7:00作者:Dr.Wu | 博士算力猎场

核心观点:BIS新规之后,昇腾910C的关注度暴涨。所有人都在问同一个问题:它能不能替代B300?答案是"能替代一部分,但不是全部"。这篇文章把昇腾910C的最新进展、真实性能、生态瓶颈讲清楚,帮你判断什么时候该用昇腾,什么时候必须坚守英伟达。


昇腾910C:参数不差,差距在生态

先看硬参数:

维度

昇腾910C

B300

H100

FP16算力

~400 TFLOPS

4,500 TFLOPS

1,979 TFLOPS

显存

128GB HBM2e

288GB HBM3e

80GB HBM3

显存带宽

~1.6 TB/s

8 TB/s

3.35 TB/s

互联

HCCS(自研)

NVLink 5(1,800 GB/s)

NVLink 4(900 GB/s)

TDP

~400W

1,400W

700W

制造工艺

中芯国际7nm(N+2)

台积电4nm

台积电4nm

价格(估算)

~80-120万/8卡

1050万/8卡

~220万/8卡

从参数看:昇腾910C的FP16算力大约是H100的20%(400/1979≈20%)、B300的9%(400/4500≈9%)。单看绝对值差距很大,但实际业务中不是所有场景都需要B300级别的算力。

昇腾在推理场景中的表现相当不错——尤其是针对中文NLP任务(如文本分类、情感分析、摘要生成),经过优化的昇腾推理延迟可以做到H100的80-90%。但在大模型训练场景中,差距是数量级的——昇腾做不了GPT-4级别的训练,主要是显存不够(128GB vs B300的288GB)。


昇腾的三个优势和一个致命短板

优势一:不受出口管制

这不需要解释。华为自己设计、中芯国际代工、全链条国产——BIS管不到。对于那些"不想哪天醒来发现卡被扣了"的企业来说,昇腾是唯一能让人睡着觉的选择。

优势二:价格可控

昇腾910C的8卡整机价格约80-120万,是B300的不到1/8。而且价格稳定——国产供应链不受BIS影响,不会有"3个月涨50%"这种事。

优势三:政策支持

工信部、科技部对国产AI芯片有明确的采购引导。国企、政府项目、高校科研——这些场景默认优先选昇腾。这个市场不小,且稳定。

致命短板:CUDA生态

英伟达最深的护城河不是硬件,是CUDA。全球90%以上的AI框架(PyTorch、TensorFlow、JAX)对CUDA做了深度优化。20年来积累的算子库、调优经验、社区支持——这些不是"写个转译层"就能替代的。

昇腾有自己的CANN(Compute Architecture for Neural Networks)软件栈,也做了PyTorch的适配。但实际使用中:

  • 模型迁移成本
    把一个已经在CUDA上跑通的模型迁移到昇腾上,平均需要2-4周的适配时间。GPU版本代码不能直接跑,需要逐层改写算子。
  • 性能损耗
    经过CANN转译的PyTorch模型,性能比原生CUDA版本低15-30%。华为在持续优化这个数字,但目前仍是现实。
  • 算子覆盖
    昇腾的算子库覆盖了约70-80%的常用PyTorch算子。如果你的模型用了比较新的或冷的算子,大概率不支持——需要自己写。

大厂的昇腾采购进展

公司

昇腾部署情况

主要用途

字节跳动

数千台昇腾910C

推荐系统推理(替代H100)

百度

~2000台昇腾910C

文心大模型推理 + 部分训练

阿里巴巴

~1500台昇腾910C

通义千问推理

科大讯飞

~3000台昇腾(多种型号)

语音识别+大模型推理

中国移动/电信

各约1000台

IDC租赁 + 内部AI

大厂的策略是一致的:推理用昇腾,训练用英伟达。在推理场景中,昇腾的性价比远超英伟达(同样性能价格1/5-1/3)。在训练场景中,英伟达的CUDA生态优势无法替代。


什么时候该选昇腾?一个决策框架

场景

推荐

原因

中文NLP推理(20B以下模型)

昇腾910C

性价比最高,生态适配充分

计算机视觉推理

昇腾910C

已跑通主流CV模型

大模型训练(70B+)

英伟达B300

昇腾显存不够+训练效率差

多模态模型训练

英伟达B300

算子支持不足

对合规性要求极高的项目

昇腾910C

不受BIS管制风险

预算有限但需要GPU算力

昇腾910C

价格极低


结论:昇腾正在吃掉B300"够用就行"的那部分市场,但离"替代B300"还差一个CUDA的距离。

2026年下半年最值得关注的事件:华为的CANN 7.0版本是否能在算子覆盖和性能上追到CUDA的85%以上。如果做到了——B300的国内需求可能会缩减20-30%。如果没有——B300的"不可替代"叙事还能维持至少一年。


你在用什么卡?有没有尝试过昇腾?你觉得昇腾哪一年能在训练上真正替代英伟达?留言区聊聊。

| Dr.Wu微信 | michaelwqs | | Alan Ng微信 | AlanNgw | | 群二维码 |

添加Dr.Wu微信:michaelwqs 添加Alan Ng微信:AlanNgw,或扫描以下群二维码免费入群

Dr.Wu微信

michaelwqs

Alan Ng微信

AlanNgw

发表评论
0评