行业洞察 | 2026年7月2日 周四 早7:00作者:Dr.Wu | 博士算力猎场

核心观点:BIS新规之后,昇腾910C的关注度暴涨。所有人都在问同一个问题:它能不能替代B300?答案是"能替代一部分,但不是全部"。这篇文章把昇腾910C的最新进展、真实性能、生态瓶颈讲清楚,帮你判断什么时候该用昇腾,什么时候必须坚守英伟达。
昇腾910C:参数不差,差距在生态
先看硬参数:
维度 | 昇腾910C | B300 | H100 |
FP16算力 | ~400 TFLOPS | 4,500 TFLOPS | 1,979 TFLOPS |
显存 | 128GB HBM2e | 288GB HBM3e | 80GB HBM3 |
显存带宽 | ~1.6 TB/s | 8 TB/s | 3.35 TB/s |
互联 | HCCS(自研) | NVLink 5(1,800 GB/s) | NVLink 4(900 GB/s) |
TDP | ~400W | 1,400W | 700W |
制造工艺 | 中芯国际7nm(N+2) | 台积电4nm | 台积电4nm |
价格(估算) | ~80-120万/8卡 | 1050万/8卡 | ~220万/8卡 |
从参数看:昇腾910C的FP16算力大约是H100的20%(400/1979≈20%)、B300的9%(400/4500≈9%)。单看绝对值差距很大,但实际业务中不是所有场景都需要B300级别的算力。
昇腾在推理场景中的表现相当不错——尤其是针对中文NLP任务(如文本分类、情感分析、摘要生成),经过优化的昇腾推理延迟可以做到H100的80-90%。但在大模型训练场景中,差距是数量级的——昇腾做不了GPT-4级别的训练,主要是显存不够(128GB vs B300的288GB)。

昇腾的三个优势和一个致命短板
优势一:不受出口管制
这不需要解释。华为自己设计、中芯国际代工、全链条国产——BIS管不到。对于那些"不想哪天醒来发现卡被扣了"的企业来说,昇腾是唯一能让人睡着觉的选择。
优势二:价格可控
昇腾910C的8卡整机价格约80-120万,是B300的不到1/8。而且价格稳定——国产供应链不受BIS影响,不会有"3个月涨50%"这种事。
优势三:政策支持
工信部、科技部对国产AI芯片有明确的采购引导。国企、政府项目、高校科研——这些场景默认优先选昇腾。这个市场不小,且稳定。
致命短板:CUDA生态
英伟达最深的护城河不是硬件,是CUDA。全球90%以上的AI框架(PyTorch、TensorFlow、JAX)对CUDA做了深度优化。20年来积累的算子库、调优经验、社区支持——这些不是"写个转译层"就能替代的。
昇腾有自己的CANN(Compute Architecture for Neural Networks)软件栈,也做了PyTorch的适配。但实际使用中:
- 模型迁移成本
把一个已经在CUDA上跑通的模型迁移到昇腾上,平均需要2-4周的适配时间。GPU版本代码不能直接跑,需要逐层改写算子。 - 性能损耗
经过CANN转译的PyTorch模型,性能比原生CUDA版本低15-30%。华为在持续优化这个数字,但目前仍是现实。 - 算子覆盖
昇腾的算子库覆盖了约70-80%的常用PyTorch算子。如果你的模型用了比较新的或冷的算子,大概率不支持——需要自己写。

大厂的昇腾采购进展
公司 | 昇腾部署情况 | 主要用途 |
字节跳动 | 数千台昇腾910C | 推荐系统推理(替代H100) |
百度 | ~2000台昇腾910C | 文心大模型推理 + 部分训练 |
阿里巴巴 | ~1500台昇腾910C | 通义千问推理 |
科大讯飞 | ~3000台昇腾(多种型号) | 语音识别+大模型推理 |
中国移动/电信 | 各约1000台 | IDC租赁 + 内部AI |
大厂的策略是一致的:推理用昇腾,训练用英伟达。在推理场景中,昇腾的性价比远超英伟达(同样性能价格1/5-1/3)。在训练场景中,英伟达的CUDA生态优势无法替代。

什么时候该选昇腾?一个决策框架
场景 | 推荐 | 原因 |
中文NLP推理(20B以下模型) | 昇腾910C | 性价比最高,生态适配充分 |
计算机视觉推理 | 昇腾910C | 已跑通主流CV模型 |
大模型训练(70B+) | 英伟达B300 | 昇腾显存不够+训练效率差 |
多模态模型训练 | 英伟达B300 | 算子支持不足 |
对合规性要求极高的项目 | 昇腾910C | 不受BIS管制风险 |
预算有限但需要GPU算力 | 昇腾910C | 价格极低 |

结论:昇腾正在吃掉B300"够用就行"的那部分市场,但离"替代B300"还差一个CUDA的距离。
2026年下半年最值得关注的事件:华为的CANN 7.0版本是否能在算子覆盖和性能上追到CUDA的85%以上。如果做到了——B300的国内需求可能会缩减20-30%。如果没有——B300的"不可替代"叙事还能维持至少一年。
你在用什么卡?有没有尝试过昇腾?你觉得昇腾哪一年能在训练上真正替代英伟达?留言区聊聊。
| Dr.Wu微信 | michaelwqs | | Alan Ng微信 | AlanNgw | | 群二维码 |
添加Dr.Wu微信:michaelwqs 添加Alan Ng微信:AlanNgw,或扫描以下群二维码免费入群
Dr.Wu微信 | michaelwqs |
Alan Ng微信 | AlanNgw |
