展会资讯

AI报告重磅-4月版:全球领先企业技术动态(国内)

2026-04-24 19:09

AI报告重磅-4月版:全球领先企业技术动态(国内)

华为

昇腾芯片技术路线深度解析

产品规划时间表

2026 年 Q1：昇腾 950PR，算力 1PFLOPS (FP8)/2PFLOPS (FP4)，144GB HBM，带宽 4TB/s，SIMD/SIMT 双编程模型
2026 年 Q4：昇腾 950DT，128GB HBM，带宽 1.6TB/s，全精度支持
2027 年 Q4：昇腾 960，算力翻倍至 2PFLOPS (FP8)/4PFLOPS (FP4)，288GB HBM，带宽 9.6TB/s
2028 年 Q4：昇腾 970，算力 4PFLOPS (FP8)/8PFLOPS (FP4)，288GB HBM，带宽 14.4TB/s

技术突破亮点

昇腾 950PR 启用自研 HBM（HiBL 1.0/HiZQ 2.0），全链路自主可控
HiBL 1.0容量128GB，带宽1.6TB/s；HiZQ 2.0容量144GB，带宽4TB/s
FP4 单卡算力 1.56P FLOPS，为 H20 的 2.87 倍，112GB HBM 可单卡加载 70B 参数

超节点集群规划

Atlas 950 SuperPoD：8192 卡，FP8 8EFlops、FP4 16EFlops，互联带宽 16PB
Atlas 960 SuperPoD：15488 卡，性能翻倍，2027 年 Q4 上市
TaiShan950 SuperPoD：全球首个通算超节点，鲲鹏 950 基座，最大 16 节点 / 48TB 内存，支持池化，2026 年 Q1 上市

4 月新增动态

智谱 GLM-5.1 基于 10 万块昇腾 910B 全栈训练，无英伟达 GPU，实现国产算力自主闭环
昇腾生态适配提速，DeepSeek V4 首发原生适配昇腾，标志 “去 CUDA 化” 落地

阿里云

“欢乐马” 视频生成大模型

HappyHorse1.0 多模态大模型将于 4 月 27 日通过阿里云百炼平台逐步开放 API 测试，5月底商用

支持最长 120 秒连贯生成，解决穿模、闪烁、变形等痛点
文本 / 图像 / 音频统一架构，支持多镜头、叙事、风格化，覆盖影视 / 广告 / 短视频
已开放商用 API 与私有化部署，提供可视化界面

通义大模型事业部升级

4 月 8 日组织调整：设立集团技术委员会，通义实验室升级为通义大模型事业部（周靖人负责），李飞飞任阿里云 CTO，吴泽明任集团 CTO

AI 算力价格调整

平头哥真武 810E 等算力卡涨价 5%–34%，CPFS (智算版) 涨价 30%
与百度智能云、腾讯云集体涨价，终结云计算近 20 年 “只降不升” 周期

4 月新增动态

一周内连发三款模型：Qwen-Max 推理增强、端侧轻量版、200 万 Token 长文档模型
发布 HappyOyster 世界模型，填补国内音视频联合生成空白
上线全生命周期 MCP 服务，集成 50 + 工具，推进智能体生态

字节跳动

Seeduplex 全双工语音大模型

全量接入豆包 App，边听边说、实时打断、零等待连续交互
嘈杂环境识别、多轮记忆、意图理解、口语纠错达行业领先

Seedance 2.0 视频生成模型

4 月 2 日开放企业公测，改为按调用付费
新签用户默认 10 并发，合同未达 1000 万元不开放真人脸 / 自定义虚拟人

DeepSeek

DeepSeek V4 旗舰模型发布（4 月 24 日），终于露面了

发布 V4-Pro / V4-Flash 双版本，同步开源权重
V4-Pro：1.6 万亿总参数、490 亿激活参数，定位高性能推理 / 智能体 / 代码
V4-Flash：2840 亿总参数、130 亿激活参数，轻量化、低成本部署
支持 100 万 Token 超长上下文，长文本、智能体记忆能力大幅提升

核心技术突破

Ultra-MoE 稀疏架构 + DSA 稀疏注意力，算力效率大幅提升
V4-Pro 推理算力仅为 V3.2 的 27%，KV 缓存仅 10%
数学、STEM、代码能力达到开源模型全球第一梯队

国产算力里程碑

DeepSeek V4 原生适配华为昇腾 950PR，实现完全去 CUDA 化
依托昇腾集群训练与推理，国产大模型 + 国产算力正式闭环

商业化与生态

API、网页端、App 全平台上线
旧版接口将于7 月 24 日停止服务，全面切换 V4
4 月完成新一轮融资，估值超 100 亿美元

其他厂商动态

百度智能云

推出具身智能数据超市，开放星云计划，小米 / 荣耀 /vivo 接入
文心大模型在具身智能、数字人场景规模化落地

腾讯云

2026 年 AI 投入翻倍至 360 亿元，资本开支 950 亿元
TI-ONE 智能体平台上线，推进微信生态 AI 原生改造

商汤科技

4 月 22 日发布端侧 MoE 大模型 Sage（32B 总参 / 3B 激活），端侧部署性能超越 GPT-5.4
绝影智能车舱与 Sage 融合，AI + 汽车进入规模化落地

科大讯飞

4 月 16 日发布 AstronClaw 智能体矩阵，软硬一体覆盖办公本、AI 眼镜、机器人
面向政务、金融、制造推出行业专属执行智能体

中科曙光

4 月 14 日落地郑州 6 万卡 AI4S 科学计算集群，自研高速互联打破海外垄断
液冷智算订单排至三季度，国产算力底座地位稳固

行业整体动态（4 月核心）

AI 算力涨价潮

国内：阿里云、百度智能云、腾讯云、智谱 AI 集体涨价
全球：AWS、谷歌云同步上调，算力供需失衡与硬件成本上涨为主因

政策与标准落地

4 月 2 日：工信部启动普惠算力专项，提出 “毫秒用算”，推广算力银行 / 超市
4 月 10 日：五部门发布《人工智能拟人化互动服务管理暂行办法》，7 月 15 日施行
液冷强制化：新建智算中心 100% 液冷，PUE≤1.2，绿电占比≥60%

市场与竞争格局

斯坦福 AI 指数：中美顶级模型性能差距缩至 2.7%
2025 年美国私人 AI 投资 2859 亿美元，中国 124 亿美元
2026 全球 AI 智能体市场 108.82 亿美元，中国 2025 年 804 亿元，2030 年有望破 6000 亿元
DeepSeek V4 4 月底发布：万亿参数、百万级上下文、昇腾首发适配，估值融资超 100 亿美元

未来展望与战略建议

短期（2026 年）

DeepSeek V4 成国产算力里程碑，昇腾份额快速提升
AI 智能体、视频生成、具身智能进入爆发期

中期（2027–2028 年）

中美性能差距进一步缩小，国产算力生态成熟
应用从实验走向大规模生产部署

未来重点（职业机会）

算力基建：加大万卡级集群与液冷投入，对接国家智算网络
技术自主：加速芯片、互联、存储全栈国产化替代
人才体系：对标全球薪酬，强化研发与工程人才储备
生态协同：推进 MCP、智能体、行业大模型标准化落地

发表评论