AI报告重磅-4月版:全球领先企业技术动态(国内)
2026-04-24 19:09
AI报告重磅-4月版:全球领先企业技术动态(国内)
华为
昇腾芯片技术路线深度解析
产品规划时间表
- 2026 年 Q1:昇腾 950PR,算力 1PFLOPS (FP8)/2PFLOPS (FP4),144GB HBM,带宽 4TB/s,SIMD/SIMT 双编程模型
- 2026 年 Q4:昇腾 950DT,128GB HBM,带宽 1.6TB/s,全精度支持
- 2027 年 Q4:昇腾 960,算力翻倍至 2PFLOPS (FP8)/4PFLOPS (FP4),288GB HBM,带宽 9.6TB/s
- 2028 年 Q4:昇腾 970,算力 4PFLOPS (FP8)/8PFLOPS (FP4),288GB HBM,带宽 14.4TB/s
技术突破亮点
- 昇腾 950PR 启用自研 HBM(HiBL 1.0/HiZQ 2.0),全链路自主可控
- HiBL 1.0容量128GB,带宽1.6TB/s;HiZQ 2.0容量144GB,带宽4TB/s
- FP4 单卡算力 1.56P FLOPS,为 H20 的 2.87 倍,112GB HBM 可单卡加载 70B 参数
超节点集群规划
- Atlas 950 SuperPoD:8192 卡,FP8 8EFlops、FP4 16EFlops,互联带宽 16PB
- Atlas 960 SuperPoD:15488 卡,性能翻倍,2027 年 Q4 上市
- TaiShan950 SuperPoD:全球首个通算超节点,鲲鹏 950 基座,最大 16 节点 / 48TB 内存,支持池化,2026 年 Q1 上市
4 月新增动态
- 智谱 GLM-5.1 基于 10 万块昇腾 910B 全栈训练,无英伟达 GPU,实现国产算力自主闭环
- 昇腾生态适配提速,DeepSeek V4 首发原生适配昇腾,标志 “去 CUDA 化” 落地
阿里云
“欢乐马” 视频生成大模型
HappyHorse1.0 多模态大模型将于 4 月 27 日通过阿里云百炼平台逐步开放 API 测试,5月底商用
- 支持最长 120 秒连贯生成,解决穿模、闪烁、变形等痛点
- 文本 / 图像 / 音频统一架构,支持多镜头、叙事、风格化,覆盖影视 / 广告 / 短视频
通义大模型事业部升级
- 4 月 8 日组织调整:设立集团技术委员会,通义实验室升级为通义大模型事业部(周靖人负责),李飞飞任阿里云 CTO,吴泽明任集团 CTO
AI 算力价格调整
- 平头哥真武 810E 等算力卡涨价 5%–34%,CPFS (智算版) 涨价 30%
- 与百度智能云、腾讯云集体涨价,终结云计算近 20 年 “只降不升” 周期
4 月新增动态
- 一周内连发三款模型:Qwen-Max 推理增强、端侧轻量版、200 万 Token 长文档模型
- 发布 HappyOyster 世界模型,填补国内音视频联合生成空白
- 上线全生命周期 MCP 服务,集成 50 + 工具,推进智能体生态
字节跳动
Seeduplex 全双工语音大模型
- 全量接入豆包 App,边听边说、实时打断、零等待连续交互
- 嘈杂环境识别、多轮记忆、意图理解、口语纠错达行业领先
Seedance 2.0 视频生成模型
- 新签用户默认 10 并发,合同未达 1000 万元不开放真人脸 / 自定义虚拟人
DeepSeek
DeepSeek V4 旗舰模型发布(4 月 24 日),终于露面了
- 发布 V4-Pro / V4-Flash 双版本,同步开源权重
- V4-Pro:1.6 万亿总参数、490 亿激活参数,定位高性能推理 / 智能体 / 代码
- V4-Flash:2840 亿总参数、130 亿激活参数,轻量化、低成本部署
- 支持 100 万 Token 超长上下文,长文本、智能体记忆能力大幅提升
核心技术突破
- Ultra-MoE 稀疏架构 + DSA 稀疏注意力,算力效率大幅提升
- V4-Pro 推理算力仅为 V3.2 的 27%,KV 缓存仅 10%
- 数学、STEM、代码能力达到 开源模型全球第一梯队
国产算力里程碑
- DeepSeek V4 原生适配华为昇腾 950PR,实现完全去 CUDA 化
- 依托昇腾集群训练与推理,国产大模型 + 国产算力正式闭环
商业化与生态
- 旧版接口 将于7 月 24 日停止服务,全面切换 V4
其他厂商动态
百度智能云
- 推出具身智能数据超市,开放星云计划,小米 / 荣耀 /vivo 接入
腾讯云
- 2026 年 AI 投入翻倍至 360 亿元,资本开支 950 亿元
- TI-ONE 智能体平台上线,推进微信生态 AI 原生改造
商汤科技
- 4 月 22 日发布端侧 MoE 大模型 Sage(32B 总参 / 3B 激活),端侧部署性能超越 GPT-5.4
- 绝影智能车舱与 Sage 融合,AI + 汽车进入规模化落地
科大讯飞
- 4 月 16 日发布 AstronClaw 智能体矩阵,软硬一体覆盖办公本、AI 眼镜、机器人
中科曙光
- 4 月 14 日落地郑州 6 万卡 AI4S 科学计算集群,自研高速互联打破海外垄断
行业整体动态(4 月核心)
AI 算力涨价潮
- 国内:阿里云、百度智能云、腾讯云、智谱 AI 集体涨价
- 全球:AWS、谷歌云同步上调,算力供需失衡与硬件成本上涨为主因
政策与标准落地
- 4 月 2 日:工信部启动普惠算力专项,提出 “毫秒用算”,推广算力银行 / 超市
- 4 月 10 日:五部门发布《人工智能拟人化互动服务管理暂行办法》,7 月 15 日施行
- 液冷强制化:新建智算中心 100% 液冷,PUE≤1.2,绿电占比≥60%
市场与竞争格局
- 斯坦福 AI 指数:中美顶级模型性能差距缩至 2.7%
- 2025 年美国私人 AI 投资 2859 亿美元,中国 124 亿美元
- 2026 全球 AI 智能体市场 108.82 亿美元,中国 2025 年 804 亿元,2030 年有望破 6000 亿元
- DeepSeek V4 4 月底发布:万亿参数、百万级上下文、昇腾首发适配,估值融资超 100 亿美元
未来展望与战略建议
短期(2026 年)
- DeepSeek V4 成国产算力里程碑,昇腾份额快速提升
中期(2027–2028 年)
未来重点(职业机会)
- 算力基建:加大万卡级集群与液冷投入,对接国家智算网络
- 生态协同:推进 MCP、智能体、行业大模型标准化落地