展会资讯
AI报告重磅-4月版:全球领先企业技术动态(国内)
2026-04-24 19:09
AI报告重磅-4月版:全球领先企业技术动态(国内)

华为

昇腾芯片技术路线深度解析

产品规划时间表

  • 2026 年 Q1:昇腾 950PR,算力 1PFLOPS (FP8)/2PFLOPS (FP4),144GB HBM,带宽 4TB/s,SIMD/SIMT 双编程模型
  • 2026 年 Q4:昇腾 950DT,128GB HBM,带宽 1.6TB/s,全精度支持
  • 2027 年 Q4:昇腾 960,算力翻倍至 2PFLOPS (FP8)/4PFLOPS (FP4),288GB HBM,带宽 9.6TB/s
  • 2028 年 Q4:昇腾 970,算力 4PFLOPS (FP8)/8PFLOPS (FP4),288GB HBM,带宽 14.4TB/s

技术突破亮点

  • 昇腾 950PR 启用自研 HBM(HiBL 1.0/HiZQ 2.0),全链路自主可控
  • HiBL 1.0容量128GB,带宽1.6TB/s;HiZQ 2.0容量144GB,带宽4TB/s
  • FP4 单卡算力 1.56P FLOPS,为 H20 的 2.87 倍,112GB HBM 可单卡加载 70B 参数

超节点集群规划

  • Atlas 950 SuperPoD:8192 卡,FP8 8EFlops、FP4 16EFlops,互联带宽 16PB
  • Atlas 960 SuperPoD:15488 卡,性能翻倍,2027 年 Q4 上市
  • TaiShan950 SuperPoD:全球首个通算超节点,鲲鹏 950 基座,最大 16 节点 / 48TB 内存,支持池化,2026 年 Q1 上市

4 月新增动态

  • 智谱 GLM-5.1 基于 10 万块昇腾 910B 全栈训练,无英伟达 GPU,实现国产算力自主闭环
  • 昇腾生态适配提速,DeepSeek V4 首发原生适配昇腾,标志 “去 CUDA 化” 落地

阿里云

“欢乐马” 视频生成大模型

  • HappyHorse1.0 多模态大模型将于 4 月 27 日通过阿里云百炼平台逐步开放 API 测试,5月底商用

  • 支持最长 120 秒连贯生成,解决穿模、闪烁、变形等痛点
  • 文本 / 图像 / 音频统一架构,支持多镜头、叙事、风格化,覆盖影视 / 广告 / 短视频
  • 已开放商用 API 与私有化部署,提供可视化界面

通义大模型事业部升级

  • 4 月 8 日组织调整:设立集团技术委员会,通义实验室升级为通义大模型事业部(周靖人负责),李飞飞任阿里云 CTO,吴泽明任集团 CTO

AI 算力价格调整

  • 平头哥真武 810E 等算力卡涨价 5%–34%,CPFS (智算版) 涨价 30%
  • 与百度智能云、腾讯云集体涨价,终结云计算近 20 年 “只降不升” 周期

4 月新增动态

  • 一周内连发三款模型:Qwen-Max 推理增强、端侧轻量版、200 万 Token 长文档模型
  • 发布 HappyOyster 世界模型,填补国内音视频联合生成空白
  • 上线全生命周期 MCP 服务,集成 50 + 工具,推进智能体生态

字节跳动

Seeduplex 全双工语音大模型

  • 全量接入豆包 App,边听边说、实时打断、零等待连续交互
  • 嘈杂环境识别、多轮记忆、意图理解、口语纠错达行业领先

Seedance 2.0 视频生成模型

  • 4 月 2 日开放企业公测,改为按调用付费
  • 新签用户默认 10 并发,合同未达 1000 万元不开放真人脸 / 自定义虚拟人

DeepSeek

DeepSeek V4 旗舰模型发布(4 月 24 日),终于露面了

  • 发布 V4-Pro / V4-Flash 双版本,同步开源权重
  • V4-Pro:1.6 万亿总参数、490 亿激活参数,定位高性能推理 / 智能体 / 代码
  • V4-Flash:2840 亿总参数、130 亿激活参数,轻量化、低成本部署
  • 支持 100 万 Token 超长上下文,长文本、智能体记忆能力大幅提升

核心技术突破

  • Ultra-MoE 稀疏架构 + DSA 稀疏注意力,算力效率大幅提升
  • V4-Pro 推理算力仅为 V3.2 的 27%,KV 缓存仅 10%
  • 数学、STEM、代码能力达到 开源模型全球第一梯队

国产算力里程碑

  • DeepSeek V4 原生适配华为昇腾 950PR,实现完全去 CUDA 化
  • 依托昇腾集群训练与推理,国产大模型 + 国产算力正式闭环

商业化与生态

  • API、网页端、App 全平台上线
  • 旧版接口 将于7 月 24 日停止服务,全面切换 V4
  • 4 月完成新一轮融资,估值超 100 亿美元

其他厂商动态

百度智能云

  • 推出具身智能数据超市,开放星云计划,小米 / 荣耀 /vivo 接入
  • 文心大模型在具身智能、数字人场景规模化落地

腾讯云

  • 2026 年 AI 投入翻倍至 360 亿元,资本开支 950 亿元
  • TI-ONE 智能体平台上线,推进微信生态 AI 原生改造

商汤科技

  • 4 月 22 日发布端侧 MoE 大模型 Sage(32B 总参 / 3B 激活),端侧部署性能超越 GPT-5.4
  • 绝影智能车舱与 Sage 融合,AI + 汽车进入规模化落地

科大讯飞

  • 4 月 16 日发布 AstronClaw 智能体矩阵,软硬一体覆盖办公本、AI 眼镜、机器人
  • 面向政务、金融、制造推出行业专属执行智能体

中科曙光

  • 4 月 14 日落地郑州 6 万卡 AI4S 科学计算集群,自研高速互联打破海外垄断
  • 液冷智算订单排至三季度,国产算力底座地位稳固

行业整体动态(4 月核心)

AI 算力涨价潮

  • 国内:阿里云、百度智能云、腾讯云、智谱 AI 集体涨价
  • 全球:AWS、谷歌云同步上调,算力供需失衡与硬件成本上涨为主因

政策与标准落地

  • 4 月 2 日:工信部启动普惠算力专项,提出 “毫秒用算”,推广算力银行 / 超市
  • 4 月 10 日:五部门发布《人工智能拟人化互动服务管理暂行办法》,7 月 15 日施行
  • 液冷强制化:新建智算中心 100% 液冷,PUE≤1.2,绿电占比≥60%

市场与竞争格局

  • 斯坦福 AI 指数:中美顶级模型性能差距缩至 2.7%
  • 2025 年美国私人 AI 投资 2859 亿美元,中国 124 亿美元
  • 2026 全球 AI 智能体市场 108.82 亿美元,中国 2025 年 804 亿元,2030 年有望破 6000 亿元
  • DeepSeek V4 4 月底发布:万亿参数、百万级上下文、昇腾首发适配,估值融资超 100 亿美元

未来展望与战略建议

短期(2026 年)

  • DeepSeek V4 成国产算力里程碑,昇腾份额快速提升
  • AI 智能体、视频生成、具身智能进入爆发期

中期(2027–2028 年)

  • 中美性能差距进一步缩小,国产算力生态成熟
  • 应用从实验走向大规模生产部署

未来重点(职业机会)

  1. 算力基建:加大万卡级集群与液冷投入,对接国家智算网络
  2. 技术自主:加速芯片、互联、存储全栈国产化替代
  3. 人才体系:对标全球薪酬,强化研发与工程人才储备
  4. 生态协同:推进 MCP、智能体、行业大模型标准化落地
发表评论
0评