

2026年4月,中国人工智能学会发布《具身智能白皮书(2026版)》,从技术、数据到应用完整勾勒了具身智能全貌。白皮书指出,行业正经历从VLA(视觉-语言-动作)到WAM(世界-动作模型)的范式跃迁,其核心是让机器从“模仿指令”跨越到“理解物理因果”。
具身智能初相识
当我们谈论AI时,你可能首先想到聊天机器人。但人工智能的下一个爆发点,正从虚拟世界走向真实物理世界,它就是具身智能。
简单来说,具身智能让AI拥有了“身体”。它不再是离身的算法,而是能通过机器人、机械臂等物理实体,像人一样感知环境、自主决策并执行动作。比如,一个家庭机器人听懂“我渴了”,能自主完成“走到厨房—拿杯子—倒水—递给你”的全过程。
这项技术正从实验室快速走向产业化,将深刻改变三大领域:
? 生活服务:机器人正在变成全能管家,实现衣物折叠、餐食制作、老人陪护等复杂家务。在零售场景,它们自主上货、制作咖啡,甚至运营无人便利店。
? 智能制造:搭载“工业之眼”和“工业之手”的机器人,能在柔性产线上实现精密装配和自适应焊接,推动制造业升级。
? 精准农业:无人驾驶农机通过北斗导航和环境感知,实现厘米级定位,自主完成从播种到收割的全流程作业。
具身智能的核心在于“感知—决策—执行”的闭环技术体系,其算法范式正从VLA(视觉-语言-动作)向WAM(世界-动作模型)跃迁,让机器具备更强的物理因果理解能力。
AI不再只是思考,而是开始行动。 这场从“数字智能”到“物理智能”的跨越,将重新定义未来的生产力、生活方式乃至人机关系。
白皮书原文











































































来源:海豚数智科学实验室、中关村金融科技产业发展联盟
编辑:单雯瑶
一审:陆盈盈
二审:陆鉴
三审:钟元




