推广 热搜: 采购方式  甲带  滤芯  气动隔膜泵  减速机型号  减速机  履带  带式称重给煤机  链式给煤机  无级变速机 

【报告】机器人大模型专题二:机器人大模型行业深度报告:我们距离真正的具身智能大模型还有多远?(附PDF下载)

   日期:2026-01-26 03:53:36     来源:网络整理    作者:本站编辑    评论:0    
【报告】机器人大模型专题二:机器人大模型行业深度报告:我们距离真正的具身智能大模型还有多远?(附PDF下载)
东吴证券
《机器人大模型行业深度报告:我们距离真正的具身智能大模型还有多远?
(完整版.pdf )
以下仅展示部分内容
下载方式见文末

一、报告核心定位与核心问题

《机器人大模型行业深度报告:我们距离真正的具身智能大模型还有多远?》由东吴证券出品,聚焦人形机器人智能化核心痛点,围绕 “为何需要高智能大模型”“当前技术进展如何”“未来发展方向是什么” 三大核心问题,系统剖析具身智能大模型的技术架构、数据支撑、产业格局与投资机会。报告指出,人形机器人产业化落地的关键在于摆脱传统工业机器人 “控制刚、泛化弱” 的局限,而具身智能大模型正是补足不确定性理解与适应能力的核心,当前行业智能化普遍处于 L2 初级阶段,通往泛化智能仍需突破建模方法、数据规模与训练范式等多重挑战。

二、人形机器人为何需要高智能大模型?

(一)形态并非核心难点,通用智能是关键

人形机器人的形态工程早已成熟,本田 ASIMO、波士顿动力 Atlas 等早期产品已具备出色运动能力,但均依赖预设行为库,缺乏对环境的感知、任务的理解与泛化能力,本质是 “人形的机器” 而非 “具备人类智能的机器人”。本轮产业热潮的核心驱动力,是市场对机器人 “智能性” 的高度期待,多模态大模型的突破使机器人首次具备 “感知 - 理解 - 决策” 的潜力,成为拥有 “大脑” 的关键起点。

(二)大模型开启智能进化,撬动 0-1 落地

大语言模型(LLM)验证了大规模文本训练的推理可行性,视觉语言模型(VLM)拓展了跨模态统一表征能力,而动作模态的融入则赋予机器人执行操作的能力。初级具身智能模型的出现,使机器人可在特定场景落地应用,并通过 “收集数据 - 改进模型 - 提升产品 - 获取更多数据” 的数据飞轮,开启迭代加速期,实现从 0-1 到 1-100 的演化。

(三)当前智能水平有限,泛化能力待突破

根据《人形机器人智能化分级》标准,智能水平从 L1-L5 分为五级,涵盖感知认知、决策学习、执行表现、协作交互四大维度。目前主流产品普遍处于 L2 阶段,仅能实现 “固定任务 + 微调”,尚未具备自主泛化与应变能力,距离真正的通用智能仍有较长路径,需在技术、数据体系和生态协同上持续积累。

三、具身智能大模型的技术进展:架构与数据双轮驱动

(一)架构端演进:从模块化到端到端,动作频率持续提升

具身智能大模型的架构演进围绕多模态融合、动作频率提升、泛化能力增强三条主线展开,形成多代际技术迭代:

  1. 早期模块化架构:2022 年 Google 发布的 SayCan 模型,通过 LLM 拆解自然语言指令,结合可行性模型评估动作候选,实现 “说得通也做得到” 的人机交互,但存在语义脱节、迁移成本高、缺乏自主重规划能力等局限;
  2. 端到端控制模型:同年 Google 推出 RT-1 模型,基于 Transformer 架构,将图像与语言联合编码输出动作 Token,在 700 余项任务中平均成功率达 97%,但受限于任务平台耦合、语义理解能力弱;
  3. 多模态具身模型:2023 年 Google 发布 PaLM-E,融合语言、视觉和传感器状态信息,实现高层推理与决策生成,可完成 “分类推积木” 等复杂任务,但模型体量庞大、训练成本高,低层控制仍依赖预设策略;
  4. 动作信息融入 VLM:2023 年 RT2 模型将动作信息转化为语言 Token 纳入 VLM 训练,构成端到端 VLA 架构,泛化能力显著提升,但动作输出频率仅 1-5Hz,难以满足实际工作需求;
  5. 动作专家增强:2024 年 π0 模型引入 FlowMatch 动作专家,动作输出频率提升至 50Hz,稳定性和成功率大幅提高,适配复杂环境处理,但尚未达到 100Hz 的复杂场景需求;
  6. 快慢脑并行架构:2025 年 Helix 模型采用 “慢脑(7B 参数量 VLM 负责高层分析)+ 快脑(80M 参数量 Transformer 负责实时执行)” 架构,动作输出频率突破 200Hz,实现零样本多机器人协同,首次涌现任意物品拾取能力。

此外,架构优化方向还包括 FiS-VLA 的双系统融合设计,将 VLM 末端模块重构为执行模块,提升协同效率与动作稳定性。

(二)数据端支撑:三类数据协同,动捕设备成关键

数据是具身智能大模型训练的核心燃料,遵循三大 Scaling 法则(预训练 Scaling、后训练 Scaling、推理阶段 Scaling),形成 “互联网数据 + 仿真数据 + 真实数据” 的金字塔结构:

  1. 互联网数据:位于金字塔基座,以海量未标记视频为主,获取成本极低,适用于预训练阶段,但场景泛化难,监督学习标注成本高;
  2. 仿真数据:居于中间层,通过英伟达 Isaac 等平台生成,具备成本低、效率高、场景切换灵活等优势,可零成本生成完美标签,多用于模型冷启动,但存在 Sim2Real Gap(仿真与现实对齐难题)和过拟合风险;
  3. 真实数据:位于金字塔顶端,通过遥操作或动捕设备采集,数据质量最高,是后训练阶段提升实用性的关键,但采集效率低、成本高昂。

真机数据采集高度依赖动捕设备,分为光学动捕与惯性动捕两类:光学动捕以亚毫米级精度适配集中式训练场,代表企业包括凌云光、青瞳视觉;惯性动捕部署灵活、成本较低,适用于中低精度场景,代表企业有诺亦腾、Xsens。行业普遍采用 “仿真 + 真机” 混合训练模式,数据占比差异显著,智元机器人实现 100% 真机数据驱动,北京人形机器人创新中心则采用 7:3 的仿真数据占比。

四、具身智能大模型的未来发展方向

(一)模态扩展:融入更多感知通道

当前主流模型以视觉、语言、动作三模态为主,未来将引入触觉、温度等更多模态,构筑更真实的世界模型。触觉模态已成为重点突破方向,VTLA(视觉 - 触觉 - 语言 - 动作)模型相关技术储备已在戴盟、帕西尼等企业落地,有望进一步提升模型泛化能力。

(二)推理机制:引入世界模型提升认知

未来架构将融入 “世界模型”,使机器人具备 “感知 - 建模 - 预测 - 决策” 的闭环认知。英伟达发布的 Cosmos 世界模型平台,可生成照片级真实的合成数据,通过扩散模型、自回归模型等模块,赋予机器人 “想象力”,提升环境建模与复杂任务推理能力。

(三)数据构成:仿真与真实数据融合

纯真实数据采集效率低、缺乏负样本,纯仿真数据存在现实对齐难题,二者融合训练成为必然趋势。标准化、可扩展的机器人数据训练场加速建设,1 亿条高质量行为轨迹被视为模型能力跃迁的关键门槛,优必选、特斯拉、华为等企业正加速搭建 “仿真 - 真机融合” 的数据训练场。

五、核心企业与标的分析

(一)模型端核心企业

  1. 银河通用:专注具身多模态大模型,采用全仿真数据预训练(占比 99%+)+ 少量真机数据微调模式,发布全球首个完全依靠合成数据预训练的 VLA 模型 GraspVLA,训练数据达十亿帧 “视觉 - 语言 - 动作” 对,首款机器人 Galbot(G1)具备泛化抓取能力;
  2. 星动纪元:孵化于清华大学交叉信息研究院,自研端到端模型 ERA-42,采用双系统架构,是全球首个融合世界模型的全模态具身大模型,开源 AIGC 生成式模型 VPP,利用互联网视频数据训练,提升策略泛化性;
  3. 智元机器人:发布通用具身基座大模型 GO-1,采用 ViLLA 架构融合 VLM 与混合专家系统,推出全球首个基于机器人动作序列驱动的具身世界模型 EVAC 及评测基准 EWMBench,实现感知 - 规划 - 执行闭环。

(二)数据采集与训练场标的

  1. 数据采集领域:青瞳视觉(光学动捕系统,集成 Kinetiq AI 解算器)、凌云光(光场重建与动捕系统国内市占率第一,服务头部机器人厂商)、奥比中光(3D 视觉龙头,Gemini 系列相机支持毫米级深度感知);
  2. 数据训练场领域:天奇股份(与优必选、银河通用合作,构建工业数据采集与实训中心,可容纳 50 台人形机器人并行训练)。

六、投资建议与风险提示

(一)投资建议

模型端建议关注银河通用、星动纪元、智元机器人等一级市场企业;数据采集领域重点关注青瞳视觉、凌云光(688400.SH)、奥比中光(688322.SH);数据训练场领域建议关注天奇股份(002009.SZ)。

(二)风险提示

  1. 大模型技术进展不及预期,推理能力、泛化能力、动作输出频率等核心指标突破缓慢;
  2. 高质量数据获取受限,训练场建设进度、采集成本与效率难以满足模型训练需求;
  3. 人形机器人需求不及预期,商业化路径探索受阻,影响具身大模型产业化价值空间。

☟☟☟

☞人工智能产业链联盟筹备组征集公告☜

精选报告推荐:

11份清华大学的DeepSeek教程,全都给你打包好了,直接领取:

【清华第一版】DeepSeek从入门到精通

【清华第二版】DeepSeek如何赋能职场应用?


【清华第三版】普通人如何抓住DeepSeek红利?

【清华第四版】DeepSeek+DeepResearch让科研像聊天一样简单?

【清华第五版】DeepSeek与AI幻觉

【清华第六版】DeepSeek赋能家庭教育

【清华第七版】文科生零基础AI编程:快速提升想象力和实操能力

【清华第八版】DeepSeek政务场景应用与解决方案

【清华第九版】迈向未来的AI教学实验

【清华第十版】DeepSeek赋能品牌传播与营销

【清华第十一版】2025AI赋能教育:高考志愿填报工具使用指南

 10份北京大学的DeepSeek教程

【北京大学第一版】DeepSeek与AIGC应用

【北京大学第二版】DeepSeek提示词工程和落地场景

【北京大学第三版】Deepseek 私有化部署和一体机

【北京大学第四版】DeepSeek原理与落地应用

【北京大学第五版】Deepseek应用场景中需要关注的十个安全问题和防范措施

【北京大学第六版】DeepSeek与新媒体运营

【北京大学第七版】DeepSeek原理与教育场景应用报告

【北京大学第八版】AI工具深度测评与选型指南

【北京大学第九版】AI+Agent与Agentic+AI的原理和应用洞察与未来展望

【北京大学第十版】DeepSeek在教育和学术领域的应用场景与案例(上中下合集)

8份浙江大学的DeepSeek专题系列教程

浙江大学DeepSeek专题系列一--吴飞:DeepSeek-回望AI三大主义与加强通识教育

浙江大学DeepSeek专题系列二--陈文智:Chatting or Acting-DeepSeek的突破边界与浙大先生的未来图景

浙江大学DeepSeek专题系列三--孙凌云:DeepSeek:智能时代的全面到来和人机协作的新常态

浙江大学DeepSeek专题系列四--王则可:DeepSeek模型优势:算力、成本角度解读

浙江大学DeepSeek专题系列五--陈静远:语言解码双生花:人类经验与AI算法的镜像之旅

浙江大学DeepSeek专题系列六--吴超:走向数字社会:从Deepseek到群体智慧

浙江大学DeepSeek专题系列七--朱朝阳:DeepSeek之火,可以燎原

浙江大学DeepSeek专题系列八--陈建海:DeepSeek的本地化部署与AI通识教育之未来

4份51CTO的《DeepSeek入门宝典》

51CTO:《DeepSeek入门宝典》:第1册-技术解析篇

51CTO:《DeepSeek入门宝典》:第2册-开发实战篇

51CTO:《DeepSeek入门宝典》:第3册-行业应用篇

51CTO:《DeepSeek入门宝典》:第4册-个人使用篇

5份厦门大学的DeepSeek教程

【厦门大学第一版】DeepSeek大模型概念、技术与应用实践

【厦门大学第二版】DeepSeek大模型赋能高校教学和科研

【厦门大学第三版】DeepSeek大模型及其企业应用实践

【厦门大学第四版】DeepSeek大模型赋能政府数字化转型

【厦门大学第五版】DeepSeek等大模型工具使用手册-实战篇

10份浙江大学的DeepSeek公开课第二季专题系列教程

【精选报告】浙江大学公开课第二季:《DeepSeek技术溯源及前沿探索》(附PDF下载)

【精选报告】浙江大学公开课第二季:2025从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例(附PDF下载)

【精选报告】浙江大学公开课第二季:智能金融——AI驱动的金融变革(附PDF下载)

【精选报告】浙江大学公开课第二季:人工智能重塑科学与工程研究(附PDF下载)

【精选报告】浙江大学公开课第二季:生成式人工智能赋能智慧司法及相关思考(附PDF下载)

【精选报告】浙江大学公开课第二季:AI大模型如何破局传统医疗(附PDF下载)

【精选报告】浙江大学公开课第二季:2025年大模型:从单词接龙到行业落地报告(附PDF下载)

【精选报告】浙江大学公开课第二季:2025大小模型端云协同赋能人机交互报告(附PDF下载)

【精选报告】浙江大学公开课第二季:DeepSeek时代:让AI更懂中国文化的美与善(附PDF下载)

【精选报告】浙江大学公开课第二季:智能音乐生成:理解·反馈·融合(附PDF下载)

6份浙江大学的DeepSeek公开课第三季专题系列教程

【精选报告】浙江大学公开课第三季:走进海洋人工智能的未来(附PDF下载)

【精选报告】浙江大学公开课第三季:当艺术遇见AI:科艺融合的新探索(附PDF下载)

【精选报告】浙江大学公开课第三季:AI+BME,迈向智慧医疗健康——浙大的探索与实践(附PDF下载)

【精选报告】浙江大学公开课第三季:心理学与人工智能(附PDF下载)

【精选报告】浙江大学公开课第三季:人工智能赋能交通运输系统——关键技术与应用(附PDF下载)

【精选报告】浙江大学公开课第三季:人工智能与道德进步(附PDF下载)

  1. 篇幅有限,部分展示
    加入会员,任意下载

    资料下载方式

    Download method of report materials

    关注公众号回复:JS260101
    即可领取完整版资料
    【中国风动漫】《姜子牙》刷屏背后,藏着中国动画100年内幕
    【中国风动漫】除了《哪吒》,这些良心国产动画也应该被更多人知道!

    【中国风动漫】《雾山五行》大火,却很少人知道它的前身《岁城璃心》一个拿着十米大刀的男主夭折!

    如需获取更多报告

    扫码加入
    “人工智能产业链联盟”
    知识星球,任意下载相关报告!

    报告部分截图

    声明
    来源:东吴证券,人工智能产业链union(ID:aiyuexingqiu)推荐阅读,不代表人工智能产业链union立场,转载请注明,如涉及作品版权问题,请联系我们删除或做相关处理

    编辑:Zero

    文末福利

    1.赠送800G人工智能资源。

    获取方式:关注本公众号,回复“人工智能”。

    2.「超级公开课NVIDIA专场」免费下载

    获取方式:关注本公众号,回复“公开课”。

    3.免费微信交流群:

    人工智能行业研究报告分享群、

    人工智能知识分享群、

    智能机器人交流论坛、

    人工智能厂家交流群、

    AI产业链服务交流群、

    STEAM创客教育交流群、

    人工智能技术论坛、

    人工智能未来发展论坛、

    AI企业家交流俱乐部

    雄安企业家交流俱乐部

    细分领域交流群:

    【智能家居系统论坛】【智慧城市系统论坛】【智能医疗养老论坛】【自动驾驶产业论坛】【智慧金融交流论坛】【智慧农业交流论坛】【无人飞行器产业论坛】【人工智能大数据论坛】【人工智能※区块链论坛】【人工智能&物联网论坛】【青少年教育机器人论坛】【人工智能智能制造论坛】【AI/AR/VR/MR畅享畅聊】【机械自动化交流论坛】【工业互联网交流论坛】

    入群方式:关注本公众号,回复“入群”

    “阅读原文”下载报告。
 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON