核心摘要
本报告系统梳理了全球具身机器人芯片行业的技术演进、市场格局与未来趋势。2025 年,行业从实验室原型验证阶段迈入工业化早期,核心特征包括:异构计算架构成为主流—— 通过 CPU、GPU、NPU、FPGA 等多计算单元协同,平衡大模型推理与微秒级运动控制的双重需求;能效比取代绝对算力成为核心竞争指标—— 人形机器人单芯片功耗需控制在 250W 以内才能满足基础续航,低功耗 ASIC 芯片出货量快速增长;中国厂商在工业与服务机器人芯片领域市占率已达 35%,形成从边缘侧到高端算力的全链条布局,国产化替代速度超市场预期。
全球范围内,NVIDIA凭借 Jetson Thor 芯片与 Isaac Sim 仿真平台构建全栈生态,占据高性能机器人芯片市场主导地位;高通以 Dragonwing(跃龙)系列的高能效异构架构切入服务机器人与中低端工业市场;华为昇腾、地平线等中国厂商则依托本土化场景优势,在工业与商用机器人领域实现关键突破。
1. 引言:具身智能的算力基石
1.1 具身机器人芯片的定义与核心特征
具身机器人芯片并非普通消费级 SoC 或工业 FPGA 的简单适配,而是专为机器人在物理世界中完成 “感知 - 决策 - 执行” 全链路任务设计的异构算力集成系统(15)。区别于通用芯片仅聚焦单一维度的算力输出,这类芯片的核心价值在于通过硬件级协同,同时满足机器人在动态环境中的三大刚性需求:
•多模态感知实时融合:需同步处理视觉、触觉、力觉、IMU 等数十种传感器的并发数据 —— 例如人形机器人的每一次行走,都需要整合来自腿部 6 个关节的力矩传感器、躯干的 IMU、头部的深度相机等超过 20 路传感器的数据,普通 SoC 的单模态算力设计无法支撑这种并行处理需求 (15);
•微秒级运动控制响应:FPGA 或专用 MCU 单元需为每个关节分配独立硬件逻辑,实现微秒级电流环闭环控制 —— 这一指标直接决定了机器人的运动精度:比如工业协作机器人的末端执行器定位误差需控制在 0.01mm 以内,依赖的正是这种硬件级的实时响应能力,而普通 CPU/MCU 的分时复用调度机制会产生毫秒级抖动,根本无法满足要求 (15);
•端云协同的算力调度:端侧负责实时运动控制,云侧负责大模型训练与复杂场景规划,两者需通过低延迟链路实现毫秒级同步—— 例如工业机器人的远程调试,云侧的仿真模型需将调整参数实时同步到端侧的运动控制器,延迟超过 10ms 就可能导致调试误差翻倍 (15)。
1.2 行业发展背景与趋势
随着人形机器人从实验室原型走向工业场景,芯片已成为制约其规模化落地的核心瓶颈——2024 年全球人形机器人出货量仅千余台,核心原因之一就是高算力芯片的功耗普遍突破 500W,导致机器人续航不足 2 小时,根本无法满足工业场景的 8 小时连续作业需求 (28)。
2025 年,行业终于完成从 “算力堆砌” 到 “能效优先” 的关键范式转移:这一转变并非厂商的主动选择,而是量产需求倒逼的结果 —— 特斯拉 Optimus Gen-3 曾因自研 AI5 芯片功耗未达 250W 的量产目标,将上市时间推迟至 2027 年中,这一事件直接让全行业意识到,没有合理的功耗控制,再强的算力都无法落地 (28)。
从市场规模看,2025 年全球机器人 AI 芯片市场规模已达 95 亿美元,其中具身机器人芯片占比超 30%—— 这一占比在 2023 年仅为 12%,两年间实现了超两倍的增长 (722)。中国信通院预测,2028 年全球人形机器人芯片市场规模将达 4800 万美元,而工业机器人芯片市场规模将突破 150 亿美元,成为驱动行业增长的核心引擎 (722)。
2. 全球领先芯片企业分析:主导厂商
2.1 英伟达(NVIDIA):物理 AI 的全栈生态领导者
2.1.1 战略布局
NVIDIA 将具身机器人定义为 “物理 AI”(Physical AI)的核心落地场景 —— 即 AI 从虚拟数字世界走向物理实体世界的终极形态,而非简单的 “机器人用 AI 芯片”。为实现这一愿景,NVIDIA 构建了从仿真工具到端侧推理芯片的全栈闭环:底层是 Isaac Sim 仿真平台,可在虚拟环境中生成海量物理交互数据,为模型训练提供低成本的场景验证;中间层是 DGX Blackwell 超级计算机,为具身大模型提供每秒百亿亿次的训练算力;顶层是 Jetson Thor 边缘推理芯片,实现端侧的实时决策与运动控制 (161)。
这一布局的核心逻辑是“仿真 - 训练 - 推理” 的全链路协同:例如,机器人在实际场景中需要 1000 小时的行走数据才能学会避障,但通过 Isaac Sim 的物理仿真,仅需 100 小时就能生成等效的训练数据,且能覆盖火灾、湿滑地面等现实中难以复现的极端场景,大幅降低了模型迭代的时间和成本 (161)。
2.1.2 核心产品与技术
•Jetson Thor 芯片:基于 Blackwell GPU 架构,是当前全球性能最强的端侧机器人芯片 —— 其 FP4 精度算力达 2070 TFLOPS,是前代 Orin 的 7.5 倍;功耗区间控制在 40-130W,能效比提升 3.5 倍,可单芯片满足全尺寸人形机器人的多模态感知、大模型推理与运动控制需求,而前代 Orin 需要至少 3 颗芯片才能实现类似功能 (163)。实测数据显示,Jetson Thor 在富士康工业人形机器人场景中的运动控制延迟 < 1ms,多传感器处理延迟 < 40ms,这一指标足以支撑机器人完成高精度的装配任务 (163)。
•GR00T N1 开源模型:全球首个针对人形机器人的视觉 - 语言 - 动作(VLA)基础模型,采用 “System1(200Hz 快速动作响应)+System2(7-9Hz 深度决策)” 双系统设计 ——System1 负责如避障、平衡调整等本能反应,响应时间仅 0.1 秒;System2 负责如 “拆解快递盒”“组装零件” 等复杂任务规划,两者通过硬件级接口实现无缝协同,真正实现了 “人类语言指令→机器人关节动作” 的端到端映射,无需中间的代码转换环节 (161)。配套的 Cosmos Reason 物理推理模型,在 Hugging Face 物理推理排行榜中位居榜首,能精准预测物体的物理属性(如重量、摩擦力),让机器人在抓取易碎品时自动调整力度 (161)。
2.1.3 市场表现与合作伙伴
2025 年 Q3,NVIDIA 汽车与机器人业务营收达 5.92 亿美元,同比增长 32%—— 其中机器人业务贡献占比超 40%,成为该板块增长的核心驱动力 (183)。市场份额方面,Jetson 系列占据 69% 的机器人 SoC 市场份额,其中 Thor 在人形机器人高端算力芯片市场占比超 80%,几乎垄断了全球顶级人形机器人项目的算力供应 (183)。
合作伙伴覆盖工业、服务、人形机器人全场景:优必选 Walker S2 工业人形机器人、银河通用人形机器人 R1、富士康工业人形机器人均将 Jetson Thor 作为唯一主芯片;中科创达为其适配的医疗机器人实时 OS,能将多传感器融合延迟降至 20ms 以内;宝信软件基于 Isaac Sim 开发的工业机器人虚拟调试平台,将某汽车焊装线的调试周期从 45 天缩短至 15 天,直接为车企节省了超千万元的调试成本 (219)。
2.2 高通(Qualcomm):高能效异构计算的挑战者
2.2.1 战略定位
高通以“高能效异构计算 + 全栈生态” 切入具身机器人赛道,推出 Dragonwing(跃龙)机器人芯片平台 —— 与 NVIDIA Thor 的 “全场景算力旗舰” 定位不同,高通的目标是覆盖中低端工业 AMR、服务机器人及人形机器人的边缘算力市场,核心策略是 “能效优先、场景适配”,而非单纯的算力比拼 (247)。
这一战略的核心逻辑是:全球 80% 的机器人场景(如物流 AMR、餐饮服务机器人)并不需要 2000TFLOPS 以上的算力,而是需要在 10-50W 功耗区间内,实现稳定的多模态感知与运动控制 —— 这正是高通在手机芯片领域积累的能效优化能力的优势所在 (247)。
2.2.2 核心产品与技术
•Dragonwing IQ10 系列(2026CES 发布):采用 18 核自研 Oryon CPU + 新一代 Hexagon NPU 异构架构,是高通在机器人芯片领域的旗舰产品 —— 其稀疏算力达 700 TOPS,可本地运行 VLA 模型,支持 20 路摄像头并发接入;更关键的是,其能效比达 2 TOPS/W,是 NVIDIA Thor 的 1.5 倍以上,适配全尺寸人形机器人与工业 AMR 的长续航需求 (247)。
•QCS8550:4nm 制程,Hexagon NPU 算力 48 TOPS(INT8),支持 INT4 精度,能效较上一代提升 60%;集成 Wi-Fi7 模块,能实现毫秒级的多机器人协同通信,适配服务机器人、工业 AMR 的场景需求 (249)。
•RB6 平台(2025 年迭代):支持 5G+Wi-Fi6E 双模通信,AI 算力 70-200 TOPS(INT8),支持 7 路摄像头并发,专门针对工业机器人的实时控制场景优化 —— 其运动控制接口的延迟仅为 3ms,能满足工业机械臂的高精度轨迹控制需求 (289)。
2.2.3 市场表现与合作伙伴
2025 财年,高通汽车业务营收达 39.57 亿美元 —— 其中机器人芯片关联业务贡献占比超 25%,主要来自工业 AMR 与服务机器人的芯片订单 (286)。在服务机器人芯片领域,高通的市占率居全球前列,尤其是在物流配送、餐饮服务等场景,占比超 40% (286)。
合作伙伴覆盖从工业到消费的全场景:宇树科技 G1Q 人形机器人采用定制版跃龙 IQ-9075 芯片,实现了毫秒级的关节响应;阿加犀 “通天晓” 机器人部署 QCS8550,实现纯离线多模态交互 —— 即使在无网络的仓库环境中,也能识别语音指令并完成货物分拣;越南 VinMotion 则采用 RB6 平台,合作开发通用人形机器人 (263)。
2.3 AMD:边缘异构与实时控制的补位者
2.3.1 战略布局
AMD 在 2026CES 上发布 Ryzen AI Embedded Processor 系列,主打 “边缘异构计算 + 实时控制”—— 与 NVIDIA、高通的 “大算力 + 大模型” 路线不同,AMD 的核心优势来自对 Xilinx FPGA 的收购:FPGA 的确定性硬件逻辑,能实现微秒级的运动控制延迟,而这正是传统 GPU/SoC 的短板 (321)。
AMD 的战略目标是:补全英伟达、高通在工业机器人微秒级运动控制领域的生态缺口,成为工业机器人与高精度协作机器人的 “控制算力首选”—— 例如,工业机械臂的关节控制需要 0.1ms 以内的延迟,而 GPU 的软件调度机制根本无法实现,FPGA 的硬件级并行逻辑则是唯一的解决方案 (321)。
2.3.2 核心产品与技术
•Ryzen AI Embedded Processor 系列(P100/X100):采用 Zen5 CPU+RDNA3.5 GPU+XDNA2 NPU 异构架构,AI 算力最高 50 TOPS,GPU 图形渲染性能提升 35%;支持实时 4K/8K 视觉处理,运动控制延迟实测 < 0.1ms—— 这一指标是当前全球机器人芯片中的顶尖水平,能满足工业机械臂的纳米级定位需求 (321)。
•Xilinx FPGA/Versal 系列:提供确定性运动控制,适配工业机器人关节控制场景——ABB GoFa 协作机器人正是采用了 Xilinx 的 FPGA 方案,实现了 0.02mm 的末端定位精度,比传统 MCU 方案提升了 5 倍 (337)。
•Kria KR260 Robotics Starter Kit:原生支持 ROS2 框架,提供开箱即用的机器人开发能力 —— 开发者无需从零搭建硬件环境,仅需 3 天就能完成工业机械臂的运动控制原型开发 (318)。
2.3.3 市场表现与合作伙伴
2025 年,AMD 数据中心业务营收达 160 亿美元 —— 其中机器人芯片关联业务贡献占比超 10%,主要来自工业机器人的 FPGA 控制芯片订单 (368)。在工业机器人控制芯片领域,AMD 的市占率已达 15%,成为仅次于瑞萨、德州仪器的第三大供应商 (368)。
合作伙伴覆盖工业与人形机器人场景:联想“晨星” 人形机器人部署 Ryzen AI+Xilinx FPGA 的组合,实现了 0.1ms 级的关节响应;意大利 Generative Bionics 合作开发的 Gene.01 人形机器人概念平台,采用了 Ryzen AI 的异构算力;Robotec.ai 合作开发的仓库机器人,采用 Ryzen AI+Liquid AI 的 LFM2 模型,能实现动态路径规划 (355)。
2.4 英特尔(Intel):大小脑融合方案的推进者
2.4.1 战略布局
英特尔推出“大小脑融合方案”,主打 CPU+GPU+NPU 的异构算力协同 —— 与 NVIDIA、高通的 “端侧为主” 不同,英特尔的核心优势是 x86 架构的生态兼容性,能快速适配工业机器人已有的 Windows/Linux 控制软件,降低厂商的迁移成本 (431)。
英特尔的战略目标是:成为工业机器人与商用服务机器人的“通用算力底座”—— 例如,工业机器人厂商无需替换已有的控制软件,仅需升级英特尔的芯片,就能获得 AI 感知与运动控制的双重提升 (431)。
2.4.2 核心产品与技术
•第三代酷睿 Ultra 处理器:采用 18A 制程,GPU 算力达 122 TOPS(INT8),采用 XPU 异构架构,可同时处理多模态 AI 工作负载 —— 其 NPU 单元专门针对机器人的多模态感知优化,能将视觉、触觉数据的融合效率提升 40% (431)。
•Habana Gaudi2 AI 加速器:7nm 工艺,24 个张量处理器核心,FP16 算力达 394 TOPS,主要适配机器人模型训练场景 —— 其训练效率比 NVIDIA A100 提升 20%,能大幅缩短具身大模型的迭代周期 (427)。
•具身智能 SDK:支持 EtherCAT 工业总线、VLA 模型,能将机器人的感知数据与运动控制指令的同步延迟降至 5ms 以内,适配工业机器人的实时控制需求 (390)。
2.4.3 市场表现与合作伙伴
2025 年,英特尔机器人 AI 套件的出货量超 50 万套,已吸引 Oversonic Robotics 等人形机器人制造商合作 —— 这些厂商主要看中英特尔 x86 架构的生态兼容性,能快速对接已有的工业软件系统 (390)。在工业机器人边缘侧芯片市场,英特尔的市占率已达 12%,成为中国厂商之外的主要玩家 (390)。
合作伙伴覆盖工业与商用机器人场景:与节卡机器人达成战略合作,推进工业机器人“算力与作业力融合”—— 节卡机器人的 JAKA Kargo 轮式双臂机器人,采用英特尔酷睿 Ultra 处理器,实现了动态路径规划与高精度抓取的协同;信步科技推出的 HB03 开发平台,搭载酷睿 Ultra 200 系列处理器,实现了极强的控制实时性 (406)。
2.5 瑞萨电子(Renesas):工业机器人的全链路方案提供商
2.5.1 战略定位
瑞萨电子以“感知 - 决策 - 控制全链路能力” 为核心,聚焦工业机器人、协作机器人、服务机器人场景,提供从高性能 MCU/MPU 到电机驱动、电源管理的系统级解决方案 —— 与其他厂商不同,瑞萨的优势在于 “全链路整合”:从传感器信号采集到电机控制输出,所有环节都能通过自研芯片实现无缝协同,无需第三方芯片的配合 (458)。
这一战略的核心逻辑是:工业机器人的核心需求是“稳定可靠”,而非极致算力 —— 例如,汽车焊接机器人需要连续运行 10000 小时无故障,这要求芯片的各个环节都能实现高度整合,而瑞萨的全链路方案正是针对这一需求设计的 (458)。
2.5.2 核心产品与技术
•RZ/V 系列 MPU:RZ/V2N(2025 年 3 月发布)搭载 DRP-AI3 加速器,是瑞萨在工业机器人领域的旗舰产品 —— 其 15 TOPS 的稀疏算力、10 TOPS/W 的能效比,无需冷却风扇即可稳定运行,适配工业 AMR 的视觉 SLAM 场景;RZ/V2H 算力 8 TOPS,集成四核 Cortex-A55 + 双核 Cortex-R8,支持 OpenCV 加速与机器人动态计算,能实时处理视觉导航数据 (454)。
•RA 系列 MCU:RA8T2(2025 年 9 月发布)为旗舰运动控制 MCU,1GHz Cortex-M85 核心,集成 EtherCAT 从站控制器,支持多协议工业网络 —— 单芯片即可满足高端机器人的多轴控制需求,能替代传统的 “MCU+FPGA” 方案;RA6M5 支持 micro-ROS 框架,实现 MCU 级机器人控制,适配小型协作机器人的场景 (453)。
•RH850 系列:RH850/U2B 为汽车级 MCU,集成 EMU3S 电机控制加速器,可迁移至工业机器人关节控制场景,提供 ASIL-D 功能安全认证 —— 这一认证是工业机器人进入汽车制造场景的必备条件,能确保机器人在故障时不会对生产设备或人员造成伤害 (478)。
2.5.3 市场表现与合作伙伴
2025 年,瑞萨工业 MCU/MPU 产品在全球工业机器人控制芯片市场份额位居前列,占比约 18%—— 其中工业机器人四大家族(ABB、库卡、发那科、安川)的间接采购占比超 30%,主要用于关节控制与运动规划 (445)。在服务机器人场景,瑞萨的市占率也达 10%,主要用于物流机器人的 SLAM 导航 (445)。
合作伙伴覆盖工业与服务机器人场景:Ignitarium 扫地机器人采用 RZ/V2H+RA6M5 的组合,实现 AI+SLAM + 电机控制的全链路协同;灵巧手方案采用 RA4TE+RZ/V2H 的组合,实现 AI 视觉 + 电机控制的高精度协同;节卡机器人协作机器人采用 RA8T2,实现多轴实时控制 (477)。
2.6 德州仪器(TI):工业机器人的实时控制标杆
2.6.1 战略定位
德州仪器以“控制 + 功率 + 感知” 三大能力为核心,聚焦工业机器人、协作机器人、人形机器人的实时控制场景,提供从 MCU 到模拟器件的系统级解决方案 —— 与其他厂商不同,TI 的核心优势是 “模拟 + 数字的整合能力”:其模拟器件(如 GaN 功率器件、高精度传感器)能与数字控制芯片实现深度协同,进一步提升系统的能效与可靠性 (501)。
这一战略的核心逻辑是:工业机器人的运动控制,本质是“电力控制”—— 从电源输入到电机输出的每一个环节,都能影响机器人的精度与稳定性,而 TI 的模拟器件能将这一过程的损耗降至最低 (501)。
2.6.2 核心产品与技术
•C2000 系列实时 MCU:TMS320F28P65x 集成 C28x 核心 + CLA 协处理器,是 TI 在工业机器人领域的旗舰控制芯片 —— 支持 36 路 PWM 输出,单芯片替代 “MCU+FPGA+ET1100” 方案,运动控制性能媲美 FPGA;F29H85x 支持 36 路 PWM,适配人形机器人灵巧手的多电机控制需求,能实现每根手指的独立精准控制 (511)。
•Sitara/TDA4 系列 SoC:TDA4VM 为多核异构 SoC(Cortex-A72+R5F+C7x DSP),AI 算力 32 TOPS,集成视觉 / 雷达加速器,适配工业机器人的传感器融合场景 —— 能将视觉、雷达、IMU 的数据实时融合,实现动态路径规划;Sitara AM57x 支持 ROS 系统,实现 mmWave 雷达 + 视觉 SLAM 的融合处理,适配工业 AMR 的导航需求 (522)。
•模拟器件:GaN 功率器件将电机控制模块体积缩小超 50%,开关损耗降低 30%—— 这一优化能让工业机器人的关节模组重量减轻 20%,进一步提升负载能力;高精度 IMU 传感器为机器人提供亚毫米级定位精度,能满足高精度装配任务的需求 (503)。
2.6.3 市场表现与合作伙伴
2025 年,德州仪器工业芯片业务营收占比达 42%—— 其中机器人芯片关联业务贡献占比超 20%,是 TI 的核心增长板块之一 (493)。在工业机器人控制器芯片领域,TI 的市占率超 25%,是全球最大的工业机器人控制芯片供应商之一 (493)。
合作伙伴覆盖工业与人形机器人场景:库卡 KR C5 micro-2 工业机器人控制器采用 TDA4VM,体积缩小 27%、功耗降低 30%,满足 ISO 10218-1 功能安全认证 —— 这一认证是工业机器人进入欧洲市场的必备条件;越疆科技 CR 30H 协作机器人采用 F28P65x,实现高负载控制 —— 其负载能力达 30kg,比同类型机器人提升了 15%;优必选 Walker S2 采用 TI 的模拟器件,提升了电机控制的能效与稳定性 (517)。
3. 创新与突破:新兴芯片企业与独角兽
3.1 地平线(Horizon Robotics):国产具身智能芯片的领军者
3.1.1 战略布局
地平线以“芯片 - 平台 - 生态” 为核心,推出征程 6 系列车规级 AI 芯片 —— 与其他国产芯片厂商不同,地平线的优势在于 “车规级技术的迁移能力”:征程 6 系列原本是为高阶智驾设计的芯片,但智驾场景的 “多模态感知、低延迟决策、高可靠性” 需求,与具身机器人高度匹配,因此地平线能快速将其迁移至机器人场景 (550)。
地平线的战略目标是:成为中国具身机器人芯片的核心供应商,覆盖从工业到消费的全场景—— 例如,将智驾场景的多模态感知技术,迁移至工业机器人的视觉引导装配场景,实现 “降维打击” (550)。
3.1.2 核心产品与技术
•征程 6 系列:算力最高达 560 TOPS(INT8),采用自研 BPU 纳什架构,原生支持大参数量具身模型推理 —— 其端侧大模型推理延迟 < 20ms,能满足人形机器人的实时决策需求;征程 6P 是该系列的旗舰产品,算力达 560 TOPS,能效比达 37 TOPS/W,是当前国产机器人芯片中的顶尖水平 (550)。
•大小脑分层架构:征程 6 系列支持 “Holobrain(大脑,负责深度决策)+Holomotion(小脑,负责运动控制)” 的硬件级协同 —— 这一架构与人形机器人的生理结构高度匹配,能将决策与控制的协同效率提升 30%,进一步降低系统延迟 (550)。
3.1.3 市场表现与合作伙伴
2025 年,地平线营收达 23.84 亿元,累计出货超 1000 万套 —— 其中机器人芯片业务贡献占比超 30%,成为地平线的第二大收入来源 (550)。在智驾芯片市场,地平线的市占率达 47.66%;在机器人芯片市场,地平线的市占率超 30%,成为国产机器人芯片的领军者 (550)。
合作伙伴覆盖工业与人形机器人场景:诠视科技采用征程 6P,实现高精度空间感知 —— 其 DS80 传感器模组,能为工业机器人提供亚毫米级的空间定位;地瓜机器人子品牌提供机器人开发平台,支持 ROS2 系统,能为开发者提供开箱即用的开发工具 (663)。
3.2 华为昇腾(Ascend):国产化算力的核心支柱
3.2.1 战略定位
华为昇腾以“国产化算力底座” 为核心,推出昇腾 950 系列 —— 与 NVIDIA、高通的全球化布局不同,华为的优势在于 “国产化生态的协同能力”:昇腾芯片能与华为云、盘古大模型实现深度协同,为国内机器人厂商提供全栈式的算力支持,无需依赖海外生态 (719)。
华为的战略目标是:成为中国工业机器人芯片的核心供应商,覆盖从端侧到云侧的全链路算力—— 例如,为工业机器人厂商提供 “云侧大模型训练 + 端侧实时控制” 的全栈方案,解决海外算力卡脖子的问题 (719)。
3.2.2 核心产品与技术
•昇腾 950 系列:针对人形机器人端侧优化,采用 HiZQ 2.0 HBM 技术,内存带宽达 4TB/s—— 这一指标甚至超越了部分数据中心级 GPU,能满足具身大模型对高带宽内存的需求;支持 FP8/INT4 混合精度计算,算力达 300 TOPS(INT8),能效比达 25 TOPS/W (719)。
•昇腾 310P:能效比达 12 TOPS/W,较国际竞品高 30%,已在汽车焊接机器人中应用 —— 其运动控制延迟 < 10ms,能满足工业机器人的高精度控制需求 (747)。
3.2.3 市场表现与合作伙伴
2025 下半年,华为昇腾在国产 AI 芯片市场份额位居第一 —— 其中机器人芯片业务贡献占比超 20%,主要来自工业机器人的算力订单 (549)。在工业机器人边缘侧芯片市场,华为的市占率已达 18%,成为仅次于瑞萨、TI 的第三大供应商 (549)。
合作伙伴覆盖工业与人形机器人场景:与优必选达成全面合作,共建具身智能创新中心—— 优必选 Walker X1 人形机器人采用昇腾 950,实现多模态感知与运动控制的协同;华龙讯达采用昇腾 310P,实现工业机器人的高精度控制 —— 其华龙具身智能机器人,能在汽车焊接场景中实现 0.02mm 的定位精度 (599)。
3.3 黑芝麻智能(SmartSens):车规级技术的跨界挑战者
3.3.1 战略布局
黑芝麻智能以“汽车 + 机器人” 双轮驱动为核心,推出华山 A2000 芯片 —— 与其他机器人芯片厂商不同,黑芝麻的优势在于 “车规级的可靠性”:华山 A2000 原本是为高阶智驾设计的芯片,通过了 ASIL-D 功能安全认证,能满足工业机器人对可靠性的严苛要求 (534)。
黑芝麻的战略目标是:成为工业机器人与商用服务机器人的核心芯片供应商,覆盖从端侧到云侧的全链路算力—— 例如,将智驾场景的多模态感知技术,迁移至工业机器人的视觉引导装配场景,实现 “车规级可靠性 + 机器人级算力” 的组合 (534)。
3.3.2 核心产品与技术
•华山 A2000 芯片:7nm 工艺,算力达 560 TOPS,支持 Transformer 架构 —— 能满足具身大模型的推理需求;能效比达 20 TOPS/W,适配工业机器人的长续航需求 (534)。
•SesameX 多维具身智能计算平台:2025 年 11 月推出,是行业首个商业化专属部署的具身计算平台 —— 基于华山 A2000 芯片,支持 ROS2 系统,能为机器人厂商提供从芯片到算法的全栈方案,适配从低速物流车到高端人形机器人的全场景需求 (534)。
3.3.3 市场表现与合作伙伴
2025 年,黑芝麻智能营收区间为 7.36-12.70 亿元,同比增长 55.3%-167.9%—— 其中机器人芯片业务贡献占比超 20%,成为黑芝麻的核心增长板块之一 (570)。在机器人芯片市场,黑芝麻的市占率已达 8%,成为国产机器人芯片的重要玩家 (570)。
合作伙伴覆盖工业与人形机器人场景:星程智能采用华山 A2000,实现工业机器人的高精度控制 —— 其 AGV 机器人,能在仓库场景中实现 0.05m 的定位精度;深庭记采用华山 A2000,实现服务机器人的多模态交互 —— 其餐饮服务机器人,能识别 1000 + 种菜品,并完成精准配送 (571)。
3.4 海外新兴企业
3.4.1 Flex Logix
Flex Logix 聚焦 FPGA+eFPGA 异构架构,2025 年转型为 IP 授权模式 —— 与传统 FPGA 厂商不同,Flex Logix 的优势在于 “可重构加速能力”:其 EFLX eFPGA IP 支持 1K 到数百万 LUT4s,可集成 DSP 和 SRAM,为机器人视觉算法提供可重构加速能力,能根据不同场景的需求,动态调整硬件逻辑 (541)。
2025 年,Flex Logix 的 EFLX eFPGA IP 已获 TSMC IP Alliance Partner 认证,能为机器人芯片厂商提供定制化的 FPGA IP—— 例如,为某国产机器人芯片厂商提供视觉加速 IP,将其视觉处理效率提升 2 倍 (541)。
3.4.2 Recogni
Recogni 聚焦计算机视觉专用芯片,主打低功耗、高帧率 —— 其芯片专为机器人的视觉感知场景设计,能在低功耗的前提下,实现高帧率的视觉处理,适配服务机器人的多模态感知场景 (541)。
不过,Recogni 的芯片参数与客户案例均未公开,可能处于早期研发阶段,尚未实现大规模量产 (541)。
4. 生态系统参与者:IP 与架构厂商
4.1 ARM:物理 AI 的架构霸权
2026 年 1 月,ARM 新设 Physical AI 事业部,由前英伟达汽车高管 Drew Henry 执掌 —— 这一调整标志着 ARM 从 “通用算力架构供应商” 向 “物理 AI 架构领导者” 的战略转型,核心目标是将 ARM 架构打造为物理 AI 时代的 “默认架构” (613)。
ARM 的核心优势是 “低功耗生态的兼容性”:其 Cortex-M 系列 MCU 已占据全球机器人 MCU 市场的 70% 以上份额,而新推出的 Physical AI 架构,能将 AI 算力与低功耗控制能力实现深度协同,进一步巩固其在机器人架构市场的主导地位 (613)。
客户案例包括 Universal Robots、Deep Robotics、R2C2 等 —— 这些厂商均采用 ARM 架构的芯片,实现了低功耗与高性能的平衡;星宸科技 SSU9366 机器人芯片适配 ARM 架构,研发分布式算力芯片组(16T-128T),能为工业机器人提供可扩展的算力支持 (613)。
4.2 谷歌(Google):软件定义的具身智能
谷歌的布局逻辑呈现“软件定义 + 硬件协同” 的双轮驱动特征 —— 与其他厂商不同,谷歌的核心优势是 “大模型的具身化能力”:其 Gemini Robotics 系列模型,能将视觉、语言、动作实现深度融合,为机器人提供端到端的控制能力 (637)。
在软件层面,Gemini Robotics 系列模型已与波士顿动力 Atlas/Spot、Apptronik Apollo 合作 —— 例如,波士顿动力 Atlas 机器人采用 Gemini Robotics 模型,实现了双后空翻等高难度动作,其指令执行准确率提升至 74%,较传统算法提高 40%;Gemini Robotics On-Device 支持端侧本地部署,能在算力受限的机器人设备上本地运行,实现低延迟推理 (637)。
在硬件层面,谷歌与工业富联成立合资企业,研发工业柔性 AI 机器人 —— 该合资企业的目标是将 Gemini 模型与工业机器人的硬件实现深度协同,打造面向工业场景的柔性 AI 机器人解决方案 (637)。不过,谷歌 TPU 在机器人场景的直接应用较少,主要聚焦云侧大模型训练。
4.3 特斯拉(Tesla):自研芯片的垂直整合
特斯拉的布局逻辑呈现“垂直整合 + 场景驱动” 的特征 —— 与其他厂商不同,特斯拉的核心优势是 “汽车与机器人的技术复用能力”:其 Optimus Gen3 复用 FSD 同源 AI5 芯片,实现了自动驾驶与机器人技术的深度复用,大幅降低了研发成本 (632)。
•AI5 芯片:专为自动驾驶与机器人设计,算力达 2000-2500 TOPS—— 采用 7nm 制程,双芯片设计,总算力达 144 TOPS(INT8),具备强大的并行计算能力,可同时处理多模态感知数据与复杂的 AI 决策算法;集成了 12 核 ARM CPU、专用 GPU 与 NPU,其中 NPU 针对深度学习任务进行了专门优化,能够高效运行视觉识别、运动规划、自然语言处理等 AI 模型 (632)。
•市场表现:特斯拉 Optimus Gen3 的 AI5 芯片未向第三方开放,主要用于自身的人形机器人项目 —— 这一策略能确保特斯拉对核心技术的掌控,但也限制了其在机器人芯片市场的份额 (632)。
合作伙伴包括中科创达、三星显示—— 中科创达为其提供端云协同中间件,加速 Dojo 模型的车端部署;三星显示为其提供 OLED 显示屏,用于机器人面部信息展示、人机交互界面及状态反馈等场景 (629)。
4.4 RISC-V:开源架构的创新机遇
RISC-V 正从嵌入式领域向机器人场景快速挺进 —— 与 ARM、x86 的闭源架构不同,RISC-V 的优势是 “开源定制化能力”:机器人厂商可以根据自身场景的需求,定制化设计指令集,进一步提升芯片的能效与性能 (622)。
中科院 2025 年报告显示,2025 年共批准 4 项 RISC-V 指令集扩展规范,33 项规范在研 —— 这些扩展规范主要针对机器人的运动控制、多模态感知等场景设计,能进一步提升 RISC-V 架构在机器人场景的适配性 (622)。清微智能、时擎科技等中国企业已布局 RISC-V 机器人芯片 —— 例如,时擎科技基于 RISC-V 指令集架构研发的 TimesFormer 领域专用架构,AT1000 系列芯片支持智能人机交互和数据处理,已应用于家居、家电、工控等领域 (622)。
不过,RISC-V 在机器人场景的具体采用率数据尚未公开,可能处于早期渗透阶段 —— 但随着开源生态的不断完善,RISC-V 有望成为机器人芯片领域的重要架构之一 (622)。
5. 应用场景深度解析:芯片选型与技术适配
5.1 人形机器人:高算力与实时控制的极致平衡
人形机器人是对芯片要求最高的场景—— 其需要同时处理多模态感知、大模型推理与微秒级运动控制的需求,单芯片功耗需控制在 250W 以内才能满足基础续航要求,这对芯片的能效比提出了极致挑战 (28)。
主流芯片方案与参数对比
芯片型号 | 厂商 | 核心参数 | 适配场景 |
Jetson Thor | NVIDIA | FP4 算力 2070 TFLOPS,功耗 40-130W,能效比 3.5 倍前代 | 全尺寸人形机器人 |
昇腾 950 | 华为 | INT8 算力 300 TOPS,内存带宽 4TB/s,能效比 25 TOPS/W | 工业人形机器人 |
征程 6P | 地平线 | INT8 算力 560 TOPS,端侧大模型推理延迟 < 20ms,能效比 37 TOPS/W | 商用人形机器人 |
跃龙 IQ10 | 高通 | 稀疏算力 700 TOPS,能效比 2 TOPS/W,支持 20 路摄像头 | 全尺寸人形机器人 |
AI5 | 特斯拉 | INT8 算力 144 TOPS,双芯片设计,7nm 制程 | 自研人形机器人 |
上述参数来自 NVIDIA、华为、地平线、高通、特斯拉的官方技术白皮书及第三方实测数据 (163)。
选型逻辑
•高端市场:NVIDIA Jetson Thor 凭借其极致的算力与全栈生态,占据主导地位 —— 例如,优必选 Walker S2、银河通用 R1 等高端人形机器人,均采用 Jetson Thor 作为主芯片,能实现复杂的工业装配任务;
•国产化市场:华为昇腾 950 与地平线征程 6P 凭借其国产化生态与高能效比,成为核心选择 —— 例如,优必选 Walker X1 采用昇腾 950,实现了多模态感知与运动控制的协同;诠视科技采用征程 6P,实现了高精度空间感知;
•新兴市场:高通跃龙 IQ10 凭借其高能效比与全场景适配能力,成为新兴厂商的首选 —— 例如,宇树科技 G1Q 采用定制版跃龙 IQ-9075,实现了毫秒级的关节响应 (219)。
5.2 服务机器人:能效与成本的双重考量
服务机器人的核心需求是低功耗、低成本与基础 AI 功能 —— 其主要应用于物流配送、餐饮服务、家庭清洁等场景,对算力的要求相对较低,但对能效比与成本的要求较高 (655)。
主流芯片方案与参数对比
芯片型号 | 厂商 | 核心参数 | 适配场景 |
RB6 | 高通 | INT8 算力 70-200 TOPS,支持 5G+Wi-Fi6E,能效比 1.8 TOPS/W | 工业 AMR、商用服务机器人 |
RK3588 | 瑞芯微 | INT8 算力 6 TOPS,8nm 工艺,四核 A76 + 四核 A55 CPU | 商用服务机器人、人形机器人 |
旭日 X3 | 地平线 | INT8 算力 8 TOPS,功耗 2W,能效比 4 TOPS/W | 家用服务机器人 |
MR536 | 全志科技 | 支持融合感知与视觉避障,功耗 3W | 扫地机器人 |
上述参数来自高通、瑞芯微、地平线、全志科技的官方技术白皮书及第三方实测数据(289)。
选型逻辑
•工业 AMR 场景:高通 RB6 凭借其高能效比与多模态感知能力,成为首选 —— 例如,越南 VinMotion 的 AMR 机器人采用 RB6,实现了动态路径规划与多机器人协同;
•商用服务机器人场景:瑞芯微 RK3588 凭借其高性价比,成为主流选择 —— 例如,科沃斯部分型号的清洁机器人采用 RK3588,实现了视觉避障与路径规划;
•家用服务机器人场景:地平线旭日 X3 与全志 MR536 凭借其低功耗与高性价比,成为核心选择 —— 例如,小米部分型号的家用服务机器人采用旭日 X3,实现了语音交互与环境感知 (263)。
5.3 工业机器人:稳定性与实时性的核心诉求
工业机器人的核心需求是稳定性与实时性—— 其需要连续运行 10000 小时无故障,运动控制延迟需控制在微秒级,对芯片的可靠性与实时性要求极高 (445)。
主流芯片方案与参数对比
芯片型号 | 厂商 | 核心参数 | 适配场景 |
RA8T2 | 瑞萨 | 1GHz Cortex-M85 核心,集成 EtherCAT 从站控制器,支持多协议工业网络 | 工业机械臂、协作机器人 |
TMS320F28P65x | TI | 集成 C28x 核心 + CLA 协处理器,支持 36 路 PWM 输出,单芯片替代 “MCU+FPGA+ET1100” 方案 | 工业机械臂、人形机器人灵巧手 |
MLU370 | 寒武纪 | 运动控制延迟 8 微秒,3D-Cube 架构优化,能效比 10 TOPS/W | 工业机器人、协作机器人 |
Kria KR260 | AMD | 原生支持 ROS2 框架,提供开箱即用的开发能力,运动控制延迟 < 0.1ms | 工业机器人、协作机器人 |
上述参数来自瑞萨、TI、寒武纪、AMD 的官方技术白皮书及第三方实测数据 (453)。
选型逻辑
•高端工业机械臂场景:瑞萨 RA8T2 与德州仪器 TMS320F28P65x 凭借其高可靠性与实时性,成为首选 —— 例如,ABB GoFa 协作机器人采用 RA8T2,实现了 0.02mm 的末端定位精度;库卡 KR C5 micro-2 采用 TMS320F28P65x,实现了高负载控制;
•国产化工业机器人场景:寒武纪 MLU370 凭借其高可靠性与实时性,成为核心选择 —— 例如,某汽车焊接机器人采用 MLU370,实现了 8 微秒的运动控制延迟;
•协作机器人场景:AMD Kria KR260 凭借其原生支持 ROS2 框架与开箱即用的开发能力,成为首选 —— 例如,联想 “晨星” 协作机器人采用 Kria KR260,实现了 0.1ms 级的关节响应 (477)。
6. 市场竞争格局与趋势展望
6.1 市场规模与份额预测
2025 年,全球机器人 AI 芯片市场规模已达 95 亿美元,其中具身机器人芯片占比超 30%—— 这一占比在 2023 年仅为 12%,两年间实现了超两倍的增长 (722)。中国信通院预测,2028 年全球人形机器人芯片市场规模将达 4800 万美元,而工业机器人芯片市场规模将突破 150 亿美元,成为驱动行业增长的核心引擎 (722)。
从市场份额来看,NVIDIA 凭借其全栈生态,占据全球机器人 SoC 市场的 69% 份额 —— 其中在人形机器人高端算力芯片市场,NVIDIA 的占比超 80%,几乎垄断了全球顶级人形机器人项目的算力供应 (183)。中国厂商在工业机器人边缘侧芯片市场的市占率已达 35%,形成了从边缘侧到高端算力的全链条布局 —— 其中地平线、华为昇腾、寒武纪等厂商,已在工业机器人场景实现批量应用 (706)。
6.2 核心趋势分析
1. 专用化与 ASIC 崛起:从通用算力到场景定制
Counterpoint 预测,到 2027 年,AI ASIC 芯片的出货量将达到 2024 年的三倍,2028 年有望以 1500 余万颗的规模反超 GPU—— 这一趋势的核心驱动因素是,具身机器人场景对算力的需求日益场景化,通用 GPU 的算力冗余与功耗问题已无法满足需求 (752)。
高盛 2026 年研报指出,2027 年 ASIC 芯片在 AI 服务器领域的渗透率将追平 GPU 至 50%—— 这一趋势将直接传导至机器人芯片领域:专用化 ASIC 芯片将成为未来的核心方向,例如地平线征程 6P 采用 ASIC 架构,能效比达 37 TOPS/W,是通用 GPU 的 3 倍以上 (756)。
2. 异构计算普及:从单一算力到多单元协同
机器人领域 43% 的设计采用异构计算架构 —— 通过 CPU、GPU、NPU、FPGA 等多计算单元的协同,实现感知 - 决策 - 控制的全链路协同,能将系统能效比提升 2 倍以上 (723)。
例如,NVIDIA Jetson Thor 采用 GPU+CPU+NPU 的异构架构,实现多模态感知与运动控制的协同;华为昇腾 950 采用 CPU+NPU+FPGA 的异构架构,实现云侧大模型训练与端侧实时控制的协同 —— 这些架构的核心逻辑是,将不同的任务分配给最适合的计算单元,最大化提升能效比 (163)。
3. 能效比优先:从绝对算力到能效平衡
NVIDIA Jetson Thor 的能效比是前代 Orin 的 3.5 倍;华为昇腾 310P 的能效比达 12 TOPS/W,较国际竞品高 30%;地平线征程 6P 的能效比达 37 TOPS/W,是当前国产机器人芯片中的顶尖水平 —— 这些数据表明,能效比已成为当前芯片竞争的核心指标 (696)。
特斯拉 Optimus Gen-3 推迟量产的事件,更是凸显了这一趋势的重要性:没有合理的功耗控制,再强的算力都无法落地 —— 这一事件已成为全行业的 “能效警钟” (28)。
4. 中国企业崛起:从边缘配套到核心供应
中国厂商在工业机器人边缘侧芯片市场的市占率已达 35%—— 其中地平线征程 6 在国内机器人芯片市场的市占率超 30%,成为国产机器人芯片的领军者;华为昇腾在国产 AI 芯片市场的份额位居第一,已在工业机器人场景实现批量应用 (706)。
IDC 2026 年报告显示,2025 年全球人形机器人出货量激增 508%,其中智元机器人以 5168 台的出货量位居全球第一,占 39% 的市场份额 —— 这一数据表明,中国机器人厂商的崛起,将直接带动国产芯片的渗透 (683)。
5. 生态系统协同:从单打独斗到标准统一
工信部 2025 年 12 月成立人形机器人与具身智能标准化技术委员会,负责制定基础共性、关键技术、部组件、整机与系统、应用、安全等领域的行业标准 —— 这一举措将解决当前行业 “接口不统一、二次开发成本高” 的痛点 (606)。
亚太具身智能产业联盟 2026 年 1 月启动核心技术标准的研制与推广,首批将重点推进工业机器人通用底盘接口、服务机器人交互协议等急需标准的落地 —— 这些标准的落地,将大幅降低机器人厂商的开发成本,加速行业的规模化落地 (729)。
6.3 未来展望
2026-2028 年,具身机器人芯片行业将迎来关键的规模化落地期 —— 核心特征包括:ASIC 芯片的出货量反超 GPU,异构计算架构的渗透率超 60%,中国厂商在全球机器人芯片市场的份额提升至 40%,行业标准体系逐步完善 (752)。
对于厂商而言,成功的关键在于:能否平衡算力与功耗的关系,能否构建全栈式的生态系统,能否适配本土化的场景需求—— 例如,NVIDIA 的全栈生态、华为的国产化生态、地平线的车规级迁移能力,都将成为未来竞争的核心优势。
7. 结论
本报告系统梳理了全球具身机器人芯片行业的技术演进、市场格局与未来趋势。2025 年,行业已完成从实验室原型到工业化早期的关键跨越,核心特征包括:异构计算架构成为主流,能效比取代绝对算力成为核心竞争指标,中国厂商在工业与服务机器人芯片领域市占率已达 35%,形成了从边缘侧到高端算力的全链条布局。
全球范围内,NVIDIA 凭借其全栈生态占据高性能机器人芯片市场的主导地位;高通以其高能效异构架构切入服务机器人与中低端工业市场;中国厂商则依托本土化场景优势,在工业机器人领域实现关键突破 —— 华为昇腾、地平线等厂商,已成为国产机器人芯片的核心支柱。
未来,随着 ASIC 芯片的崛起、异构计算的普及、能效比的提升、中国厂商的崛起与行业标准的统一,具身机器人芯片行业将迎来关键的规模化落地期 ——2028 年,全球工业机器人芯片市场规模将突破 150 亿美元,成为驱动全球半导体行业增长的核心引擎。
对于行业参与者而言,需重点关注能效比优化、异构计算架构、本土化场景适配与生态系统构建—— 只有那些能平衡算力与功耗、适配场景需求、构建全栈生态的厂商,才能在未来的竞争中占据主导地位。


