1. 执行摘要
在机器人技术与人工智能(AI)加速融合的历史性节点,Field AI(以下简称“Field AI”或“公司”)作为一股独特的革新力量崛起,正在从根本上挑战并重塑工业自动化的既有范式。与当前市场上主流的仅仅依赖大数据驱动、试图将大语言模型(LLM)的语义逻辑强行嫁接到物理控制上的“端到端”策略不同,Field AI 坚定地确立了 “物理优先”(Physics-First) 的具身智能(Embodied AI)技术路线。这家成立于2023年的独角兽企业,由来自美国国家航空航天局喷气推进实验室(NASA JPL)、国防部高级研究计划局(DARPA)、Google DeepMind 以及卡内基梅隆大学(CMU)的顶尖科学家与工程师联合创立。他们将其在火星探测、地下作战以及极端环境导航中积累的数十年的技术底蕴,转化为了一套通用的、跨平台的机器人“大脑”——Field Foundation Models (FFMs)。
截至2026年初,Field AI 已成功完成超过 4.05亿美元 的融资,投后估值达到 20亿美元。这一令人瞩目的资本成就,得益于由 Bezos Expeditions(杰夫·贝佐斯的投资公司)、NVentures(NVIDIA)、Intel Capital、Khosla Ventures、Temasek(淡马锡)以及 Gates Frontier(比尔·盖茨)组成的顶级投资财团的强力背书。这不仅证明了资本市场对“物理优先”技术路线的高度认可,也为公司在与 OpenAI 支持的 Figure AI 或 Skild AI 等竞争对手的角逐中提供了充足的弹药。
Field AI 的核心价值主张在于解决工业机器人规模化部署中的“最后一公里”难题:即传统自动化设备无法在没有预先地图、没有GPS信号、且充满动态不确定性的非结构化环境中可靠运行。通过开发一种与硬件解耦的通用自主系统,Field AI 成功地让波士顿动力(Boston Dynamics)的 Spot 机器狗以及各类轮式和飞行平台具备了 Level 4 级别的自主作业能力。其在建筑巨头 DPR Construction 的实际部署案例中,实现了单次任务自主扫描数十万平方英尺、采集数万张工程照片的壮举,标志着具身智能从实验室演示迈向了真正的商业落地。
本报告将以详尽的篇幅,深入剖析 Field AI 的企业基因、技术架构的底层逻辑、商业模式的演进路径、以及其在建筑、能源、国防等关键垂直领域的战略布局,旨在为行业观察者、技术决策者及投资者提供一份关于下一代工业自主系统的权威参考。
2. 起源与基因:来自星际探索的“非标准偏差者”
Field AI 的诞生并非典型的硅谷 SaaS 创业故事,而是一场从星际探索到地球工业的技术降维打击。公司的技术内核深深植根于人类对极端环境的探索欲望——从火星的熔岩管到地球深处的矿井。这支被内部戏称为“非标准偏差者”(The Non-Standard Deviators)的核心团队,代表了全球机器人领域最硬核的技术流派。
2.1 创始团队:NASA JPL 与 DARPA 的技术遗产
Field AI 虽然成立于2023年,但其技术积累可以追溯到十年前 NASA 和 DARPA 的一系列宏大计划。这些计划的目标只有一个:让机器人在没有任何人类干预的情况下,在未知的、通讯拒止的极端环境中生存并完成任务。
阿里·阿加博士 (Dr. Ali Agha),创始人兼首席执行官 (CEO)
背景深究: 在创立 Field AI 之前,Agha 博士在 NASA JPL 度过了七年时光,担任人工智能与自主系统首席研究员。他是全球机器人自主性领域的领军人物。
核心贡献: 他最著名的成就是领导 Team CoSTAR(一个由 JPL、MIT、Caltech、KAIST 等机构组成的联合战队)参加 DARPA 地下挑战赛(SubT Challenge)。这是一项为期三年的全球顶级机器人赛事,旨在寻求在地下隧道、城市地铁和天然洞穴中快速测绘、导航和搜索的解决方案。
技术遗产: 在 SubT 挑战赛中,Agha 博士领导开发的 NeBula (Networked Belief-aware Perceptual Autonomy) 架构,确立了“基于信念状态”(Belief-aware)的规划理论。这一理论核心在于让机器人不仅感知环境,还能感知自身的“不确定性”,从而在风险与收益之间做出最优决策。这种在极端压力下打磨出的算法,直接构成了 Field AI 现有产品的理论基石。此外,他还领导了 DARPA RACER 项目,专注于越野环境下的高速自动驾驶,进一步强化了系统对动态地形的适应能力。
沙耶甘·奥米沙菲博士 (Dr. Shayegan Omidshafiei),AI 与科学负责人
背景深究: Omidshafiei 博士带来了来自 Google DeepMind 和 Google Brain 的纯正 AI 基因。作为前高级研究科学家,他在深度强化学习(Deep RL)、多智能体系统(Multi-agent Systems)以及博弈论领域拥有深厚的学术造诣。
核心贡献: 在 Field AI,他的角色是将 DeepMind 式的前沿 AI 研究(如 AlphaGo, AlphaStar 背后的决策逻辑)与物理世界的刚性约束相结合。他的研究重点在于如何让大规模 AI 模型在保持泛化能力的同时,适应机器人硬件的实时控制需求,避免出现大模型常见的“幻觉”现象。他与 Agha 博士在 MIT 时期就有过深入的合作,这种长期的默契为技术路线的统一奠定了基础。
大卫·范博士 (Dr. David Fan),创新与技术负责人
背景深究: 同样来自 NASA JPL,范博士曾担任 DARPA RACER 项目的首席工程师和 DARPA SubT 项目的首席技术专家。
核心贡献: 范博士是“混合智能”的坚定践行者。他擅长将传统的控制理论(Classical Control Theory)与现代机器学习(Machine Learning)相结合。在 RACER 项目中,面对高速越野战车在复杂地形中的极限制控问题,他开发了一套能够处理车辆动力学非线性的算法。在 Field AI,他负责确保那些基于学习的算法最终能转化为安全、可靠的控制指令,防止机器人出现物理层面的失控。
塞巴斯蒂安·舍雷尔教授 (Sebastian Scherer),外场具身智能总监
背景深究: 作为卡内基梅隆大学(CMU)机器人研究所的副研究教授,舍雷尔是机器人野外导航领域的泰斗级人物。
核心贡献: 他的研究涵盖了自主着陆、避障和大规模环境测绘。他在 CMU 的工作重点是让无人机和地面机器人在未知环境中以极高速度运行。他的加入,为 Field AI 注入了学术界最前沿的 SLAM (Simultaneous Localization and Mapping) 和路径规划算法,特别是针对那些无法使用 GPS 的场景。
埃里克·克罗特科夫博士 (Dr. Eric Krotkov),联邦部门战略负责人
背景深究: 克罗特科夫博士在机器人界享有崇高地位,被称为 PackBot 和 Talon 机器人的“祖师爷”。这两种机器人在伊拉克和阿富汗战场上拯救了无数士兵的生命,是军用机器人的代名词。他曾任 丰田研究所 (TRI) 的首席科学官和 DARPA 的项目经理。
核心贡献: 他的存在直接打通了 Field AI 与美国国防部及联邦政府的战略通道。作为 DARPA 机器人挑战赛(DRC)的首席裁判,他对机器人系统的极限能力有着深刻的理解。
邓肯·麦金泰尔 (Duncan McIntyre),首席财务官 (CFO)
背景深究: 麦金泰尔不仅拥有机器人工程背景,还曾在麦格理银行(Macquarie Bank)和 Delivery Hero 担任高管。在 Delivery Hero,他助力公司营收从1亿美元增长至75亿美元。
核心贡献: 这种技术与资本的双重背景,对于一家处于极速扩张期的硬科技公司至关重要。他主导了 Field AI 复杂的融资架构,并负责构建“机器人即服务”(RaaS)的商业模型。
2.2 使命演进:从“AI for Humanity”到“Field AI”
公司早期曾使用 "AI for Humanity" 这一名称,反映了其技术在搜救、灾难响应等领域的初心。然而,随着技术的成熟和商业化路径的清晰,更名为 Field AI 标志着其战略重心的转移——专注于“Field”(野外/现场/实地)这一概念。
这不仅仅是名称的变更,更是对行业痛点的精准回应。在工厂内部,环境是结构化的、可控的,传统自动化(如机械臂)已经做得很好。但在工厂围墙之外——在建筑工地、海上钻井平台、地下矿井、森林火场——现有的机器人技术几乎是一片空白。Field AI 的使命就是填补这一巨大的 “部署鸿沟”(Deployment Gap),让机器人走出实验室的温室,进入真实世界的泥泞。
3. 技术哲学:物理优先与风险感知
在当前的 AI 浪潮中,主流声音倾向于认为“数据就是一切”,即只要有足够多的视频和文本数据,大语言模型(LLM)或视觉-语言-动作模型(VLA)就能涌现出理解物理世界的能力。Field AI 对此持审慎甚至批判的态度,并提出了截然不同的技术哲学。
3.1 对抗“端到端”幻觉:为什么 LLM 不懂物理?
Field AI 首席执行官 Ali Agha 多次强调,公司采用的是 “物理优先”(Physics-First) 的方法,而不是试图将为语言生成而设计的 Transformer 模型强行套用到机器人控制上。
数据的本质差异: 互联网文本数据包含了人类的知识,但并不包含物理定律。一个 LLM 可以写出关于牛顿第二定律的完美论文,但无法感知在结冰路面上打滑时的微妙摩擦力变化。纯粹的数据驱动方法(Data-Driven)在面对从未见过的物理交互时,往往会产生“幻觉”——例如,模型可能会自信地指令机器人穿过一堵画着隧道的墙,或者在承重不足的木板上跳跃。
事后修正 vs. 原生设计: 许多竞争对手(如 Physical Intelligence, Skild AI)试图先用大模型生成动作,然后再用安全层去修正错误。Field AI 认为这是一种“事后诸葛亮”的修补。相反,FFM 从底层架构上就是基于物理约束构建的。它不预测下一个“Token”(词元),而是预测下一个“State”(物理状态)。
3.2 风险感知(Risk-Awareness)作为核心变量
源于 NASA 和 DARPA 的经验,Field AI 深知在火星或战场上没有“重试”的机会。因此,风险感知 被直接编码进了智能体的决策循环中。
概率性规划: Field AI 的机器人不会简单地执行“从 A 移动到 B”的指令。它会计算:“这条路径有 5% 的概率导致打滑,有 1% 的概率导致跌落。另一条路径虽然远 10 米,但风险接近于零。” 系统会基于这些概率分布,在效率和生存之间寻找帕累托最优解。
不确定性量化: 当传感器数据模糊(如浓烟、强光干扰)时,系统会主动识别这种“认知不确定性”(Epistemic Uncertainty),并采取保守策略(如减速、利用触觉探路),而不是盲目自信地前行。
4. 技术架构深解:Field Foundation Models (FFMs)
Field AI 的技术护城河主要体现在其全栈式的软件架构——Field Foundation Models (FFMs)。这是一个分层的、模块化的智能系统,旨在实现真正的 L4 级自主性。
4.1 动力学基础模型 (Dynamics Foundation Model)
这是 FFM 堆栈中最底层的部分,负责处理机器人与环境的物理交互。
功能: 它不仅包含机器人的运动学模型(Kinematics),还深入到动力学层面(Dynamics)。它能实时解算地面反作用力、关节力矩以及机身惯性。
自适应能力: 当机器人的负载发生变化(例如背负了更重的传感器),或者地面摩擦系数突变(从水泥地走到草地),该模型能毫秒级地调整控制参数。这种能力被称为“在线系统辨识”(Online System Identification),是保证机器人不摔倒的关键。
技术指标: 所有的动力学解算都在边缘端进行,延迟控制在 100毫秒 以内,确保了类似生物脊髓反射的响应速度。
4.2 多智能体基础模型 (Multi-Agent Foundation Model)
针对工业场景往往需要多台机器人协同作业的需求,Field AI 开发了去中心化的多智能体协作框架。
分布式信念状态: 受 NeBula 架构启发,每台机器人不仅维护自己的地图,还维护一个全队的“信念地图”。当通信受限时,机器人会基于局部信息行动;一旦通信恢复,数据会自动融合。
任务拍卖与分配: 系统可以动态地将一个宏大的任务(如“扫描整个工地”)分解为子任务,并根据每台机器人的位置、电量和负载能力进行实时分配。
4.3 语义导航与感知层 (Semantic Navigation & Perception)
虽然强调物理优先,Field AI 同样利用了现代深度学习在感知层面的优势,但将其严格限制在感知和高层推理上。
无地图导航 (Mapless Navigation): 传统 AGV 需要预先建立高精地图。Field AI 的机器人进入陌生环境时,依靠实时 SLAM(即时定位与建图)算法,边走边建图,完全摆脱了对预设基础设施依赖。
语义理解: 结合视觉 Transformer,机器人能识别“门”、“楼梯”、“灭火器”等语义对象。这使得操作员可以用自然语言下达指令(如“去检查那台红色的发电机”),系统将其转化为具体的坐标点导航任务。
4.4 硬件载体:传感器计算载荷 (Sensor-Compute Payload)
为了实现“硬件无关性”,Field AI 将其软件封装在一个物理载荷中。
硬件规格: 该载荷通常集成了高线束 LiDAR(用于几何感知)、广角/深度相机(用于视觉语义)、IMU(惯性测量单元)以及高性能边缘计算模块(如 NVIDIA Jetson Orin 系列)。
即插即用: 这个载荷可以像背包一样安装在波士顿动力的 Spot 或其他商用机器人平台上,通过标准接口(如 ROS2)接管机器人的底层控制权。
5. 商业模式与硬件生态:打造机器人的“Windows”
Field AI 明确表示不造机器人本体,而是致力于成为机器人领域的微软或安卓——提供通用的操作系统和大脑。
5.1 硬件无关性策略 (Hardware Agnosticism)
这一策略基于一个核心判断:机器人本体正在迅速商品化。随着全球机器人硬件供应链的成熟,高性能机器人平台的可获得性大幅提升。Field AI 选择避开硬件制造这一高投入环节,专注于高附加值的软件层。
表 1:Field AI 支持的主要硬件平台对比
平台名称 | 制造商 | 类型 | 优势 | Field AI 赋能场景 |
Spot | Boston Dynamics | 四足 | 极其稳定,生态成熟,工业级可靠性 | 高端工业巡检、核电站、联邦政府项目 |
Digit | Agility Robotics | 双足人形 | 适合人类工作空间,具有物流搬运能力 | 未来仓储物流、复杂地形物资搬运 |
Jackal | Clearpath | 轮式 | 结构简单,续航长,适合平坦地形 | 城市园区巡逻、平坦路面数据采集 |
Racer | (DARPA原型) | 越野车 | 高速,重载,越野能力极强 | 军事侦察、边境巡逻、野外救援 |
5.2 商业模式:RaaS 与 软件授权
Field AI 的收入模式灵活,旨在适应不同客户的资本结构。
机器人即服务 (RaaS): 针对建筑公司等倾向于轻资产运营的客户。客户按月或按项目支付服务费,Field AI 提供全套硬件(机器人+载荷)、软件及数据平台。这种模式降低了客户的试错成本。
软件许可与订阅: 针对拥有自己机器人车队的客户(如大型石油公司或军方)。客户购买 Field AI 的“大脑”许可证,并按年度支付软件维护费。
数据增值服务: 机器人采集的数据(如 3D 点云、热成像图)经过 Field AI 云端处理后,生成高价值的分析报告(如“施工进度偏差分析”),这也是潜在的收入增长点。
6. 资本版图与估值分析:20亿美元的独角兽
Field AI 在2025年8月完成的融资震惊了业界,不仅因为金额巨大,更因为投资方阵容的战略深意。
6.1 融资详情
轮次: A轮 / 多阶段合并融资 (Series A / Combined Rounds)
金额: 总计超过 4.05亿美元
估值: 投后估值约 20亿美元
6.2 投资方战略解读
这份投资人名单揭示了 Field AI 在整个科技生态系统中的位置:
Bezos Expeditions (Jeff Bezos): 亚马逊创始人对物流和自动化的终极关注。这暗示了 Field AI 的技术未来可能应用于亚马逊庞大的物流网络。
NVentures (NVIDIA): 作为 AI 算力的垄断者,NVIDIA 投资 Field AI 是为了确保其芯片(Jetson, Isaac Sim)成为具身智能的标准基础设施。Field AI 是 NVIDIA 生态在物理世界的延伸。
Intel Capital: 老牌芯片巨头不愿在边缘计算领域缺席,投资 Field AI 是其在工业 4.0 领域的布局。
Khosla Ventures: 作为 OpenAI 的早期投资者,Vinod Khosla 极其敏锐。他对 Field AI 的重注表明,他认为 Field AI 是“物理世界的 OpenAI”。
Temasek (淡马锡): 新加坡主权基金的加入,为 Field AI 打开了亚洲市场的大门。
Gates Frontier (Bill Gates) & Samsung: 进一步强化了其全球化和消费电子/半导体制造场景的潜力。
7. 深度案例研究:DPR Construction 与建筑业的数字化革命
Field AI 与 DPR Construction 的合作不仅是一个商业合同,更是建筑行业数字化转型的一个里程碑事件。
7.1 痛点分析:建筑业的黑箱
建筑行业是全球数字化程度最低的行业之一。
信息滞后: 传统的进度追踪依赖项目经理每天步行数小时,拍摄照片,然后手动上传。这种方式不仅耗时,而且数据是非结构化的,很难与 BIM 模型比对。
返工成本: 由于未能及时发现施工与设计的偏差,导致昂贵的返工。
7.2 解决方案与执行
Field AI 部署了搭载其“大脑”的四足机器人,在 DPR 的加州圣克拉拉(Santa Clara)工地进行夜间自主巡检。
自主性验证: 机器人需要在杂乱的建筑工地上行走,跨越散落的电缆、建材和未铺设的地面。
数据采集规模:
行走里程: 超过 100英里 (约160公里)。
照片数量: 拍摄了超过 45,000张 高清工程照片。
扫描面积: 覆盖了 500,000平方英尺 的室内面积和 125,000平方英尺 的屋顶面积。
8. 竞争格局深度对标
Field AI 处于一个极度拥挤且竞争激烈的赛道。我们需要将其与两类主要对手进行对比:一类是主打通用大模型的 AI 公司,另一类是传统的工业机器人公司。
表 2:Field AI 与主要竞争对手的深度对标
维度 | Field AI | Skild AI / Physical Intelligence | Boston Dynamics (作为软件商) | Tesla (Optimus) |
核心哲学 | 物理优先 (Physics-First) 风险感知 | 数据优先 (Data-First) 端到端大模型 | 控制优先 (Control-First) 经典控制 | 视觉优先 (Vision-First) 模仿学习 |
主要场景 | 非结构化野外 (建筑、矿山、战场) | 半结构化室内 (家庭、桌面操作) | 特定工业场景 (巡检、仓储) | 工厂制造 (汽车流水线) |
优势 | 鲁棒性极强,不论地形多么恶劣都能走 | 泛化能力强,可能学会从未见过的技能 | 运动能力天花板,硬件质量极高 | 成本控制能力,制造规模 |
劣势 | 目前侧重移动,操作能力在研发中 | 可靠性存疑,存在“幻觉”风险 | 软件生态相对封闭 | 专注于自身工厂 |
8.1 与 Skild AI 的路线之争
Skild AI 旨在构建一个“通用的机器人大脑”。他们的路径是收集海量的机器人数据,训练一个巨大的 VLA 模型,希望涌现出通用智能。
Field AI 对此的反驳是:物理世界的长尾效应是无限的。Field AI 认为,必须将物理定律作为先验知识(Prior Knowledge)嵌入模型,而不是让模型去重新学习万有引力。这种“混合架构”(Hybrid Architecture)在工业应用中被认为更安全、更可解释。
9. 展望未来:FAIRI 研究院与终极愿景
Field AI 不满足于仅做移动机器人。公司的未来愿景由 FAIRI (Field AI Research Institute) 承载。
9.1 从移动到操作 (Locomotion to Manipulation)
目前的 FFM 主要解决的是“走到哪里”(Locomotion)的问题。FAIRI 的下一步是解决“做什么”(Manipulation)的问题。这包括:
移动操作 (Mobile Manipulation): 让四足机器人背上机械臂,去拧阀门、开门。
语言-动作落地 (Language-Action Grounding): 如何让机器人理解复杂的自然语言指令,并将其分解为符合物理约束的动作序列。
9.2 结论
Field AI 代表了机器人技术的一个成熟转折点。它标志着行业正在从“演示软件”时代迈向“工业部署”时代。通过将 NASA JPL 的严谨工程纪律与硅谷的资本扩张能力相结合,Field AI 正在构建物理世界的操作系统。其“物理优先”的方法,虽然在媒体声量上可能不如“端到端大模型”性感,但在泥泞、黑暗、复杂的真实世界中,这可能是通往通用具身智能的唯一可行之路。
(报告结束)


