推广 热搜: 采购方式  甲带  滤芯  气动隔膜泵  减速机  减速机型号  履带  带式称重给煤机  无级变速机  链式给煤机 

世界模型教父教母创业,公司估值加起来近百亿美元

   日期:2026-01-26 23:50:47     来源:网络整理    作者:本站编辑    评论:0    
世界模型教父教母创业,公司估值加起来近百亿美元

AI 时代,独角兽已经不稀奇了,但世界模型这块还是有所空缺的。

从估值的变化上来看,李飞飞的World Labs,最有可能成为全球首个世界模型独角兽公司。

根据报道,World Labs的估值已经突破了50亿美元,并且拟融资5亿美元。

而2024年9月的时候,这家公司才以10亿美元估值完成2.3亿美元融资,正式在公众面前亮相。

从结果上来看,从登场到50亿美元估值,李飞飞仅用了16个月的时间。

这个速度有多快?

OpenAI从2015年成立,到 2019年微软首次投资,此时他们的估值也只有10亿美元。

最接近World Labs速度的可能是Anthropic,但也花了25个月。

如果说李飞飞是世界模型教母,那么杨立昆可以说是世界模型教父。

2025年12月,杨立昆在LinkedIn上确认离开Meta,结束了他在这家公司长达12年的职业生涯。

杨立昆创立的新公司名为Advanced Machine Intelligence Labs,总部设在巴黎。AMI Labs正在寻求以30至35亿欧元估值融资5亿欧元。

不过,这两家企业高估值背后,并非对世界模型这一技术的吹捧,而是实打实的技术落地和商业化。

01

何为World Labs?

World Labs的投资方阵容包括Andreessen Horowitz、NEA、Radical Ventures(李飞飞本人是Radical Ventures的科学合伙人)、英伟达风投部门、沙特Sanabil Investments和新加坡淡马锡。

天使投资人包括谷歌DeepMind首席科学家杰夫·迪恩(Jeff Dean),以及图灵奖得主杰弗里·辛顿(Geoffrey Hinton)。

World Labs的核心技术理念叫做空间智能,这是一种“升维”的概念。

目前的顶尖AI虽然看起来很聪明,但它们本质上是“二维”的。它们只是处理文字序列或者像素排列,它们并不理解体积、有重量、受重力影响的实体。

World Labs的空间智能技术,就是要赋予AI“对三维世界的认知能力”。

以生成视频为例,空间智能是直接生成一个具有三维结构、且符合物理规律的虚拟环境,然后再在这个环境里去模拟要生成的实体。实体不仅有长宽高,还有材质和物理反馈。

在传统的AI训练中,模型学习的是像素之间的概率关联,比如蓝天下面通常是绿地,绿地旁边通常是小溪。

但World Labs的世界模型则是基于三维几何与物理模拟的原理进行训练的。

它在学习数据的过程中,得到的不仅仅是图像的纹理,还有图像背后的空间几何信息(比如深度、遮挡关系、透视角度)以及物理动力学规则(比如刚体如何碰撞、流体如何流动、光线如何反射)。

2025年11月,World Labs推出首款商业产品Marble,这是一个能够从文本、图像、视频或粗略3D布局生成持久化3D世界的模型。

Marble的技术底层采用神经辐射场(NeRF)和高斯点云(3D Gaussian Splatting)技术,而非传统的多边形网格。

神经辐射场是一种利用神经网络表示三维场景的技术,它将场景表示为连续的体积函数,输入三维空间坐标和观察方向,输出该点的颜色和体积密度。这种方法通过多层感知机学习场景的几何和光照信息,然后通过体积渲染生成逼真的新视角图像。

相当于在相同场景内,从每一个角度对实体进行拍摄,这样生成实体以后,用户从哪个角度看都符合物理规律。

高斯点云则是另一种三维表示方法,它用数百万个带有位置、大小、形状、颜色和透明度属性的高斯椭球体来表示场景,渲染速度比神经辐射场快得多,同时保持了高质量的视觉效果。

类似于乐高,通过小积木块最终搭建成完整的实体。

这使其能够生成连续的辐射场,包含空间理解、光照和深度信息的完整环境,而不是简单地组装多边形。

在2026年CES大会上,李飞飞在AMD CEO苏姿丰的主题演讲中展示了Marble的能力。

李飞飞说:“将少数图片变成连贯、实时的世界,不再是对遥远未来的一瞥,而是下一章的开始。AI 正在给人们的生活带来一些改变,将少数图片或照片转化为一个实时可探索的世界。空间智能需要极致算力支持,才能实现可交互级帧率和无限持久的世界交互。”

World Labs采用免费增值模式,免费版提供4次生成,20 美元每月可获得更多生成次数,最高95美元每月提供75次生成和商业使用权。

目标客户包括游戏开发者、影视特效制作、虚拟现实应用。而且Marble还支持苹果Vision Pro和Quest 3 VR头显,每个生成的世界都可以在VR中查看。

更重要的是,Marble可以导出与Unreal Engine和Unity兼容的格式,这意味着它可以无缝集成到现有的游戏开发流程中。

李飞飞曾在访谈中表示,这项技术可能颠覆Unity和Epic Games的Unreal Engine等传统游戏引擎。

除了AIGC产业,World Labs还瞄准机器人训练市场,通过模拟环境训练机器人的自主导航软件。世界模型可以为机器人提供一个安全的虚拟训练场,让它们在数字空间中学习物理交互、因果关系和长期规划,然后再应用到真实世界。

02

AMI Labs的技术优势是什么?

但AMI Labs不像李飞飞的World Labs那样拥有实际的产品,目前还只停留在技术概念阶段。

潜在投资方包括Cathay Innovation、Greycroft、Hiro Capital(杨立昆是Hiro Capital的顾问)、20VC、法国公共投资银行Bpifrance、Daphni和HV Capital。

要注意,杨立昆在AMI Labs里担任的是执行主席而非CEO。

该公司CEO职位由亚历克斯·勒布朗(Alex LeBrun)担任,他是医疗AI初创公司Nabla的联合创始人兼前CEO。LeBrun的前一家公司Wit.ai被Meta收购后,他曾在FAIR直接向杨立昆汇报。

团队还包括Meta欧洲副总裁劳伦特·索利(Laurent Solly),他于2025年12月离职加入AMI。

不仅如此,AMI Labs有法国总统亲自背书。法国总统马克龙对杨立昆选择巴黎表示自豪,承诺将尽一切努力确保他从法国取得成功。

AMI Labs的核心技术是杨立昆多年倡导的联合嵌入预测架构(JEPA,Joint Embedding Predictive Architecture)。

以往的AI,都是逐token生成输出的,然而联合嵌入预测架构能一口气直接以抽象表示的形式来创建世界,能够更好地预测未来状态。

联合嵌入预测架构的工作原理是,它不预测原始像素或token,而是预测高层次的嵌入表示。

系统有两个编码器,一个处理上下文信息,另一个处理目标信息,还有一个预测器在嵌入空间中进行预测。这种方法避免了生成模型的一个关键问题,生成模型必须预测每一个像素或token,包括那些不可预测的随机细节,而联合嵌入预测架构只关注可预测的高层次特征,忽略无关紧要的细节。

杨立昆在哈佛演讲中解释,这类系统通过在嵌入空间中进行优化来实现规划和推理。

AMI Labs公司将推进AI研究并开发可靠性、可控性和安全性真正重要的应用,特别是工业过程控制、自动化、可穿戴设备、机器人、医疗保健等领域。

AMI Labs的第一个应用将是医疗保健。

具体来讲,AMI Labs通过与Nabla合作,开发临床护理AI助手。截止发稿,这个AI助手已获得了1.2亿美元融资,预计两年内达到1亿美元年度订阅收入。

作为交易的一部分,Nabla获得AMI世界模型的特权访问权,而亚历克斯从CEO转为首席AI科学家兼董事长。

亚历克斯表示,他加入AMI的一个重要原因是将世界模型应用于医疗保健的前景,因为医疗保健的复杂性和高风险性使其成为测试世界模型的理想场景。

FDA认证要求确定性、可解释的推理,这正是LLM无法提供而世界模型承诺实现的。大语言模型存在幻觉问题,在医疗场景中可能导致严重后果,而世界模型通过建立对患者生理状态的内部模拟,可以预测疾病进展,提供更可靠的决策支持。

2026年1月,杨立昆还加入了另一家初创公司Logical Intelligence,担任技术研究委员会创始主席。这家公司推出了名为Kona 1.0的能量基础推理模型,通过对约束条件评分来验证和优化解决方案,寻找最低能量也就是最一致的结果。

这种非自回归模型也和AMI Labs的联合嵌入预测架构相似,能够一口气生成完整的推理轨迹。

能量基础模型是一类通过能量函数来定义概率分布的模型。在这个框架中,每个可能的输出都被赋予一个能量值,能量越低表示该输出越符合约束条件。

模型通过优化过程寻找能量最小的解决方案。这种方法的优势在于可以同时考虑多个约束条件,并且可以进行全局优化,而不是像自回归模型那样只能做局部决策。

杨立昆表示,AGI的最终状态不会来自单一模型类别,而需要能量基础模型、LLM、世界模型等组成的相互依存的生态系统。

03

都是世界模型,两家又有什么不同?

虽然李飞飞和杨立昆都在构建世界模型,但技术路线存在根本差异。

由于技术还处于早期,World Labs的Marble本质上还是传统的生成式AI方法。它确实能生成3D世界,但这些世界本身还不具备物理知识。

World Labs联合创始人在采访中表示,Marble生成的罗马拱门并不知道如果移除一块砖,其他砖可能会掉落。它只是学会了罗马拱门在视觉上应该是什么样子,而不是理解支撑它的物理原理。

这种方法在创意内容生成方面表现出色,可以快速产出视觉上令人信服的场景,但缺乏对因果关系的深层理解。

相比之下,因为杨立昆的联合嵌入预测架构能够直接生成完整的结果,它就能够表示出来这里面的因果关系。

但是在市场方面,World Labs已经获得了早期客户。World Labs透露已有多家组织采用了Marble API。这种先发优势使其在融资谈判中占据有利位置。

World Labs明确瞄准创意产业,这些市场已经存在,客户有明确的痛点,3D 内容制作成本高、周期长,Marble提供了立竿见影的价值。

游戏开发者可以用Marble快速生成背景环境,然后在Unity或Unreal Engine中添加交互逻辑。影视制作团队可以用它进行虚拟场景预览,大幅缩短前期制作时间。

从商业角度看,World Labs的策略更加务实。它选择了一个已经存在的市场,提供了一个可以立即使用的产品,并且建立了清晰的商业模式。

AMI Labs有点超前,它押注于一个尚未成熟的市场,追求技术突破,给这片全新的市场带来需求。这种方法风险更高,但如果成功,回报也会更大。

李飞飞的World Labs扎根硅谷,投资方以美国VC为主,虽然也包括沙特和新加坡主权基金。这使其能够充分利用硅谷的人才、资本和客户网络。

反观杨立昆,他选择巴黎作为总部,这不仅是个人偏好,更是战略选择。

欧盟正在建立AI主权,减少对美国科技巨头的依赖。AMI Labs获得法国政府的高调支持,可能在欧洲监管环境中获得优势,特别是在医疗保健等高度监管的领域。

两家公司的人才策略也有所不同。

World Labs主要招募的是大量计算机视觉和图形学背景的研究者,这些人擅长处理视觉数据和渲染问题。AMI Labs方面则更倾向于招募有机器学习理论和物理建模背景的研究者,这些人更关注模型的数学基础和泛化能力。

李飞飞相信通过大规模数据和计算,可以让模型学会对空间的隐式理解,即使它不明确建模物理规律。这种方法在计算机视觉领域已经被证明有效,ImageNet项目就是最好的例证。

杨立昆则坚持认为,真正的智能需要显式的世界模型,需要理解因果关系而不仅仅是相关性。他多年来一直批评纯粹的生成式方法,认为它们无法达到人类水平的推理能力。

所以看下来,虽然两个人的技术完全不同,然而实际上,这两条路之间好像也没有那么水火不相容。

事实上,它们可能最终会融合。World Labs的生成能力可以为杨立昆的因果模型提供丰富的训练数据,而联合嵌入预测架构的推理能力可以增强Marble的物理一致性。

AI的未来可能不是选择其中一条路,而是找到两者的最佳结合点。

无论哪条路径最终胜出,世界模型都代表了AI从理解语言到理解物理世界的重要转变。

它意味着我们不再满足于让AI模仿人类的语言能力,而是要让它理解什么才叫客观规律。

欢迎在评论区留言~如需开白请加小编微信:dongfangmark

 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON