空间智能将成为大模型进入物理世界的关键能力
极顶数创创始人兼CEO嵇盼重点分享了空间智能、世界模型和3D内容生成的发展趋势。他指出,当前大模型已经在语言、图片、视频和编程等领域取得显著进展,但其能力主要集中在一维、二维及带有时间维度的“2.5D”信息空间,对真实三维世界的感知、理解、预测、交互和行动能力仍然不足。3D能力的缺失,是大模型迈向通用人工智能以及具身智能实现自主决策的重要瓶颈。
嵇盼将空间智能概括为感知、表征、推理、预测和行动五个核心环节。世界模型是空间智能的底层模型载体,具身智能则是空间智能在物理世界中的实体承载形态。随着机器人本体运动能力快速进步,行业下一阶段的竞争重点将从“身体”逐步转向“大脑”,即如何让机器人真正理解三维空间并作出自主决策。

极顶数创选择以物体级3D生成为切入点,通过图生3D、文生3D、动作迁移及AI Shader等技术,降低3D内容生产门槛。目前,用户仅需输入单张或多张图片,即可在较短时间内生成高还原度3D模型,相关资产可应用于游戏、数字人、3D打印、空间展示和具身智能仿真数据构建等领域。
在C端领域,普通用户可以通过拍摄图片、选择风格、生成模型三个步骤完成3D内容创作,并在移动端查看、管理和分享3D资产。未来,随着空间智能和世界模型持续成熟,3D内容有望成为连接数字世界与物理世界的重要基础设施。
大模型持续提升智能水平,多模态理解和生成推高智能上限
MiniMax投融资总监何婧怡围绕 AI 产业竞争格局、多模态技术路线以及公司的模型与harness进展进行了分享。 她表示,大模型产业已经从早期的“百模大战”阶段,收敛到全球范围内只有十几个玩家,未来全球大模型玩家将会进一步收敛。与此同时,随着智能水平的提升,大模型解锁的场景越来越多,TAM越来越大。与互联网时代主要围绕流量展开竞争不同,大模型时代最重要的竞争力是模型本身的智能水平。模型能力一旦实现关键突破,便可能迅速带动用户规模和商业收入的跳变跃升。

在技术方向上,何婧怡认为,这一代大模型的技术特征为:一是不同场景由统一的通用底座模型承载;二是文本、多模态理解,声音生成、图片和视频生成相融合的多模态模型成为重要方向;三是模型研发涵盖基础设施、模型训练、推理优化和上层应用的全链路系统工程。
她介绍,MiniMax 目前同时布局文本模型和生成式多模态模型。M3 文本模型强调原生多模态理解、高智能密度、较快输出速度和较低推理成本,适合多模态理解,Agent, coding等对响应速度,任务复杂度和成本要求较高的场景。公司还通过“10X 计划”引入金融、法律、 网络安全等行业专家,提升模型在专业领域中的任务执行能力。 在生成式多模态模型方向,海螺系列模型持续提升音视频生成质量和复杂场景还原能力。公司也在将原有应用进一步升级为Harness,使用户能够沉淀图片、视频、skills和工作流等个人资产。何婧怡表示,大模型公司的长期竞争不仅是单一模型指标的竞争,还包括基础设施效率、组织迭代速度、用户资产沉淀和harness协同能力的综合竞争。
智能交互将从语音入口走向多模态主动协作
宇生月伴创始人兼 CEO 梅杰分享了端到端情感交互大模型及多模态智能交互系统的发展路径。他认为,当前大模型产业主要沿着智能推理、具身智能和多模态三个方向演进。
宇生月伴聚焦多模态领域中的智能交互赛道,并将其发展划分为三个阶段:第一阶段是已经进入规模化商业应用的语音智能交互;第二阶段是融合视觉理解能力的多模态交互;第三阶段则是微轮次交互,AI 能够根据语音、表情、动作和环境信息,在数百毫秒内判断是否需要主动回应或插话。 在技术层面,公司围绕声音分离、语音理解与生成、实时翻译、视频理解及音视频协同生成形成了较完整的能力体系。例如,在多人同时说话或背景噪声复杂的环境中,模型可以分离不同说话人的声音;实时同传功能能够在较低延迟下完成多语言翻译,并尽可能保留说话人的音色和表达风格。

在商业化方面,宇生月伴已将语音交互能力应用于物流、保险、酒店SaaS 等领域,通过“硅基数字员工”辅助人工完成大量电话沟通与服务工作。同时,公司正推进与消费电子、智能眼镜、汽车等 AIoT 设备结合。梅杰表示,语音只是多模态交互的起点。未来的智能交互系统将连接人与Agent、智能硬件及物理世界,在交通事故取证、保险理赔、设备控制和具身智能等场景中发挥更大价值,并逐步成为 AI 时代重要的人机交互界面。
图模融合是产业级智能体实现可靠决策的重要路径
海致科技 CFO 何飞宏围绕知识图谱、大模型与产业级智能体的融合落地进行了分享。他指出,大语言模型本质上具有概率性,在信息整理、内容生成和通用问答等场景中表现突出,但在金融、能源、公安、交通和工业等产业场景中,企业不仅需要 AI 发挥工具属性 “给出答案”,更需要 AI 具备如同一线员工般调用工具完成任务的执行能力,同时要求决策过程可解释、可依赖、可回溯、可审计。知识图谱能够以显性的关系结构呈现数据和推理路径,与大模型结合后,可以提升智能体在复杂产业任务中的执行及决策确定性。
何飞宏将产业级智能体概括为“大模型 + Harness 驾驭工程体系”。其中,Harness 不仅包括模型调用和工具调度,还涉及数据层、语义层、能力层、权限层和审计层。数据层负责建立不同数据之间的逻辑关系,语义层负责统一专业概念,能力层负责匹配任务工具,权限层明确 AI 自主决策与人工介入的边界,审计层则确保决策过程能够被追踪和复核。

在实际场景中,图模融合可以支持复杂股权关系识别、电网设备风险分析、反欺诈、反洗钱和案件研判等多跳推理任务。例如,产业智能体不仅能够说明设备故障原因,还可以进一步识别潜在的批次或家族性风险,并形成排查、备货和供应链调整建议。
何飞宏表示,随着大模型逐渐进入企业核心业务流,产业级智能体的竞争焦点将从基础模型能力,进一步延伸至行业本体构建、数据工程、知识工程、权限管理等 Harness 工程能力。能够将行业经验及 Know-how 工程化,并不断获取以往企业软件中未覆盖的新增数据的智能体服务商,有望在产业智能体时代建立长期壁垒。
AI正从效率工具升级为企业认知基础设施
觅深科技AI解决方案副总裁李辉以AI用户洞察为切入点,分享了人工智能如何推动企业决策智能化升级。
他表示,传统用户研究主要依赖问卷、访谈和焦点小组,通常以单个项目为单位展开,容易受到时间、地域和样本规模限制,难以持续跟踪快速变化的消费者需求。同时,传统研究的发现、验证和监测环节往往相互割裂,研究成果也较难沉淀为可持续复用的组织资产。
AI能够将阶段性的用户调研转化为持续的客户洞察能力。通过智能访谈、自动追问、情绪识别、多语言分析和证据链整理,企业不仅能够知道“发生了什么”,还能够进一步理解用户行为背后的动机、场景和情绪。

李辉分享了健康医疗、游戏和新能源汽车等行业的实践案例。在健康医疗场景中,部分用户更愿意向AI披露较为敏感的信息,企业由此发现用户对相关产品的核心需求不仅是问题解答,也包括关怀和陪伴;在全球游戏场景中,AI能够突破语言和人力限制,快速处理大规模用户反馈;在汽车调研中,AI可以在用户完成车型评分后继续追问原因,并自动生成包含用户原声的高光片段。
对于证券行业,李辉认为,AI可以帮助机构从交易、账户和行为等表层数据进一步深入到客户的投资目标、风险认知、决策逻辑及情绪变化,形成从客群识别、深度对话、证据链沉淀到投顾服务和客户陪伴的完整闭环。下一阶段,AI将不再只是降本增效工具,而会成为连接用户、市场、产品和管理决策的企业认知基础设施。
AI编程催生新生产力,OPC模式正在加速走向现实
字节前大数据产品负责人、现准OPC沈瞳围绕AI编程、Agent提效及“一人公司”模式进行了分享。
他结合自身实践介绍,早期使用Cursor开发产品时,个人已经能够承担传统多人团队的部分工作,但开发者仍需要具备代码阅读和问题排查能力。随着Claude等模型的编程、测试和工具调用能力增强,开发者可以更多地通过自然语言完成需求描述、代码生成、测试及发布流程,AI编程正从辅助编码逐步走向端到端任务执行。
在一个协同工具的开发案例中,个人借助AI在约一周时间内完成了传统团队可能需要数百人天完成的工作。沈瞳将这种效率提升拆解为两部分:一是AI直接提升编码和执行效率;二是个人与AI协作大幅减少产品、开发、测试等不同角色之间的会议沟通和协作摩擦。

他同时强调,AI提效并不意味着所有工作都能实现无人化。按照类似自动驾驶的分级方法,当前多数AI应用仍处于“工具”或“工具构建者”阶段,即人类负责目标设定、过程校验和最终判断,AI负责执行具体任务。真正能够独立承担完整工作流程的“AI全职员工”仍处于探索阶段。
此外,AI还存在幻觉、误操作和方向判断错误等风险。AI可以放大执行效率,却无法突破使用者自身的认知边界;如果方向选择错误,效率越高,带来的潜在损失也可能越大。因此,AI原生创业和OPC模式的核心并非简单压缩人员数量,而是要求创业者同时具备产品判断、需求洞察、任务拆解和风险控制能力。
沈瞳认为,互联网和影视等跨角色沟通较多的行业具备更高的AI提效空间,而金融投研等依赖隐性经验、线下信息和专业判断的行业,AI更适合承担标准化与工具化工作。未来,随着Agent能力持续增强,个人将能够调用越来越多的数字员工和专业工具,“一人即团队”的新型生产组织模式有望加速普及。
AI产业加速由技术突破迈向组织与业务重构
从本次论坛嘉宾的分享可以看到,AI产业正在进入由模型能力突破向规模化产业落地加速演进的新阶段。无论是金融场景AIAgent、空间智能、全模态模型、多模态交互、产业级智能体,还是企业用户洞察与AI原生开发,其共同方向都是让AI从信息生成工具进一步进入真实工作流和核心业务流程。
与此同时,AI落地也不只是技术问题。数据安全、行业知识、组织激励、权限边界、审计机制、协同流程以及专业人员的最终判断,共同决定了AI能否真正创造价值。
面向Agent时代,企业竞争力将越来越取决于模型智能、行业Know-how、Harness工程体系与组织协同能力的结合。专业人才负责判断与创新,AI负责执行与协作,人机共同构成的新型生产力体系正在逐步形成。

拆解AI漫剧的爆款密码、共探AI 3D多模态的应用前景……十余位嘉宾分享技术破壁与内容价值的共生进化


年度峰会|近百位分享嘉宾揭晓!抢先链接2026年中国AI创新力量,全球化/漫影文娱/智能硬件/产业落地

共谈AIGC赋能短剧、漫剧、影视、设计…十余位嘉宾分享深度实战经验和前沿趋势机遇!



赤道象限xGDPS2025全球开发者先锋大会,三场Workshop共同呈现全球AI与开源发展的最新洞察与未来路径
