推广 热搜: 采购方式  甲带  滤芯  气动隔膜泵  带式称重给煤机  减速机型号  链式给煤机  减速机  无级变速机  履带 

清华大学:全球通用智能体竞争研究报告 2026

   日期:2026-03-17 09:32:17     来源:网络整理    作者:本站编辑    评论:0    
清华大学:全球通用智能体竞争研究报告 2026

核心速览

本报告聚焦全球通用智能体竞争,指出竞争已从模型层转向产品层,以Manus、Genspark、Flowith为核心,强调任务交付、工作台入口等护城河,而非参数规模。

重新定义研究对象

区分基座模型与通用智能体产品:报告不再以基座模型为中心,而是聚焦产品层。基座模型决定能力上限,是工具;通用智能体产品是用户实际使用的最终竞争单位,需接任务、拆任务、执行并交付结果。

新三层框架:包括产品层(Manus、Genspark、Flowith为核心)、原语层(如OpenAI、Google、Anthropic提供的computer use等能力)、垂直代理层(如Devin)。

产品层主战场

Manus:典型任务交付型通用agent,定位为“autonomous general AI agent + virtual colleague with its own computer”的虚拟同事,产品重心是create slides、build websites等可交付任务,通过Browser Operator在用户本地浏览器使用现有登录态和活动标签页,能生成PPT、网站等真实文件成果,交付“成果”而非“信息”。

Genspark:all-in-one AI workspace,将Super Agent与Docs/Sheets/Slides/Designer/Teams等模块拼成统一工作台,定义为“your all-in-one AI workspace”和“thinks, plans, and acts to complete your everyday tasks”,更像agent-工作套件,争夺工作台入口,形成迁移成本和团队入口。

Flowith:canvas-first agent workspace,定义为agentic AI workspace,通过Canvas、Recipe、Nodes和Knowledge Garden把agent行为显式化,强调长期上下文、可视化工作流和agent协作空间,其FlowithOS定位为“next-generation AI Agent Operating System”,争夺“AI Agent Operating System”心智。

产品层三强对比:Manus核心是最像数字同事,关键功能强调任务交付与结果生成,工作模式为自动执行流程;Genspark核心是最像agent-native工作套件,关键功能强调统一入口和产品模块,工作模式为集成多重Agent;Flowith核心是最像长期项目工作台,关键功能强调上下文、记忆和可视化任务流,工作模式为人机协同项目管理。

底座能力层

OpenAI:从Operator到ChatGPT agent,Operator能用自己的浏览器替用户执行任务,ChatGPT agent进一步整合研究、表格、预订和slides等任务到统一产品,具备computer use + integrated task execution能力。

Anthropic:computer use作为agent动作层能力,重点在工具和GUI操作,开发者可在沙箱计算环境里操作GUI,增强agent执行能力,偏底层动作原语角色。

原语层与产品层关系:原语层决定agent能否看屏幕、点网页等基础能力,但用户心智由产品层包装的默认工作入口决定,底座厂商重要但不应替代产品层成为报告主角。

高价值垂直代理

Devin:典型高价值垂直agent,定位为AI software engineer和collaborative AI teammate,可计划、执行复杂工程任务,在shell、编辑器和浏览器环境中工作,后续版本加入self-verify、auto-fix和computer use测试能力,核心场景是软件工程,深度极强但广度不等于通用agent,与Manus等产品层agent并存。

真正的竞争维度

五个竞争维度:任务交付能力(高效完成用户特定任务)、环境控制能力(浏览器/电脑/工具控制)、workspace与记忆(Workspace/项目流、工作记忆存储)、用户入口与平台黏性(核心入口点、高平台黏性)、企业治理与控制面(企业安全、控制台、策略管理)。

关键概念:任务交付型智能体(替用户完成任务并交付结果)、原语层与产品层分离(底座厂商提供动作能力,产品层提供最终体验)、工作台护城河(用户迁入同一workspace后的高切换成本)、广度智能体与深度智能体(广度覆盖多任务,深度单一场景深入)、交付替换权(成为用户默认任务承接方后的持续支配力)。

未来两年判断

主要判断:通用智能体竞争越来越像产品竞争而非模型排名竞争;底座能力层和产品层继续分离;工作台、记忆和入口的价值持续上升。

最终判断:报告应将Manus、Genspark、Flowith放在中心,真正的主角是能接任务、拆任务、做任务、交付任务的产品,未来胜负取决于谁能成为默认任务承接方。

欢迎加入智能交通技术群!扫码进入。
点击文后阅读原文,可获得下载资料的方法
联系方式:微信号18515441838
 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON