核心速览
本报告聚焦全球通用智能体竞争,指出竞争已从模型层转向产品层,以Manus、Genspark、Flowith为核心,强调任务交付、工作台入口等护城河,而非参数规模。
重新定义研究对象
区分基座模型与通用智能体产品:报告不再以基座模型为中心,而是聚焦产品层。基座模型决定能力上限,是工具;通用智能体产品是用户实际使用的最终竞争单位,需接任务、拆任务、执行并交付结果。
新三层框架:包括产品层(Manus、Genspark、Flowith为核心)、原语层(如OpenAI、Google、Anthropic提供的computer use等能力)、垂直代理层(如Devin)。
产品层主战场
Manus:典型任务交付型通用agent,定位为“autonomous general AI agent + virtual colleague with its own computer”的虚拟同事,产品重心是create slides、build websites等可交付任务,通过Browser Operator在用户本地浏览器使用现有登录态和活动标签页,能生成PPT、网站等真实文件成果,交付“成果”而非“信息”。
Genspark:all-in-one AI workspace,将Super Agent与Docs/Sheets/Slides/Designer/Teams等模块拼成统一工作台,定义为“your all-in-one AI workspace”和“thinks, plans, and acts to complete your everyday tasks”,更像agent-工作套件,争夺工作台入口,形成迁移成本和团队入口。
Flowith:canvas-first agent workspace,定义为agentic AI workspace,通过Canvas、Recipe、Nodes和Knowledge Garden把agent行为显式化,强调长期上下文、可视化工作流和agent协作空间,其FlowithOS定位为“next-generation AI Agent Operating System”,争夺“AI Agent Operating System”心智。
产品层三强对比:Manus核心是最像数字同事,关键功能强调任务交付与结果生成,工作模式为自动执行流程;Genspark核心是最像agent-native工作套件,关键功能强调统一入口和产品模块,工作模式为集成多重Agent;Flowith核心是最像长期项目工作台,关键功能强调上下文、记忆和可视化任务流,工作模式为人机协同项目管理。
底座能力层
OpenAI:从Operator到ChatGPT agent,Operator能用自己的浏览器替用户执行任务,ChatGPT agent进一步整合研究、表格、预订和slides等任务到统一产品,具备computer use + integrated task execution能力。
Anthropic:computer use作为agent动作层能力,重点在工具和GUI操作,开发者可在沙箱计算环境里操作GUI,增强agent执行能力,偏底层动作原语角色。
原语层与产品层关系:原语层决定agent能否看屏幕、点网页等基础能力,但用户心智由产品层包装的默认工作入口决定,底座厂商重要但不应替代产品层成为报告主角。
高价值垂直代理
Devin:典型高价值垂直agent,定位为AI software engineer和collaborative AI teammate,可计划、执行复杂工程任务,在shell、编辑器和浏览器环境中工作,后续版本加入self-verify、auto-fix和computer use测试能力,核心场景是软件工程,深度极强但广度不等于通用agent,与Manus等产品层agent并存。
真正的竞争维度
五个竞争维度:任务交付能力(高效完成用户特定任务)、环境控制能力(浏览器/电脑/工具控制)、workspace与记忆(Workspace/项目流、工作记忆存储)、用户入口与平台黏性(核心入口点、高平台黏性)、企业治理与控制面(企业安全、控制台、策略管理)。
关键概念:任务交付型智能体(替用户完成任务并交付结果)、原语层与产品层分离(底座厂商提供动作能力,产品层提供最终体验)、工作台护城河(用户迁入同一workspace后的高切换成本)、广度智能体与深度智能体(广度覆盖多任务,深度单一场景深入)、交付替换权(成为用户默认任务承接方后的持续支配力)。
未来两年判断
主要判断:通用智能体竞争越来越像产品竞争而非模型排名竞争;底座能力层和产品层继续分离;工作台、记忆和入口的价值持续上升。
最终判断:报告应将Manus、Genspark、Flowith放在中心,真正的主角是能接任务、拆任务、做任务、交付任务的产品,未来胜负取决于谁能成为默认任务承接方。




































