推广 热搜： 采购方式滤芯带式称重给煤机甲带气动隔膜泵减速机型号无级变速机链式给煤机履带减速机

清华大学:全球通用智能体竞争研究报告 2026

日期：2026-03-17 09:32:17 来源：网络整理作者：本站编辑评论：0

核心速览

本报告聚焦全球通用智能体竞争，指出竞争已从模型层转向产品层，以Manus、Genspark、Flowith为核心，强调任务交付、工作台入口等护城河，而非参数规模。

重新定义研究对象

区分基座模型与通用智能体产品：报告不再以基座模型为中心，而是聚焦产品层。基座模型决定能力上限，是工具；通用智能体产品是用户实际使用的最终竞争单位，需接任务、拆任务、执行并交付结果。

新三层框架：包括产品层（Manus、Genspark、Flowith为核心）、原语层（如OpenAI、Google、Anthropic提供的computer use等能力）、垂直代理层（如Devin）。

产品层主战场

Manus：典型任务交付型通用agent，定位为“autonomous general AI agent + virtual colleague with its own computer”的虚拟同事，产品重心是create slides、build websites等可交付任务，通过Browser Operator在用户本地浏览器使用现有登录态和活动标签页，能生成PPT、网站等真实文件成果，交付“成果”而非“信息”。

Genspark：all-in-one AI workspace，将Super Agent与Docs/Sheets/Slides/Designer/Teams等模块拼成统一工作台，定义为“your all-in-one AI workspace”和“thinks, plans, and acts to complete your everyday tasks”，更像agent-工作套件，争夺工作台入口，形成迁移成本和团队入口。

Flowith：canvas-first agent workspace，定义为agentic AI workspace，通过Canvas、Recipe、Nodes和Knowledge Garden把agent行为显式化，强调长期上下文、可视化工作流和agent协作空间，其FlowithOS定位为“next-generation AI Agent Operating System”，争夺“AI Agent Operating System”心智。

产品层三强对比：Manus核心是最像数字同事，关键功能强调任务交付与结果生成，工作模式为自动执行流程；Genspark核心是最像agent-native工作套件，关键功能强调统一入口和产品模块，工作模式为集成多重Agent；Flowith核心是最像长期项目工作台，关键功能强调上下文、记忆和可视化任务流，工作模式为人机协同项目管理。

底座能力层

OpenAI：从Operator到ChatGPT agent，Operator能用自己的浏览器替用户执行任务，ChatGPT agent进一步整合研究、表格、预订和slides等任务到统一产品，具备computer use + integrated task execution能力。

Anthropic：computer use作为agent动作层能力，重点在工具和GUI操作，开发者可在沙箱计算环境里操作GUI，增强agent执行能力，偏底层动作原语角色。

原语层与产品层关系：原语层决定agent能否看屏幕、点网页等基础能力，但用户心智由产品层包装的默认工作入口决定，底座厂商重要但不应替代产品层成为报告主角。

高价值垂直代理

Devin：典型高价值垂直agent，定位为AI software engineer和collaborative AI teammate，可计划、执行复杂工程任务，在shell、编辑器和浏览器环境中工作，后续版本加入self-verify、auto-fix和computer use测试能力，核心场景是软件工程，深度极强但广度不等于通用agent，与Manus等产品层agent并存。

真正的竞争维度

五个竞争维度：任务交付能力（高效完成用户特定任务）、环境控制能力（浏览器/电脑/工具控制）、workspace与记忆（Workspace/项目流、工作记忆存储）、用户入口与平台黏性（核心入口点、高平台黏性）、企业治理与控制面（企业安全、控制台、策略管理）。

关键概念：任务交付型智能体（替用户完成任务并交付结果）、原语层与产品层分离（底座厂商提供动作能力，产品层提供最终体验）、工作台护城河（用户迁入同一workspace后的高切换成本）、广度智能体与深度智能体（广度覆盖多任务，深度单一场景深入）、交付替换权（成为用户默认任务承接方后的持续支配力）。

未来两年判断

主要判断：通用智能体竞争越来越像产品竞争而非模型排名竞争；底座能力层和产品层继续分离；工作台、记忆和入口的价值持续上升。

最终判断：报告应将Manus、Genspark、Flowith放在中心，真正的主角是能接任务、拆任务、做任务、交付任务的产品，未来胜负取决于谁能成为默认任务承接方。