调查时间: 2026年5月29日
官网:https://tinyhumans.ai/openhuman
GitHub:tinyhumansai/openhuman
出品方: TinyHumans AI(独立团队,非大厂背景)
一、产品定位
“Your Personal AI super intelligence: Private, Simple and extremely powerful.”
OpenHuman 是一个开源桌面 AI 助手,以“个人记忆系统”为核心差异化卖点。标语直击行业痛点:
“Every model in the world shares the same fundamental limitation: they are stateless.”
它认为所有 LLM 都是“瞬时记忆”——你打完 prompt,上下文消失。OpenHuman 要做的事:把 AI 的记忆从“便利贴”升级为“Obsidian 知识库”。
二、核心能力
2.1 Memory Tree(记忆树)
这是 OpenHuman 的灵魂能力:
- 数据源
:118+ 服务 OAuth 接入(Gmail、GitHub、Slack、Notion、Stripe、Calendar、Drive、Linear、Jira 等) - 处理流程
:数据 → 确定性 pipeline → canonical Markdown,≤3k-token 块,打分 → 折叠进 per-source / per-topic / per-day 总结树 - 存储
:SQLite 在本地, .md文件同步到 Obsidian 可读的 Vault - 特点
:记忆透明可读,用户可直接用 Obsidian 打开/编辑/手动链接(“You can’t trust a memory you can’t read”) - 自动刷新
:每 20 分钟无感抓取新数据,Agent 始终有“明天的上下文”
2.2 Obsidian Wiki 记忆层
和 Karpathy 的 obsidian-wiki 理念一脉相承:
AI 推理用的同一批 chunks,直接落盘成 .md文件用户可以用 Obsidian 手工补充、链接、标签 本地 SQLite + Markdown 双写,隐私与可编辑兼得
2.3 118+ 服务集成
通过 Composio 连接层实现一键 OAuth,官方声称“无需手动配 API Key”。覆盖:
邮件:Gmail 代码:GitHub、GitLab 办公:Notion、Slack、Linear、Jira、Stripe 日历:Google Calendar 云盘:Google Drive 等……
⚠️ 注意:托管模式(默认)下,OAuth 握手和工具调用通过 OpenHuman 后端代理。如需完全自控,可配置自己的 Composio API Key(direct mode),但部分实时 Webhook 触发需要自行托管。
2.4 TokenJuice 智能压缩
将 HTML 转为 Markdown、长 URL 缩短、工具输出去重压缩,通过规则叠加实现:
CJK、emoji 逐字保留,不被误删 实测压缩率最高可达 80% 让“扫描半年邮件”这类操作的 token 成本降至个位数美元
2.5 自动模型路由
根据 hint 标签自动选择最优模型:
底层通过 OpenHuman 后端统一订阅,用户无感知切换。
2.6 Voice + 实时吉祥物
- STT 输入
:语音指令 - TTS 输出
:ElevenLabs 声音 - 吉祥物口型同步
:桌面 mascot 实时唇形 - Google Meet 实时代理
:作为真实参会者加入会议,转录存入 Memory Tree,可语音发言
2.7 内置工具集(开箱即用)
文件系统、Git、lint、测试、grep 浏览器控制、计算机控制 Cron 调度、记忆工具 子 Agent 协同(spawn sub-agents) Web 搜索、网页抓取
三、技术架构
3.1 技术栈
3.2 代码结构
openhuman/
├── src/ # Rust 核心
│ ├── core/ # Agent、dispatch、memory、auth、socketio、event_bus
│ ├── api/ # API 层
│ └── rpc/ # RPC 协议
├── app/ # TypeScript 前端
│ ├── src/ # React 组件
│ ├── src-tauri/ # Tauri 原生壳(Rust)
│ └── src-tauri-mobile/
├── e2e/ # 端到端测试
└── packages/ # 工作区共享包
3.3 安装方式
⚠️ 已知问题:AppImage 在 Wayland 和 Arch 上可能崩溃(#2463),推荐 Debian/Ubuntu 用户使用 .deb包。
四、版本与社区
发布节奏:平均每 2-3 天一个版本(v0.54 2026-05-19 → v0.56 2026-05-27),开发极为活跃。
五、竞品对比分析
5.1 一句话总结
5.2 核心定位对比

5.3 能力矩阵

⚠️ 说明:Hermes 的“飞书/微信/Telegram”能力来自技能/插件扩展,并非核心功能;OpenClaw 的“多平台”指浏览器自动化而非 IM 消息聚合。
5.4 技术架构对比

5.5 典型使用场景
OpenHuman — 个人数据中枢 + 主动记忆
“帮我回顾过去一个月里,所有邮件中提到的项目里程碑” “整理 Obsidian 笔记,按主题生成本周知识摘要” “明早 8 点前给我一份 Google Calendar 上所有会议的摘要”
Marvis — 日常生活 + 轻办公
“帮我整理桌面上的文档,按项目分类” “把这份合同的关键条款提取出来” “下周去上海的旅行攻略怎么样?”
OpenClaw — 浏览器自动化 + CLI 开发
将飞书文档页面转化为命令行接口操作 自动化网页数据抓取 浏览器多标签页批量管理
Hermes — 个人 AI 工作流自动化
“每天早上 8 点给我发一份 A 股强势股筛选” “把网页内容总结后发到飞书知识库” 管理多平台消息、调度子任务
Claude Code — 专业编程闭环
“帮我重构这个模块,添加单元测试” “解释这段代码,列出潜在 bug” 直接在代码库里工作,写文件、执行 git、跑测试
六、关键差异总结
6.1 各产品独特价值
6.2 选型决策树
用户是普通用户,需要“帮我操作电脑”?
├── 是 → Marvis(系统级操作,门槛:6核+16GB)
└── 否 →
用户需要“记住我的一切,主动在后台思考”?
├── 是 → OpenHuman(Memory Tree + Obsidian + Auto-fetch)
└── 否 →
用户是程序员,需要“代码任务全自动闭环”?
├── 是 → Claude Code(深度 IDE 集成,Anthropic SaaS)
└── 否 →
用户需要“将任意网站转化为命令行工具”?
├── 是 → OpenClaw(浏览器自动化,开发者专属)
└── 否 →
用户需要“跨平台 Bot 编排 + 定时任务 + Skills 工作流”?
├── 是 → Hermes(Agent 执行引擎,完全自托管)
└── 否 →
以上都不是?
└── → 需要进一步明确需求
七、六大 AI Agent 趋势预测
以下预测基于各产品当前定位、社区活跃度、技术架构和市场竞争格局综合推演。预测为个人观点,存在不确定性。
7.1 各产品定位总结
7.2 OpenHuman 趋势预测
短期(1年内): 凭借 GPLv3 开源、Rust 架构和 Obsidian 记忆层,OpenHuman 会吸引一批技术用户和隐私主义者,成为“个人 AI 数据中枢”赛道的标杆。其 TokenJuice + Auto-fetch 的组合让“低成本大记忆”成为可能,对高信息量用户有强烈吸引力。Product Hunt TOP 3 的光环和快速迭代(每2-3天一个版本)表明团队在认真做产品。
中期(1-3年): OpenHuman 最大的挑战是商业化。当前统一订阅模式依赖 OpenHuman 后端(OAuth 代理、模型路由),这意味着“本地部署”并非完全自由,仍受制于云端服务。一旦订阅费用过高或隐私丑闻爆发,社区可能 fork 出纯本地版本(类似 TrueNAS vs NAS)。如果能搞定消费级用户的认知门槛(目前主要在技术圈传播),有机会像 Obsidian 一样从小众工具变成主流。
核心变量: 118+ 集成的体验稳定性、TokenJuice 的实际压缩效果、吉祥物 Meta 在 Meet 中的真实体验价值。
预测结论: 未来3年将保持“技术圈 cult favorite”地位,不会有爆发性增长,但会成为“个人记忆 AI”的事实标准(类似 Obsidian 在笔记领域的地位)。
7.3 Marvis 趋势预测
短期(1年内): 腾讯的资源和分发能力是最大优势——微信小程序 + PC 客户端 + 手机端的多端覆盖,让 Marvis 可以快速下沉到普通用户。16GB 内存门槛会随硬件迭代自然降低(2027年主流 PC 预期 32GB)。腾讯元宝和 Marvis 的协同效应值得关注——前者是“对话 AI”,后者是“操作 AI”,两个产品覆盖不同场景。
中期(1-3年): Marvis 的威胁来自隐私信任。腾讯是中国公司,隐私条款虽承诺本地模式,但“本地模式不等于完全离线”是客观事实。对隐私敏感的企业用户会选择 Marvis 的本地模式而非云端,这限制了腾讯数据变现的空间。但如果腾讯能证明“数据不出设备”,有机会在企业市场打开局面。
核心变量: 腾讯 AI 战略优先级(是否把 Marvis 作为核心产品?)、收费模式是否透明、硬件门槛能否降低。
预测结论: 在中国国内会有一席之地,但受限于 Windows 16GB 门槛和腾讯的企业属性,全球化可能性低。腾讯 AI 产品矩阵(元宝 + Marvis + IMA + 文档AI)的协同是关键。
7.4 OpenClaw 趋势预测
当前最大变量: Stars 37.5万,是这份榜单里最高的一个,但 GitHub 描述是“personal AI assistant”而 README 实际是 CLI 工具,存在明显的定位落差。这说明 OpenClaw 在早期借用了“AI assistant”的概念红利,但实际产品力和品牌力存在错位。
短期(1年内): OpenClaw 的核心价值在于将任意网站转化为 CLI 这一差异化能力,在技术用户中有强需求。浏览器自动化 + 多适配器架构的组合让开发者在工作流中有极高灵活性。如果团队能持续维护(目前仍在活跃更新),会成为开发者工具链中的常驻组件。
中期(1-3年): OpenClaw 面临的最大挑战是价值锚点模糊。当 Claude Code 这样专注编程的 Agent 和 OpenHuman 这样专注记忆的 Agent 都在抢占用户心智时,“通用的网站→CLI 转换工具”听起来不够聚焦。如果 OpenClaw 能在特定垂直场景(电商、社交媒体管理、数据采集)找到突破口,可能复制“Figma 从设计工具中胜出”的路径。
核心变量: 产品定位是否收窄(成为“网站自动化 CLI 第一名”而不是“通用 AI 助手”)、团队商业化策略、社区活跃度能否维持。
预测结论: 长期看好,但需要更清晰的定位。37.5万 Stars 是历史积累,如何将流量转化为付费用户是核心挑战。
7.5 Hermes 趋势预测
当前最大变量: Hermes( NousResearch/hermes-agent,171,510 ⭐)是唯一一个以“框架/引擎”为核心定位的产品,其他5个都是直接面向用户的终端产品。这意味着 Hermes 的价值通过下游用户间接体现,而非直接服务用户。
短期(1年内): Hermes 的 Skills 生态和跨平台 Bot 能力(飞书/微信/Telegram)在特定垂直场景(跨境电商运营、品牌社交媒体管理、有多平台消息需求的企业)中有不可替代的价值。“定时任务 + 跨平台消息 + Skills 工作流”的组合对运营人员友好。
中期(1-3年): Hermes 面临两个方向的竞争——垂直化(Marvis/OpenHuman 直接解决终端用户问题,Hermes 变成“底层基础设施”)和平台化(OpenClaw/Claude Code 凭借更强的品牌和资金切入同类场景)。Hermes 必须在“深化技能生态”和“降低使用门槛”之间找到平衡。
核心变量: Skills 生态的丰富程度(更多飞书/微信/Telegram 高级技能)、是否有商业化案例、能否吸引开发者社区而非只有用户。
预测结论: 未来会分化成两条路——要么成为“企业 AI 自动化基础设施”(在幕后提供服务),要么被更垂直的产品收购/整合。独立长大的可能性中等。
7.6 Claude Code 趋势预测
当前最大变量: Anthropic 的 Claude 系列模型能力在编码场景中处于绝对领先地位,这让 Claude Code 成为“编程 Agent”的事实标准。Stars 12.7万,紧随 OpenClaw 和 Codex 之后,但 Claude Code 是纯编程工具,OpenClaw 是通用助手,所以实际影响力和渗透率比 Stars 显示的更高。
短期(1年内): Claude Code 会继续深化 IDE 集成(Cursor、VS Code、JetBrains 全家桶),成为“AI 编程体验”的事实标准。Sonnet 4 的性价比和 Opus 4 的深度推理能力形成高低搭配,覆盖从简单补全到复杂重构的全场景。Anthropic 的订阅模式让 Claude Code 可以直接变现,无需广告。
中期(1-3年): Claude Code 的威胁是上下文长度竞争。当 GPT-5 和 Gemini Ultra 的上下文窗口扩展到 10M token 时,Codex 可以做整代码库的深度理解,Claude Code 的“深度读代码库”优势会被削弱。但 Anthropic 的模型能力提升会让这个差距保持可接受范围。
核心变量: Anthropic 模型升级节奏、Claude Code 是否引入记忆系统(让 Agent 能跨项目记住用户偏好)、是否推出 Team/Enterprise 版本。
预测结论: 编程 Agent 领域的绝对领导者,未来3年会保持这个地位。除非 Anthropic 被严重战略失误或 OpenAI Codex 实现颠覆性突破,否则 Claude Code 的位置稳固。
7.7 OpenAI Codex 趋势预测
当前最大变量: Codex 深度嵌入 GitHub(Copilot)的产品链中,这是它最大的优势——每天有数百万开发者在使用,却不知道自己用的是 Codex。从 Stars 8.6万来看,Copilot 的品牌认知远超 Codex 这个底层模型的名字认知。
短期(1年内): Codex 作为 OpenAI 的编程载体,会随 GPT-4o / o3 的升级同步提升能力。但 OpenAI 当前面临政策监管、竞争加剧、收入压力等多重挑战,Codex 的优先级可能被稀释。更关键的是:OpenAI 的战略是“平台化”而非“垂直化”,Codex 最终可能变成 GPT 能力的编程场景展示,而非独立产品。
中期(1-3年): GitHub Copilot 的付费墙和 Claude Code 的崛起会形成两极——Copilot 靠 GitHub 生态保持装机量,Claude Code 靠体验深度赢得专业开发者。Codex 在中间夹着,既没有 Copilot 的渠道,也没有 Claude Code 的深度,定位最尴尬。
核心变量: OpenAI 是否会将 Codex 品牌彻底统一到 Copilot 下、Copilot 订阅费上涨空间、OpenAI 能否保持模型性能领先。
预测结论: 未来3年会逐渐被“GitHub Copilot”品牌吞噬,Codex 作为模型/品牌的独立性会下降,最终变成幕后的模型层。OpenAI 不会放弃编程场景,但会用 Copilot 而非 Codex 作为前台品牌。
八、更新日志
报告基于 GitHub(Stars / Fork / Language / License / commits)、官网文档(GitBook)、README 内容综合整理。数据截至 2026-05-29。


