OpenHuman 深度调研报告_展会资讯_资讯

OpenHuman 深度调研报告

调查时间： 2026年5月29日

官网：https://tinyhumans.ai/openhuman

GitHub：tinyhumansai/openhuman

出品方： TinyHumans AI（独立团队，非大厂背景）

一、产品定位

“Your Personal AI super intelligence: Private, Simple and extremely powerful.”

OpenHuman 是一个开源桌面 AI 助手，以“个人记忆系统”为核心差异化卖点。标语直击行业痛点：

“Every model in the world shares the same fundamental limitation: they are stateless.”

它认为所有 LLM 都是“瞬时记忆”——你打完 prompt，上下文消失。OpenHuman 要做的事：把 AI 的记忆从“便利贴”升级为“Obsidian 知识库”。

特性	描述
定位	个人 AI 超智能体，记忆驱动的主动 Agent
目标用户	技术用户 + 追求个人数据自主的高净值用户
运行环境	桌面端（Windows/macOS/Linux）+ 未来移动端
核心能力	118+ 服务集成、Memory Tree、Obsidian 式 Wiki、Voice/Meet 机器人
收费模式	统一订阅（一个订阅包含所有模型，自动路由）
开源	GPLv3

二、核心能力

2.1 Memory Tree（记忆树）

这是 OpenHuman 的灵魂能力：

数据源
：118+ 服务 OAuth 接入（Gmail、GitHub、Slack、Notion、Stripe、Calendar、Drive、Linear、Jira 等）
处理流程
：数据 → 确定性 pipeline → canonical Markdown，≤3k-token 块，打分 → 折叠进 per-source / per-topic / per-day 总结树
存储
：SQLite 在本地，.md 文件同步到 Obsidian 可读的 Vault
特点
：记忆透明可读，用户可直接用 Obsidian 打开/编辑/手动链接（“You can’t trust a memory you can’t read”）
自动刷新
：每 20 分钟无感抓取新数据，Agent 始终有“明天的上下文”

2.2 Obsidian Wiki 记忆层

和 Karpathy 的 obsidian-wiki 理念一脉相承：

AI 推理用的同一批 chunks，直接落盘成 .md 文件
用户可以用 Obsidian 手工补充、链接、标签
本地 SQLite + Markdown 双写，隐私与可编辑兼得

2.3 118+ 服务集成

通过 Composio 连接层实现一键 OAuth，官方声称“无需手动配 API Key”。覆盖：

邮件：Gmail
代码：GitHub、GitLab
办公：Notion、Slack、Linear、Jira、Stripe
日历：Google Calendar
云盘：Google Drive
等……

⚠️ 注意：托管模式（默认）下，OAuth 握手和工具调用通过 OpenHuman 后端代理。如需完全自控，可配置自己的 Composio API Key（direct mode），但部分实时 Webhook 触发需要自行托管。

2.4 TokenJuice 智能压缩

将 HTML 转为 Markdown、长 URL 缩短、工具输出去重压缩，通过规则叠加实现：

CJK、emoji 逐字保留，不被误删
实测压缩率最高可达 80%
让“扫描半年邮件”这类操作的 token 成本降至个位数美元

2.5 自动模型路由

根据 hint 标签自动选择最优模型：

Hint	模型类型	场景
hint:reasoning	前沿大模型	复杂推理、深度分析
hint:fast	便宜快速模型	简单查询、快速响应
vision	视觉模型	图片理解

底层通过 OpenHuman 后端统一订阅，用户无感知切换。

2.6 Voice + 实时吉祥物

STT 输入
：语音指令
TTS 输出
：ElevenLabs 声音
吉祥物口型同步
：桌面 mascot 实时唇形
Google Meet 实时代理
：作为真实参会者加入会议，转录存入 Memory Tree，可语音发言

2.7 内置工具集（开箱即用）

文件系统、Git、lint、测试、grep
浏览器控制、计算机控制
Cron 调度、记忆工具
子 Agent 协同（spawn sub-agents）
Web 搜索、网页抓取

三、技术架构

3.1 技术栈

层级	技术
核心语言	Rust
桌面框架	Tauri + Chromium Embedded Framework (CEF)
前端	React + Tailwind CSS + TypeScript
记忆存储	SQLite（本地）
文档格式	Markdown（Obsidian 兼容）
连接层	Composio（OAuth 集成）
本地 AI	Ollama / LM Studio（可选）
订阅模式	统一后端托管订阅

3.2 代码结构

openhuman/

├── src/ # Rust 核心

│ ├── core/ # Agent、dispatch、memory、auth、socketio、event_bus

│ ├── api/ # API 层

│ └── rpc/ # RPC 协议

├── app/ # TypeScript 前端

│ ├── src/ # React 组件

│ ├── src-tauri/ # Tauri 原生壳（Rust）

│ └── src-tauri-mobile/

├── e2e/ # 端到端测试

└── packages/ # 工作区共享包

3.3 安装方式

平台	安装方式
macOS	brew tap tinyhumansai/core && brew install openhuman
Linux (Debian/Ubuntu)	Signed apt repo（推荐）
Linux (Arch)	AUR: yay -S openhuman-bin
Windows	Signed .msi / .exe installer
通用	.dmg / .AppImage / .deb 直接下载

⚠️ 已知问题：AppImage 在 Wayland 和 Arch 上可能崩溃（#2463），推荐 Debian/Ubuntu 用户使用 .deb 包。

四、版本与社区

指标	数据
最新版本	v0.56.0（2026-05-27发布）
Stars	29,229
Forks	2,759
主要贡献者	senamakel（926次提交）、graycyrus、M3gA-Mind、oxoxDev
成立时间	2026-02-18（距今约3个月）
语言	Rust
许可证	GPLv3
Open Issues	142
多语言 README	英/中/日/韩/德 5 种
荣誉	Product Hunt TOP 3，Trendshift TOP 1 repository

发布节奏：平均每 2-3 天一个版本（v0.54 2026-05-19 → v0.56 2026-05-27），开发极为活跃。

五、竞品对比分析

5.1 一句话总结

产品	定位
OpenHuman	记忆驱动的个人 AI 超智能体，本地持久记忆 + 主动 Agent
Marvis	操作系统级本地 AI 助手，帮人操作电脑/手机，面向普通用户
OpenClaw	将任意网站/应用转化为 CLI 工具，浏览器自动化，开发者工作流
Hermes	Agent 运行时框架，调度工具、记忆、技能系统的执行引擎
Claude Code	专业编程助手，读代码库、写文件、执行终端命令、深度 IDE 集成
OpenAI Codex	编程 Copilot，嵌入开发流程的代码补全与生成工具

5.2 核心定位对比

5.3 能力矩阵

⚠️ 说明：Hermes 的“飞书/微信/Telegram”能力来自技能/插件扩展，并非核心功能；OpenClaw 的“多平台”指浏览器自动化而非 IM 消息聚合。

5.4 技术架构对比

5.5 典型使用场景

OpenHuman — 个人数据中枢 + 主动记忆

“帮我回顾过去一个月里，所有邮件中提到的项目里程碑”
“整理 Obsidian 笔记，按主题生成本周知识摘要”
“明早 8 点前给我一份 Google Calendar 上所有会议的摘要”

Marvis — 日常生活 + 轻办公

“帮我整理桌面上的文档，按项目分类”
“把这份合同的关键条款提取出来”
“下周去上海的旅行攻略怎么样？”

OpenClaw — 浏览器自动化 + CLI 开发

将飞书文档页面转化为命令行接口操作
自动化网页数据抓取
浏览器多标签页批量管理

Hermes — 个人 AI 工作流自动化

“每天早上 8 点给我发一份 A 股强势股筛选”
“把网页内容总结后发到飞书知识库”
管理多平台消息、调度子任务

Claude Code — 专业编程闭环

“帮我重构这个模块，添加单元测试”
“解释这段代码，列出潜在 bug”
直接在代码库里工作，写文件、执行 git、跑测试

六、关键差异总结

6.1 各产品独特价值

产品	独特价值
OpenHuman	记忆透明可编辑、Obsidian 兼容、主动 Agent（无感刷新）、TokenJuice 压缩 80%、Google Meet 实时代理
Marvis	唯一一个直接操控操作系统的 AI——装在电脑里就能“帮你用电脑”，面向普通用户；硬件门槛较高（16GB）是主要限制
OpenClaw	浏览器自动化 + 将任意网站转化为 CLI 工具，开发者工作流利器
Hermes	任务执行 + 工具调度 + 个人 AI 工作流自动化，Skills 生态成熟，跨平台消息
Claude Code	纯编程 Agent，能独立完成多步骤编程任务闭环，深度 IDE 集成
Codex	坐在旁边的编程搭档，实时代码补全和建议，GitHub 原生嵌入

6.2 选型决策树

用户是普通用户，需要“帮我操作电脑”？

├── 是 → Marvis（系统级操作，门槛：6核+16GB）

└── 否 →

用户需要“记住我的一切，主动在后台思考”？

├── 是 → OpenHuman（Memory Tree + Obsidian + Auto-fetch）

└── 否 →

用户是程序员，需要“代码任务全自动闭环”？

├── 是 → Claude Code（深度 IDE 集成，Anthropic SaaS）

└── 否 →

用户需要“将任意网站转化为命令行工具”？

├── 是 → OpenClaw（浏览器自动化，开发者专属）

└── 否 →

用户需要“跨平台 Bot 编排 + 定时任务 + Skills 工作流”？

├── 是 → Hermes（Agent 执行引擎，完全自托管）

└── 否 →

以上都不是？

└── → 需要进一步明确需求

七、六大 AI Agent 趋势预测

以下预测基于各产品当前定位、社区活跃度、技术架构和市场竞争格局综合推演。预测为个人观点，存在不确定性。

7.1 各产品定位总结

产品	当前定位	Stars	最近更新
OpenClaw	个人 AI 助手（Any OS/Any Platform）	375,287 ⭐	2026-05-28
Hermes	NousResearch 开源 Agent 运行时	171,510 ⭐	—
Claude Code	终端编程 Agent	127,308 ⭐	2026-05-28
Codex	GitHub 内嵌编程 Copilot	86,613 ⭐	2026-05-28
OpenHuman	记忆驱动个人 AI 超智能体	29,229 ⭐	2026-05-27
Marvis	OS 级本地 AI 助手（腾讯闭源）	—（闭源）	—

7.2 OpenHuman 趋势预测

短期（1年内）： 凭借 GPLv3 开源、Rust 架构和 Obsidian 记忆层，OpenHuman 会吸引一批技术用户和隐私主义者，成为“个人 AI 数据中枢”赛道的标杆。其 TokenJuice + Auto-fetch 的组合让“低成本大记忆”成为可能，对高信息量用户有强烈吸引力。Product Hunt TOP 3 的光环和快速迭代（每2-3天一个版本）表明团队在认真做产品。

中期（1-3年）： OpenHuman 最大的挑战是商业化。当前统一订阅模式依赖 OpenHuman 后端（OAuth 代理、模型路由），这意味着“本地部署”并非完全自由，仍受制于云端服务。一旦订阅费用过高或隐私丑闻爆发，社区可能 fork 出纯本地版本（类似 TrueNAS vs NAS）。如果能搞定消费级用户的认知门槛（目前主要在技术圈传播），有机会像 Obsidian 一样从小众工具变成主流。

核心变量： 118+ 集成的体验稳定性、TokenJuice 的实际压缩效果、吉祥物 Meta 在 Meet 中的真实体验价值。

预测结论： 未来3年将保持“技术圈 cult favorite”地位，不会有爆发性增长，但会成为“个人记忆 AI”的事实标准（类似 Obsidian 在笔记领域的地位）。

7.3 Marvis 趋势预测

短期（1年内）： 腾讯的资源和分发能力是最大优势——微信小程序 + PC 客户端 + 手机端的多端覆盖，让 Marvis 可以快速下沉到普通用户。16GB 内存门槛会随硬件迭代自然降低（2027年主流 PC 预期 32GB）。腾讯元宝和 Marvis 的协同效应值得关注——前者是“对话 AI”，后者是“操作 AI”，两个产品覆盖不同场景。

中期（1-3年）： Marvis 的威胁来自隐私信任。腾讯是中国公司，隐私条款虽承诺本地模式，但“本地模式不等于完全离线”是客观事实。对隐私敏感的企业用户会选择 Marvis 的本地模式而非云端，这限制了腾讯数据变现的空间。但如果腾讯能证明“数据不出设备”，有机会在企业市场打开局面。

核心变量： 腾讯 AI 战略优先级（是否把 Marvis 作为核心产品？）、收费模式是否透明、硬件门槛能否降低。

预测结论： 在中国国内会有一席之地，但受限于 Windows 16GB 门槛和腾讯的企业属性，全球化可能性低。腾讯 AI 产品矩阵（元宝 + Marvis + IMA + 文档AI）的协同是关键。

7.4 OpenClaw 趋势预测

当前最大变量： Stars 37.5万，是这份榜单里最高的一个，但 GitHub 描述是“personal AI assistant”而 README 实际是 CLI 工具，存在明显的定位落差。这说明 OpenClaw 在早期借用了“AI assistant”的概念红利，但实际产品力和品牌力存在错位。

短期（1年内）： OpenClaw 的核心价值在于将任意网站转化为 CLI 这一差异化能力，在技术用户中有强需求。浏览器自动化 + 多适配器架构的组合让开发者在工作流中有极高灵活性。如果团队能持续维护（目前仍在活跃更新），会成为开发者工具链中的常驻组件。

中期（1-3年）： OpenClaw 面临的最大挑战是价值锚点模糊。当 Claude Code 这样专注编程的 Agent 和 OpenHuman 这样专注记忆的 Agent 都在抢占用户心智时，“通用的网站→CLI 转换工具”听起来不够聚焦。如果 OpenClaw 能在特定垂直场景（电商、社交媒体管理、数据采集）找到突破口，可能复制“Figma 从设计工具中胜出”的路径。

核心变量： 产品定位是否收窄（成为“网站自动化 CLI 第一名”而不是“通用 AI 助手”）、团队商业化策略、社区活跃度能否维持。

预测结论： 长期看好，但需要更清晰的定位。37.5万 Stars 是历史积累，如何将流量转化为付费用户是核心挑战。

7.5 Hermes 趋势预测

当前最大变量： Hermes（ NousResearch/hermes-agent，171,510 ⭐）是唯一一个以“框架/引擎”为核心定位的产品，其他5个都是直接面向用户的终端产品。这意味着 Hermes 的价值通过下游用户间接体现，而非直接服务用户。

短期（1年内）： Hermes 的 Skills 生态和跨平台 Bot 能力（飞书/微信/Telegram）在特定垂直场景（跨境电商运营、品牌社交媒体管理、有多平台消息需求的企业）中有不可替代的价值。“定时任务 + 跨平台消息 + Skills 工作流”的组合对运营人员友好。

中期（1-3年）： Hermes 面临两个方向的竞争——垂直化（Marvis/OpenHuman 直接解决终端用户问题，Hermes 变成“底层基础设施”）和平台化（OpenClaw/Claude Code 凭借更强的品牌和资金切入同类场景）。Hermes 必须在“深化技能生态”和“降低使用门槛”之间找到平衡。

核心变量： Skills 生态的丰富程度（更多飞书/微信/Telegram 高级技能）、是否有商业化案例、能否吸引开发者社区而非只有用户。

预测结论： 未来会分化成两条路——要么成为“企业 AI 自动化基础设施”（在幕后提供服务），要么被更垂直的产品收购/整合。独立长大的可能性中等。

7.6 Claude Code 趋势预测

当前最大变量： Anthropic 的 Claude 系列模型能力在编码场景中处于绝对领先地位，这让 Claude Code 成为“编程 Agent”的事实标准。Stars 12.7万，紧随 OpenClaw 和 Codex 之后，但 Claude Code 是纯编程工具，OpenClaw 是通用助手，所以实际影响力和渗透率比 Stars 显示的更高。

短期（1年内）： Claude Code 会继续深化 IDE 集成（Cursor、VS Code、JetBrains 全家桶），成为“AI 编程体验”的事实标准。Sonnet 4 的性价比和 Opus 4 的深度推理能力形成高低搭配，覆盖从简单补全到复杂重构的全场景。Anthropic 的订阅模式让 Claude Code 可以直接变现，无需广告。

中期（1-3年）： Claude Code 的威胁是上下文长度竞争。当 GPT-5 和 Gemini Ultra 的上下文窗口扩展到 10M token 时，Codex 可以做整代码库的深度理解，Claude Code 的“深度读代码库”优势会被削弱。但 Anthropic 的模型能力提升会让这个差距保持可接受范围。

核心变量： Anthropic 模型升级节奏、Claude Code 是否引入记忆系统（让 Agent 能跨项目记住用户偏好）、是否推出 Team/Enterprise 版本。

预测结论： 编程 Agent 领域的绝对领导者，未来3年会保持这个地位。除非 Anthropic 被严重战略失误或 OpenAI Codex 实现颠覆性突破，否则 Claude Code 的位置稳固。

7.7 OpenAI Codex 趋势预测

当前最大变量： Codex 深度嵌入 GitHub（Copilot）的产品链中，这是它最大的优势——每天有数百万开发者在使用，却不知道自己用的是 Codex。从 Stars 8.6万来看，Copilot 的品牌认知远超 Codex 这个底层模型的名字认知。

短期（1年内）： Codex 作为 OpenAI 的编程载体，会随 GPT-4o / o3 的升级同步提升能力。但 OpenAI 当前面临政策监管、竞争加剧、收入压力等多重挑战，Codex 的优先级可能被稀释。更关键的是：OpenAI 的战略是“平台化”而非“垂直化”，Codex 最终可能变成 GPT 能力的编程场景展示，而非独立产品。

中期（1-3年）： GitHub Copilot 的付费墙和 Claude Code 的崛起会形成两极——Copilot 靠 GitHub 生态保持装机量，Claude Code 靠体验深度赢得专业开发者。Codex 在中间夹着，既没有 Copilot 的渠道，也没有 Claude Code 的深度，定位最尴尬。

核心变量： OpenAI 是否会将 Codex 品牌彻底统一到 Copilot 下、Copilot 订阅费上涨空间、OpenAI 能否保持模型性能领先。

预测结论： 未来3年会逐渐被“GitHub Copilot”品牌吞噬，Codex 作为模型/品牌的独立性会下降，最终变成幕后的模型层。OpenAI 不会放弃编程场景，但会用 Copilot 而非 Codex 作为前台品牌。

八、更新日志

日期	更新内容
2026-05-29	初次调查完成，基于 GitHub API + 官网文档

报告基于 GitHub（Stars / Fork / Language / License / commits）、官网文档（GitBook）、README 内容综合整理。数据截至 2026-05-29。