推广 热搜: 采购方式  滤芯  带式称重给煤机  甲带  气动隔膜泵  减速机型号  无级变速机  链式给煤机  履带  减速机 

OpenHuman 深度调研报告

   日期:2026-05-29 11:22:34     来源:网络整理    作者:本站编辑    评论:0    
OpenHuman 深度调研报告

调查时间: 2026年5月29日

官网:https://tinyhumans.ai/openhuman

GitHub:tinyhumansai/openhuman

出品方: TinyHumans AI(独立团队,非大厂背景)


一、产品定位

“Your Personal AI super intelligence: Private, Simple and extremely powerful.”

OpenHuman 是一个开源桌面 AI 助手,以“个人记忆系统”为核心差异化卖点。标语直击行业痛点:

“Every model in the world shares the same fundamental limitation: they are stateless.”

它认为所有 LLM 都是“瞬时记忆”——你打完 prompt,上下文消失。OpenHuman 要做的事:把 AI 的记忆从“便利贴”升级为“Obsidian 知识库”。

特性
描述
定位
个人 AI 超智能体,记忆驱动的主动 Agent
目标用户
技术用户 + 追求个人数据自主的高净值用户
运行环境
桌面端(Windows/macOS/Linux)+ 未来移动端
核心能力
118+ 服务集成、Memory Tree、Obsidian 式 Wiki、Voice/Meet 机器人
收费模式
统一订阅(一个订阅包含所有模型,自动路由)
开源
GPLv3

二、核心能力

2.1 Memory Tree(记忆树)

这是 OpenHuman 的灵魂能力

  • 数据源
    :118+ 服务 OAuth 接入(Gmail、GitHub、Slack、Notion、Stripe、Calendar、Drive、Linear、Jira 等)
  • 处理流程
    :数据 → 确定性 pipeline → canonical Markdown,≤3k-token 块,打分 → 折叠进 per-source / per-topic / per-day 总结树
  • 存储
    :SQLite 在本地,.md 文件同步到 Obsidian 可读的 Vault
  • 特点
    :记忆透明可读,用户可直接用 Obsidian 打开/编辑/手动链接(“You can’t trust a memory you can’t read”)
  • 自动刷新
    :每 20 分钟无感抓取新数据,Agent 始终有“明天的上下文”

2.2 Obsidian Wiki 记忆层

和 Karpathy 的 obsidian-wiki 理念一脉相承:

  • AI 推理用的同一批 chunks,直接落盘成 .md 文件
  • 用户可以用 Obsidian 手工补充、链接、标签
  • 本地 SQLite + Markdown 双写,隐私与可编辑兼得

2.3 118+ 服务集成

通过 Composio 连接层实现一键 OAuth,官方声称“无需手动配 API Key”。覆盖:

  • 邮件:Gmail
  • 代码:GitHub、GitLab
  • 办公:Notion、Slack、Linear、Jira、Stripe
  • 日历:Google Calendar
  • 云盘:Google Drive
  • 等……
 ⚠️ 注意:托管模式(默认)下,OAuth 握手和工具调用通过 OpenHuman 后端代理。如需完全自控,可配置自己的 Composio API Key(direct mode),但部分实时 Webhook 触发需要自行托管。

2.4 TokenJuice 智能压缩

将 HTML 转为 Markdown、长 URL 缩短、工具输出去重压缩,通过规则叠加实现:

  • CJK、emoji 逐字保留,不被误删
  • 实测压缩率最高可达 80%
  • 让“扫描半年邮件”这类操作的 token 成本降至个位数美元

2.5 自动模型路由

根据 hint 标签自动选择最优模型:

Hint
模型类型
场景
hint:reasoning
前沿大模型
复杂推理、深度分析
hint:fast
便宜快速模型
简单查询、快速响应
vision
视觉模型
图片理解

底层通过 OpenHuman 后端统一订阅,用户无感知切换。

2.6 Voice + 实时吉祥物

  • STT 输入
    :语音指令
  • TTS 输出
    :ElevenLabs 声音
  • 吉祥物口型同步
    :桌面 mascot 实时唇形
  • Google Meet 实时代理
    :作为真实参会者加入会议,转录存入 Memory Tree,可语音发言

2.7 内置工具集(开箱即用)

  • 文件系统、Git、lint、测试、grep
  • 浏览器控制、计算机控制
  • Cron 调度、记忆工具
  • 子 Agent 协同(spawn sub-agents)
  • Web 搜索、网页抓取

三、技术架构

3.1 技术栈

层级
技术
核心语言
Rust
桌面框架
Tauri + Chromium Embedded Framework (CEF)
前端
React + Tailwind CSS + TypeScript
记忆存储
SQLite(本地)
文档格式
Markdown(Obsidian 兼容)
连接层
Composio(OAuth 集成)
本地 AI
Ollama / LM Studio(可选)
订阅模式
统一后端托管订阅

3.2 代码结构

openhuman/

├── src/              # Rust 核心

│   ├── core/         # Agent、dispatch、memory、auth、socketio、event_bus

│   ├── api/          # API 层

│   └── rpc/          # RPC 协议

├── app/              # TypeScript 前端

│   ├── src/          # React 组件

│   ├── src-tauri/    # Tauri 原生壳(Rust)

│   └── src-tauri-mobile/

├── e2e/              # 端到端测试

└── packages/         # 工作区共享包

3.3 安装方式

平台
安装方式
macOS
brew tap tinyhumansai/core && brew install openhuman
Linux (Debian/Ubuntu)
Signed apt repo(推荐)
Linux (Arch)
AUR: yay -S openhuman-bin
Windows
Signed .msi / .exe installer
通用
.dmg / .AppImage / .deb 直接下载
 ⚠️ 已知问题:AppImage 在 Wayland 和 Arch 上可能崩溃(#2463),推荐 Debian/Ubuntu 用户使用 .deb 包。

四、版本与社区

指标
数据
最新版本
v0.56.0(2026-05-27发布)
Stars
29,229
Forks
2,759
主要贡献者
senamakel(926次提交)、graycyrus、M3gA-Mind、oxoxDev
成立时间
2026-02-18(距今约3个月)
语言
Rust
许可证
GPLv3
Open Issues
142
多语言 README
英/中/日/韩/德 5 种
荣誉
Product Hunt TOP 3,Trendshift TOP 1 repository

发布节奏:平均每 2-3 天一个版本(v0.54 2026-05-19 → v0.56 2026-05-27),开发极为活跃。


五、竞品对比分析

5.1 一句话总结

产品
定位
OpenHuman
记忆驱动的个人 AI 超智能体,本地持久记忆 + 主动 Agent
Marvis
操作系统级本地 AI 助手,帮人操作电脑/手机,面向普通用户
OpenClaw
将任意网站/应用转化为 CLI 工具,浏览器自动化,开发者工作流
Hermes
Agent 运行时框架,调度工具、记忆、技能系统的执行引擎
Claude Code
专业编程助手,读代码库、写文件、执行终端命令、深度 IDE 集成
OpenAI Codex
编程 Copilot,嵌入开发流程的代码补全与生成工具

5.2 核心定位对比

5.3 能力矩阵

 ⚠️ 说明:Hermes 的“飞书/微信/Telegram”能力来自技能/插件扩展,并非核心功能;OpenClaw 的“多平台”指浏览器自动化而非 IM 消息聚合。

5.4 技术架构对比

5.5 典型使用场景

OpenHuman — 个人数据中枢 + 主动记忆

  • “帮我回顾过去一个月里,所有邮件中提到的项目里程碑”
  • “整理 Obsidian 笔记,按主题生成本周知识摘要”
  • “明早 8 点前给我一份 Google Calendar 上所有会议的摘要”

Marvis — 日常生活 + 轻办公

  • “帮我整理桌面上的文档,按项目分类”
  • “把这份合同的关键条款提取出来”
  • “下周去上海的旅行攻略怎么样?”

OpenClaw — 浏览器自动化 + CLI 开发

  • 将飞书文档页面转化为命令行接口操作
  • 自动化网页数据抓取
  • 浏览器多标签页批量管理

Hermes — 个人 AI 工作流自动化

  • “每天早上 8 点给我发一份 A 股强势股筛选”
  • “把网页内容总结后发到飞书知识库”
  • 管理多平台消息、调度子任务

Claude Code — 专业编程闭环

  • “帮我重构这个模块,添加单元测试”
  • “解释这段代码,列出潜在 bug”
  • 直接在代码库里工作,写文件、执行 git、跑测试

六、关键差异总结

6.1 各产品独特价值

产品
独特价值
OpenHuman
记忆透明可编辑、Obsidian 兼容、主动 Agent(无感刷新)、TokenJuice 压缩 80%、Google Meet 实时代理
Marvis
唯一一个直接操控操作系统的 AI——装在电脑里就能“帮你用电脑”,面向普通用户;硬件门槛较高(16GB)是主要限制
OpenClaw
浏览器自动化 + 将任意网站转化为 CLI 工具,开发者工作流利器
Hermes
任务执行 + 工具调度 + 个人 AI 工作流自动化,Skills 生态成熟,跨平台消息
Claude Code
纯编程 Agent,能独立完成多步骤编程任务闭环,深度 IDE 集成
Codex
坐在旁边的编程搭档,实时代码补全和建议,GitHub 原生嵌入

6.2 选型决策树

用户是普通用户,需要“帮我操作电脑”?

├── 是 → Marvis(系统级操作,门槛:6核+16GB)

└── 否 →

用户需要“记住我的一切,主动在后台思考”?

├── 是 → OpenHuman(Memory Tree + Obsidian + Auto-fetch)

└── 否 →

用户是程序员,需要“代码任务全自动闭环”?

├── 是 → Claude Code(深度 IDE 集成,Anthropic SaaS)

└── 否 →

用户需要“将任意网站转化为命令行工具”?

├── 是 → OpenClaw(浏览器自动化,开发者专属)

└── 否 →

用户需要“跨平台 Bot 编排 + 定时任务 + Skills 工作流”?

├── 是 → Hermes(Agent 执行引擎,完全自托管)

└── 否 →

以上都不是?

└── → 需要进一步明确需求


七、六大 AI Agent 趋势预测

 以下预测基于各产品当前定位、社区活跃度、技术架构和市场竞争格局综合推演。预测为个人观点,存在不确定性。

7.1 各产品定位总结

产品
当前定位
Stars
最近更新
OpenClaw
个人 AI 助手(Any OS/Any Platform)
375,287 ⭐
2026-05-28
Hermes
NousResearch 开源 Agent 运行时
171,510 ⭐
Claude Code
终端编程 Agent
127,308 ⭐
2026-05-28
Codex
GitHub 内嵌编程 Copilot
86,613 ⭐
2026-05-28
OpenHuman
记忆驱动个人 AI 超智能体
29,229 ⭐
2026-05-27
Marvis
OS 级本地 AI 助手(腾讯闭源)
—(闭源)

7.2 OpenHuman 趋势预测

短期(1年内): 凭借 GPLv3 开源、Rust 架构和 Obsidian 记忆层,OpenHuman 会吸引一批技术用户和隐私主义者,成为“个人 AI 数据中枢”赛道的标杆。其 TokenJuice + Auto-fetch 的组合让“低成本大记忆”成为可能,对高信息量用户有强烈吸引力。Product Hunt TOP 3 的光环和快速迭代(每2-3天一个版本)表明团队在认真做产品。

中期(1-3年): OpenHuman 最大的挑战是商业化。当前统一订阅模式依赖 OpenHuman 后端(OAuth 代理、模型路由),这意味着“本地部署”并非完全自由,仍受制于云端服务。一旦订阅费用过高或隐私丑闻爆发,社区可能 fork 出纯本地版本(类似 TrueNAS vs NAS)。如果能搞定消费级用户的认知门槛(目前主要在技术圈传播),有机会像 Obsidian 一样从小众工具变成主流。

核心变量: 118+ 集成的体验稳定性、TokenJuice 的实际压缩效果、吉祥物 Meta 在 Meet 中的真实体验价值。

预测结论: 未来3年将保持“技术圈 cult favorite”地位,不会有爆发性增长,但会成为“个人记忆 AI”的事实标准(类似 Obsidian 在笔记领域的地位)。


7.3 Marvis 趋势预测

短期(1年内): 腾讯的资源和分发能力是最大优势——微信小程序 + PC 客户端 + 手机端的多端覆盖,让 Marvis 可以快速下沉到普通用户。16GB 内存门槛会随硬件迭代自然降低(2027年主流 PC 预期 32GB)。腾讯元宝和 Marvis 的协同效应值得关注——前者是“对话 AI”,后者是“操作 AI”,两个产品覆盖不同场景。

中期(1-3年): Marvis 的威胁来自隐私信任。腾讯是中国公司,隐私条款虽承诺本地模式,但“本地模式不等于完全离线”是客观事实。对隐私敏感的企业用户会选择 Marvis 的本地模式而非云端,这限制了腾讯数据变现的空间。但如果腾讯能证明“数据不出设备”,有机会在企业市场打开局面。

核心变量: 腾讯 AI 战略优先级(是否把 Marvis 作为核心产品?)、收费模式是否透明、硬件门槛能否降低。

预测结论: 在中国国内会有一席之地,但受限于 Windows 16GB 门槛和腾讯的企业属性,全球化可能性低。腾讯 AI 产品矩阵(元宝 + Marvis + IMA + 文档AI)的协同是关键。


7.4 OpenClaw 趋势预测

当前最大变量: Stars 37.5万,是这份榜单里最高的一个,但 GitHub 描述是“personal AI assistant”而 README 实际是 CLI 工具,存在明显的定位落差。这说明 OpenClaw 在早期借用了“AI assistant”的概念红利,但实际产品力和品牌力存在错位。

短期(1年内): OpenClaw 的核心价值在于将任意网站转化为 CLI 这一差异化能力,在技术用户中有强需求。浏览器自动化 + 多适配器架构的组合让开发者在工作流中有极高灵活性。如果团队能持续维护(目前仍在活跃更新),会成为开发者工具链中的常驻组件。

中期(1-3年): OpenClaw 面临的最大挑战是价值锚点模糊。当 Claude Code 这样专注编程的 Agent 和 OpenHuman 这样专注记忆的 Agent 都在抢占用户心智时,“通用的网站→CLI 转换工具”听起来不够聚焦。如果 OpenClaw 能在特定垂直场景(电商、社交媒体管理、数据采集)找到突破口,可能复制“Figma 从设计工具中胜出”的路径。

核心变量: 产品定位是否收窄(成为“网站自动化 CLI 第一名”而不是“通用 AI 助手”)、团队商业化策略、社区活跃度能否维持。

预测结论: 长期看好,但需要更清晰的定位。37.5万 Stars 是历史积累,如何将流量转化为付费用户是核心挑战。


7.5 Hermes 趋势预测

当前最大变量: Hermes( NousResearch/hermes-agent,171,510 ⭐)是唯一一个以“框架/引擎”为核心定位的产品,其他5个都是直接面向用户的终端产品。这意味着 Hermes 的价值通过下游用户间接体现,而非直接服务用户。

短期(1年内): Hermes 的 Skills 生态和跨平台 Bot 能力(飞书/微信/Telegram)在特定垂直场景(跨境电商运营、品牌社交媒体管理、有多平台消息需求的企业)中有不可替代的价值。“定时任务 + 跨平台消息 + Skills 工作流”的组合对运营人员友好。

中期(1-3年): Hermes 面临两个方向的竞争——垂直化(Marvis/OpenHuman 直接解决终端用户问题,Hermes 变成“底层基础设施”)和平台化(OpenClaw/Claude Code 凭借更强的品牌和资金切入同类场景)。Hermes 必须在“深化技能生态”和“降低使用门槛”之间找到平衡。

核心变量: Skills 生态的丰富程度(更多飞书/微信/Telegram 高级技能)、是否有商业化案例、能否吸引开发者社区而非只有用户。

预测结论: 未来会分化成两条路——要么成为“企业 AI 自动化基础设施”(在幕后提供服务),要么被更垂直的产品收购/整合。独立长大的可能性中等。


7.6 Claude Code 趋势预测

当前最大变量: Anthropic 的 Claude 系列模型能力在编码场景中处于绝对领先地位,这让 Claude Code 成为“编程 Agent”的事实标准。Stars 12.7万,紧随 OpenClaw 和 Codex 之后,但 Claude Code 是纯编程工具,OpenClaw 是通用助手,所以实际影响力和渗透率比 Stars 显示的更高。

短期(1年内): Claude Code 会继续深化 IDE 集成(Cursor、VS Code、JetBrains 全家桶),成为“AI 编程体验”的事实标准。Sonnet 4 的性价比和 Opus 4 的深度推理能力形成高低搭配,覆盖从简单补全到复杂重构的全场景。Anthropic 的订阅模式让 Claude Code 可以直接变现,无需广告。

中期(1-3年): Claude Code 的威胁是上下文长度竞争。当 GPT-5 和 Gemini Ultra 的上下文窗口扩展到 10M token 时,Codex 可以做整代码库的深度理解,Claude Code 的“深度读代码库”优势会被削弱。但 Anthropic 的模型能力提升会让这个差距保持可接受范围。

核心变量: Anthropic 模型升级节奏、Claude Code 是否引入记忆系统(让 Agent 能跨项目记住用户偏好)、是否推出 Team/Enterprise 版本。

预测结论: 编程 Agent 领域的绝对领导者,未来3年会保持这个地位。除非 Anthropic 被严重战略失误或 OpenAI Codex 实现颠覆性突破,否则 Claude Code 的位置稳固。


7.7 OpenAI Codex 趋势预测

当前最大变量: Codex 深度嵌入 GitHub(Copilot)的产品链中,这是它最大的优势——每天有数百万开发者在使用,却不知道自己用的是 Codex。从 Stars 8.6万来看,Copilot 的品牌认知远超 Codex 这个底层模型的名字认知。

短期(1年内): Codex 作为 OpenAI 的编程载体,会随 GPT-4o / o3 的升级同步提升能力。但 OpenAI 当前面临政策监管、竞争加剧、收入压力等多重挑战,Codex 的优先级可能被稀释。更关键的是:OpenAI 的战略是“平台化”而非“垂直化”,Codex 最终可能变成 GPT 能力的编程场景展示,而非独立产品。

中期(1-3年): GitHub Copilot 的付费墙和 Claude Code 的崛起会形成两极——Copilot 靠 GitHub 生态保持装机量,Claude Code 靠体验深度赢得专业开发者。Codex 在中间夹着,既没有 Copilot 的渠道,也没有 Claude Code 的深度,定位最尴尬。

核心变量: OpenAI 是否会将 Codex 品牌彻底统一到 Copilot 下、Copilot 订阅费上涨空间、OpenAI 能否保持模型性能领先。

预测结论: 未来3年会逐渐被“GitHub Copilot”品牌吞噬,Codex 作为模型/品牌的独立性会下降,最终变成幕后的模型层。OpenAI 不会放弃编程场景,但会用 Copilot 而非 Codex 作为前台品牌。


八、更新日志

日期
更新内容
2026-05-29
初次调查完成,基于 GitHub API + 官网文档

报告基于 GitHub(Stars / Fork / Language / License / commits)、官网文档(GitBook)、README 内容综合整理。数据截至 2026-05-29。

 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON