研究对象定义:Hermes Agent(由 Nous Research 开发的开源自进化 AI 智能体框架)
一、纵向分析:从赫尔墨斯到“爱马仕”——一段关于成长、野心与争议的故事
1. 起源:一个去中心化 AI 实验室的诞生
要理解 Hermes Agent,得先从它背后的 Nous Research 说起。这既不是一家典型的硅谷创业公司,也不走寻常的 AI 融资路径。
2022 年,当全球科技界还沉浸在 ChatGPT 发布前夜的焦虑中时,一群分散在世界各地的 AI 研究者开始在一件事上达成共识:大模型的未来不应该是少数几家巨头的专属游戏。他们决定用一种全新的方式做 AI——通过去中心化的算力网络,让任何人都能为模型训练贡献自己的 GPU 算力,并因此获得激励。
Nous Research 就这样诞生了。没有豪华的办公室,没有金光闪闪的创始团队履历,只有一群理想主义者和他们心中的“开放 AI”愿景。团队将 Solana 区块链作为底层协调网络,希望构建一个“抵抗审查、容错性强”的开放模型生态。这条路在当时看起来极其另类——2022 年的 AI 世界,OpenAI 刚刚用 ChatGPT 震惊世界,Anthropic 刚刚完成第一轮融资,所有人都在比拼谁家的模型更大、参数更多。而 Nous Research 选择了一条完全不同的路:做开源模型,而且要做“为代理场景专门优化”的开源模型。
命运的转折发生在 2023 年到 2024 年初。随着 Llama 系列模型的开源,整个开源社区突然有了一个足以匹敌闭源模型的基础底座。Nous Research 敏锐地抓住了这个机会,开始基于 Llama进行深度微调,推出了 Hermes 系列模型——Hermes 1、Hermes 2 Pro,这些模型在开源社区迅速积累了口碑。Hermes 2 Pro 在函数调用准确率上达到了 90%,而同尺寸的通用模型通常只有 60-70%。一个信号正在悄悄释放:Nous 知道怎么把模型做成“能干活的模型”,而不只是“能聊天的模型”。
2024 年 8 月,Hermes 3 正式发布。这是基于 Llama 3.1 的全参数微调模型,参数规模覆盖 8B、70B 和 405B。与 Meta 官方的 Llama 3.1 Instruct 相比,Hermes 3 在三个维度有结构性差异:更复杂的工具调用、更长的多轮对话能力、以及针对代理场景专门优化的推理轨迹。这个版本的训练数据达到了约 3.9 亿 token,全部通过合成数据生成,没有使用人工反馈——这是 Nous 在数据工程上的一次重要探索。
但真正让业界侧目的,是 2025 年 8 月推出的 Hermes 4。这个版本带来了两个重大创新:Hybrid Reasoning(混合推理)和 DataForge(图形化合成数据生成系统)。混合推理让模型可以在标准回答和显式推演之间自由切换,推演轨迹最长可达 16,000 token。而 DataForge 则用一个有向无环图系统取代了人工数据整理流程,将 Hermes 3 的约 120 亿 token 训练数据直接拉升到约 600 亿 token。Hermes 4 的发布标志着 Nous 在模型层面已经具备了与一线闭源模型在代理任务上正面竞争的能力。Hermes 4 之后,开源的 405B 参数模型在 Agentic 任务上直接对标闭源超大规模模型,差距已经肉眼可见地缩小了。
然而,Nous Research 的“开源理想”和“商业现实”之间的张力,在 2025 年 4 月迎来了一次集中释放。据《财富》杂志报道,Nous Research 完成了由 Paradigm 领投的 5000 万美元 A 轮融资,代币估值达到 10 亿美元。更早之前,公司还通过种子轮融资筹集了约 2000 万美元,投资方包括 Distributed Global、North Island Ventures、Delphi Digital 等。这是 Paradigm 自 FTX 事件以来在 AI 领域最大的一笔赌注。但外界很快注意到一个微妙的信号:Nous 还没有决定是用自己的代币还是 Solana 代币进行激励,系统何时上线也没有明确时间表。
这笔融资的性质因此变得有些模糊——是 VC 对开源 AI 未来的真金白银下注,还是一场加密圈“叙事+代币”的提前定价?公开资料显示,We 的早期投资者还包括 Y Combinator 的前总裁 Sam Altman(OpenAI 现任 CEO),尽管目前 Altman 已不再与该项目有直接关联。但无论如何,一个事实是明确的:在 Hermes Agent 诞生之前,Nous Research 已经是一个拥有 7000 万美元以上融资规模(有报道称总额达 6500 万美元)、估值 10 亿美元的去中心化 AI 项目。
然而,手握重金的 Nous 在接下来的一年里却显得异常安静。模型在迭代——Hermes 4 确实很强——但外界期待的“大动作”迟迟没有出现。这家实验室就像一艘巨轮,动力系统已经轰鸣,却还在迷雾中寻找航线。
2. 诞生:从“模型”到“Agent”的最后一公里
2025 年,AI 行业的大主题从“更大的模型”转向了“能干活的应用”。Agent 成为了新的叙事核心。Manus 在 2025 年初掀起了通用 Agent 的第一波浪潮;年中,OpenClaw(江湖人称“龙虾”)凭借全托管部署、多 IM 平台适配、MIT 开源协议等核心特性迅速成为开源 Agent 框架的标杆级产品。与此同时,Anthropic 推出了 Claude Code,OpenAI 放出了 Operator,Meta 收购了 Manus——科技巨头们正在从各个方向围堵这个新赛道。
Nous Research 手里有最好的开源代理模型之一(Hermes 3 和 Hermes 4),但一直缺一个让普通开发者能把模型“用起来”的 Agent 框架。这个缺口在 2025 年下半年变得越来越扎眼:开源社区里有人在问“Hermes 模型这么好,为什么没有一个像 OpenClaw 那样好用的框架?”
这个问题在 Nous 内部一定被反复讨论过。是做一条新赛道,还是跟着 OpenClaw 的方向走?是做闭源的商业化产品,还是延续开源的传统?是做一个单纯的“模型运行时”,还是做一个真正的“能自进化的 Agent”?最终,Nous 给出的答案很清晰:不做另一个 OpenClaw,而是做一个“能自进化的 Agent”——一个把 Harness Engineering 方法直接做成产品的智能体。
2025 年 7 月 22 日,Hermes Agent 项目在 GitHub 上正式立项。但有趣的是,从立项到实质性更新之间,出现了长达半年的空档期。这半年的沉默有几种可能的解释。推测一:Nous 当时可能还在纠结产品形态和商业定位——是做免费开源的社区项目,还是像许多同类产品一样走商业化路线?推测二:团队的资源可能被其他优先事项占据,比如 Hermes 4 的后续优化、与 Paradigm 相关的去中心化算力网络 Psyche 的建设。推测三:Hermes Agent 最初可能只是内部的一个实验性项目,优先级并不高,直到 2026 年初外部环境的变化才让它被推到前台。
不管原因是什么,2026 年 1 月 31 日之后,Hermes Agent 的更新突然加速了。几乎在同一时间,另一件大事正在发生——2026 年 2 月 1 日,中国 AI 团队 EvoMap 开源了自进化引擎 Evolver,上线 10 分钟即登顶 ClawHub 热门榜首。这个“巧合”的时间线后来成为一场抄袭争议的导火索。
但无论如何,2026 年 2 月 25 日,Hermes Agent 正式向公众发布了。它的 slogan 很有野心:“the agent that grows with you”——一个会跟着你一起成长的智能体。它的核心定位介于“Claude Code 风格的 CLI Agent”和“OpenClaw 风格的消息平台 Agent”之间。MIT 协议,零遥测,支持 OpenAI、Anthropic、Google 以及本地 Ollama 推理等超过 400 个模型。
Hermes Agent 的发布,可以理解为 Nous 把“训练好的模型”和“跑模型的 Agent 框架”两端彻底打通了:Agent 运行产生的轨迹数据,通过一个叫 Atropos 的系统反哺到下一代 Hermes 模型的训练中。这种“模型与 Agent 双向赋能”的架构,在开源 Agent 框架里是独一份的。如果你把 Hermes 系列模型想象成大脑,Hermes Agent 就是让这个大脑真正动起来的神经系统和肌肉骨骼系统。
它和 OpenClaw 表面上看都是开源的 AI Agent 框架——都支持全托管部署、MIT 协议、多 IM 平台接入、多模型切换。但 Hermes Agent 在诞生之初就做了一个截然不同的选择:把“自进化”作为产品的核心 DNA,而不是某个可以被剥离的附加功能。
3. 演进:从默默无闻到全球刷屏的三个月
2026 年 3 月 30 日,Hermes Agent 发布 v0.6.0 版本。这是一个关键的转折点。从功能上看,这个版本支持多实例配置跑隔离代理、提供 Docker 容器化部署、两天内合并了 95 个 Pull Request。但从市场传播的角度看,这个版本出现在了一个完美的时间窗口:
竞品的“窗口期” :同期,OpenClaw 恰好出现了崩溃和限流问题,大量用户开始寻找替代方案。
叙事环境的催化:Anthropic 收紧第三方调用路径,切断了通过 Claude 订阅额度“绕道”支撑 OpenClaw 等外挂 Agent 的通道。小米大模型负责人罗福莉从工程成本角度拆解了第三方 Agent 框架的效率问题,她观察到 OpenClaw 的上下文管理存在明显浪费:一次用户查询往往被拆分为多轮低价值工具调用,每次 API 请求都携带超过 10 万 token 的上下文窗口,单次任务的真实推理成本可能达到订阅价格的数十倍。这篇分析引发了开发者社区的强烈共鸣。
时机的巧合:周末资讯真空期、流动性薄、Crypto Twitter 正缺话题,几个大号一转就扩散开了。
这三点叠加在一起,形成了一个近乎完美的“爆款”组合。GitHub star 数开始火箭般蹿升——不到两个月,Hermes Agent 在 GitHub 上斩获了超过 8.5 万颗星标。在 OpenRouter 上,它的 token 消耗日榜一度位列第二,仅次于 OpenClaw。更夸张的是,它还登顶了全球“编程应用”榜首。
真正让 Hermes Agent 在中国开发者社区“破圈”的事件,发生在 2026 年 4 月初——Nous Research 官宣 Hermes 可以“原生”支持微信了。用的是腾讯官方的 iLink Bot API,不是第三方破解协议,扫个码就完事。上线当天,Nous Research 官方账号专门发了一条中文推文,浏览达到 54.9 万次,是这家美国实验室近期互动最高的几条之一。一位用户在评论中说:“在中国,你能把微信搞定,你就起飞了。”
这句评论一语成谶。腾讯云、阿里云相继为 Hermes Agent 推出了云端一键部署方案。钉钉、飞书、企业微信也全部打通。一时间,从“养龙虾”到“养马”成为开发者社区的新潮语,打工人开始讨论“Hermes 怎么装、怎么用”。精明的商人迅速嗅到商机,电商平台上“45 元一键安装‘爱马仕’”“零基础学 Hermes”“三天速成 Hermes 开发”的教程和培训班如雨后春笋般涌现。
甚至连 YC 的 CEO Garry Tan 也公开表态:“亲自尝试后,彻底回不去了。”
在一个 VC 都开始亲自下场站台的时刻,Hermes Agent 的叙事从“一个开源框架”变成了“下一个 OpenClaw”乃至“OpenClaw 的终结者”。但速度带来了关注,也带来了未曾预料的风险。
4. 争议:一场改变开源游戏规则的抄袭风波
2026 年 4 月 15 日,中国 AI 团队 EvoMap 在社交媒体上发表了一篇长文,指控 Hermes Agent 的“自进化”功能抄袭了他们 36 天前开源的项目 Evolver。
这份技术对比报告详细列出了两套系统的惊人相似之处:同样的“任务完成后自动提取可复用资产”闭环范式;同样的三层记忆体系(持久事实层 + 程序性记忆层 + 历史搜索层);同样的“技能在使用中自我改进”的设计思路。EvoMap 研发工程师范茂伟对媒体说:“Hermes 的代码在逻辑和架构上与我们存在极高的雷同性。”
更关键的是时间线的对比:Hermes Agent 于 2025 年 7 月 22 日立项,然后陷入长达半年的空档期,直到 2026 年 1 月 31 日后才恢复更新。而 Evolver 于 2026 年 2 月 1 日开源,提出了“进化”这一核心概念,并开始持续密集更新。也就是说,Evolver 开源后仅 36 天,Hermes 就将自己的品牌定位更改为“自进化 AI 智能体”。范茂伟告诉第一财经记者:“Hermes 是和‘龙虾’一样面向 C 端的智能体,而 Evolver 更像是一个挂载在智能体上的‘大脑’或‘技能插件’。Evolver 可以接入‘龙虾’或者 Hermes,让这些智能体从错误中学习”——而这正是 Hermes 后来主打的能力。
抄袭指控曝光后,Nous Research 的回应引发了更大的争议。官方账号先在 EvoMap 成员的社交平台上回应称“我们仓库 2025 年 7 月就有了。我们是‘先驱’。删除你们的账号”,并拉黑了该中国团队成员。这条回应迅速被删除。随后,Nous Research 联合创始人 Teknium 发表第二次回应:“我这辈子从来没有听说过这个人、他的项目,或者他正在做的任何事情。今天是我第一次听说或看到这个项目。毫无证据地声称我剽窃了他们的作品,这是谎言。”
两种说法之间存在着明显的张力。GitHub 上确实有 2025 年 7 月的项目创建记录,但自进化功能的完整闭环是在 2026 年初才出现的。Evolver 团队认为,两个人可能有同样的思想,但演进路径很难完全一致——Hermes 的代码结构和演进路径与 Evolver 高度相似,足以构成实质性证据。
这场风波的后续发展令人唏嘘。EvoMap 团队最终宣布将项目的核心模块改为混淆发布,协议从 MIT 变更为 GPL-3.0。团队创始人张昊阳在接受采访时坦言:“从个人开发者到小团队,从国内大厂到海外巨头,开源代码不被尊重正在成为常态。AI 时代把开发门槛降到了最低,每个人都可以创造,但原创者的尊严和生存空间,却被压缩到了极致。我们只能用自己的行动——闭源,来表达我们的态度。”
更具讽刺意味的是,EvoMap 指出:Hermes 通过 AI 辅助编程几乎可以一键洗代码,然后整合到自己的项目里——而在这场风波中,“人类老板”可能根本不知道底下的“AI 员工”参考了别人的项目。但问题在于,MIT 协议只要求保留原作者署名,而 Hermes 没有在任何地方标注对 Evolver 的引用或致谢。在 MIT 协议下,使用代码本身并不违法,但在这个信息高度透明的 AI 时代,一个价值 10 亿美元的项目是否应该在创新的名义下,把刚开源 36 天的项目代码作为自己的核心卖点而不做任何标注——这个问题,无论法律如何裁决,都已经在开源社区引发了无法弥合的信任裂痕。
截至本报告撰写时,GitHub 上 Evolver 的星标数约为 2300 余颗,而 Hermes Agent 已突破 8.5 万颗。两个项目之间巨大的影响力差距,让这场争议变得更加复杂。
5. 现状:顶流之上,暗流之下
2026 年 4 月中旬,Hermes Agent 正处于一个极其矛盾的十字路口。
一方面,它的增长数据惊人。GitHub 星标超过 8.5 万,贡献者超过 240 人。腾讯云和阿里云都推出了云端一键部署方案。它的微信接入能力在国内开发者社区掀起了“养马”热潮。更值得注意的是,MiniMax 于 2026 年 4 月 16 日上线了基于 Hermes Agent 构建的云端自我进化 AI 助手 MaxHermes,打通了飞书、钉钉、企业微信等多个 IM 渠道——这是 Hermes Agent 生态从开发者工具向企业级应用延伸的重要信号。
另一方面,三道暗流正在积聚压力:
第一道暗流是信任危机。抄袭指控已经对 Hermes Agent 的品牌造成了实质性损伤。在开源社区,“信任”是最昂贵的货币,一旦失去,很难用任何技术优势来挽回。Reddit、X 上的讨论已经从“Hermes 比 OpenClaw 好在哪里”逐渐变成了“Hermes 的自进化到底是不是原创的”。EvoMap 的闭源决定或许只是一个开始——如果原创者的维权成本高于抄袭成本,开源生态的根基将被动摇。
第二道暗流是竞争升级。OpenClaw 在受到冲击后正在快速迭代,Anthropic 的 Managed Agents 以“云托管、沙箱隔离”的产品形态对 OpenClaw 和 Hermes 形成了降维打击。科技巨头的入场正在改变游戏规则——当 Anthropic、OpenAI、Google 都在以更大的资源投入 Agent 赛道时,一个开源框架能否保持自己的技术领先性和社区活跃度,是一个尚未被回答的问题。
第三道暗流是商业化的两难。Hermes Agent 是 MIT 协议的开源项目,这意味着任何商业公司都可以直接使用甚至分叉它的代码。MiniMax 推出 MaxHermes 这件事本身就是一个信号:Hermes Agent 的技术价值正在被商业实体捕获,但 Nous Research 自己似乎还没有找到将这种价值转化为可持续收入的有效路径。结合它 10 亿美元的代币估值,这种“免费开源 + 高估值代币”的模式能否经得起时间的考验,是投资人和社区都在关注的核心问题。
二、横向分析:群雄逐鹿的 Agent 赛道
赛道格局判断:竞品充分(场景 C)
2026 年的 AI Agent 赛道已经进入了“百花齐放”的阶段,竞争格局高度分化。根据 MIT、哈佛、斯坦福等机构联合发布的《2025 AI Agent Index》,市面上最具代表性的代理系统已经达到了数十个,产品形态收拢在三个主要方向:聊天式代理(12 个)、企业自动化平台(13 个)、浏览器/GUI 型 Agent(5 个)。
在开源 Agent 框架这个细分赛道里,Hermes Agent 的直接竞品主要包括 OpenClaw、LangGraph、AutoGen 等;在 AI 编码 Agent 细分赛道里,竞品包括 Claude Code、Cursor、Copilot、Codex 等;在通用自主 Agent 细分赛道里,则有 Manus、Devin、OpenAI Operator 等。Hermes Agent 的定位恰好横跨了这三个细分赛道的交集区域——它既是开源的 Agent 框架,又具备编码 Agent 的能力,同时也在朝着通用自主 Agent 的方向演化。
因此,本报告将选取 4 个最具代表性的竞品进行深度对比:
OpenClaw(龙虾) ——开源 Agent 框架的标杆级产品,Hermes 最直接的竞争对手
Claude Code ——Anthropic 出品的 CLI 编码 Agent,代表了闭源大厂的技术上限
Manus AI ——通用自主 Agent 的商业化代表,已被 Meta 收购
LangGraph ——企业级多 Agent 编排框架,代表了另一种架构范式
1. OpenClaw:从霸主到守擂者的“龙虾”
1.1 它活成了什么样?
OpenClaw(江湖人称“龙虾”)是 Hermes Agent 出现之前开源 AI Agent 领域“近乎共识的答案”。它的崛起堪称 2025 年底 AI 圈最大的现象级事件之一——在 60 天内 GitHub 星标数突破 33.5 万,峰值时期全球开发者几乎人手一个。
OpenClaw 的核心是一套 Gateway 架构。它的设计重心在于连接和协调:统一管理会话、路由和渠道,把 Telegram、Slack、WhatsApp 等 20 多个消息入口汇聚到一个调度中心,再将请求分发给模型和工具。这种架构的优点是生态扩张极快——开发者贡献的技能(Skills)和插件在短短几个月内就形成了一个庞大的社区市场。对于喜欢自己动手配置、享受“养虾”过程的开发者来说,OpenClaw 提供了极高的可玩性和定制自由度。
但 OpenClaw 的问题也在使用规模的扩大中逐渐暴露。
架构复杂度的外溢是一个长期存在的痛点。OpenClaw 的设计本质上是“配置驱动”的——用户需要手动给 Agent 设定规则、安装技能、配置工具,Agent 按给定的配置去工作。随着技能生态的膨胀,这种手动维护的成本线性上升。更致命的是,根据多家网络与信息安全机构的最新报告,ClawHub 上高达 36.8% 的插件被查出存在严重漏洞或被投毒。“ClawHavoc”攻击事件中,恶意插件直接扫荡用户的本地目录,窃取聊天记录、私钥和交易所密码。
安全之外,成本问题也在发酵。小米大模型负责人罗福莉从工程成本角度拆解了 OpenClaw 的效率问题:一次用户查询往往被拆分为多轮低价值工具调用,每次 API 请求都携带超过 10 万 token 的上下文窗口。按 API 定价折算,单次任务的真实推理成本可能达到订阅价格的数十倍。
2026 年 4 月,Anthropic 宣布推出 Managed Agents,并收紧通过 Claude 订阅额度“绕道”支撑第三方 Agent 的通道。这一动作对 OpenClaw 形成了“降维打击”——想要用 Claude 做核心大脑,必须走按用量计费的 API,这在成本上直接击穿了 OpenClaw 免费生态的经济模型。
从 OpenRouter 的使用数据来看,OpenClaw 虽然仍然是体量最大的 Agent 框架,但已经从 3 月底的峰值开始回落。
1.2 用户选它的真实理由
OpenClaw 的核心用户画像有两类:一类是喜欢“动手养虾”的极客开发者,他们享受配置和定制的过程,对 Agent 的每一个行为都有高度控制欲;另一类是依赖社区技能生态的实用型用户,他们不需要自己造轮子,直接从社区拿来就用。
真实用户反馈中,被提及最多的优点是“生态成熟”——你几乎可以在社区里找到任何你需要的技能。被提及最多的槽点是“配置太麻烦”——半夜两点还在调试 API Key、一次更新直接白屏、闲置时 Token 还在默默烧钱。
有用户在 Reddit 上分享了他的“叛逃”经历:“迁移到 Hermes Agent 就像丝滑换壳,不但没翻车,体验还直线飙升。”评论区瞬间变成大型“龙虾”吐槽大会。但也有用户指出,OpenClaw 的成熟度仍然是 Hermes 短期内难以超越的——“Hermes 还在快速迭代,有时一个版本发出来就跑不起来。”
1.3 架构路线的根本差异
OpenClaw 和 Hermes Agent 的表面特性高度重合——都是 MIT 协议、都支持多 IM 平台、都兼容多模型——但底层设计哲学有着本质区别。
OpenClaw 是“网关”架构。它的核心是把模型和业务连接起来,做好路由和协调。在这种架构里,Agent 的智能主要来自外部配置和技能市场,模型的角色更像是“执行器”。
Hermes Agent 是“引擎”架构。它的核心是把智能内化到模型本身——通过 Atropos 系统,Agent 运行产生的轨迹数据反哺到 Hermes 模型的训练中,形成一个“用得越多越聪明”的闭环。用户给目标 → Agent 写 Skill → Agent 用 Skill → Agent 改 Skill,整个过程几乎不需要人工介入。
用更直白的话说:OpenClaw 需要你去“养”,你给它喂什么它就吃什么;Hermes 会自己“长大”,你只需要给它目标和方向。
但在现实中,这种差异带来的用户体验是复杂的。有用户发现 Hermes 的“自我改进”是通过 AI 自己评估任务结果实现的,评估的质量直接决定了进化的质量。另一位用户在安全领域测试时发现,Hermes 在积累相关知识后准确度确实在提高,但“Hermes 的記憶問題”——记忆的长期稳定性仍然是一个需要持续优化的挑战。还有用户警告:Copilot 渠道里的某些模型在长任务处理中存在严重的幻觉问题,建议不要把它们当成“指挥官”来用。
2. Claude Code:大厂标准的“天花板”
2.1 它活成了什么样?
Claude Code 是 Anthropic 在 2024 年初推出的 CLI 编码 Agent,代表了闭源大厂在 Agent 赛道上的最高技术水平。
它的核心优势在于模型能力本身。Claude 3.5/3.7/4 系列模型在代码理解、推理和工具调用上的表现长期位居行业前列。根据 Anthropic 2026 年的白皮书数据,Claude Code 在 SWE-bench 上的解决率达到 80.9%,并拥有 20 万 token 的上下文窗口。在开发者社区的评价中,“Claude Code 的代码质量最高”是一个被反复提及的判断。
Claude Code 的架构选择也很有特色。它是一款纯 CLI 工具,专注于终端环境中的代码操作,不依赖任何图形界面。这种“小而精”的定位让它在一众 AI 编码工具中独树一帜。
但 Claude Code 的局限性同样明显。它是“云优先”的——所有计算都在 Anthropic 的服务器上完成,用户的数据必须经过云端。这对重视数据隐私的企业用户来说是一个不可忽视的顾虑。此外,它的定价策略也让部分开发者望而却步——按 API 用量计费,对于高频使用者来说成本不菲。
2026 年 4 月,Anthropic 推出了 Managed Agents,进一步强化了云端托管、沙箱隔离的能力。这一产品在架构层面对 OpenClaw 和 Hermes 等第三方框架形成了降维打击——当 AI 本身成为操作系统,工具成为外设,传统的“Harness”模式就变得冗余。
2.2 用户选它的真实理由
Claude Code 的用户主要是专业软件工程师和大型企业的开发团队。他们的核心诉求是“完成复杂任务”而非“玩 Agent”。一位开发者的评论很有代表性:“Claude Code 是最佳代码理解能力,终端原生循环。监控和研究?Hermes 更好——24/7 运行,在 Telegram 上给你发消息。”
在 Reddit 的每一场“Hermes Agent vs Claude Code”讨论中,最终都会陷入同一个僵局:两种工具服务于不同的场景和需求,很难简单地分出优劣。
被提及最多的优点是“代码理解能力强”和“1M 上下文窗口”。被提及最多的槽点是“成本高”和“云依赖”——有分析指出 Claude Code 虽然 token 效率是 Cursor 的 5.5 倍,但 API 定价使得长期使用的总成本仍然不低。
3. Manus AI:商业化的“先遣军”
3.1 它活成了什么样?
Manus AI 是 2025 年 AI Agent 商业化浪潮中最具代表性的产品之一。由新加坡公司蝴蝶效应开发,Manus 是一个云原生的通用自主 Agent,采用多 Agent 架构,底层由 Claude 3.5/3.7 和阿里的 Qwen 模型驱动。
Manus 的叙事核心是“一个目标,全自动完成”。用户只需提供一个高层目标,Manus 就能自动分解任务、浏览网页、在安全沙箱中执行代码,最后交付一个完整的产出——比如一份研究报告或一个可运行的 Web 应用。这种“零配置、全自动”的体验在 Demo 阶段震撼了无数观众,Manus 的候补名单一度达到 200 万人。
2025 年 12 月,Meta 以约 20 亿美元的价格收购了 Manus 的母公司蝴蝶效应,这是 Meta 成立以来规模第三大的并购案。收购后,Manus 保持独立运营,同时也被整合到 Meta 的消费级和企业级产品中。
Manus 的商业化路径代表了 Agent 赛道中“闭源+云托管”的模式。这种模式的优势是用户体验一致、无需本地部署、数据由厂商托管;劣势是用户对数据和执行过程的控制权几乎为零。
3.2 用户选它的真实理由
Manus 的用户是那些“不想碰技术”的普通用户和需要快速验证 AI 能力的企业。你不需要懂 Python、不需要配置服务器、不需要管理 API Key,只需要会用自然语言描述你的目标。
但用户反馈中也存在明显的“开盲盒”问题。在一次任务执行过程中,你很难干预 Agent 的决策,也无法完全了解它每一步做了什么。对于需要精确控制的场景,Manus 的“黑箱”属性是一个痛点。有评论将 Manus 定位为“探索型 Agent”——适合做你不确定怎么做的事情;而 Hermes 这类开源框架则更适合“交付型”的确定性任务。
3.3 对 Hermes 的启示
Manus 的收购事件对整个 Agent 赛道产生了深远影响。它证明了两件事:第一,通用自主 Agent 是一个有巨大商业价值的赛道;第二,即使你的产品是开源的(Manus 是闭源但底层用了开源模型),巨头仍然愿意以数十亿美元的价格收购你的团队和技术。
对 Hermes 而言,Manus 的路径提供了一个“可能的结果”,但也是一个“难以复制的路径”。Manus 的团队从 2023 年开始就专注于打造一个完整的商业产品,而 Hermes 至今仍然是一个以开源项目形式存在的 Agent 框架。如果 Nous Research 无法在商业化上找到有效路径,Hermes Agent 可能会永远停留在“开发者玩具”的阶段,无法像 Manus 一样完成向企业级市场的跨越。
4. LangGraph:多 Agent 编排的“架构师”
4.1 它活成了什么样?
LangGraph 是 LangChain 团队推出的多 Agent 编排框架,代表了与 Hermes 截然不同的 Agent 架构思路。
LangGraph 的核心设计理念是“图结构”的任务编排。开发者可以将一个复杂的任务拆解成多个节点,每个节点由不同的 Agent 或工具执行,节点之间通过有向边连接,形成完整的工作流。这种架构的优势是高度的可控性和可观测性——你可以清楚地知道任务的每一步是谁在执行、执行的结果是什么、下一步应该去哪个节点。
相比之下,Hermes 的设计更接近“单一超级 Agent”的范式——一个 Agent 试图包揽所有事情,工具全局共享,每次执行的结果具有一定的概率性。
有评论指出这种架构差异的深层含义:“超级 Agent 在进化,但进化方向是‘让一个 Agent 越来越强’。问题是,一个人再强也比不过一个团队。让一群 Agent 各管各的事——每个 Agent 提示词聚焦、工具精简、反复任务又快又稳——可能才是正确方向。”
4.2 两种架构路线的较量
LangGraph 和 Hermes 代表了 Agent 架构的两种不同哲学。LangGraph 选择“拆”——把复杂任务拆成多个简单任务,交给专门的 Agent 处理。Hermes 选择“融”——通过自进化和记忆机制,让一个 Agent 变得越来越聪明,能够处理越来越复杂的任务。
在当前的行业讨论中,这两种路线都在吸引着各自的拥趸。但值得注意的是,Gartner 预测到 2026 年底,约 40% 的企业应用将集成任务型 AI Agent,远超 2025 年不到 5% 的水平。在企业级场景中,LangGraph 的“可控性”和“可观测性”可能比 Hermes 的“自进化”更具吸引力——因为企业需要知道 Agent 的每一步决策是如何做出的,而 Hermes 的自进化过程恰恰是一个“黑箱”。
三、横纵交汇:在时间与空间的交叉点上看 Hermes Agent
1. 三条叙事线的交汇
Hermes Agent 的历史叙事可以被概括为三条线索的交织:技术驱动线(Nous Research 从开源模型到 Agent 框架的演进)、市场机会线(OpenClaw 疲态与用户迁移需求)、以及争议与合规线(抄袭指控与开源伦理困境)。
在 2026 年 4 月的这个时间点,这三条线正在以完全不同的方式影响 Hermes Agent 的未来走向。
技术驱动线是 Hermes Agent 最坚实的基石。Nous Research 在 Hermes 系列模型上的长期积累——从 Hermes 2 Pro 的 90% 函数调用准确率,到 Hermes 3 的合成数据训练,再到 Hermes 4 的混合推理和 DataForge——构成了 Hermes Agent 的核心竞争力。Atropos 系统将 Agent 运行轨迹反哺到模型训练中,在开源 Agent 框架中是独一无二的。这条线的推力是稳定且正向的,只要 Nous 继续在模型和框架两条线同时投入,Hermes Agent 的技术领先优势就不容易被撼动。
市场机会线是 Hermes Agent 短期爆发的核心驱动力,但也正是这条线最不确定。OpenClaw 的疲态——架构复杂度、安全风险、成本压力——给了 Hermes 切入市场的空间。但 OpenClaw 并非束手待毙,它的技能生态、社区规模和产品成熟度仍然是 Hermes 短期内难以超越的。更重要的是,Anthropic Managed Agents 的入局正在重新定义“Agent 的形态”,这种“云原生 Agent”是否会让本地部署的开源框架整体贬值,是一个值得警惕的问题。一个来自开发者社区的观察很能说明问题:“每次新产品出现时总会出现类似的情况”——技术炒作周期中,热度本身并不等于长期价值。
争议与合规线是这三条线中唯一一个对 Hermes Agent 产生负面影响的因素。抄袭指控已经超越了简单的“代码复用”争议,触及了开源社区最敏感的神经——当 MIT 协议下的创新被商业化项目吸收而不做任何标注,当影响力差异悬殊的项目之间出现高度相似的功能实现,社区如何判断“创新”与“抄袭”的边界?更重要的是,EvoMap 已经将核心模块改为混淆发布,协议变更为 GPL-3.0。如果更多原创者因为担心“被抄”而选择闭源,整个开源生态将遭受不可逆的损伤。Hermes Agent 作为这个争议中的受益方,其品牌的长期信誉已经受到了质疑。
2. 生态位分析:填补了什么空白,跟谁正面竞争?
在整个 Agent 赛道的版图中,Hermes Agent 占据的是一个“中间地带”的位置。
在 开源 vs 闭源 的维度上,Hermes 是开源的(MIT 协议),但它背后的公司 Nous Research 有 10 亿美元估值和 5000 万美元以上的融资,这不是一个普通“社区项目”的体量。这使它既不同于纯粹的开源社区项目,也不同于 Anthropic、OpenAI 的闭源商业产品。它填补的是“有商业资源支撑的开源 Agent 框架”这个空白。
在 配置驱动 vs 学习驱动 的维度上,Hermes 是学习驱动的——自进化、记忆、自动提炼 Skill 是它的核心卖点。这使它区别于 OpenClaw 的“网关”模式,也区别于 LangGraph 的“编排”模式。它填补的是“主动成长的 Agent 伴侣”这个空白。
在 消费级 vs 企业级 的维度上,Hermes 目前更偏向消费级开发者——它的用户以个人开发者和技术爱好者为主,GitHub 上 8.5 万星标主要来自这个群体。但 MiniMax 基于 Hermes Agent 推出的 MaxHermes,以及阿里云、腾讯云的一键部署方案,表明企业级市场正在关注它。它正处于从“开发者玩具”向“企业级工具”跨越的关键节点。
Hermes 目前正面竞争的主要对手是 OpenClaw——在开源 Agent 框架的赛道上,二者正在争夺“第一框架”的位置。但在更广义的 Agent 赛道上,它的竞品还包括 Claude Code(编码 Agent)、Manus(通用 Agent)、LangGraph(编排框架)等,这些产品虽然定位不同,但都在争夺开发者注意力和用户使用时长。在这个意义上,Hermes 面临的是“多方围剿”而非“单一对手”的竞争格局。
3. 机会与风险的平衡
机会
最大的机会来自 Agent 赛道的结构性增长。Gartner 预测到 2026 年底约 40% 的企业应用将集成任务型 AI Agent,而 2025 年这一比例不到 5%。这意味着 Agent 市场正处于从“早期采用者”到“早期主流”的跨越阶段。在这个窗口期,占据用户心智的产品有巨大的先发优势。Hermes 已经在开源社区建立了较强的影响力,接下来需要做的是把这种影响力转化为企业级的实际应用。
第二个机会来自 MCP 等标准化协议的普及与反思。2025 年 MCP 协议爆发式增长后,2026 年出现了“MCP 是理想,Skill 是现实”的论调。一份 2026 年的质量报告显示,44% 的 MCP Server 没有通过基本质量检查,约一半的 MCP 创业公司已经“弃船”。Hermes 采用的 Skills 机制——以 Markdown 文件形式存储的可复用能力——提供了一种比 MCP 更轻量、更务实的替代方案。这使 Hermes 在“标准化协议过热、实际可用性不足”的市场环境中占据了差异化优势。
第三个机会是“自进化”叙事的稀缺性。在“智能体生态元年”的大背景下,市面上绝大多数 Agent 框架要么是配置驱动的(如 OpenClaw),要么是编排驱动的(如 LangGraph),真正实现“在运行中学习、在学习中进化”的产品屈指可数。Hermes 在这个维度上的差异化是真实的、可验证的,这使它在一众 Agent 产品中拥有了独特的品牌认知。
风险
最大的风险来自抄袭指控的后续发酵。在开源社区,“信任”一旦受损,很难在短时间内修复。如果更多证据被披露,或者更多开发者发现 Hermes 的代码与其他开源项目存在高度相似之处,GitHub 上的星标增长可能会逆转。更深远的影响是,这一事件可能会成为开源社区对“AI 辅助编程时代原创性保护”问题的一次集体觉醒——如果这种觉醒导向对 Hermes 的抵制,其长期影响将难以估量。
第二个风险是商业模式的不确定性。Hermes Agent 是 MIT 协议的开源项目,任何人都可以免费使用、修改、商用。MiniMax 推出 MaxHermes 的案例说明,商业实体可以快速捕获 Hermes 的技术价值并打包成自己的产品。如果 Nous Research 不能找到有效的商业化路径——无论是通过托管服务、企业版、还是代币激励——那么“10 亿美元估值”和“免费开源项目”之间的张力将越来越大。结合 2025 年 4 月完成的 5000 万美元 A 轮融资,VC 的回报预期与开源项目的免费属性之间天然存在矛盾,这种矛盾在某个时间点必须被解决。
第三个风险是巨头入局带来的“升维打击” 。Anthropic 的 Managed Agents 已经展示了“云原生 Agent”的新范式。如果 OpenAI、Google 也推出类似的云端托管 Agent 服务,并且以低于本地部署的综合成本提供服务,那么 Hermes 这类需要用户自己部署、管理 API Key 的开源框架将面临巨大的竞争压力。用户选择开源框架的核心理由是“自由和控制权”,但如果商业产品的自由度和控制权足够高,而使用成本却更低,这个理由就会失效。
4. 走向判断
基于以上分析,我对 Hermes Agent 的走向判断如下:
短期(3-6 个月) :热度将持续,但增速将放缓。微信接入、腾讯云和阿里云的一键部署方案会持续带来新用户。但抄袭争议的不确定性会影响部分用户的选择,尤其是注重开源伦理的开发者群体。v0.6.0 之后的产品迭代速度将是决定社区留存率的关键。
中期(6-18 个月) :将面临“商业化 vs 开源”的范式选择。如果 Nous Research 能推出可持续的商业模式——例如托管版 Hermes(类似 Anthropic Managed Agents 的形态)、企业级部署方案、或者通过 Psyche 网络实现算力激励——Hermes 有望从“开发者玩具”跨越到“企业级工具”。如果商业化尝试失败,Hermes 可能会像许多优秀的开源项目一样,停留在“社区项目”的阶段,被商业产品边缘化。
长期(18 个月以上) :Agent 赛道的终局形态尚未可知。如果“单一超级 Agent”被证明是正确的方向,Hermes 有潜力成为这个方向的代表性产品。但如果“多 Agent 矩阵”或“云原生 Agent”成为主流,Hermes 可能需要经历一次重大的架构调整。
横纵分析最终指向一个核心判断:Hermes Agent 的技术基础扎实,产品定位独特,市场窗口期良好,但其长期命运取决于两个外部变量和一个内部决策——外部变量是巨头入局的节奏和抄袭争议的演变,内部决策是 Nous Research 能否在“开源理想”和“商业现实”之间找到一个可持续的平衡点。
对于一个刚上线两个月的开源项目来说,8.5 万颗 GitHub 星标是一个了不起的成就。但星标不等于收入,热度不等于信任,增长不等于成功。Hermes Agent 的故事才刚刚开始,而接下来的几章,将比前几章更具挑战性。


