Hermes Agent:自我进化的 AI 代理
研究时间:2026年4月 | 所属领域:AI Agent 框架 | 研究对象类型:开源软件产品

一、一句话定义
Hermes Agent 是由 Nous Research 于 2026 年 2 月发布的开源 AI Agent 框架,其核心理念是「与你共同成长的 Agent」——通过内置的四阶段学习循环(观察-推理-行动-学习),让 Agent 在执行任务后自动提炼经验、生成可复用的技能,并在后续会话中持续优化,从而解决传统 AI Agent 「每次对话从零开始」的根本性缺陷。
二、纵向分析:从诞生到当下
2.1 起源:为什么是他们?
要理解 Hermes Agent 的独特气质,必须先了解它的缔造者 Nous Research。
这是一家极为特殊的 AI 实验室。四位创始人中,CEO Jeffrey Quesnelle 在创建 Nous 之前已在车载网络和自动驾驶领域深耕 11 年,后又在 Eden Network 担任首席工程师,精通密码学和 MEV(最大可提取价值)。CTO Teknium 是一位匿名开源 AI 研究员,从 2023 年起在 Discord 和 Twitter 上发布 Llama 微调模型,逐渐积累了一批追随者。另外两位联合创始人 Karan Malhotra 和 Shivani Mitra 分别来自加密经济学和增长运营背景。
这样的组合决定了 Nous Research 的 DNA:他们是「AI 研究者变成了加密原生者」,而非「加密创业者转向 AI」。这个顺序至关重要——前者意味着技术优先、安全优先、开源优先;后者往往意味着追逐热点、快速变现。
2023 年,Nous Research 正式注册。他们发布的 Hermes 模型系列基于 Llama 微调,累计下载量突破 5000 万。这个过程中,团队逐渐形成了一个核心信念:AI Agent 不应该只是「执行人类指令的工具」,而应该是「能够自我进化的学习系统」。
2026 年初,一个外部事件加速了这个信念的落地。当时最流行的 AI Agent 框架 OpenClaw 在 63 天内爆出了 138 个 CVE 漏洞,其中包括零点击 RCE 漏洞。开发者社区陷入恐慌,急需一个更安全、更可靠的替代方案。
2026 年 2 月 25 日,Jeffrey Quesnelle 在 Twitter 上发了一条推文:「Meet Hermes Agent, the open source agent that grows with you.」
2.2 诞生:第三代 AI 工程范式的宣言
Hermes Agent v0.1.0 的发布,伴随着一个颇具野心的概念:Harness Engineering(驾驭工程)。
大家通常总结 AI 工程的发展划分为三代:
这个框架的深意在于:人类不应该试图控制 AI 的每一个动作,而应该设计好边界条件,让 AI 在边界内自主探索、试错、进化。这是一种从「教 AI 做事」到「让 AI 自学做事」的范式转移。
v0.1.0 版本确立了三个核心架构:
四层记忆系统
Session Memory:当前对话的短期记忆 Periodic Prompts:周期性触发的系统提示 LLM Summary Memory:由 LLM 自动摘要的长期记忆 Skill System:可复用的程序化技能
自学习循环
任务完成后自动审查执行过程 将成功模式提炼为可复用的 Skills 技能随使用自动优化
技术基础
SQLite + FTS5 全文搜索引擎 跨会话连续性 自托管架构,数据本地存储
发布当天,这条推文获得了 557 个点赞。没人预料到,这个看似低调的开源项目将在接下来的 42 天内创造历史。
2.3 42 天冲刺:史上增长最快的 AI Agent 框架
从 2 月 25 日到 4 月 8 日,Hermes Agent 经历了堪称疯狂的「42 天冲刺」:
在这 42 天内:
发布了 8 个主要版本,平均每 5.25 天一个 合并了 500+ Pull Requests 汇聚了 242+ 贡献者 GitHub Stars 从 0 增长到 47,000
这是什么概念?LangChain 达到同样的 Stars 数量用了超过一年。CrewAI 用了八个月。Hermes Agent 只用了 42 天。

图:Hermes Agent 42 天 GitHub Stars 增长时间线
增长的背后,是社区对「学习优先」理念的强烈共鸣。在 Reddit 和 GitHub Issues 中,开发者们反复提及一个痛点:现有 Agent 框架都是「无状态」的——每次对话结束,一切归零。Hermes Agent 的「会学习、能记住」特性,恰好击中了靶心。
2.4 技术架构的三次跃迁
第一次跃迁:从静态到动态(v0.1.0 → v0.2.0)
v0.2.0 的核心是自进化功能的完整落地。具体实现是一个四阶段学习循环:
任务执行 → 结果评估 → 技能抽象 → 技能优化 ↑ │ └────────────────────────────┘执行阶段,Agent 以 ReAct 模式运行,所有轨迹被捕获为 JSONL 格式。任务结束后,进入自动反思阶段,评估成功或失败。如果成功,执行轨迹会被转换为 Markdown + YAML 格式的技能文档,存入 ~/.hermes/skills/。后续执行类似任务时,Agent 会优先加载相关技能,并根据成功率、执行时间等指标持续优化。

图:Hermes Agent 核心创新——四阶段自学习循环
第二次跃迁:从单点到网络(v0.4.0 → v0.8.0)
v0.4.0 引入了 Provider 回退机制和 16 个消息平台的支持。v0.8.0 更进一步,推出了 Web 仪表板、/fast 模式,以及 iMessage 和微信的原生支持。
这意味着 Hermes Agent 从「命令行工具」进化成了「无处不在的 AI 助手」——你可以通过 Telegram、Discord、Slack、WhatsApp、Signal,甚至是 iMessage 和微信与它交互。所有这些渠道的会话状态都是统一的,Agent 会记住你在 Telegram 上说过的话,当你切换到微信时,对话可以无缝继续。
第三次跃迁:从工具到生态(v0.10.0)
v0.10.0 发布了 Nous Tool Gateway,这是一个托管工具服务,付费订阅者可以自动获得搜索、图像生成、TTS、浏览器自动化等高级能力,无需自行配置 API 密钥。
这个举动标志着 Hermes Agent 开始探索开源商业模式:核心框架保持 MIT 许可证完全开源,高级托管服务收费。这与 GitHub 的模式类似——Git 是开源的,但 GitHub 的托管服务收费。
2.5 EvoMap 争议:开源社区的一次信任危机
在高速增长的背后,一场争议正在发酵。
2026 年 2 月 1 日,一个名为 EvoMap 的中国团队开源了 Evolver 引擎和 GEP(基因进化协议)。2 月 16 日,他们发布了完整的 GEP 架构文档,详细描述了一个 10 步进化循环和三层记忆系统。
2 月 25 日,Hermes Agent v0.1.0 发布。
3 月 9 日,Hermes 创建了一个独立的 self-evolution 仓库。3 月 12 日,v0.2.0 发布完整的自进化功能。
4 月,EvoMap 公开发表文章,指控 Hermes Agent 「结构性抄袭」他们的 Evolver 引擎。他们列出了 12 对核心术语的「系统性替换」:
EvoMap 指出,Hermes 的 10 步执行流程、三层记忆系统、核心概念与 Evolver 存在一一对应关系,且所有相似性都是在 2 月 25 日之后突然出现的。
Nous Research 两次公开否认,声称「从未听说过这个项目」。
这场争议没有法律裁决,却在开源社区引发了激烈讨论。支持者认为,技术理念的相似不等于抄袭,且 Hermes 的实现细节与 Evolver 有显著差异。质疑者则认为,时间线和概念映射的吻合度难以用巧合解释。
普通大众有时候不太关心是谁抄袭,比较关心到底谁好用,只看结果不看过程
无论真相如何,这场争议给 Hermes Agent 的增长蒙上了一层阴影。一些开发者开始观望,等待更多证据的出现。
2.6 融资:从草根开源到独角兽
2025 年 4 月,也就是 Hermes Agent 发布前大约 10 个月,Nous Research 宣布完成 5000 万美元 Series A 融资,由 Paradigm 领投,估值达到 10 亿美元。
这是这家公司的第三轮公开融资:
| 总计 | ~7000万美元 |
Paradigm 是加密领域最顶级的风投之一,曾投资 Coinbase、Uniswap、StarkWare 等头部项目。他们的入局,意味着 Nous Research 的「AI + 去中心化」叙事获得了主流资本的认可。
融资消息公布后,Fortune 杂志的一篇报道揭示了 Jeffrey Quesnelle 的野心:「我们要证明,去中心化的 AI 研发可以与 OpenAI 竞争。」
2.7 阶段划分:从萌芽到裂变
回顾 Hermes Agent 的发展历程,可以清晰地划分为三个阶段:
萌芽期(2023-2025):模型积累与团队成型
Nous Research 成立,发布 Hermes 模型系列 积累 5000 万+ 下载量,建立开源社区基础 核心创始团队磨合,形成「学习优先」的产品哲学
爆发期(2026.02-2026.04):42 天神话
v0.1.0 至 v0.10.0 的快速迭代 GitHub Stars 从 0 到 97,600 的历史性增长 242+ 贡献者的社区爆发 EvoMap 争议与信任危机
成熟期(2026.04-至今):商业化与生态建设
Nous Tool Gateway 开启商业化探索 从单点工具向平台生态转型 面临从「增长」到「留存」的新挑战
三、横向分析:竞争图谱
3.1 竞品全景:AI Agent 框架的五大门派
Hermes Agent 所处的赛道,是 AI Agent 框架的「战国时代」。按照技术路线和产品形态,可以将主要竞品划分为五大类:
1. 通用编排派:LangChain / LangGraph
最大的生态系统(1800+ 集成、600+ 连接器、100+ LLM 提供商) 强调完全控制力和灵活性 企业采用最广泛,但开发者口碑两极分化
2. 角色协作派:CrewAI
基于角色的多智能体设计(Manager、Researcher、Writer 等) 强调快速原型和业务流程自动化 原生支持 MCP 和 A2A 协议
3. 数据优先派:LlamaIndex
专注于 RAG(检索增强生成)和数据连接 顶级的文档解析和知识图谱能力 不是纯 Agent 框架,但在数据密集型场景无可替代
4. 自主探索派:AutoGPT / MetaGPT
AutoGPT:递归任务分解,自主探索行为,实验性导向 MetaGPT:SOP 驱动的软件开发自动化,模拟软件公司角色
5. 极简原生派:OpenAI Agents SDK
OpenAI 官方出品,极简抽象 基于「交接(Handoff)」的多 Agent 模型 零基础设施托管工具,快速上手
Hermes Agent 的差异化定位,是「学习优先派」——唯一将「自我改进」作为核心架构而非附加功能的框架。

图:AI Agent 框架市场竞争格局——五大门派
3.2 核心差异对比:六维雷达图
为了更直观地理解各框架的差异,我们可以从六个维度进行对比:
| 上手难度 | |||||
| 灵活性 | |||||
| 生态系统 | |||||
| 多 Agent 支持 | |||||
| 持久记忆 | |||||
| 自学习能力 | 核心优势 |
这个表格揭示了一个关键洞察:Hermes Agent 在「持久记忆」和「自学习能力」两个维度上形成了独特的护城河,但在「多 Agent 支持」和「生态系统」上明显弱于竞品。

图:Hermes Agent 与主要竞品的六维竞争力对比
3.3 用户口碑:Reddit 与 GitHub Issues 的真实声音
LangChain:从「行业标准」到「过度工程化」
2023 年,LangChain 是几乎所有 AI 应用开发者的首选。但到了 2025-2026 年,口碑发生了逆转。
Reddit 上的热门评论:
「LangChain 解决了你自己可以轻松完成的简单问题,但在设计和架构上没有太多思考来帮助你解决难题。」
HackerNews 上的吐槽:
「调试 LangChain 就像在一堆抽象层中挖隧道,你永远不知道问题出在哪一层。」
2025 年,LangChain 爆出了三个高危安全漏洞(路径遍历、反序列化泄露、SQLite 注入),而其每周 6000 万+ 的下载量意味着这些漏洞影响整个 AI 栈。Analytics India Magazine 甚至发表了标题为「LangChain 是垃圾软件」的文章。
CrewAI:黑盒问题与稳定性危机
CrewAI 是 2024-2025 年增长最快的 Agent 框架之一,但快速增长带来了稳定性问题。
GitHub Issues 中未解决的严重 bug:
用户在 Discord 上的抱怨:
「黑盒问题——无法看到发送给 LLM 的提示、完整推理轨迹或 Agent 为何做出特定决策。」
Reddit 用户的惨痛经历:
「添加一个『带特定指令的网页浏览』工具花了三天,仍然随机失败。最终完全放弃了该框架。」
MetaGPT:理想丰满,现实骨感
MetaGPT 的愿景很宏大——用 AI 模拟整个软件公司,自动生成 PRD、API 规范、设计文档。但现实很残酷。
RepoGenesis 基准测试显示:
仅 23.67% Pass@1 成功率 50.2% 跨文件一致性问题 26.0% 架构一致性问题
用户的实际体验:
生成一个 CRUD 应用需要 10+ 分钟,每次约 $3 Token 成本 依赖地狱(pydantic 与 llama-index 循环依赖) 生成的代码有 bug,非技术用户难以修复
OpenAI Agents SDK:简单,但有边界
作为官方出品,OpenAI Agents SDK 的优势是「极简」——4 行代码就能跑起一个 Agent。但这也带来了局限:
灵活性有限,深度定制困难 OpenAI 生态锁定,难以切换模型 错误处理需要 DIY
Hermes Agent:好评与槽点并存
正面反馈集中在:
「5 分钟安装」——持续受到赞扬 「比其他竞争对手更省 token」 「开箱即用,配置更好」 重复研究任务后 40% 速度提升
但批评也很尖锐:
「自评估不可靠——总是认为自己做得很好」 「自动学习会覆盖手动编辑的技能」 「与 OpenClaw 相比,集成较少(14 vs 22+)」 「本地模型性能问题(1-2 tokens/s vs 原生 45 tokens/s)」
3.4 生态位分析:Hermes Agent 的位置
在当前的市场格局中,Hermes Agent 占据了一个独特的生态位:
它填补了什么空白?
「有状态 AI 助手」的空白——现有框架都是「无状态」的,每次对话从零开始 「个人学习伙伴」的空白——不是面向团队协作,而是面向个人长期使用 「成本敏感场景」的空白——通过 Token 效率优化,典型 API 成本 $10-40/月
它在跟谁正面竞争?
与 OpenClaw 在「个人开发助手」场景直接竞争 与 Claude Code 在「长期项目协助」场景部分重叠 与 AutoGPT 在「自主探索型 Agent」场景有替代关系
它的边界在哪里?
不适合需要复杂多 Agent 协作的场景(CrewAI、LangGraph 更擅长) 不适合需要大量预置工具集成的场景(OpenClaw、LangChain 更丰富) 不适合企业级合规要求严格的场景(尚未获得 SOC2/HIPAA 认证)
3.5 竞争格局趋势:从「一统天下」到「分而治之」
2024-2025 年的 AI Agent 框架市场,呈现出明显的「分而治之」趋势:
专业化分工形成
LangChain:通用编排,但开发者开始流失 LlamaIndex:RAG 专业,无可替代 CrewAI:多 Agent 业务工作流,快速占领市场 Hermes Agent:学习优先单 Agent,差异化生存
MCP 协议成为共识
Model Context Protocol(模型上下文协议)由 Anthropic 提出,现已被所有主流框架接受 CrewAI 在 MCP + A2A 协议支持上领先 Hermes Agent 也在 v0.2.0+ 支持 MCP 客户端模式,v0.6.0+ 支持服务器模式
开发者体验成为关键差异化因素
复杂度成为主要痛点,「简洁、类型安全、易调试」成为新框架的卖点 PydanticAI、Vercel AI SDK 等新兴框架凭借更好的开发者体验获得关注
混合架构趋势
生产系统 increasingly 组合多个框架 例如:LangGraph 编排 + CrewAI 多 Agent 节点 + OpenAI SDK 路由 + Hermes Agent 学习模块
四、横纵交汇洞察
4.1 历史如何塑造了当下的竞争位置
Hermes Agent 今天在横向竞争中的独特位置,很大程度上是由其纵向发展历程中的几个关键决策决定的。
第一个关键决策:「有界记忆」架构
这个决策可以追溯到 Jeffrey Quesnelle 在车载网络领域的背景。在汽车电子系统中,资源是有限的,必须在约束条件下优化性能。这种思维方式被带到了 Hermes Agent 的设计中——不追求无限上下文窗口,而是设计「有界记忆」系统,迫使 Agent 学习什么重要、什么可以遗忘。
这个决策在今天的竞争格局中形成了独特优势:
Token 效率显著高于竞品 Agent 表现出更强的「注意力管理」能力 成本优势明显(典型 100+/月)
但也带来了局限:
复杂多步骤任务的上下文丢失风险 需要更频繁的「记忆整理」周期
第二个关键决策:「单 Agent 优先」
Hermes Agent 迄今为止的版本,核心架构都是围绕单 Agent 设计的。这与 CrewAI、LangGraph 的多 Agent 路线形成鲜明对比。
这个决策的根源在于 Nous Research 的「个人助手」产品哲学——他们想要构建的是一个「了解你的 AI 伙伴」,而不是一个「团队协调工具」。
这个决策在今天的竞争格局中的影响:
优势:在「长期个人助手」场景形成了体验优势 劣势:在企业级「多角色协作」场景难以与 CrewAI 竞争 机会:可能成为「个人 Agent」与「团队 Agent」之间的连接器
第三个关键决策:Web3 DNA
Nous Research 的加密背景,赋予了 Hermes Agent 一些独特的基因:
安全优先:权限隔离、沙箱执行、OSV 恶意软件检查 去中心化思维:支持本地模型、自托管、零遥测 开源文化:从 Discord 志愿者小组发展而来,社区驱动
这些基因在今天的竞争格局中的价值:
在 OpenClaw 安全危机后,「安全」成为差异化卖点 隐私敏感用户的首选(零遥测、本地存储) 开源社区的强认同感(242+ 贡献者)
4.2 竞品的纵向对比:它们为何走向不同的路
如果将主要竞品也放到时间线上,会发现它们的路径选择差异极大。
LangChain:从「瑞士军刀」到「过度工程化」
LangChain 诞生于 2022 年底,当时的核心诉求是「统一所有 LLM 的调用方式」。这个定位在早期极具价值——开发者不用再为每个模型写不同的适配代码。
但随着时间推移,LangChain 逐渐膨胀。1800+ 集成意味着 1800+ 个潜在的故障点。每一次版本更新都可能破坏现有代码。开发者开始意识到:「我只需要一把螺丝刀,但你给了我一个装满工具的仓库。」
今天的 LangChain 正在经历「减肥」——推出 LangGraph 作为更轻量的替代,强调「显式状态管理」而非「隐式魔法」。
CrewAI:从「快速原型」到「生产级危机」
CrewAI 诞生于 2023 年,核心创新是「角色(Role)抽象」——让开发者可以用产品经理、研究员、写手等角色来定义 Agent,而不是写复杂的提示词。
这个创新击中了痛点,带来了快速增长。但快速增长也带来了技术债务。今天的 CrewAI 面临着严重的稳定性问题——GitHub Issues 中大量未解决的内存泄漏、死锁、上下文溢出 bug。
CrewAI 的挑战在于:如何在保持「易用性」的同时,解决「可观测性」和「稳定性」问题。
OpenAI Agents SDK:从「封闭生态」到「开放接口」
OpenAI 在 2024 年推出了 Assistants API,但在 2025 年开源了 Agents SDK。这个转变本身就值得关注——连 OpenAI 都意识到,封闭的 Agent 生态难以赢得开发者。
但 OpenAI Agents SDK 仍然带有明显的「OpenAI 优先」烙印:最优体验需要 GPT-4o,切换其他模型会失去部分功能。这与 Hermes Agent 的「模型无关」哲学形成对比。
4.3 优势的历史根源:每个核心优势能追溯到哪个节点
4.4 劣势的历史根源:当初的「好决策」有没有变成今天的包袱
4.5 未来推演:三个剧本
基于纵向趋势和横向竞争格局,以下是 Hermes Agent 的三个可能剧本:
剧本一:最可能的——「专注者生存」
Hermes Agent 继续强化「学习优先」差异化定位,不试图与 CrewAI/LangChain 在「通用性」上竞争,而是成为「长期个人助手」场景的首选。
与多 Agent 框架形成互补而非竞争(例如:CrewAI 负责协调,Hermes Agent 负责执行具体任务并学习) 发展「agentskills.io」开放标准,让技能可以跨框架共享 通过 Nous Tool Gateway 实现可持续的商业化
概率:60%
剧本二:最危险的——「增长陷阱」
Hermes Agent 试图复制「42 天冲刺」的增长神话,过快扩张功能边界,导致:
技术债务累积,稳定性问题爆发 社区贡献者流失,维护负担过重(目前已有 ~1800 个开放 Issue) 与 EvoMap 争议的负面影响持续发酵 在「通用性」上竞争不过 LangChain/CrewAI,在「专业性」上又失去了焦点
概率:25%
剧本三:最乐观的——「范式定义者」
「Harness Engineering」被行业广泛接受,成为继 Prompt Engineering、Context Engineering 之后的第三代标准范式。Hermes Agent 凭借先发优势,成为这个范式的代名词。
其他框架开始模仿「学习循环」架构 「技能(Skill)」成为 Agent 能力的标准单位 Nous Research 完成 B 轮甚至 C 轮融资,成为 OpenAI 的去中心化替代品
概率:15%

图:基于纵向趋势与横向格局的未来推演
五、信息来源
声明:图中配图来自豆包、千问等模型生成。
最后,没上手的同学可以操练起来,别人说的再怎么好或者坏,都不如你亲自感受实在。
能看到这里的朋友,就高抬贵手 加关注、点赞 一下啦~~多谢~


