
? 卷首语 @羊羊|有AI业务咨询相关请私信我的AI工作室「YHan_Studio」
当 Agent 框架的 GitHub Stars 从几千飙升到数万,当每个月都有新的革命性框架横空出世,我们真的需要另一篇「入门教程」吗?
我想我们真正需要的是一张能指导真实选型的技术地图。
这篇报告用 8000 字 + 20 张对比图表,深度解剖了三大主流 Agent 框架(DeerFlow、Hermes、everything-claude-code)的七大特性。我们不做概念科普,只谈架构权衡。不追逐 Stars 数字,只看技术创新的本质。
如果你正面临这些困境:
? 不知道该选 DeerFlow 的三层记忆,还是 Hermes 的闭环学习?
? 上下文 Token 成本居高不下,不知道如何优化?
? 想让 Agent 越用越聪明,但不知道自进化能力如何实现?
?️ 担心 Agent 的安全风险,不知道如何做好隔离?
希望这篇报告能为你省下数周的调研时间和数月的试错成本。
? 阅读指南
⏱️ 3 分钟速读版(适合决策者)
精读:研究概述 + 八、综合对比与选型建议 + 九、总结与展望
收获:快速了解三大框架定位,获得场景化选型建议
? 30 分钟深度版(适合架构师)
重点:一至五章(记忆系统、Skill 系统、上下文优化、子代理架构、自进化能力)
收获:理解核心技术创新,掌握架构设计权衡
? 完整学习版(适合技术专家)
通读全文 + 查阅参考文献 + 对照术语表
收获:建立完整的 Agent 框架知识体系,具备自主设计能力
? 必存工具箱
? 表 8.1 核心特性对比矩阵:一眼看懂三大框架优劣势
? 表 8.4 场景选型建议:6 大场景的最佳框架推荐
? 术语表:40+ 个关键术语速查手册
?️ 报告结构
Part 1 | 五大核心系统深度解剖
一、记忆系统:从“存储所有”到“智能筛选”的进化路径
二、Skill 系统:Instinct(本能)vs Skill(技能)的创新对决
三、上下文优化:Token 成本降低 70% 的卸载策略
四、子代理架构:零上下文成本的 RPC 式隔离方案
五、自进化能力:Agent 如何实现“越用越聪明”
Part 2 | 安全与生态
六、安全与权限控制:从 Docker 隔离到 AgentShield 扫描
七、多渠道接入:跨平台消息网关 vs IDE 深度集成
Part 3 | 选型决策框架
八、综合对比与选型建议:核心特性矩阵 + 场景化推荐
九、总结与展望:四大技术趋势 + 未来演进方向
附录 | 工具箱
参考文献:三大框架官方资源 + 技术依赖项目
术语表:40+ 个关键术语的权威解释
研究概述
本报告深入分析当前主流 Agent 框架的关键特性实现方案,涵盖记忆系统、Skill 管理、上下文优化、子代理架构、自进化能力、安全控制、多渠道接入七大核心模块。
重点分析对象:

*Stars 数据统计时间:2026 年 3 月
其他研究对象: TradingAgents、last30days-skill、Project N. O. M. A. D、MoneyPrinterV2
一、记忆系统(Memory System)
1.1 核心问题
记忆系统解决的是 Agent 如何在多轮对话、跨会话场景中保持“连续性”的问题。底层逻辑都是:
提取 → 将关键信息持久化到文件/数据库
检索 → 在下次对话时检索相关记忆
注入 → 将记忆作为“提示词”注入到上下文中
1.2 框架对比分析
DeerFlow:分层记忆架构
三层记忆架构:
短期记忆(Working Memory)
↓ 压缩/提取
中期记忆(Session Memory)
↓ 归档
长期记忆(Long-term Memory)
核心机制:
Working Memory:当前会话的活跃上下文,存储在内存中
Session Memory:会话级别的记忆,存储在文件系统(
~/.deerflow/memory/)Long-term Memory:跨会话的持久记忆,支持向量检索
技术实现:
使用 LangGraph 的 checkpoint 机制实现状态持久化
记忆文件采用 JSON 格式,支持增量更新
提供记忆评分机制,优先注入高分记忆
与 Sandbox 文件系统深度集成
Hermes Agent:闭环学习系统
三大记忆类型:

核心创新:Agent-curated Memory
用户对话 → Agent 自动判断"值得记住"的内容
↓
定期 Nudge(提醒)Agent 整理记忆
↓
写入 MEMORY.md 或创建 Skill
↓
下次对话时通过 FTS5 检索注入
关键机制:
Periodic Nudges:Agent 会主动提醒自己整理记忆
Honcho Dialectic Modeling:构建用户画像,理解“你是谁”
Cross-session Recall:通过 LLM 总结历史对话,实现跨会话回忆
everything-claude-code: Hook 驱动记忆
Hook 驱动的记忆系统:
SessionStart Hook
↓ 加载上下文
当前会话
↓ SessionEnd Hook
保存状态
↓ PreCompact Hook
压缩前保存
核心机制:
memory-persistence hooks:会话开始时自动加载上下文,会话结束时自动保存状态
strategic-compact hooks:在压缩前保存关键信息,提供“压缩建议”
evaluate-session hooks:从会话中提取模式,自动生成本能/技能
1.3 记忆系统横向对比

1.4 记忆系统优化建议
问题:记忆注入导致上下文膨胀
解决方案:
记忆排序 + Top-K 注入
DeerFlow:按评分排序,仅注入 Top 15
Hermes:按时间衰减 + 相关性排序
记忆压缩
使用 LLM 将多条记忆压缩为一条摘要
例如:将 10 条关于“用户偏好”的记忆压缩为“用户偏好:简洁、技术向、喜欢表格”
分层注入
高层记忆(用户画像)始终注入
中层记忆(近期对话)按需注入
底层记忆(细节)仅当检索命中时注入
二、Skill 系统(渐进式披露)
2.1 核心问题
Skill 系统解决的是 Agent 能力边界的扩展问题。核心挑战:
内置 Skill 多寡:决定 Agent 的“开箱即用”程度
渐进式披露:如何在不爆炸上下文的前提下提供丰富能力
Skill 创建门槛:用户能否轻松创建新 Skill
2.2 框架对比分析
DeerFlow: Skill + Tool 双层架构
架构设计:
Tool(原子能力)
↓ 组合
Skill(复合能力)
↓ 编排
Agent(任务执行)
核心特性:
内置 Skill:深度研究、代码生成、内容创作、数据分析
渐进式披露:初始只加载 Skill 元数据,调用时才加载完整定义
支持 MCP Server 扩展
支持 Python 函数定义和自然语言描述
Hermes Agent:自进化 Skill 系统
核心创新:自动 Skill 创建
复杂任务(>5步)
↓ 完成
Agent 判断:"这个流程值得复用"
↓
自动创建 Skill
↓
下次直接调用
Skill 生命周期:
创建 → 使用 → 改进 → 废弃
↑ ↓
└──── 学习循环 ←─────┘
关键机制:
自动创建规则:超过 5 步的任务完成后自动创建
Skill 改进:每次使用后评估效果,效果不佳时自动修改
Skills Hub:支持从社区导入 Skill,符合 agentskills.io 开放标准
everything-claude-code: Skill + Instinct 双层架构
核心创新:Instincts(本能系统)
这是 ECC 最独特的创新点,其他框架都没有类似概念。
Instincts 是介于“硬编码规则”和“动态学习”之间的中间层:
Rules(规则)→ 静态、不可变
↓
Instincts(本能)→ 可学习、可进化、有置信度
↓
Skills(技能)→ 显式调用、复杂流程
核心特性:
自动提取:从成功任务中自动提取模式,生成“本能”而非“技能”
置信度评分:每个本能有置信度分数(0-1),高置信度本能优先应用
进化机制:
/evolve命令:将多个本能聚类成技能/prune命令:删除过期的待定本能支持导入/导出(
/instinct-import、/instinct-export)
与 Hermes 自进化的对比:

关键差异:
Hermes 的 Skill 是“显式能力”,需要调用
ECC 的 Instinct 是“隐式直觉”,自动应用
内置能力:
136+ 个技能:覆盖编码标准、后端模式、前端模式、安全审查、TDD 工作流等
30 个专门子代理:planner、architect、tdd-guide、code-reviewer、security-reviewer 等
多语言规则:TypeScript、Python、Go、Swift、PHP、Java、Kotlin、Rust、C++、Perl
2.3 Skill 系统横向对比

2.4 Skill 系统优化建议
问题:Skill 过多导致选择困难
解决方案:
智能推荐:根据当前任务自动推荐相关 Skill
Skill 分组:按功能域分组(研究、编码、创作)
Skill 版本管理:支持多版本共存,用户可选择稳定版或最新版
三、上下文长度优化
3.1 核心问题
上下文长度是 Agent 的核心瓶颈。主要挑战:
Token 限制:模型有最大上下文限制
成本控制:Token 越多,成本越高
质量下降:上下文过长可能导致模型“遗忘”关键信息
3.2 框架对比分析
DeerFlow:多维度上下文管理
核心策略:
中间过程卸载:将中间结果写入 Sandbox 文件系统
渐进式 Skill 披露:初始只加载 Skill 元数据,调用时才加载完整定义
记忆排序 + Top-K:记忆按相关性排序,仅注入 Top 15 条记忆
自动压缩:使用 LLM 压缩历史对话,保留关键决策点
Hermes Agent:三层压缩策略

用户可控:
/compress:手动触发压缩/usage:查看当前上下文使用情况
everything-claude-code: Hook 驱动压缩
核心机制:
strategic-compact hooks:在压缩前保存关键信息,提供“压缩建议”
PreCompact Hook:压缩前保存状态,保护重要内容不被丢失
SessionEnd Hook:会话结束时自动保存状态
3.3 上下文优化横向对比

3.4 上下文优化建议
问题:压缩可能丢失关键信息
解决方案:
关键信息保护:用户明确要求的内容标记为“不可压缩”
分层压缩:高层信息不压缩,中层轻度压缩,底层深度压缩
可恢复设计:压缩后保留“指针”,用户可要求展开原始内容
四、子代理系统(Sub-Agent Architecture)
4.1 核心问题
子代理系统解决的是复杂任务的分解与并行执行问题。核心挑战:
任务拆解:如何将复杂任务分解为子任务
上下文隔离:子代理不应继承主代理的全部上下文
结果聚合:如何合并多个子代理的输出
4.2 框架对比分析
DeerFlow:编排式子代理
架构设计:
主 Agent(Orchestrator)
↓ 任务拆解
子 Agent 1 | 子 Agent 2 | 子 Agent 3
↓ ↓ ↓
执行 执行 执行
↓ ↓ ↓
└────────┴────────┘
↓
结果聚合
核心特性:
任务拆解:主 Agent 使用 LLM 分析任务,自动生成子任务列表
上下文隔离:每个子 Agent 独立上下文,只接收必要的任务信息
并行执行:无依赖的子任务并行执行,支持资源限制
Hermes Agent: RPC 式子代理
核心创新:零上下文成本
主 Agent
↓ RPC 调用
子 Agent(独立进程)
↓ 执行 Python 脚本
返回结果
关键机制:
RPC 调用:子 Agent 运行在独立进程,通过 RPC 协议通信
Python 脚本执行:子 Agent 可执行任意 Python 代码,多步流程压缩为单次返回
完全上下文隔离:主 Agent 不消耗子 Agent 的上下文
everything-claude-code:委托式子代理
30 个预定义专门代理:

语言覆盖: TypeScript、Python、Go、Java、Kotlin、Rust、C++、Swift、PHP、Perl(10 种语言)
多代理编排:PM2 + Multi-Commands
/pm2:PM2 服务生命周期管理/multi-plan:多代理任务分解/multi-execute:编排式多代理执行/multi-backend:后端多服务编排/multi-frontend:前端多服务编排
4.3 子代理系统横向对比

4.4 子代理系统优化建议
问题:子代理间通信成本
解决方案:
标准化消息格式:定义统一的子代理输出格式
结果缓存:相同子任务结果缓存,避免重复执行
动态调度:根据负载动态调整子代理数量,支持优先级队列
五、自进化能力(Self-Improvement)
5.1 核心思路
越来越聪明的本质是:
学习:从经验中提取知识
记忆:将知识持久化
应用:在下次使用时展示
5.2 框架对比分析
Hermes Agent:闭环学习系统
核心创新:目前最完善的自我进化 Agent
任务执行
↓
效果评估
↓
知识提取
↓
记忆/Skill 创建
↓
下次使用
↓
效果改进
关键机制:
自动 Skill 创建:超过 5 步的任务完成后自动创建
Skill 自改进:每次使用后评估效果,效果不佳时自动修改
用户画像深化:Honcho 建模持续学习用户偏好
everything-claude-code: Instinct 进化系统
核心创新:Instinct → Skill 进化路径
学习产物:
Instinct(本能):轻量、隐式、有置信度评分
Skill(技能):复杂、显式、可调用
进化机制:
/evolve:将多个本能聚类成技能/prune:删除过期的待定本能/instinct-import、/instinct-export:导入/导出本能
关键差异:
Hermes:学习产物是 Skill(显式能力)
ECC:学习产物是 Instinct(隐式直觉)→ Skill(复杂能力)
DeerFlow:手动进化
当前状态:
不支持自动 Skill 创建
用户需手动定义 Skill
记忆系统支持增量学习
5.3 自进化能力横向对比

5.4 自进化能力优化建议
问题:自动创建的 Skill 质量参差不齐
解决方案:
质量评估机制:新创建的 Skill 标记为“实验性”,使用多次后升级为“稳定”
用户审核:自动创建后通知用户,用户可选择保留/修改/删除
版本回滚:Skill 改进后效果变差时自动回滚
六、安全与权限控制
6.1 框架对比分析
DeerFlow: Sandbox 隔离
核心特性:
Docker 容器隔离
Kubernetes Pod 支持
本地执行模式
Provisioner 服务
Hermes:命令审批 + DM 配对
核心特性:
命令审批机制
DM 配对验证
容器隔离
everything-claude-code: AgentShield
核心特性:
1282 个安全测试
102 条安全规则
沙箱隔离
输入清理
CVE 检测
使用方式:/security-scan
6.2 安全系统横向对比

七、多渠道接入
7.1 框架对比分析
Hermes:跨平台消息网关
支持的平台: Telegram、Discord、Slack、WhatsApp、Signal、Email、CLI
核心特性:
一个网关进程支持所有平台
语音备忘录转录
跨平台对话连续性
Home Assistant 集成
DeerFlow: IM Channels
支持的平台: Telegram、Discord、Slack
核心特性:
自动启动
无需公网 IP
OAuth 支持
everything-claude-code: IDE 集成
支持的平台: Claude Code、Cursor、OpenCode、Codex CLI/App、Antigravity IDE
核心特性:
跨 IDE 兼容
包管理器自动检测(npm、pnpm、yarn、bun)
跨平台支持(Windows、macOS、Linux)
7.2 多渠道接入横向对比

八、综合对比与选型建议
8.1 核心特性对比矩阵

8.2 三大框架定位

8.3 核心创新点

8.4 场景选型建议

九、总结与展望
9.1 核心发现
Hermes Agent 是当前最先进的自进化 Agent
实现完整闭环学习的框架
Skill 自动创建 + 自改进 + 用户画像建模是核心创新
DeerFlow 是最完善的通用 Agent 框架
记忆系统分层设计合理
子代理编排能力强
Sandbox 隔离适合生产环境
everything-claude-code 是代码开发领域的标杆
Instinct(本能)系统是独特创新
136+ 技能 + 30 语言专家代理
AgentShield 安全扫描
9.2 技术趋势洞察
记忆系统走向“智能筛选”
从“存储所有”到“Agent 自主判断值得记住的内容”
Hermes 的 Agent-curated Memory 是标杆
Skill 系统走向“自进化 + 置信度”
从“手动定义”到“自动创建”
ECC 的 Instinct + 置信度评分是创新方向
上下文管理走向“分层卸载”
从“压缩”到“卸载到文件系统”
DeerFlow 的中间过程卸载是最佳实践
子代理走向“零上下文成本”
从“共享上下文”到“完全隔离”
Hermes 的 RPC 式子代理是创新点
9.3 未来方向
记忆系统
更智能的筛选机制
支持多模态记忆(图片、视频)
跨 Agent 记忆共享
Skill 系统
更低门槛的创建方式
社区生态更完善
支持 Skill 交易市场
上下文优化
更激进的卸载策略
支持增量式上下文
用户可控的压缩级别
子代理系统
更智能的任务拆解
支持动态扩缩容
跨框架子代理协作
参考文献
主要框架官方资源
DeerFlow (ByteDance)
GitHub 仓库:https://github.com/bytedance/deer-flow
官方文档:https://github.com/bytedance/deer-flow/blob/main/README.md
后端架构文档:https://github.com/bytedance/deer-flow/blob/main/backend/README.md
Hermes Agent (Nous Research)
GitHub 仓库:https://github.com/nousresearch/hermes-agent
官方网站:https://hermes-agent.nousresearch.com/
自进化系统:https://github.com/NousResearch/hermes-agent-self-evolution
社区资源:https://github.com/0xNyk/awesome-hermes-agent
everything-claude-code
GitHub 仓库:https://github.com/affaan-m/everything-claude-code
官方网站:https://ecc.tools
AGENTS 文档:https://github.com/affaan-m/everything-claude-code/blob/main/AGENTS.md
技术依赖与相关项目
LangChain & LangGraph
LangChain:https://github.com/langchain-ai/langchain
LangGraph:https://github.com/langchain-ai/langgraph
Skill 标准与生态
AgentSkills.io:https://agentskills.io
MCP (Model Context Protocol): Anthropic 提出的工具调用标准
其他参考项目
Honcho (用户建模):Hermes Agent 使用的用户画像系统
DSPy + GEPA:Hermes 自进化系统使用的优化框架
术语表
核心概念
Agent / 智能体
- 能够感知环境、自主决策并执行任务的 AI 系统。与传统 Chatbot 的区别在于具备工具调用能力和多步推理能力。
SuperAgent / 超级代理
- 能够编排多个子代理、管理长期记忆、执行长周期任务(分钟到小时级别)的高级 Agent 系统。
Harness / 运行时框架
- 为 Agent 提供运行环境的基础设施,包括工具调用、状态管理、安全隔离等核心能力。
记忆系统相关
FTS5 (Full-Text Search 5)
- SQLite 的全文检索扩展,支持高效的文本搜索和排序。Hermes Agent 使用 FTS5 存储和检索对话历史。
向量检索 (Vector Retrieval)
- 将文本转换为向量表示,通过计算向量相似度进行语义检索。常用于长期记忆的相关性匹配。
Agent-curated Memory
- 由 Agent 自主判断并筛选“值得记住”的内容,而非全量存储所有对话。Hermes Agent 的核心创新。
Honcho Dialectic Modeling
- Hermes Agent 使用的用户画像建模系统,通过对话持续学习用户偏好、工作风格和领域知识。
Skill 系统相关
Skill / 技能
- Agent 可调用的复合能力单元,通常包含多个步骤的工作流程。可以是预定义的或自动创建的。
Tool / 工具
- Agent 可调用的原子能力,如文件读写、网络请求、代码执行等。多个 Tool 可组合成 Skill。
Instinct / 本能
- everything-claude-code 提出的创新概念,介于“硬编码规则”和“显式技能”之间的中间层。具有置信度评分,可自动应用,无需显式调用。
渐进式披露 (Progressive Disclosure)
- 初始只加载 Skill 元数据(名称、描述),调用时才加载完整定义,以节省上下文空间。
MCP (Model Context Protocol)
- Anthropic 提出的工具调用标准协议,支持跨框架的工具共享和扩展。
上下文管理相关
Token
- 大语言模型处理文本的基本单位,通常一个 Token 约等于 0.75 个英文单词或 0.5 个中文字符。
上下文窗口 (Context Window)
- 模型一次能处理的最大 Token 数量。例如 GPT-4 的上下文窗口为 128k tokens。
上下文压缩 (Context Compression)
- 使用 LLM 将长文本压缩为摘要,保留关键信息的同时减少 Token 消耗。
上下文卸载 (Context Offloading)
- 将中间结果写入文件系统或数据库,而非保留在对话上下文中。DeerFlow 的核心策略。
子代理系统相关
RPC (Remote Procedure Call)
- 远程过程调用,允许程序调用另一个地址空间的程序。Hermes 使用 RPC 实现子 Agent 的完全上下文隔离。
编排式架构 (Orchestration Architecture)
- 主 Agent 负责任务拆解和结果聚合,子 Agent 负责执行。DeerFlow 采用此架构。
委托式架构 (Delegation Architecture)
- 主 Agent 将特定任务委托给专门代理处理。everything-claude-code 的 30 个预定义代理采用此模式。
安全与隔离相关
Sandbox / 沙箱
- 隔离的执行环境,限制程序对系统资源的访问。DeerFlow 使用 Docker 容器作为沙箱。
Docker 容器
- 轻量级的应用隔离技术,将应用及其依赖打包在独立的运行环境中。
Kubernetes (K8s)
- 容器编排平台,用于自动化部署、扩展和管理容器化应用。
AgentShield
- everything-claude-code 内置的安全扫描系统,包含 1282 个安全测试和 102 条安全规则。
CVE (Common Vulnerabilities and Exposures)
- 公开披露的网络安全漏洞标准命名系统。
自进化相关
闭环学习 (Closed-loop Learning)
- 任务执行 → 效果评估 → 知识提取 → 能力更新 → 下次应用的完整循环。Hermes Agent 的核心特性。
DSPy
- 用于优化 LLM 提示词和程序的框架,Hermes 自进化系统的技术基础之一。
GEPA (Genetic Evolution of Prompts and Agents)
- 遗传算法驱动的提示词和 Agent 进化系统。
其他技术术语
LangGraph
- LangChain 推出的多 Agent 编排框架,支持状态持久化和复杂工作流。DeerFlow 基于 LangGraph 构建。
Checkpoint 机制
- 定期保存程序状态的快照,支持恢复和回溯。LangGraph 使用 Checkpoint 实现状态持久化。
TDD (Test-Driven Development)
- 测试驱动开发,先编写测试用例,再实现功能代码的开发方法。
PM2
- Node.js 应用的进程管理器,支持多进程管理、负载均衡和自动重启。everything-claude-code 使用 PM2 进行多代理编排。
下篇见!
避免错过更多干货,点击下方卡片关注
希望本文能对你有所启发,欢迎关注~
也感谢你的点赞与分享:)
?关于我:
专注于 AI 产品落地的实践者,操盘过多个企业级 AI 应用从 0 到 1 的架构设计与迭代。
擅长在模型能力不确定的前提下,通过系统组件的合理编排,构建稳定、可维护、可解释的 AI 系统。
目前主要提供:
✔ 轻量级企业 AI 落地策略咨询
✔ AI 架构与方向评审
✔ 企业 AI 应用培训与支持
如果你正在思考 AI 如何真正为业务创造长期价值,欢迎交流。
? 合作相关,请添加工作室微信:YHan_Studio


