









过去一年,AI Agent 的发展速度远超所有人的预期。2024 年初我们还需要复杂的 Workflow 才能让模型完成多步骤任务,2025 年中用一个 while True 加一个超详细 Prompt 就能跑完整流程。
? 为什么以前要 Workflow?
早期的 GPT-4、Claude 3 有明显限制:
工具调用不稳定
上下文很小(128K)
推理深度不够
没有长期记忆
所以我们必须手动拆任务、设计节点、写跳转逻辑、维护状态机,一堆代码才能让它不跑偏。
? 为什么现在只需要一个 while 循环?
2025 的模型(Claude 3.7、GPT-4.5、o4-mini 等)进步太快:
上下文 1M+
工具调用准确率接近 95%
多步推理能做到 20+ 步
Prompt 理解能力暴涨
于是一个循环就够了:模型自己规划下一步、决定用什么工具、判断任务是否完成、自动纠错。框架不再「指挥模型」,模型本身就能当 Agent。
? 核心转变:Prompt + 模型 = Agent
以前: 开发者 → Workflow → 模型(框架是核心)
现在: 详细 Prompt → 模型 → 工具(模型是大脑)
Claude Code、Deep Research 等方法都指向一个趋势: 复杂 Agent = 强模型 + 超详细系统 Prompt + 简单循环。
? 让模型成为 Agent 的四个关键
超详细 Prompt 不再追求精简,而是像“操作手册”一样写到 5000 字,告诉模型怎么做、遇到问题怎么办。
Todo List 工具 强制模型先列计划再执行,让思维链外化,不跑偏。
子代理机制 主模型负责规划,子模型负责拆解任务、执行搜索或代码。
文件系统当长期记忆 笔记、分析、代码、结果都写入文件,不占上下文,还能长期运行任务。
? 一年总结:模型进化速度 >> 框架设计速度
2024 Q1:Workflow 是标准 2024 Q4:o4-mini 能深度推理 2025 Q1:Claude Code 证明 while 循环就够 2025 Q2:行业开始反思是否过度工程化
结论非常简单:
框架越复杂,越容易被下一代模型淘汰
Prompt 比代码更重要
模型越强,Agent 架构越简单
最终,我们发现:Agent 的本质不是框架,而是模型本身。框架只是辅助,模型才是大脑。
#claudecode #agent
? 为什么以前要 Workflow?
早期的 GPT-4、Claude 3 有明显限制:
工具调用不稳定
上下文很小(128K)
推理深度不够
没有长期记忆
所以我们必须手动拆任务、设计节点、写跳转逻辑、维护状态机,一堆代码才能让它不跑偏。
? 为什么现在只需要一个 while 循环?
2025 的模型(Claude 3.7、GPT-4.5、o4-mini 等)进步太快:
上下文 1M+
工具调用准确率接近 95%
多步推理能做到 20+ 步
Prompt 理解能力暴涨
于是一个循环就够了:模型自己规划下一步、决定用什么工具、判断任务是否完成、自动纠错。框架不再「指挥模型」,模型本身就能当 Agent。
? 核心转变:Prompt + 模型 = Agent
以前: 开发者 → Workflow → 模型(框架是核心)
现在: 详细 Prompt → 模型 → 工具(模型是大脑)
Claude Code、Deep Research 等方法都指向一个趋势: 复杂 Agent = 强模型 + 超详细系统 Prompt + 简单循环。
? 让模型成为 Agent 的四个关键
超详细 Prompt 不再追求精简,而是像“操作手册”一样写到 5000 字,告诉模型怎么做、遇到问题怎么办。
Todo List 工具 强制模型先列计划再执行,让思维链外化,不跑偏。
子代理机制 主模型负责规划,子模型负责拆解任务、执行搜索或代码。
文件系统当长期记忆 笔记、分析、代码、结果都写入文件,不占上下文,还能长期运行任务。
? 一年总结:模型进化速度 >> 框架设计速度
2024 Q1:Workflow 是标准 2024 Q4:o4-mini 能深度推理 2025 Q1:Claude Code 证明 while 循环就够 2025 Q2:行业开始反思是否过度工程化
结论非常简单:
框架越复杂,越容易被下一代模型淘汰
Prompt 比代码更重要
模型越强,Agent 架构越简单
最终,我们发现:Agent 的本质不是框架,而是模型本身。框架只是辅助,模型才是大脑。
#claudecode #agent


