大多数 AI 工具在比"谁的功能多"。这个项目反着来——把行业研究拆成一条可执行、可检查、可沉淀的流水线,让 Agent 在 Cursor + Skills 里就能稳定产出,而不是再搭一套系统。
上周把 search-agent 推到 GitHub 上,一个朋友看了 README 问我:"你这也没多少功能啊,就几个 Skill 文件?"
我说对,这就是重点。
这个项目的价值不在功能多,而在它证明了:你不需要再搭一套系统,用现有的工具就能让 Agent 稳定产出行业研究报告。
1. 大多数 AI 工具在解决"错误的问题"
现在做 AI Agent 工具的主流思路是什么?
搭一个平台。前端、后端、数据库、工作流引擎、权限系统、SaaS 订阅。然后往里面塞功能——搜索、阅读、总结、报告、协作、导出、定时任务。
看起来很完整。但问题在哪?
你花了三个月搭平台,用户真正需要的只是"给我一份存储行业深度报告"。
而且更致命的是——平台搭完,Agent 产出的质量并不比直接用 Cursor + 几个 Skill 文件高。因为质量不取决于平台功能多少,取决于研究流程本身的设计。
这就是 search-agent 跟其他工具的根本区别。
2. 核心设计:把研究拆成一条流水线
search-agent 的架构极其简单——一条 6 步流水线,每一步只做一件事:
用户提需求
↓
Planner(规划:生成 Workflow YAML)
↓
Search(发现来源:不读正文,只列清单)
↓
Read(提取内容:文件 + kimi-webbridge 读网页)
↓
Summarize(综合摘要 + 交叉验证)
↓
Evaluate(质量门控:信息够不够?)
↓ ↓
不够 够了
↓ ↓
Planner 补规划 Report(输出最终报告)每一步的职责边界极其清晰:
- Planner 只规划,不执行——输出一个 YAML 文件
- Search 只发现,不读正文——输出来源清单
- Read 只提取,不分析——输出原始笔记
- Summarize 只综合,不搜索——输出结构化摘要
- Evaluate 只判断,不写作——输出"够"或"不够"
- Report 只写作,不采集——基于摘要输出最终报告
每一步的输入和输出都是文件。这意味着你可以在任何一步停下来,人工检查、修改、补充,然后继续。
这不是"功能少",这是刻意为之的约束。
3. 为什么"文件优先"比"平台化"更靠谱
大多数 AI 工具把中间过程藏在数据库里。你看不到 Planner 生成了什么规划,看不到 Search 找到了哪些来源,看不到 Summarize 的摘要质量如何。
出了问题你只能猜——是搜索不够全?是阅读不够深?是总结不够准?
search-agent 的做法是File First:
| 阶段 | 输出文件 | 你可以做什么 |
|---|---|---|
| Planner | tasks/running/{id}.workflow.yaml | 打开看规划是否合理,手动改 |
| Search | knowledge/references/{id}-sources.yaml | 检查来源质量,删掉不靠谱的 |
| Read | knowledge/raw/{date}-{source}.md | 看原始提取是否完整 |
| Summarize | knowledge/summaries/{id}-synthesis.md | 验证摘要是否准确 |
| Report | reports/{date}-{slug}.md | 最终报告,直接可用 |
所有中间产物都是 Markdown 或 YAML,可 grep、可 diff、可人工编辑。
这意味着什么?
你不需要信任 Agent。你可以验证 Agent。
这是 AI 工具从"黑箱"到"白箱"的关键一步。大多数工具在让你"相信 AI",这个项目在让你"检查 AI"。
4. Evaluate 闭环:AI 工具最被低估的能力
search-agent 里有一个其他工具几乎不做的东西:Evaluate(质量门控)。
Summarize 完成后,Evaluate 会判断:信息够不够写报告?
- 够了→ 进入 Report,输出最终报告
- 不够→ 回到 Planner,根据 gaps 补充规划,再跑一轮 Search → Read → Summarize
最多 3 轮。
这个设计解决了一个非常实际的问题:AI 研究经常在第一轮就"觉得够了",但实际上漏掉了关键信息。
举个例子:研究存储行业竞争格局。第一轮搜索可能找到了三星、海力士、美光的数据,但漏掉了长江存储。Evaluate 发现"中国企业数据缺失"→ replan → 第二轮补上长江存储 → 报告才完整。
这不是"多一个功能",这是把"研究质量"从靠运气变成了靠机制。
5. Domain Lens:不写死路由,用"视角"注入
另一个有意思的设计是 Domain Lens。
大多数工具的做法是:加密行业写一套逻辑,竞品分析写一套逻辑,趋势分析写一套逻辑。代码越写越多,维护越来越重。
search-agent 的做法是:Pipeline 是通用的,Domain Lens 是注入的。
Planner 根据任务类型,决定注入哪些 Lens:
- 加密行业 → 注入
cryptoLens(代币经济、链上数据视角) - 竞品分析 → 注入
competitorLens(对比框架) - 趋势判断 → 注入
trendLens(阶段判定:萌芽/增长/爆发/成熟) - 商业机会 → 注入
opportunityLens(痛点/产品形态/窗口期)
Lens 只在Summarize 阶段应用,不单独跑流水线。
这意味着:加一个新行业,不需要写一套新系统,只需要写一个 Lens 文件。
6. 这套设计对创业者意味着什么
如果你在考虑用 AI 做内容、做研究、做分析,这个项目给你三个启发:
启发一:不要搭平台,先跑通流水线
大多数人的第一反应是"我要搭一个系统"。但系统搭完,流程还没跑通。
search-agent 的做法是反过来的:先用文件把流程跑通,跑稳了再考虑要不要包装成产品。
你现在就可以把它装到 Cursor 里用。不需要部署,不需要数据库,不需要注册。
启发二:把"质量"从人的经验变成流程的机制
没有 Evaluate 的研究流程,质量取决于"这次 Agent 运气好不好"。有了 Evaluate + replan,质量取决于"流程跑了几轮"。
可重复的质量,比偶尔的高质量更有商业价值。
启发三:File First 让你可以随时接管
AI 工具最大的风险不是你用不好,而是你失去了对过程的控制。File First 的设计让你在任何一步都能介入——检查、修改、补充、重跑。
这不是"AI 替代人",这是"AI 放大人的判断力"。
7. 这个项目不会"爆"
说实话,这个项目不会火。
它没有漂亮的 UI,没有一键生成,没有 SaaS 订阅。它只是一堆 Skill 文件和一个清晰的架构。
但它是那种你用了一次就回不去的工具。因为它解决的是真问题——不是"AI 能做什么",而是"AI 怎么稳定地做出高质量的东西"。
项目地址:https://github.com/owlteam990/search-agent
装到 Cursor 里就能用。README 里有完整说明。
你觉得 AI 工具应该追求"功能多"还是"流程稳"?在评论区聊聊。
下一篇预告:我用 search-agent 跑了一份存储行业深度报告,从规划到输出只用了 15 分钟。具体怎么跑的,下篇拆解。