展会资讯
我开源了一个行业研究工具集,但它的价值不在功能多
2026-07-04 21:37
我开源了一个行业研究工具集,但它的价值不在功能多

大多数 AI 工具在比"谁的功能多"。这个项目反着来——把行业研究拆成一条可执行、可检查、可沉淀的流水线,让 Agent 在 Cursor + Skills 里就能稳定产出,而不是再搭一套系统。


上周把 search-agent 推到 GitHub 上,一个朋友看了 README 问我:"你这也没多少功能啊,就几个 Skill 文件?"

我说对,这就是重点。

这个项目的价值不在功能多,而在它证明了:你不需要再搭一套系统,用现有的工具就能让 Agent 稳定产出行业研究报告。


1. 大多数 AI 工具在解决"错误的问题"

现在做 AI Agent 工具的主流思路是什么?

搭一个平台。前端、后端、数据库、工作流引擎、权限系统、SaaS 订阅。然后往里面塞功能——搜索、阅读、总结、报告、协作、导出、定时任务。

看起来很完整。但问题在哪?

你花了三个月搭平台,用户真正需要的只是"给我一份存储行业深度报告"。

而且更致命的是——平台搭完,Agent 产出的质量并不比直接用 Cursor + 几个 Skill 文件高。因为质量不取决于平台功能多少,取决于研究流程本身的设计。

这就是 search-agent 跟其他工具的根本区别。


2. 核心设计:把研究拆成一条流水线

search-agent 的架构极其简单——一条 6 步流水线,每一步只做一件事

用户提需求
 ↓
Planner(规划:生成 Workflow YAML)
 ↓
Search(发现来源:不读正文,只列清单)
 ↓
Read(提取内容:文件 + kimi-webbridge 读网页)
 ↓
Summarize(综合摘要 + 交叉验证)
 ↓
Evaluate(质量门控:信息够不够?)
 ↓ ↓
 不够 够了
 ↓ ↓
Planner 补规划 Report(输出最终报告)

每一步的职责边界极其清晰:

  • Planner 只规划,不执行——输出一个 YAML 文件
  • Search 只发现,不读正文——输出来源清单
  • Read 只提取,不分析——输出原始笔记
  • Summarize 只综合,不搜索——输出结构化摘要
  • Evaluate 只判断,不写作——输出"够"或"不够"
  • Report 只写作,不采集——基于摘要输出最终报告

每一步的输入和输出都是文件。这意味着你可以在任何一步停下来,人工检查、修改、补充,然后继续。

这不是"功能少",这是刻意为之的约束


3. 为什么"文件优先"比"平台化"更靠谱

大多数 AI 工具把中间过程藏在数据库里。你看不到 Planner 生成了什么规划,看不到 Search 找到了哪些来源,看不到 Summarize 的摘要质量如何。

出了问题你只能猜——是搜索不够全?是阅读不够深?是总结不够准?

search-agent 的做法是File First

阶段输出文件你可以做什么
Plannertasks/running/{id}.workflow.yaml打开看规划是否合理,手动改
Searchknowledge/references/{id}-sources.yaml检查来源质量,删掉不靠谱的
Readknowledge/raw/{date}-{source}.md看原始提取是否完整
Summarizeknowledge/summaries/{id}-synthesis.md验证摘要是否准确
Reportreports/{date}-{slug}.md最终报告,直接可用

所有中间产物都是 Markdown 或 YAML,可 grep、可 diff、可人工编辑。

这意味着什么?

你不需要信任 Agent。你可以验证 Agent。

这是 AI 工具从"黑箱"到"白箱"的关键一步。大多数工具在让你"相信 AI",这个项目在让你"检查 AI"。


4. Evaluate 闭环:AI 工具最被低估的能力

search-agent 里有一个其他工具几乎不做的东西:Evaluate(质量门控)

Summarize 完成后,Evaluate 会判断:信息够不够写报告?

  • 够了→ 进入 Report,输出最终报告
  • 不够→ 回到 Planner,根据 gaps 补充规划,再跑一轮 Search → Read → Summarize

最多 3 轮。

这个设计解决了一个非常实际的问题:AI 研究经常在第一轮就"觉得够了",但实际上漏掉了关键信息。

举个例子:研究存储行业竞争格局。第一轮搜索可能找到了三星、海力士、美光的数据,但漏掉了长江存储。Evaluate 发现"中国企业数据缺失"→ replan → 第二轮补上长江存储 → 报告才完整。

这不是"多一个功能",这是把"研究质量"从靠运气变成了靠机制。


5. Domain Lens:不写死路由,用"视角"注入

另一个有意思的设计是 Domain Lens。

大多数工具的做法是:加密行业写一套逻辑,竞品分析写一套逻辑,趋势分析写一套逻辑。代码越写越多,维护越来越重。

search-agent 的做法是:Pipeline 是通用的,Domain Lens 是注入的。

Planner 根据任务类型,决定注入哪些 Lens:

  • 加密行业 → 注入cryptoLens(代币经济、链上数据视角)
  • 竞品分析 → 注入competitorLens(对比框架)
  • 趋势判断 → 注入trendLens(阶段判定:萌芽/增长/爆发/成熟)
  • 商业机会 → 注入opportunityLens(痛点/产品形态/窗口期)

Lens 只在Summarize 阶段应用,不单独跑流水线。

这意味着:加一个新行业,不需要写一套新系统,只需要写一个 Lens 文件。


6. 这套设计对创业者意味着什么

如果你在考虑用 AI 做内容、做研究、做分析,这个项目给你三个启发:

启发一:不要搭平台,先跑通流水线

大多数人的第一反应是"我要搭一个系统"。但系统搭完,流程还没跑通。

search-agent 的做法是反过来的:先用文件把流程跑通,跑稳了再考虑要不要包装成产品。

你现在就可以把它装到 Cursor 里用。不需要部署,不需要数据库,不需要注册。

启发二:把"质量"从人的经验变成流程的机制

没有 Evaluate 的研究流程,质量取决于"这次 Agent 运气好不好"。有了 Evaluate + replan,质量取决于"流程跑了几轮"。

可重复的质量,比偶尔的高质量更有商业价值。

启发三:File First 让你可以随时接管

AI 工具最大的风险不是你用不好,而是你失去了对过程的控制。File First 的设计让你在任何一步都能介入——检查、修改、补充、重跑。

这不是"AI 替代人",这是"AI 放大人的判断力"。


7. 这个项目不会"爆"

说实话,这个项目不会火。

它没有漂亮的 UI,没有一键生成,没有 SaaS 订阅。它只是一堆 Skill 文件和一个清晰的架构。

但它是那种你用了一次就回不去的工具。因为它解决的是真问题——不是"AI 能做什么",而是"AI 怎么稳定地做出高质量的东西"。

项目地址:https://github.com/owlteam990/search-agent

装到 Cursor 里就能用。README 里有完整说明。


你觉得 AI 工具应该追求"功能多"还是"流程稳"?在评论区聊聊。

下一篇预告:我用 search-agent 跑了一份存储行业深度报告,从规划到输出只用了 15 分钟。具体怎么跑的,下篇拆解。

发表评论
0评