我开源了一个行业研究工具集,但它的价值不在功能多_展会资讯_资讯

我开源了一个行业研究工具集,但它的价值不在功能多

2026-07-04 21:37

我开源了一个行业研究工具集,但它的价值不在功能多

大多数 AI 工具在比"谁的功能多"。这个项目反着来——把行业研究拆成一条可执行、可检查、可沉淀的流水线，让 Agent 在 Cursor + Skills 里就能稳定产出，而不是再搭一套系统。

上周把 search-agent 推到 GitHub 上，一个朋友看了 README 问我："你这也没多少功能啊，就几个 Skill 文件？"

我说对，这就是重点。

这个项目的价值不在功能多，而在它证明了：你不需要再搭一套系统，用现有的工具就能让 Agent 稳定产出行业研究报告。

1. 大多数 AI 工具在解决"错误的问题"

现在做 AI Agent 工具的主流思路是什么？

搭一个平台。前端、后端、数据库、工作流引擎、权限系统、SaaS 订阅。然后往里面塞功能——搜索、阅读、总结、报告、协作、导出、定时任务。

看起来很完整。但问题在哪？

你花了三个月搭平台，用户真正需要的只是"给我一份存储行业深度报告"。

而且更致命的是——平台搭完，Agent 产出的质量并不比直接用 Cursor + 几个 Skill 文件高。因为质量不取决于平台功能多少，取决于研究流程本身的设计。

这就是 search-agent 跟其他工具的根本区别。

2. 核心设计：把研究拆成一条流水线

search-agent 的架构极其简单——一条 6 步流水线，每一步只做一件事：

用户提需求
 ↓
Planner（规划：生成 Workflow YAML）
 ↓
Search（发现来源：不读正文，只列清单）
 ↓
Read（提取内容：文件 + kimi-webbridge 读网页）
 ↓
Summarize（综合摘要 + 交叉验证）
 ↓
Evaluate（质量门控：信息够不够？）
 ↓ ↓
 不够 够了
 ↓ ↓
Planner 补规划 Report（输出最终报告）

每一步的职责边界极其清晰：

Planner 只规划，不执行——输出一个 YAML 文件
Search 只发现，不读正文——输出来源清单
Read 只提取，不分析——输出原始笔记
Summarize 只综合，不搜索——输出结构化摘要
Evaluate 只判断，不写作——输出"够"或"不够"
Report 只写作，不采集——基于摘要输出最终报告

每一步的输入和输出都是文件。这意味着你可以在任何一步停下来，人工检查、修改、补充，然后继续。

这不是"功能少"，这是刻意为之的约束。

3. 为什么"文件优先"比"平台化"更靠谱

大多数 AI 工具把中间过程藏在数据库里。你看不到 Planner 生成了什么规划，看不到 Search 找到了哪些来源，看不到 Summarize 的摘要质量如何。

出了问题你只能猜——是搜索不够全？是阅读不够深？是总结不够准？

search-agent 的做法是File First：

阶段	输出文件	你可以做什么
Planner	`tasks/running/{id}.workflow.yaml`	打开看规划是否合理，手动改
Search	`knowledge/references/{id}-sources.yaml`	检查来源质量，删掉不靠谱的
Read	`knowledge/raw/{date}-{source}.md`	看原始提取是否完整
Summarize	`knowledge/summaries/{id}-synthesis.md`	验证摘要是否准确
Report	`reports/{date}-{slug}.md`	最终报告，直接可用

所有中间产物都是 Markdown 或 YAML，可 grep、可 diff、可人工编辑。

这意味着什么？

你不需要信任 Agent。你可以验证 Agent。

这是 AI 工具从"黑箱"到"白箱"的关键一步。大多数工具在让你"相信 AI"，这个项目在让你"检查 AI"。

4. Evaluate 闭环：AI 工具最被低估的能力

search-agent 里有一个其他工具几乎不做的东西：Evaluate（质量门控）。

Summarize 完成后，Evaluate 会判断：信息够不够写报告？

够了→ 进入 Report，输出最终报告
不够→ 回到 Planner，根据 gaps 补充规划，再跑一轮 Search → Read → Summarize

最多 3 轮。

这个设计解决了一个非常实际的问题：AI 研究经常在第一轮就"觉得够了"，但实际上漏掉了关键信息。

举个例子：研究存储行业竞争格局。第一轮搜索可能找到了三星、海力士、美光的数据，但漏掉了长江存储。Evaluate 发现"中国企业数据缺失"→ replan → 第二轮补上长江存储 → 报告才完整。

这不是"多一个功能"，这是把"研究质量"从靠运气变成了靠机制。

5. Domain Lens：不写死路由，用"视角"注入

另一个有意思的设计是 Domain Lens。

大多数工具的做法是：加密行业写一套逻辑，竞品分析写一套逻辑，趋势分析写一套逻辑。代码越写越多，维护越来越重。

search-agent 的做法是：Pipeline 是通用的，Domain Lens 是注入的。

Planner 根据任务类型，决定注入哪些 Lens：

加密行业 → 注入cryptoLens（代币经济、链上数据视角）
竞品分析 → 注入competitorLens（对比框架）
趋势判断 → 注入trendLens（阶段判定：萌芽/增长/爆发/成熟）
商业机会 → 注入opportunityLens（痛点/产品形态/窗口期）

Lens 只在Summarize 阶段应用，不单独跑流水线。

这意味着：加一个新行业，不需要写一套新系统，只需要写一个 Lens 文件。

6. 这套设计对创业者意味着什么

如果你在考虑用 AI 做内容、做研究、做分析，这个项目给你三个启发：

启发一：不要搭平台，先跑通流水线

大多数人的第一反应是"我要搭一个系统"。但系统搭完，流程还没跑通。

search-agent 的做法是反过来的：先用文件把流程跑通，跑稳了再考虑要不要包装成产品。

你现在就可以把它装到 Cursor 里用。不需要部署，不需要数据库，不需要注册。

启发二：把"质量"从人的经验变成流程的机制

没有 Evaluate 的研究流程，质量取决于"这次 Agent 运气好不好"。有了 Evaluate + replan，质量取决于"流程跑了几轮"。

可重复的质量，比偶尔的高质量更有商业价值。

启发三：File First 让你可以随时接管

AI 工具最大的风险不是你用不好，而是你失去了对过程的控制。File First 的设计让你在任何一步都能介入——检查、修改、补充、重跑。

这不是"AI 替代人"，这是"AI 放大人的判断力"。

7. 这个项目不会"爆"

说实话，这个项目不会火。

它没有漂亮的 UI，没有一键生成，没有 SaaS 订阅。它只是一堆 Skill 文件和一个清晰的架构。

但它是那种你用了一次就回不去的工具。因为它解决的是真问题——不是"AI 能做什么"，而是"AI 怎么稳定地做出高质量的东西"。

项目地址：https://github.com/owlteam990/search-agent

装到 Cursor 里就能用。README 里有完整说明。

你觉得 AI 工具应该追求"功能多"还是"流程稳"？在评论区聊聊。

下一篇预告：我用 search-agent 跑了一份存储行业深度报告，从规划到输出只用了 15 分钟。具体怎么跑的，下篇拆解。

打赏