三月,年报发布季如期而至。对于投资者和分析师而言,这既是一场信息的盛宴,也是一场体力的考验。面对几百家上市公司、每份动辄几百页的PDF财报,我们常常感到力不从心。在之前的文章中,我们分享过利用RAG(检索增强生成)技术快速提取财报数据的方法。但很多读者反馈:“问简单问题还行,一旦涉及‘近5年趋势’这种跨文档的复杂问题,AI就开始胡言乱语了。”为什么?因为传统的AI像是一个只会“关键词匹配”的图书管理员。你问它“伊利股份近5年的营收变化”,它会在书海里疯狂匹配“近5年“这个词,结果当然找不到。于是,它只能凭概率瞎猜,或者只给你意思最接近的数据。输入的数据质量不佳,输出的结论自然也是“垃圾”。
今天,我们要引入一位真正的“分析师”——智能体(Agent)。我们将利用 Cherry Studio 搭配 阿里百炼,并赋予它两套工具(mutool 和 pdfgrep),教大家零代码搭建一个能像人类一样“拆解问题、精准定位”的财报分析助手。


从“单次对话”到“智能体规划”

在开始动手之前,我们需要先厘清一个关键概念:智能体(Agent)和我们平时用的普通对话机器人(Chatbot)到底有什么区别?简单来说,普通对话的路径是确定的,智能体的路径是动态的。
在基于RAG的普通对话中,是一个特定的流程:输入问题 -> 检索资料 -> 聚合输出。乍一看,蛮合理的。但是,对于稍微需要一点推理的,比如我们前面列出的“伊利股份近5年的营收变化”,它就懵逼了。最基础的智能体模式,叫ReAct,很简单,就是加了一个反馈循环。但是,可别小看这个反馈循环,它让大语言模型拥有了任务规划和分解能力,虽然简单,但让解决系统性的复杂问题成为了可能。

这就好比“问路”与“雇佣向导”的区别:
普通对话就像你问一个路人:“去火车站怎么走?”它基于记忆,直接给你一个大概的路线,当你发现路况变了,它已经走远了。
智能体就像雇佣一位司机或向导,你问:“去火车站怎么走?”它不会马上回答,而是先思考:“现在的路况如何?用户偏好地铁还是打车?然后它行动:调用地图API查路况、查询时刻表、对比价格。最后它规划:综合所有信息,给你制定一个包含“步行5分钟->乘坐地铁3号线->换乘1号线->出站”的详细分步指南。
最重要的是,当你遇到前方道路封堵,它会自动反馈并规划新的路线。

在财报分析中,这种区别尤为明显:
Chatbot试图一次性从海量文本中“猜”出近5年的趋势,结果往往是幻觉。
Agent则会将大问题拆解为6个子任务:“查2021年营收”、“查2022年营收”……直到“查2025年营收”,然后逐个执行,最后汇总分析。
人类的智慧不在于记忆力超群,而在于擅长将复杂任务拆解为可执行的简单步骤。 今天,我们就把这种智慧赋予AI。
A

实战演练:打造你的“财报挖掘机”

我们将通过 阿里百炼 构建大脑,通过 Cherry Studio 作为操作界面,并挂载两个关键工具,模拟人类分析师“先看目录,再翻书页”的过程。
准备“大脑” (阿里百炼)
登录阿里云百炼平台,申请Token。


接下来,把这个Token填入到CherryStudio中。这里有一点需要特别注意:默认的百炼是OpenAI接口,但智能体要求使用Anthropic接口,所以我们就不能使用Cherry Studio内置的百炼端点,幸好阿里百炼是两种接口都支持的,我们需要手动添加。

安装手脚:阅读PDF的两大工具
如果智能体是大脑,那它还需要一双能干的“手”去翻阅文件。人类分析师阅读几百页的财报时,有一套标准的肌肉记忆动作:
先看目录:快速定位“财务报表”或“主要数据”在第几章、第几页。
再按 Ctrl+F:在锁定的页面范围内,精准搜索关键词(如“营业总收入”),避免全文搜索带来的噪音。
为了让智能体具备这种能力,我们引入了两个轻量级但极其强大的命令行工具:mutool 和 pdfgrep。它们将分别赋予AI“看目录”和“精准搜索”的能力。
这两个工具都是开源免费的,安装非常简单。请根据你的操作系统选择对应方法:大部分Mac系统都安装了Brew,只需要 brew install mupdf 和 brew install pdfgrep 两条命令即可。Windows下略显繁琐,需要在官网下载,安装后可在cmd或powershell中分别运行这两个命令验证,在此不再赘述。
组装头脑与手脚:创建智能体
接下来在Cherry Studio首页,创建智能体。注意,这里有两个选项:分别是助手和Agent。助手是我们之前提到的“一问一答”的模式,我们需要选择“智能体”。

然后设置智能体的基本信息:模型就选择千问的旗舰模型qwen3.5,特别注意工作目录,选择你存放PDF的文件夹,便于智能体搜索(如果选择其他路径,请在提示词中指出),以及提示词,简单说明我们需要调用的工具、文件夹说明即可。

让智能体辅助阅读
不多说,我们直接上图。提问“伊利股份2020-2024营业收入有何趋势?”,它不是直接检索,而是先找pdf,然后逐个读取目录、查找关键词进行分析。

从上图我们可以看出,智能体把我们的问题拆解成了6个子任务(5个年度的财报+综合分析)并逐个击破。在消息记录里,我们可以看到它的思考和执行过程。最后结果如下,不仅给出了数据,还从PDF的管理层讨论分析里挖掘了下降原因。

更进一步:装上更多工具
刚才我们只安装了“眼睛”(mutool)和“手指”(pdfgrep),但这仅仅是智能体能力的冰山一角。工具调用、MCP、SKILLS是智能体连接外部世界的三个最主要工具。在 AI 的世界里,工具调用(Tool Calling)、MCP (Model Context Protocol) 和 SKILLS 是智能体连接外部世界的三大核心协议。它们就像是为大脑接上了神经束,让智能体不再是一个封闭的聊天机器人,而是一个能感知世界、执行操作的超级助手。

有了这些协议,你的财报智能体可以进化成什么样?
自动绘图专家:接入 Python (Matplotlib/Plotly) 或 ECharts 工具。当用户问“画出近5年营收趋势图”时,智能体不仅给出文字结论,还会直接调用绘图工具,生成一张专业的折线图或柱状图,甚至自动标注出“拐点”。
舆情监控哨兵:接入 联网搜索 (Search API) 或 新闻聚合工具。在分析完财务数据后,自动搜索该公司最近半年的负面新闻或行业政策,进行“财务+舆情”的双重风险评估。
标准化接口接入小龙虾:当你将 mutool、pdfgrep 以及未来的绘图、搜索工具都封装成标准的 MCP Server 或 OpenAPI 接口后,你就可以将它们接入到更宏大的自动化工作流平台(如 OpenCLAW、LangChain 或 Dify 等)。想象一下,你不再需要手动打开 Cherry Studio 提问。你可以设定一个定时任务:“每天上午9点,自动扫描交易所公告,一旦有新的年报发布,立即触发智能体工作流:下载PDF -> 调用 mutool 定位 -> 调用 pdfgrep 提取核心数据 -> 调用绘图工具生成图表 -> 将分析报告推送到我的飞书/钉钉群。”

这就是从“辅助阅读”到“全自动投研流水线”的跨越。通过标准化的接口,你的智能体不再是孤立的玩具,而是成为了你整个投资系统中一个7x24小时运转的自动化节点。
A
结语:让人类回归决策,让AI负责繁琐
技术的进步,从来不是为了替代人类的思考,而是为了将我们从重复、低效的“翻书、查找、摘录”中解放出来。
在这个年报密集发布的三月,面对堆积如山的PDF,你不必再揉着酸痛的双眼去死磕每一个数字。通过 Cherry Studio 与 阿里百炼 的强强联合,配合 mutool 和 pdfgrep 这两把利器,你已经拥有了一位不知疲倦、逻辑严密且精准度极高的“初级分析师”。
它负责在海量数据中披沙拣金,负责跨文档的逻辑拆解与验证;而你,只需要坐在屏幕前,基于它提供的精准数据和深度洞察,去判断趋势、分析因果,做出那个最关键的投资决策。
从“人找信息”到“信息找人”,再到如今的“智能体主动规划并交付结果”,这才是AI赋能投研的正确打开方式。
年报季才刚刚开始,别再用老办法应对新挑战了。现在就动手搭建你的专属智能体,让数据分析变得简单、透明且充满乐趣。


