实用技巧|处理财报时,分模块拆分比一次性上传更准
直接把整份年报(100+ 页)上传 AI,常见问题是:AI 容易"漂移",前面处理得认真,后面开始走捷径。更有效的做法是把财报拆成「财务数据」「MD&A」「风险披露」三个模块,分别跑指令。效率不减,准确率高一档。
财报季每来一次,我都要加一两个通宵。
之前的流程是:下载年报 PDF → 手动翻财务报表 → 复制数据到 Excel → 整理格式 → 写分析摘要。一家公司走完这套,快的话 3 小时,遇到数据分散在多个附注里,半天就没了。
去年四季报季之前,我重新梳理了一遍流程,把 AI 插进去。现在跑完一家的基础分析,大概需要 45 分钟。今天把这套流程拆开,每个步骤都说清楚。
流程总览
一共 4 步:
- 数据预处理
:把 PDF 里的财务数据转成可用的文字 - 财务数据提取
:用结构化指令提取核心指标 - 管理层讨论分析
:提取实质性风险和管理层态度 - 整合输出
:把两份结果整合成可用的分析底稿
每步有各自的指令,一一列出来。
第一步:数据预处理
做什么
年报 PDF 直接上传 AI 有个问题:很多上市公司的年报是扫描版,或者财务数据做成了图片/表格。这种情况下,AI 识别准确率很低,甚至直接漏掉整页数据。
我的预处理方式:
用 Adobe Acrobat 的"导出为 Excel"功能,把财务报表部分(三张表)单独导出 检查一遍数字有没有乱码或错位 把结果复制成纯文字(去掉格式,只留数字和名称)
这步没什么 AI 参与,但很关键。预处理做得干净,后面指令的输出质量差距很大。
踩坑记录:扫描版年报会直接翻车
有一次偷懒,直接把 PDF 丢进 Claude 的文件上传。年报是某家制造业公司的,利润表全部做成了图片格式。AI 告诉我"未能从上传文件中识别到利润表数据"。白白浪费了上传机会。
教训:先检查财报格式,再决定用什么方式上传。扫描版或图片型财报,先用 OCR 工具处理一遍。
第二步:财务数据提取
预处理完之后,把财务数据文字粘贴进去,跑这条指令:
指令:提取财报关键财务数据
[使用前:将年报利润表 + 资产负债表 + 现金流量表内容复制为纯文字]
你是一位专业的财务分析助手。请从以下财报内容中提取关键财务数据。
输出格式:
【营收与利润】
- 营业收入:XX亿元(同比+X%)
- 归母净利润:XX亿元(同比+X%)
- 毛利率:XX%(上年同期:XX%)
- 净利率:XX%(上年同期:XX%)
【现金流】
- 经营性现金流净额:XX亿元
- 资本开支:XX亿元
- 自由现金流:XX亿元(经营现金流 - 资本开支)
【资产负债】
- 资产负债率:XX%
- 有息负债合计:XX亿元
- 货币资金:XX亿元
如果某项数据在原文中未出现,标注"原文未披露",不要自行推算。
效果:输出格式很稳定,跑了 20+ 家公司,格式从没崩过。最关键的是"不要自行推算"这句话——不加这句,AI 会用相近数据估算,生成看起来合理但实际是编造的数字。自由现金流尤其容易出这种问题。
注意事项
一次只处理一家公司,不要把多家公司数据混在一起粘贴 数据年份要注意:很多年报同时包含当年和上年数据,确认 AI 提取的是正确年份 输出拿到之后,抽查 2-3 个数字和原文核对
第三步:管理层讨论分析
财务数据给你数字,管理层讨论(MD&A)给你逻辑。这一步单独跑,输入和处理逻辑完全不同。
指令:提取管理层讨论中的实质性信息
[使用前:将年报"管理层讨论与分析"部分复制]
请阅读以下管理层讨论内容,完成两件事:
第一,找出实质性风险(排除通用套话,例如"宏观经济存在不确定性"不算)。
每条风险一句话,不超过30字。最多5条。
第二,判断管理层态度:
- 多次出现"稳健"、"审慎"、"控制" → 标注"保守"
- 多次出现"扩张"、"加大投入"、"新市场" → 标注"积极"
- 两类均衡 → 标注"中性"
输出:
【实质性风险】
1. ...
2. ...
【管理层态度】:XX
依据(引用原文1-2句):...
效果:横向对比多家公司时特别好用。一个行业的 10 家公司,跑完之后把管理层态度列成表,能快速看出谁在扩张、谁在收缩。单独看一家的话,风险识别准确率大概 7 成,剩下 3 成需要自己再过一遍。
局限性
MD&A 里有些公司会用大量正面词汇,AI 的态度判断会偏向"积极"。遇到这种情况,可以追问一句:"你引用的这几句话,有没有具体的量化目标或时间节点?"没有的话,那个"积极"要打个折。
第四步:整合成分析底稿
跑完前两步,手里有两份结构化输出:财务数据 + 管理层分析。这一步把它们整合成可以直接用的底稿。
指令:整合财务数据和管理层分析生成分析底稿
[使用前:把第二步和第三步的输出一起粘贴]
我已经完成了一家上市公司的基础分析,整理了两份内容:
(1)核心财务数据摘要
(2)管理层讨论分析
请帮我将这两份内容整合成一段分析底稿,格式如下:
【基本面概览】
(3-4句话,覆盖营收/利润/现金流的变化趋势,有数字)
【关注点】
(2-3条,结合财务数据和管理层风险,挑出最值得关注的点)
【管理层信号】
(1-2句话,说明管理层态度和依据)
要求:
- 每个模块不超过150字
- 不给买卖建议
- 数字直接用我提供的,不要推算新数字
效果:这份底稿我一般拿来作为自己写分析的起点,不直接提交。整合的框架质量稳定,措辞有时候偏模板,需要自己改几句。
效果对比
| 合计 | 约 2.5 小时 | 约 45 分钟 |
财务数据提取准确率高,抽查过,10 次里有 9 次和原文对得上。管理层分析准确率低一点,大概 7 成可用。
适合谁用
适合需要覆盖多家公司的分析师或研究员,或者要在有限时间内消化多份年报的人。
不适合:需要深度研究单家公司、对管理层表述有细颗粒度要求的场景。AI 目前处理不了"这句话的弦外之音是什么",那种判断还是得靠人。
这套流程用 Claude 或 GPT-4o 效果差不多。DeepSeek 的财务数据提取也还可以,但整合那步的中文措辞会更生硬一些,需要多改几轮。
文章里展示了 4 步流程的核心指令,但实际跑起来还有不少细节——比如遇到扫描版年报怎么处理、数字核对用什么标准、多家公司横向对比时表格怎么组织。
我把这套完整的 SOP 整理成了一份文档,包含所有指令的可复制版本 + 每步的异常处理方法,财报季可以直接对着跑。
后台回复「财务AI」,发给你。用完有问题,欢迎评论区留言,我看到都会回。


