推广 热搜: 采购方式  甲带  滤芯  带式称重给煤机  减速机型号  气动隔膜泵  无级变速机  链式给煤机  履带  减速机 

从原始数据到财报分析:一套没有废步骤的 AI 流程

   日期:2026-04-24 11:16:23     来源:网络整理    作者:本站编辑    评论:0    
从原始数据到财报分析:一套没有废步骤的 AI 流程

实用技巧|处理财报时,分模块拆分比一次性上传更准

直接把整份年报(100+ 页)上传 AI,常见问题是:AI 容易"漂移",前面处理得认真,后面开始走捷径。更有效的做法是把财报拆成「财务数据」「MD&A」「风险披露」三个模块,分别跑指令。效率不减,准确率高一档。


财报季每来一次,我都要加一两个通宵。

之前的流程是:下载年报 PDF → 手动翻财务报表 → 复制数据到 Excel → 整理格式 → 写分析摘要。一家公司走完这套,快的话 3 小时,遇到数据分散在多个附注里,半天就没了。

去年四季报季之前,我重新梳理了一遍流程,把 AI 插进去。现在跑完一家的基础分析,大概需要 45 分钟。今天把这套流程拆开,每个步骤都说清楚。


流程总览

一共 4 步:

  1. 数据预处理
    :把 PDF 里的财务数据转成可用的文字
  2. 财务数据提取
    :用结构化指令提取核心指标
  3. 管理层讨论分析
    :提取实质性风险和管理层态度
  4. 整合输出
    :把两份结果整合成可用的分析底稿

每步有各自的指令,一一列出来。


第一步:数据预处理

做什么

年报 PDF 直接上传 AI 有个问题:很多上市公司的年报是扫描版,或者财务数据做成了图片/表格。这种情况下,AI 识别准确率很低,甚至直接漏掉整页数据。

我的预处理方式:

  • 用 Adobe Acrobat 的"导出为 Excel"功能,把财务报表部分(三张表)单独导出
  • 检查一遍数字有没有乱码或错位
  • 把结果复制成纯文字(去掉格式,只留数字和名称)

这步没什么 AI 参与,但很关键。预处理做得干净,后面指令的输出质量差距很大。

踩坑记录:扫描版年报会直接翻车

有一次偷懒,直接把 PDF 丢进 Claude 的文件上传。年报是某家制造业公司的,利润表全部做成了图片格式。AI 告诉我"未能从上传文件中识别到利润表数据"。白白浪费了上传机会。

教训:先检查财报格式,再决定用什么方式上传。扫描版或图片型财报,先用 OCR 工具处理一遍。


第二步:财务数据提取

预处理完之后,把财务数据文字粘贴进去,跑这条指令:

指令:提取财报关键财务数据

[使用前:将年报利润表 + 资产负债表 + 现金流量表内容复制为纯文字]


你是一位专业的财务分析助手。请从以下财报内容中提取关键财务数据。

输出格式:
【营收与利润】
- 营业收入:XX亿元(同比+X%)
- 归母净利润:XX亿元(同比+X%)
- 毛利率:XX%(上年同期:XX%)
- 净利率:XX%(上年同期:XX%)

【现金流】
- 经营性现金流净额:XX亿元
- 资本开支:XX亿元
- 自由现金流:XX亿元(经营现金流 - 资本开支)

【资产负债】
- 资产负债率:XX%
- 有息负债合计:XX亿元
- 货币资金:XX亿元

如果某项数据在原文中未出现,标注"原文未披露",不要自行推算。

效果:输出格式很稳定,跑了 20+ 家公司,格式从没崩过。最关键的是"不要自行推算"这句话——不加这句,AI 会用相近数据估算,生成看起来合理但实际是编造的数字。自由现金流尤其容易出这种问题。

注意事项

  • 一次只处理一家公司,不要把多家公司数据混在一起粘贴
  • 数据年份要注意:很多年报同时包含当年和上年数据,确认 AI 提取的是正确年份
  • 输出拿到之后,抽查 2-3 个数字和原文核对

第三步:管理层讨论分析

财务数据给你数字,管理层讨论(MD&A)给你逻辑。这一步单独跑,输入和处理逻辑完全不同。

指令:提取管理层讨论中的实质性信息

[使用前:将年报"管理层讨论与分析"部分复制]


请阅读以下管理层讨论内容,完成两件事:

第一,找出实质性风险(排除通用套话,例如"宏观经济存在不确定性"不算)。
每条风险一句话,不超过30字。最多5条。

第二,判断管理层态度:
- 多次出现"稳健"、"审慎"、"控制" → 标注"保守"
- 多次出现"扩张"、"加大投入"、"新市场" → 标注"积极"
- 两类均衡 → 标注"中性"

输出:
【实质性风险】
1. ...
2. ...

【管理层态度】:XX
依据(引用原文1-2句):...


效果:横向对比多家公司时特别好用。一个行业的 10 家公司,跑完之后把管理层态度列成表,能快速看出谁在扩张、谁在收缩。单独看一家的话,风险识别准确率大概 7 成,剩下 3 成需要自己再过一遍。

局限性

MD&A 里有些公司会用大量正面词汇,AI 的态度判断会偏向"积极"。遇到这种情况,可以追问一句:"你引用的这几句话,有没有具体的量化目标或时间节点?"没有的话,那个"积极"要打个折。


第四步:整合成分析底稿

跑完前两步,手里有两份结构化输出:财务数据 + 管理层分析。这一步把它们整合成可以直接用的底稿。

指令:整合财务数据和管理层分析生成分析底稿

[使用前:把第二步和第三步的输出一起粘贴]


我已经完成了一家上市公司的基础分析,整理了两份内容:
(1)核心财务数据摘要
(2)管理层讨论分析

请帮我将这两份内容整合成一段分析底稿,格式如下:

【基本面概览】
(3-4句话,覆盖营收/利润/现金流的变化趋势,有数字)

【关注点】
(2-3条,结合财务数据和管理层风险,挑出最值得关注的点)

【管理层信号】
(1-2句话,说明管理层态度和依据)

要求:
- 每个模块不超过150字
- 不给买卖建议
- 数字直接用我提供的,不要推算新数字


效果:这份底稿我一般拿来作为自己写分析的起点,不直接提交。整合的框架质量稳定,措辞有时候偏模板,需要自己改几句。


效果对比

环节
之前
现在
财务数据整理
手动复制,约 45 分钟
预处理 + 指令,约 15 分钟
管理层讨论阅读
全文精读,约 60 分钟
指令提炼,约 10 分钟
写分析底稿
从零写,约 40 分钟
整合指令 + 人工修改,约 20 分钟
合计约 2.5 小时约 45 分钟

财务数据提取准确率高,抽查过,10 次里有 9 次和原文对得上。管理层分析准确率低一点,大概 7 成可用。


适合谁用

适合需要覆盖多家公司的分析师或研究员,或者要在有限时间内消化多份年报的人。

不适合:需要深度研究单家公司、对管理层表述有细颗粒度要求的场景。AI 目前处理不了"这句话的弦外之音是什么",那种判断还是得靠人。

这套流程用 Claude 或 GPT-4o 效果差不多。DeepSeek 的财务数据提取也还可以,但整合那步的中文措辞会更生硬一些,需要多改几轮。


文章里展示了 4 步流程的核心指令,但实际跑起来还有不少细节——比如遇到扫描版年报怎么处理、数字核对用什么标准、多家公司横向对比时表格怎么组织。

我把这套完整的 SOP 整理成了一份文档,包含所有指令的可复制版本 + 每步的异常处理方法,财报季可以直接对着跑。

后台回复「财务AI」,发给你。用完有问题,欢迎评论区留言,我看到都会回。

 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON