
先说结果:
用户上传上期财报 + 本期银行流水,AI 自动生成资产负债表、利润表、现金流量表,下载即用。
整个过程不需要用户懂任何财务知识,不需要注册登录,打开网页就能用。运行成本?零。
这篇文章是一个项目复盘——我会分享需求怎么来的、核心难点在哪、我是怎么解决的、以及几点感悟。
如果你也在研究 AI 落地,想知道"AI 到底能做什么实际的事",这篇应该能给你一些启发。
01
需求从哪来我身边有个朋友开了一家小公司,做技术咨询的。公司就他一个人,没什么业务,银行流水一个季度就十来笔——工资、社保、公积金、偶尔股东打点钱进来。
但每个季度要报税,就得有财务报表。他请了个代理记账,一个月 300 块。
有一天他跟我说:"我公司流水就那么几笔,代账一年收我三千六,能不能用 AI 搞?"
我当时觉得这事不难——不就是"把银行流水分分类、填到表里"嘛。
然后我就开始研究了。结果发现,真没那么简单。
02
为什么"看起来简单"的事其实不简单财务报表有三张:资产负债表、利润表、现金流量表。
最大的坑在于:这三张表用的不是同一套记账逻辑。
? 核心难点:权责发生制 vs 收付实现制
资产负债表和利润表采用权责发生制——费用在"应该承担"的时候确认,而不是实际付钱的时候。
现金流量表采用收付实现制——只看银行实际收了多少、付了多少。
举个例子:3 月的工资 4 月才发。利润表上,3 月就要确认这笔费用;但现金流量表上,4 月才有这笔支出。
这意味着你不能简单地把银行流水加加减减填进表里。三张表之间存在复杂的勾稽关系,任何一个数字错了,整张表就对不上。
除此之外还有很多细节问题:
? 银行流水的每一笔交易需要精确分类到对应的会计科目
? 管理费用不能直接用银行支出金额,必须通过 T 账户公式转换
? 跨年度(比如 Q4→Q1)的年初余额和累计金额需要特殊处理
? 三张表必须通过四项勾稽验证,确保数据一致
这些规则看似每一条都不复杂,但组合在一起就是一个环环相扣的系统。这也是为什么小公司老板自己做不了,必须请专业会计的原因。
03
我是怎么做到的研究了一段时间后,我找到了一个核心思路:
核心设计思路
让 AI 做它最擅长的事(理解语义、识别分类)
让代码做它最可靠的事(数学计算、格式输出)
让验证确保不出错(四项勾稽自动校验)
简单来说,整个系统分成几个部分:
文件解析层——用户上传的是 PDF 或 Excel,系统需要把文件内容提取为结构化数据。这一步完全不依赖大模型,用的是确定性的解析工具。
智能分类层——对银行流水的每一笔交易进行分类。大部分交易通过规则引擎直接匹配(比如"代发工资"就是工资,"公积金"就是公积金),只有少量无法确定的交易才交给大模型判断。
计算引擎——根据分类结果,按照《小企业会计准则》的规则生成三张报表。这一步全部用代码完成,不让大模型碰任何数字。
验证层——自动执行四项勾稽验证,确保资产负债表平衡、现金流量一致、净利润匹配。验证不通过就重算,直到对上为止。
? 为什么不直接让大模型生成整个报表?
我一开始就是这么做的——把财报和流水丢给大模型,让它直接输出三张表。
结果?数字经常对不上。大模型做语义理解很强,但做精确的数学计算很不可靠。一个数字错了,整张表就废了。
所以我最终采用了"混合架构":大模型只做分类,计算全部用代码。这个架构是整个工具准确率能达到 100% 的关键。
至于具体的 Prompt 怎么写、规则引擎怎么设计、三表计算的公式怎么实现、各种边界情况怎么处理——这里面有非常多的细节和 know-how。
如果你对这些感兴趣,欢迎联系我们,我们提供 1v1 的 AI 项目辅导,可以手把手教你怎么把一个 AI 想法变成一个真正能用的产品。
04
踩过的坑(选几个说)?️ 大模型输出被截断
财报数据量大,三张表加起来一百多行。第一次测试时,大模型输出到一半就断了——因为输出长度超了限制。
解决方案:优化输出结构,去掉冗余数据,只输出最终结果需要的字段。同时调整模型参数,确保输出完整。
?️ 深度思考模式反而更慢
有些大模型提供"深度思考"模式,听起来更强。但实际测试发现,开了深度思考后处理时间翻倍,甚至超时失败。
解决方案:关掉深度思考,用精确模式。因为我的 Prompt 已经把每一步的规则写得非常详细,模型不需要"想",只需要严格"执行"。结果反而更快更准。
? 启发:Prompt 写得越详细,对模型能力的要求反而越低。一份好的 Prompt 本质上是一份"操作手册"——模型只需要照着做,不需要自己推理。这意味着你可以用更便宜、更快的模型,达到同样好的效果。
?️ 文件格式千奇百怪
用户上传的 PDF 和 Excel 格式五花八门——有的列对不齐、有的有合并单元格、有的 PDF 是扫描件。文件解析这一步看起来简单,实际上花了很多时间做兼容。
解决方案:做了多层的容错处理——解析失败时自动尝试其他策略,实在识别不了就明确告诉用户"这个文件格式不支持",而不是悄悄给出错误结果。
05
最终效果用真实数据测试,生成的报表和专业会计手动做的完全一致——每一个数字都对得上。
✅ 四项勾稽验证全部通过
☑️ 资产合计 = 负债合计 + 所有者权益合计(误差 0.00 元)
☑️ 期初现金 + 净增加额 = 期末现金
☑️ 资产负债表货币资金 = 现金流量表期末余额
☑️ 未分配利润变动 = 本期净利润
用户体验上,就三步:
? 上传两个文件 — 上期财报 + 本期银行流水
⏳ 等待 1-2 分钟 — AI 自动完成分类、计算、验证
? 下载 Excel — 三个 Sheet,格式和税务系统标准报表一致

06
成本:零可能是这个项目最让人意外的地方——整个产品的运行成本是 0。
前端是纯静态页面,服务器用的是免费额度,大模型用的也是平台的免费额度,Excel 在用户浏览器里直接生成。
没有买服务器、没有买数据库、没有买 API。
当然,用户量大了以后肯定需要升级。但在早期验证阶段,能用零成本把产品跑起来、验证需求是否真实——这在以前是不可能的。
? 这说明什么?
现在做一个 AI 产品的门槛已经低到不可思议。你不需要会训练模型、不需要有 GPU、不需要大笔资金。你需要的是:一个真实的需求 + 把各种免费工具组合起来的能力。
07
几点感悟1. 不要让大模型做它不擅长的事
大模型擅长理解语义、做分类判断。但它做数学计算很不可靠。让对的工具做对的事——这是混合架构的核心理念,也是这个项目能成功的关键。
2. Prompt 工程比你想象的重要
这个项目的核心竞争力其实不是代码,而是那份经过反复打磨的 Prompt。它包含了所有的业务规则、计算逻辑、异常处理方案。写好 Prompt 的能力,本质上是把业务逻辑翻译成 AI 能理解的语言的能力。
3. 先跑通再优化
第一版很粗糙——界面丑、没有异常处理、没有安全防护。但先确保核心功能能跑通,再一步步完善。如果一开始就追求完美,可能到现在还在做。
4. AI 落地的关键不是技术,是找到真实需求
技术门槛越来越低,但发现一个值得解决的问题,这个能力永远稀缺。我这个项目不是因为技术多厉害才成功的,而是因为"小公司老板不想花冤枉钱做报表"这个需求是真实的、普遍的、持续存在的。
08
试试看 & 联系我们这个工具现在已经上线,限时免费:
? https://findaigo.cn/finance-report
适用于小企业会计准则 · 服务类小微企业
如果你也在做 AI 落地的项目,或者想学习怎么从零搭建一个 AI 产品,我们提供:
?️ AI 工具定制 — 根据你的业务场景,量身定制 AI 工具和工作流
? 1v1 AI 辅导 — 手把手教你从需求分析到产品上线的完整流程
⚙️ Prompt 工程咨询 — 帮你设计、优化面向具体业务场景的 Prompt
感兴趣的话,直接在公众号留言或者访问我们的官网咨询:
https://findaigo.cn
很多时候 AI 不需要多厉害的模型或多复杂的架构。关键是找到一个真实的需求,然后用最合适的方式把它解决。
这就是 AI 最有意思的地方。
方狗 AI — 你遛狗,定制 AI 替你打工
关注方狗 AI 公众号,获取更多 AI 实战案例