推广 热搜： 采购方式滤芯带式称重给煤机甲带气动隔膜泵减速机型号无级变速机链式给煤机履带减速机

从体检报告到企业级AI:我的Skill封装与落地心法

日期：2026-03-20 14:55:17 来源：网络整理作者：本站编辑评论：0

01

业务痛点

在医疗健康领域，体检报告的解读一直是一个耗时耗力的工作。

传统流程中，大夫需要手动阅读数百页的PDF报告，逐一识别异常指标，撰写风险提示和就医建议。这个过程不仅效率低下，而且容易出现遗漏或解读不一致的问题。

近期，我们通过WorkBuddy平台，成功将这个复杂的业务场景封装成了一个可复用的AI Skill，实现了从“手工解读”到“智能生成”的跨越。

本文将详细分享这个从0到1的完整过程。

02

需求与架构

同事的需求

我们是一家医疗机构，提出了一个明确的需求：

“能否帮我们把体检报告自动生成解读报告？”

听起来简单，但实际包含了一系列复杂的技术挑战：

PDF文本提取：体检报告是扫描件或PDF格式，需要OCR识别

AI智能分析：需要识别异常指标，生成专业的风险提示

格式化输出：生成符合医疗标准的Word文档

跨平台兼容：同事使用Windows系统，需要跨平台支持

业务规则约束：HRA报告不解读，不含运动饮食建议等

技术架构

经过调研，我们设计了以下技术架构：

体检报告PDF → OCR文本提取 → AI分析 → Word文档生成 → 健康解读报告

技术选型：

OCR引擎：RapidOCR（跨平台）+ macOS Vision（备选）+ Tesseract（兜底）

AI模型：Ollama本地模型（qwen2.5:7b）或OpenAI API

文档生成：docx npm库（专业格式控制）

跨平台支持：Python + Node.js，Windows/macOS/Linux通用

03

实现过程

MVP验证

我们首先快速搭建了一个MVP版本，验证核心流程的可行性：

# 步骤1：OCR提取python3 parse_pdf.py 体检报告.pdf > ocr.json# 步骤2：AI分析python3 analyze_report.py ocr.json > analysis.json# 步骤3：生成报告node generate_docx.mjs analysis.json 解读报告.docx

关键发现：

✅ RapidOCR对中文识别效果优秀，适合体检报告场景

✅ Ollama本地模型完全可用，无需依赖外部API

✅ 大夫的反馈帮助我们明确了业务规则约束

标准化与优化

根据大夫的反馈，我们进行了多轮优化：

明确业务规则：不解读HRA报告、不提供运动饮食建议、只保留医学异常的解读

报告格式标准化：严格按照模板格式，使用楷体等中文字体

跨平台兼容：从macOS专属的Vision框架改为RapidOCR，支持Windows/macOS/Linux三平台

Skill化封装

最关键的一步是将这个解决方案封装成可复用的Skill：

health-report-generator/├── SKILL.md                    # Skill主文件├── scripts/                    # 可执行脚本│   ├── ocr_engine.py          # OCR引擎│   ├── parse_pdf.py           # PDF解析│   ├── analyze_report.py      # AI分析│   └── generate_docx.mjs      # Word生成└── references/                # 技术文档    └── README.md

04

Skill化价值

从Demo到产品

维度	SKILL化前	SKILL化后
脚本管理	散落在项目目录	集中管理
环境配置	手动配置	标准化流程
文档	与代码分离	内聚在一起
分享	难以分享	一键打包

降低使用门槛

同事只需三步即可使用：

# 1. 安装依赖pip install rapidocr-onnxruntime pdf2imagenpm install docx# 2. 启动LLMollama pull qwen2.5:7bollama serve# 3. 生成报告python3 parse_pdf.py 报告.pdf | python3 analyze_report.py | node generate_docx.mjs - 解读报告.docx