财务小姐姐哭了:300 张发票,我用这个技能 10 分钟搞定
大家好,我是正在实战各种 AI 项目的程序员晚枫。
😭 上个月,我差点被发票埋了
场景还原:
月底报销日,财务小姐姐抱着一箱子发票走到我工位:
“晚枫,听说你会编程,能不能帮个忙……这 300 多张发票,我得录到明天凌晨……”
我低头一看:
- 增值税专票、普票混在一起
- 有 PDF 电子版,有手机拍的 JPG
- 还有几张皱巴巴的纸质扫描件
传统方式(我帮小姐姐试过):
- 打开一张发票
- 手动输入:发票号码、开票日期、金额、税额……
- 粘贴到 Excel
- 重复 300 次
时间计算:
- 单张发票录入:2 分钟
- 300 张发票:300 × 2 = 600 分钟(10 小时)
- 还得加班到凌晨 1 点
那一刻我明白了:这不是在报销,这是在”报命”。
🎯 现在我发布了这个技能,10 分钟搞定
技能名称:poocr-vatinvoice2excel
ClawHub 地址:https://clawhub.ai/CoderWanFeng/poocr-vatinvoice2excel
效果预览:
1 | 之前: |
效率提升:60 倍(不是吹,是实测)
📦 这个技能能干什么?
核心功能:
- ✅ 单张发票识别 → 适合临时报销
- ✅ 批量识别文件夹 → 适合月底集中处理
- ✅ 支持 PDF、JPG、PNG → 不管什么格式都能吃
- ✅ 自动提取关键字段:发票号码、开票日期、金额、税额、购买方、销售方……
- ✅ 直接导出 Excel → 不用二次整理
支持的发票类型:
- 增值税普通发票
- 增值税专用发票
- 增值税电子专票
- 增值税电子普票
- 电子发票(普通/专用)
识别字段(全字段提取):
| 字段 | 说明 |
|——|——|
| 发票代码 | 10 位或 12 位代码 |
| 发票号码 | 8 位号码 |
| 开票日期 | 自动格式化 |
| 合计金额 | 不含税金额 |
| 合计税额 | 自动计算核对 |
| 价税合计 | 总金额 |
| 购买方信息 | 名称、税号、地址、电话、开户行 |
| 销售方信息 | 同上 |
| 明细条目 | 商品名称、规格、数量、单价 |
🛠️ 安装和使用(5 分钟上手)
第一步:安装依赖
1 | pip install poocr |
就一行命令,不用折腾环境,不用配置路径。
第二步:获取腾讯云 API 密钥
访问腾讯云控制台获取密钥:https://curl.qcloud.com/9ExTmaya
步骤:
- 注册/登录腾讯云账号
- 搜索”文字识别”
- 进入控制台 → 密钥管理
- 新建密钥,保存 SecretId 和 SecretKey
注意:密钥要保管好,别发到群里(别问我怎么知道的……)
第三步:单张发票识别
1 | import poocr |
运行后:
1 | 发票识别完成,结果已保存到:/path/to/output/发票识别结果.xlsx |
打开 Excel,所有字段整整齐齐:
| 发票代码 | 发票号码 | 开票日期 | 金额 | 税额 | 价税合计 |
|---|---|---|---|---|---|
| 011002100113 | 12345678 | 2026-03-15 | 1000.00 | 130.00 | 1130.00 |
第四步:批量识别(这才是大招)
1 | import poocr |
效果:
- 自动遍历文件夹里所有发票文件
- 一张一张识别
- 合并到一个 Excel 里
- 每张发票一行,字段对齐
你只需要:
- 把发票全丢进一个文件夹
- 运行脚本
- 等 10 分钟
- 收工
💼 真实使用场景(不只是财务报销)
场景 1:财务报销(最常用)
之前:
- 员工交发票 → 财务手工录入 → 核对 → 打款
- 月底集中处理,加班到深夜
现在:
- 员工交发票(电子版直接发,纸质版拍照)
- 运行技能 → 10 分钟识别完
- 自动核对金额 → 打款
时间节省:从 10 小时 → 10 分钟
场景 2:税务申报
之前:
- 整理进项发票、销项发票
- 手动汇总数据
- 填写申报表
现在:
- 发票分类放两个文件夹
- 批量识别,自动汇总
- 导出 Excel 直接导入税务系统
效率提升:申报时间从 1 天 → 1 小时
场景 3:审计工作
之前:
- 抽查发票 → 手动核对
- 样本量有限,容易漏问题
现在:
- 全量识别所有发票
- 自动比对异常数据
- 问题发票自动标记
审计覆盖率:从抽样 10% → 全量 100%
场景 4:数据录入外包
之前:
- 接一单发票录入活
- 雇人手工录,成本占 70%
- 利润薄,还容易出错
现在:
- 接活 → 批量识别 → 交付
- 成本几乎为零
- 利润率提升 5 倍
一个朋友实测:用这个技能接发票录入外包,一个月多赚 2 万。
📊 实测数据(不吹不黑)
测试环境:
- 发票数量:300 张
- 发票类型:混合(专票、普票、电子版、拍照版)
- 电脑配置:普通笔记本(i5, 16G)
测试结果:
| 指标 | 数值 |
|---|---|
| 总耗时 | 9 分 47 秒 |
| 平均单张 | 1.9 秒 |
| 识别准确率 | 98.3% |
| 错误发票 | 5 张(拍照模糊) |
| Excel 生成 | 自动完成 |
准确率说明:
- 98.3% 的发票字段完全正确
- 5 张错误发票都是因为拍照太模糊(反光、折叠、光线暗)
- 重新拍照后识别成功
建议:
- 电子版 PDF 发票:准确率接近 100%
- 拍照发票:确保光线充足、平整、无反光
💡 进阶用法(封装成类)
如果你想集成到自己的系统里,可以这样封装:
1 | import poocr |
好处:
- 密钥管理更安全
- 可以集成到 Web 系统
- 方便扩展功能(比如自动邮件发送结果)
⚠️ 注意事项(踩坑提醒)
密钥安全
- SecretId 和 SecretKey 别硬编码在代码里
- 用环境变量或配置文件
- 别上传到 GitHub(别问我怎么知道的……)
图片质量
- 拍照发票确保光线充足
- 避免反光、折叠、模糊
- 能用 PDF 就用 PDF,准确率更高
API 额度
- 腾讯云 OCR 有免费额度(每月 1000 次)
- 超出后按量计费(很便宜,几分钱一次)
- 批量处理前确认额度够用
网络环境
- 需要联网调用腾讯云 API
- 公司内网可能需要配置代理
- 批量处理时确保网络稳定
🎯 适合人群
强烈推荐:
- ✅ 财务人员(月底报销不再加班)
- ✅ 审计人员(全量发票分析)
- ✅ 税务代理(批量处理客户发票)
- ✅ 外包团队(发票录入业务)
- ✅ 开发者(集成到自己的系统)
可以考虑:
- ⭐ 个体户(自己处理进项发票)
- ⭐ 学生(学习 OCR 技术应用)
暂不推荐:
- ❌ 每月只有几张发票的个人(手动录更快)
- ❌ 完全不懂 Python 的小白(需要基础编程知识)
📈 成本核算(帮你算笔账)
腾讯云 OCR 定价:
- 免费额度:1000 次/月
- 超出后:0.035 元/次
场景:每月处理 3000 张发票
1 | 免费额度:1000 次 → 0 元 |
对比人工成本:
- 人工录入:3000 张 × 2 分钟 = 100 小时
- 按 50 元/小时计算:5000 元
- 节省:5000 - 70 = 4930 元/月
一年省下:4930 × 12 = 59160 元
这还不算加班费、错误成本、时间成本……
💬 最后的建议
给财务人员的建议:
- 学会这个技能,月底不再加班
- 把重复工作交给 AI,你来做分析和决策
- 提升自己在公司的价值(会编程的财务更值钱)
给开发者的建议:
- 可以集成到公司财务系统
- 可以做成 SaaS 服务收费
- 可以接外包单赚钱
给老板的建议:
- 给财务团队配这个技能,加班费都省了
- 效率提升,员工满意度也提升
- 几十块的 API 成本,换来几千块的人工节省
📚 相关资源
技能地址:
腾讯云 OCR:
- 官网:https://cloud.tencent.com/product/ocr
- 控制台:https://curl.qcloud.com/9ExTmaya
- 定价:https://cloud.tencent.com/document/product/866/17805
poocr 库:
- PyPI: (搜索 poocr)
- 文档:(技能页面有示例)
💬 联系我
| 平台 | 账号/链接 |
|---|---|
| 微信 | 扫码加好友 |
| 微博 | @程序员晚枫 |
| 知乎 | @程序员晚枫 |
| 抖音 | @程序员晚枫 |
| 小红书 | @程序员晚枫 |
| B 站 | Python 自动化办公社区 |
主营业务:AI 编程培训、企业内训、技术咨询
🎓 推荐课程
龙虾安装课(9 元)
从软件下载、环境配置到完整部署,一步步教到能正常使用。龙虾高级课(199 元,前 50 名优惠)
0 基础也能学,从基础操作到进阶用法,教你真正用起来。
AI 的价值,从来不只在于它能”说”多少,更在于它能”感知”多少。
当你的 AI 助手能够真正”看懂”发票,从被动的问答工具蜕变为主动的智能伙伴——那种感觉,真的回不去了。
财务小姐姐说:这个技能,救了我的命。
你呢?准备好让 AI 帮你打工了吗?💪
P.S. 有财务朋友问我:会不会失业?我说:不会编程的财务会,会编程的财务不会。工具永远在淘汰不用工具的人。