大家好,这是是程序员晚枫,小红书/抖音/B站都叫这个名字。

这个五一更新完了一套课程:给小白的OCR批量识别保存为Excel(Python版),本来这套课程是文字识别专题,里面有100多个识别功能,通过近期的读者沟通,我发现大家对其中的1个功能尤其感兴趣:批量识别发票自动保存为Excel文件,1行Python代码实现

在沟通的过程中,又发现了一些新的需求,并且开发了对应的代码,本篇文字就给大家分享一下这个发票识别功能的更新内容和使用方法。

支持PDF识别了

在课程的演示里,发票识别功能只支持图片格式的发票识别,这显然对于日常PDF格式的发票不友好。

所以这次增加了PDF格式的发票识别,使用代码如下:

1
2
3
4
5
6
7
8
9
import poocr

SecretId = '免费开通方法请看文末的课程'
SecretKey = '免费开通方法请看文末的课程'

pdf_path = r'C:\程序员晚枫的文件夹\12365.pdf'

res = poocr.ocr.VatInvoiceOCR(pdf_path=pdf_path, id=SecretId, key=SecretKey)
print(res)

目前这个方法还有几个待完善的地方:

  • 增加批量识别
  • 增加识别后自动保存为Excel

发票识别增加文件名

增加了一个可选参数:file_name,填写后可以在识别的Excel里增加一列:这个发票的文件名,方便查找文件。

代码如下:

1
2
3
4
5
6
import poocr

SecretId = '免费开通方法请看文末的课程'
SecretKey = '免费开通方法请看文末的课程'
img_path=r'./img.png'
poocr.ocr2excel.VatInvoiceOCR2Excel(input_path=img_path, id=SecretId, key=SecretKey, file_name=True)

增加社保卡识别

虽然我们已经有了100多个识别功能了,点击查看:Python实现图片文字提取,准确率高达99%,100多个功能全给你!

但读者的需求是多种多样的,所以这次又增加了一个新功能:社保卡识别。

上次的文章已经给大家分享了,这里就不再重复:1行Python代码,进行社保卡识别,小白可用

全套课程

适合小白的Python入门课程,可以直接扫码查看,👇

相关阅读

程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。

🎓 AI 编程实战课程

想系统学习 AI 编程?程序员晚枫的 AI 编程实战课 帮你从零上手!