👉 项目官网:https://www.python-office.com/ 👈

👉 本开源项目的交流群 👈

atomgit star github star gitee star PyPI Downloads AI交流群

大家好,这里是程序员晚枫,正在all in AI编程实战,先给大家说一个好消息:现在开源项目的更新,已经可以放心交给新加入的小伙伴啦!

今天就给大家发布2个新加入的小伙伴更新的重要功能:poocr发票识别支持多页、PyOfficeRobot机器人支持群聊(根据关键词回复)。

poocr - 发票识别支持多页PDF:

之前的PDF发票批量识别中,只能识别第1页PDF的内容,现在不论PDF中有多少页,都可以识别了。

开源PR:https://atomgit.com/python4office/poocr/pull/6

代码演示:

1
2
# 使用之前,更新到最新版
pip install poocr -U

代码的使用其实和原来没有区别,默认支持多页的识别。

1
2
3
4
5
6
7
import poocr

poocr.ocr2excel.VatInvoiceOCR2Excel(input_path=r'D:/程序员晚枫的文件夹/test_files/VatInvoiceOCR/img.pdf',
output_path=r'D:/程序员晚枫的文件夹/test_files/VatInvoiceOCR',
id=self.SecretId,
key=self.SecretKey)

PyOfficeRobot - 机器人支持群聊(根据关键词回复):

机器人发布了2年多了,一直被吐槽的是:不支持群聊功能。

这次增加了一个群聊功能:根据关键词回复。

开源PR:https://atomgit.com/python4office/PyOfficeRobot/pull/6

代码演示:

1
2
# 使用之前,更新到最新版
pip install PyOfficeRobot -U

注意几个参数的设置

1
2
3
4
5
6
7
8
who = '测试群'
keywords = {
"报名": "你好,这是报名链接:www.python-office.com",
"学习": "你好,这是学习链接:www.python-office.com",
"课程": "你好,这是课程链接:www.python-office.com"
}
match_type = 'contains' # 关键字匹配类型 包含:contains 精确:exact
PyOfficeRobot.group.chat_by_keywords(who=who, keywords=keywords, match_type=match_type)

加入开源小组

如果你喜欢这个开源项目,欢迎加入我们的开源小组,一起交流学习,一起进步。

加我的微信:aiwf365,备注:开源

关于项目的介绍:

相关阅读

程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。

🎓 AI 编程实战课程

想系统学习 AI 编程?程序员晚枫的 AI 编程实战课 帮你从零上手!