大家好,这里是程序员晚枫,正在all in AI编程实战,今天给大家分享一个PDF自动化办公的第三方库:popdf。

源码地址:https://github.com/CoderWanFeng/popdf

popdf 是一个 Python 自动化办公之 Excel 操作的第三方库,它来自于开源项目 python-office。

以下是 popdf 的一些基本使用方法:

安装 popdf

你可以通过 pip 命令来安装 popdf:

1
pip install -i https://mirrors.aliyun.com/pypi/simple/ popdf -U

更新说明

本次popdf 发布了1.0.0版本:重点有以下几个方面的更新:

  • 精简了依赖库:重点封装了PyMuPDF和PyPDF2这2个库,去掉了其它处理PDF的库,减小了20M的存储空间。
  • 精简了代码:删除了不必要的代码和注释,优化了代码结构。
  • 统一了参数的命名方式:input_path、output_path、input_file、output_file...,下文有详细的介绍
  • 完善了配套的课程,这部分课程会发布到B站:Python自动化办公社区,大家敬请期待~

popdf 的功能

popdf 提供了多种功能,包括但不限于:

  1. add_text_watermark:给 PDF 添加文本类型的水印。
  2. txt2pdf:将 TXT 文件转换为 PDF。
  3. encrypt4pdf:对 PDF 文件进行加密。
  4. decrypt4pdf:对 PDF 文件进行解密。
  5. merge2pdf:合并多个 PDF 文件。
  6. pdf2docx:将 PDF 转换为 Word 文档。
  7. pdf2imgs:将 PDF 转换为图片。
  8. split4pdf:将 PDF 按指定页数拆分。

使用示例

以下是一些 popdf 功能的使用示例:

PDF 转 Word

1
2
3
import popdf

popdf.pdf2docx(input_file='程序员晚枫.pdf', output_path='输出的Word文件路径')

添加水印

1
2
3
import popdf

popdf.add_text_watermark(input_file='你的PDF文件路径.pdf', point=(50, 50), text='水印内容')

请注意,具体的使用方法和参数可能会根据 popdf 的版本更新而有所变化,建议查看官方文档或 GitHub 仓库以获取最新的使用指南和示例代码。

参数说明

本次更新,还统一了参数的命名方式:

  • input_path:输入PDF的路径一般用于批量操作
  • output_path:输出PDF的路径,一般用于批量操作
  • input_file: 输入PDF的文件名,可以包含路径,一般用于单个文件的操作
  • output_file:输出结果的文件名,可以包含路径,一般用于单个文件的操作
  • input_file_list: 输入PDF的文件列表,一般用于批量操作,例如:合并2个pdf文件

相关课程


扫一扫,领红包

美团红包

程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。

🎓 AI 编程实战课程

想系统学习 AI 编程?程序员晚枫的 AI 编程实战课 帮你从零上手!