👉 项目官网:https://www.python-office.com/ 👈
👉 本开源项目的交流群 👈
more >>大家好,这里是程序员晚枫,正在all in AI编程实战,之前在B站账号:Python自动化办公社区发布了一套关于Excel + Python实现自动化办公的教程,目前已经有40w+的播放了。
其中主要使用的Python第三方库是pandas,今天就以pandas为核心内容,给大家分享一下精简版的10分钟入门教程。
我根据pandas的官方文档做了以下修改:
因本人能力有限,如果有错误的地方,欢迎大家评论区 或者 加入读者群交流。
为了方便大家理解,我先用Excel里有的概念,来解释一下pandas里的基本数据类型。如下图所示:
| pandas | Excel |
|---|---|
DataFrame |
worksheet |
Series |
一列数据(含列名) |
Index |
行号 |
| row | 列 |
NaN |
空单元格 |
本文使用的演示Excel中的文件名:程序员晚枫的账号.xlsx,存放在我本地的D盘下work文件夹里,里面只有一个sheet,如下图所示,大家可以自己在电脑上创建一个。
文件的位置:
D:\work\程序员晚枫的账号.xlsx
| platform(平台) | name(账号名) | fans(粉丝数) | remark(备注) | |
|---|---|---|---|---|
| 0 | B站 | Python自动化办公社区 | 140000 | 课程 |
| 1 | 抖音 | 程序员晚枫 | 6000 | vlog |
| 2 | 公众号 | Python自动化办公社区 | 100000 | 文章 |
| 3 | 小红书 | 程序员晚枫 | 8000 | 工具 |
| 4 | 小红书 | Python自动化办公社区 | 10000 |
Python和PyCharm的安装、第三方库的安装,我就不再每个教程都重复了,大家跟着下面的3个视频顺序安装即可:
https://www.python-office.com/course/docs/50-01-python.htmlhttps://www.python-office.com/course/docs/50-02-pycharm.htmlhttps://www.python-office.com/course/docs/50-03-pip.html首先,把Excel读进Python代码里。
1 |
|
1 | print(platform_df.head(3)) #查看前5行数据 |
1 | print(platform_df.index) #查看索引 |
查看粉丝数这一列的基本统计信息,包括计数、平均值、标准差、最小值、最大值以及25%、50%、75%分位数。
1 |
|
根据某一列的值进行排序,默认是升序。
1 | print(platform_df.sort_values('fans')) |
如果想降序排列,可以使用ascending=False参数。
根据行索引进行排序,代码如下:
1 | print(platform_df.sort_index(ascending=False)) |
1 | print(platform_df[platform_df.fans > 100000]) |
1 | print(platform_df[platform_df.remark.isna()]) |
1 | platform_df['new'] = 100 |
1 | platform_df.drop('new',axis=1,inplace=True) #axis=1表示删除列,inplace=True表示直接在原数据上修改 |
1 | platform_df.to_excel('D:\\work\\程序员晚枫的账号.xlsx',sheet_name='sheet1',index=False) #index=False表示不保存索引 |



程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。
大家好,这里是程序员晚枫,正在all in AI编程实战,今天给大家分享一个PDF自动化办公的第三方库:PyMuPDF。
PyMuPDF(也称为pymupdf)是一个强大的Python库,用于处理PDF和其他图形文件格式。以下是一些基本的步骤和示例,帮助你开始使用PyMuPDF。
首先,你需要安装PyMuPDF。你可以通过pip安装:
1 | pip install pymupdf |
在1.24.3版本发布之前,这个库的顶级Python导入名称是“fitz”。在1.24.3版本中,这个名称已被弃用,取而代之的是“pymupdf”。
1 | import pymupdf # PyMuPDF |
1 | # 获取文档页数 |
1 | # 打开文档 |
1 | # 打开文档 |
1 | import pymupdf |
1 | # 打开文档 |
1 | import pymupdf |
这些只是PyMuPDF库的一些基本用法。PyMuPDF的功能非常丰富,包括但不限于修改PDF内容、添加注释、提取图像和文本、转换PDF页面等。你可以根据需要探索更多的功能和方法。



程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。
大家好,这里是程序员晚枫,正在all in AI编程实战,今天给大家分享一个PDF自动化办公的第三方库:popdf。
popdf 是一个 Python 自动化办公之 Excel 操作的第三方库,它来自于开源项目 python-office。
以下是 popdf 的一些基本使用方法:
你可以通过 pip 命令来安装 popdf:
1 | pip install -i https://mirrors.aliyun.com/pypi/simple/ popdf -U |
本次popdf 发布了1.0.0版本:重点有以下几个方面的更新:
popdf 提供了多种功能,包括但不限于:
add_text_watermark:给 PDF 添加文本类型的水印。txt2pdf:将 TXT 文件转换为 PDF。encrypt4pdf:对 PDF 文件进行加密。decrypt4pdf:对 PDF 文件进行解密。merge2pdf:合并多个 PDF 文件。pdf2docx:将 PDF 转换为 Word 文档。pdf2imgs:将 PDF 转换为图片。split4pdf:将 PDF 按指定页数拆分。以下是一些 popdf 功能的使用示例:
1 | import popdf |
1 | import popdf |
请注意,具体的使用方法和参数可能会根据 popdf 的版本更新而有所变化,建议查看官方文档或 GitHub 仓库以获取最新的使用指南和示例代码。
本次更新,还统一了参数的命名方式:



程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。
大家好,这里是程序员晚枫,正在all in AI编程实战,今天给大家分享一个Python自动化办公的第三方库:pomarkdown,专门用来处理markdown文件。
本文是该库的第1个功能:1行代码将Excel转成Markdown。
我最近在出一套课程:Python + Excel,实现自动化办公。
其中写文档的过程中需要用到到Excel转成Markdown,方便我在文档中插入表格数据。
所以我就开发了这个功能:可以实现整个Excel的转换,也可以只转换其中的1个sheet。
首先,下载一个Markdown自动化办公的专用库:pomarkdown,命令如下,👇
1 | pip install pomarkdown |
然后直接1行代码搞定,👇
1 | # pip install pomarkdown |



程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。
👉 项目官网:https://www.python-office.com/ 👈
👉 本开源项目的交流群 👈
大家好,这里是程序员晚枫,正在all in AI编程实战,今天给大家分享一个Python自动化办公的第三方库:popdf,专门用来处理PDF文件。
Python和PyCharm的安装,就不再每套课程都重复了,跟着下面视频做就行了。
课程前3讲,主要是Python环境的搭建,包含:python的安装、pycharm的安装和pip的使用。
是学习本套课程、运行课程中的代码必须安装的软件。
如果是小白,请务必按顺序听完学会;如果是已经安装并且会使用的大佬,请直接跳转到下一部分的课程。
已有功能的说明如下:
| 序号 | 方法名 | 功能 | 视频 | 文档 |
|---|---|---|---|---|
| 1 | pdf2docx | 💻PDF 转 Word | 💻 播放 | 查看 |
| 2 | pdf2imgs | PDF 转 图片 | 💻文档 | 查看 |
| 3 | txt2pdf | TXT转PDF | 文档 | 查看 |
| 4 | split4pdf | 按页切割PDF | 💻文档 | 查看 |
| 5 | encrypt4pdf | PDF加密 | 文档 | 查看 |
| 6 | decrypt4pdf | PDF解密 | 文档 | 查看 |
| 7 | add_text_watermark | PDF加水印 | 播放 | 查看 |
| 8 | merge2pdf | 合并PDF | 文档 | 查看 |
| 9 | del4pdf | 删除PDF | 文档 | 查看 |
如果你喜欢以上这些开源项目,欢迎加入我们的开源小组,一起交流学习,一起进步。
加我的微信:python-office,备注:开源
关于项目的介绍:




程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。
👉 项目官网:https://www.python-office.com/ 👈
👉 本开源项目的交流群 👈
大家好,我是程序员晚枫。今天我要给大家带来一个超实用的好消息——popdf 已经支持批量 PDF 转 Word 了!是不是很激动?别急,我来手把手教你玩转这个功能。
pip install popdf
之前我就说过,popdf 的核心就是简单暴力。只需要一行代码,你就能轻松把 PDF 转成 Word:
1 | from popdf import pdf2docx |
是不是很简单?小白也能秒上手!
现在,popdf 更是升级了!支持批量转换啦!只需要换两个参数,就能一次性处理一堆 PDF 文件。以下是关键参数的讲解:
input_file 和 output_file**:这组参数用来处理单个文件,适合零散的 PDF 转换。input_path 和 output_path**:这组参数才是今天的主角!input_path 是 PDF 文件夹路径,output_path 是输出 Word 文件夹路径。只要把 PDF 文件丢进输入文件夹,运行代码,Word 文件就自动出来了。批量转换的代码示例如下:
1 | from popdf import pdf2docx |
是不是超方便?再也不用手动一个个转换了!

为了让大家更直观地感受,我再贴一个完整的代码示例:
1 | from popdf import pdf2docx |
记住,路径一定要改成你自己的文件夹路径,否则程序会骂你哦!
我是程序员晚枫,一个热爱技术、爱折腾的开发者。平时喜欢写一些实用的工具和库,帮助大家解决开发中的小痛点。popdf 就是其中之一,希望能帮到更多人。
如果你对这个工具感兴趣,或者有任何问题,欢迎在评论区留言!告诉我你的使用体验,或者提出你想要的功能,说不定下个版本就实现了哦!
快来试试吧,保证让你惊艳!有问题留言区见! 😄
GitHub 项目地址:https://github.com/CoderWanFeng/popdf
如果你喜欢以上这些开源项目,欢迎加入我们的开源小组,一起交流学习,一起进步。
加我的微信:python-office,备注:开源
关于项目的介绍:




程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。
👉 项目官网:https://www.python-office.com/ 👈
👉 本开源项目的交流群 👈
大家好,我是程序员晚枫。今天我要给大家带来一个超实用的功能——popdf 现在支持 PDF 转图片了,而且还能批量操作!是不是很激动?别急,我来手把手教你玩转这个功能。
popdf 的核心就是简单暴力。只需要一行代码,你就能轻松把 PDF 转成图片:
1 | from popdf import pdf2imgs |
是不是很简单?小白也能秒上手!

现在,popdf 更是升级了!支持批量转换啦!只需要换两个参数,就能一次性处理一堆 PDF 文件。以下是关键参数的讲解:
input_file 和 output_file**:这组参数用来处理单个文件,适合零散的 PDF 转换。input_path 和 output_path**:这组参数才是今天的主角!input_path 是 PDF 文件夹路径,output_path 是输出图片文件夹路径。只要把 PDF 文件丢进输入文件夹,运行代码,图片文件就自动出来了。批量转换的代码示例如下:
1 | from popdf import pdf2imgs |
是不是超方便?再也不用手动一个个转换了!
为了让大家更直观地感受,我再贴一个完整的代码示例:
1 | from popdf import pdf2imgs |
记住,路径一定要改成你自己的文件夹路径,否则程序会骂你哦!
我是程序员晚枫,一个热爱技术、爱折腾的开发者。平时喜欢写一些实用的工具和库,帮助大家解决开发中的小痛点。popdf 就是其中之一,希望能帮到更多人。
如果你对这个工具感兴趣,或者有任何问题,欢迎在评论区留言!告诉我你的使用体验,或者提出你想要的功能,说不定下个版本就实现了哦!
快来试试吧,保证让你惊艳!有问题留言区见! 😄
GitHub 项目地址:https://github.com/CoderWanFeng/popdf
如果你喜欢以上这些开源项目,欢迎加入我们的开源小组,一起交流学习,一起进步。
加我的微信:python-office,备注:开源
关于项目的介绍:




程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。
👉 项目官网:https://www.python-office.com/ 👈
👉 本开源项目的交流群 👈
大家好,这里是程序员晚枫,正在all in AI编程实战,今天给大家分享一个Python自动化办公的第三方库:popdf,专门用来处理PDF文件。
首先,下载一个PDF自动化办公的专用库:popdf,命令如下,??
1 | pip install popdf |
然后直接1行代码搞定,??
1 | # pip install popdf |
如果你喜欢以上这些开源项目,欢迎加入我们的开源小组,一起交流学习,一起进步。
加我的微信:python-office,备注:开源
关于项目的介绍:




程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。
👉 项目官网:https://www.python-office.com/ 👈
👉 本开源项目的交流群 👈
大家好,这里是程序员晚枫,正在all in AI编程实战,今天给大家分享一个Python自动化办公的第三方库:popdf,专门用来处理PDF文件。
首先,下载一个PDF自动化办公的专用库:popdf,命令如下,??
1 | pip install popdf |
然后直接1行代码搞定,??
1 | # pip install popdf |
如果你喜欢以上这些开源项目,欢迎加入我们的开源小组,一起交流学习,一起进步。
加我的微信:python-office,备注:开源
关于项目的介绍:




程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。
👉 项目官网:https://www.python-office.com/ 👈
👉 本开源项目的交流群 👈
大家好,这里是程序员晚枫,正在all in AI编程实战,今天给大家分享一个Python自动化办公的第三方库:popdf,专门用来处理PDF文件。
首先,下载一个PDF自动化办公的专用库:popdf,命令如下,??
1 | pip install popdf |
然后直接1行代码搞定,??
1 | # pip install popdf |
如果你喜欢以上这些开源项目,欢迎加入我们的开源小组,一起交流学习,一起进步。
加我的微信:python-office,备注:开源
关于项目的介绍:




程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。
👉 项目官网:https://www.python-office.com/ 👈
👉 本开源项目的交流群 👈
大家好,这里是程序员晚枫,正在all in AI编程实战,今天给大家分享一个Python自动化办公的第三方库:popdf,专门用来处理PDF文件。
首先,下载一个PDF自动化办公的专用库:popdf,命令如下,??
1 | pip install popdf |
然后直接1行代码搞定,??
1 | # pip install popdf |
如果你喜欢以上这些开源项目,欢迎加入我们的开源小组,一起交流学习,一起进步。
加我的微信:python-office,备注:开源
关于项目的介绍:




程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。
👉 项目官网:https://www.python-office.com/ 👈
👉 本开源项目的交流群 👈
大家好,这里是程序员晚枫,正在all in AI编程实战,今天给大家分享一个Python自动化办公的第三方库:popdf,专门用来处理PDF文件。
首先,下载一个PDF自动化办公的专用库:popdf,命令如下,??
1 | pip install popdf |
然后直接1行代码搞定,??
1 | # pip install popdf |
如果你喜欢以上这些开源项目,欢迎加入我们的开源小组,一起交流学习,一起进步。
加我的微信:python-office,备注:开源
关于项目的介绍:




程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。
👉 项目官网:https://www.python-office.com/ 👈
👉 本开源项目的交流群 👈
大家好,这里是程序员晚枫,正在all in AI编程实战,今天给大家分享一个Python自动化办公的第三方库:popdf,专门用来处理PDF文件。
首先,下载一个PDF自动化办公的专用库:popdf,命令如下,??
1 | pip install popdf |
然后直接1行代码搞定,??
1 | # pip install popdf |
如果你喜欢以上这些开源项目,欢迎加入我们的开源小组,一起交流学习,一起进步。
加我的微信:python-office,备注:开源
关于项目的介绍:




程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。
👉 项目官网:https://www.python-office.com/ 👈
👉 本开源项目的交流群 👈
大家好,这里是程序员晚枫,正在all in AI编程实战,今天给大家分享一个Python自动化办公的第三方库:popdf,专门用来处理PDF文件。
首先,下载一个PDF自动化办公的专用库:popdf,命令如下,??
1 | pip install popdf |
然后直接1行代码搞定,??
1 | # pip install popdf |
如果你喜欢以上这些开源项目,欢迎加入我们的开源小组,一起交流学习,一起进步。
加我的微信:python-office,备注:开源
关于项目的介绍:




程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。

大家好,这里是程序员晚枫,正在all in AI编程实战。
今天给大家分享的第三方库是Python自动化办公的专用库:python-office。
从2022年发布到现在,经过40多个版本的迭代,这个库的下载量已经超过26.7万次,并且在2024年12月4日终于发布了1.0.0版本。
我们一起来看一下它的高频使用案例。
作为一个为Python新人开发的第三方库,它的下载方式非常简单,只需要在命令行中输入以下命令即可:
1 | pip install python-office==1.0.0 |
这里要说一下,本次发布的1.0.0版本,和上一个版本相比,最大的区别就是它去掉了所有运行时的广告。以前版本刚发布的时候需要一些广告来更好的推广这个库,现在有越来越多的人使用它,就不再需要广告了,非常的清爽。
python-office里的功能非常丰富,这里给大家介绍几个常用的功能。
1 | import office |
1 | import office |
1 | import office |
2024年的最后一个月,本仓库也加入了atomgit的G-Star毕业项目,这意味着这个库的维护将会更加的完善。
接下来除了继续开发新的功能外,还会重点在以下几个方面进行优化:
大家在使用这个库的过程中,有什么问题或者建议,欢迎在评论区留言。
程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。
这是专栏优秀的第三方库的第6篇原创文章。
大家好,这里是程序员晚枫,正在all in AI编程实战。
今天给大家分享一个可以把Python程序员打包 成exe程序的库——Nuitka。
Nuitka 是一个 Python 编译器,它可以将 Python 代码编译成可执行文件或扩展模块。以下是如何使用 Nuitka 的基本步骤和视频:
你可以通过 pip 来安装 Nuitk
A:
1 | pip install nuitka -i https://mirrors.aliyun.com/pypi/simple// |
确保你使用的是 Python 3.6 或更高版本。
使用 Nuitka 编译 Python 代码的基本命令是:
1 | nuitka --python python_script.py |
这将编译 python_script.py 文件。
要生成一个独立的可执行文件,可以使用以下命令:
1 | nuitka --standalone python_script.py |
这将生成一个包含所有依赖的可执行文件。
Nuitka 提供了多种编译选项,以下是一些常用的选项:
--show-progress:在编译过程中显示进度条。--enable-plugin=插件名称:启用指定的 Nuitka 插件。--disable-plugin=插件名称:禁用指定的 Nuitka 插件。--verbose:输出详细的编译信息。--assume-yes:在提示时自动回答“是”。Nuitka 还提供了一些优化选项来提升打包程序的性能和体积:
--lto:启用链接时优化(Link Time Optimization),进一步优化二进制文件体积和性能。--nofollow-imports:避免跟踪不必要的模块依赖导入,减少可执行文件的体积。--remove-output:在每次构建完成后,删除临时的构建文件,节省磁盘空间。如果 Nuitka 无法自动检测到所有第三方依赖,你可以使用 --include-data-dir 选项来指定静态资源或依赖的路径:
1 | nuitka --onefile --standalone --include-data-dir=./data=./data pdf_extract_tool.py |
这样可以将项目中的 data 文件夹一并打包。
Nuitka 支持多线程和多进程,并且可以使用 C 编译器的优化选项(如 -O3)来加速运行速度:
1 | nuitka --standalone --onefile --optimize=2 pdf_extract_tool.py |
--optimize=2 选项表示使用 C 编译器的最高优化等级。
这些是 Nuitka 的基本使用方法和一些高级特性。你可以根据项目的具体需求来选择合适的选项进行编译。
大家在阅读过程中有任何问题,或者觉得有收获的话,欢迎点赞、评论和收藏。



程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。
tag:
缺失模块。
1、请确保node版本大于6.2
2、在博客根目录(注意不是yilia根目录)执行以下命令:
npm i hexo-generator-json-content --save
3、在根目录_config.yml里添加配置:
jsonContent:
meta: false
pages: false
posts:
title: true
date: true
path: true
text: false
raw: false
content: false
slug: false
updated: false
comments: false
link: false
permalink: false
excerpt: false
categories: false
tags: true