大家好,这里是程序员晚枫,正在all in AI编程实战,之前在B站账号:Python自动化办公社区发布了一套关于Excel + Python实现自动化办公的教程,目前已经有40w+的播放了。

其中主要使用的Python第三方库是pandas,今天就以pandas为核心内容,给大家分享一下精简版的10分钟入门教程。

我根据pandas的官方文档做了以下修改:

  • 改为中文,官网是英文版,这个不用多解释了。
  • 把技术上的专用名词改为通俗易懂的日常词汇,因为关注我的朋友有一部分不是程序员。
  • 增加了pandas + excel应用的案例,官网文档主要是编程角度的介绍。

因本人能力有限,如果有错误的地方,欢迎大家评论区 或者 加入读者群交流。

0、写在前面

pandas和Excel的对比

为了方便大家理解,我先用Excel里有的概念,来解释一下pandas里的基本数据类型。如下图所示:

pandasExcel
DataFrameworksheet
Series一列数据(含列名)
Index行号
row
NaN空单元格

演示数据

本文使用的演示Excel中的文件名:程序员晚枫的账号.xlsx,存放在我本地的D盘下work文件夹里,里面只有一个sheet,如下图所示,大家可以自己在电脑上创建一个。

文件的位置:D:\work\程序员晚枫的账号.xlsx

platform(平台)name(账号名)fans(粉丝数)remark(备注)
0B站Python自动化办公社区140000课程
1抖音程序员晚枫6000vlog
2公众号Python自动化办公社区100000文章
3小红书程序员晚枫8000工具
4小红书Python自动化办公社区10000

必备软件

Python和PyCharm的安装、第三方库的安装,我就不再每个教程都重复了,大家跟着下面的3个视频顺序安装即可:

1、读取Excel

首先,把Excel读进Python代码里。

1
2
3
4
5

import pandas as pd
platform_df = pd.read_excel('D:\\work\\程序员晚枫的账号.xlsx',sheet_name='sheet1')#和下面这句代码等效
platform_df = pd.read_excel('D:\\work\\程序员晚枫的账号.xlsx',sheet_name=0)
print(platform_df) #查看读取的Excel内容

2、查看数据

查看头/尾数据

1
2
print(platform_df.head(3)) #查看前5行数据
print(platform_df.tail(3)) #查看后5行数据

查看索引、列名和值

1
2
3
print(platform_df.index)    #查看索引
print(platform_df.columns) #查看列名

查看某一列的数据分析

查看粉丝数这一列的基本统计信息,包括计数、平均值、标准差、最小值、最大值以及25%、50%、75%分位数。

1
2
3

print(platform_df.fans.describe())

3、排序

根据某一列的值进行排序,默认是升序。

1
print(platform_df.sort_values('fans'))

如果想降序排列,可以使用ascending=False参数。

根据行索引进行排序,代码如下:

1
print(platform_df.sort_index(ascending=False))

4、筛选数据

筛选出粉丝数大于10w的账号

1
print(platform_df[platform_df.fans > 100000])

筛选出备注为空的账号

1
print(platform_df[platform_df.remark.isna()])

5、新增一列

1
2
platform_df['new'] = 100
print(platform_df)

6、删除一列

1
2
platform_df.drop('new',axis=1,inplace=True) #axis=1表示删除列,inplace=True表示直接在原数据上修改
print(platform_df)

7、保存数据

1
platform_df.to_excel('D:\\work\\程序员晚枫的账号.xlsx',sheet_name='sheet1',index=False) #index=False表示不保存索引

8、参考文档

扫一扫,领红包

美团红包

相关阅读

🎓 AI 编程实战课程

程序员晚枫专注AI编程培训,通过 《30讲 · AI编程训练营》,让小白也能用AI做出实际项目。帮你从零上手!