大家好,我是正在实战各种AI项目的程序员晚枫。
今天学习Pandas最强大的功能——groupby分组聚合。
无论是做销售报表、用户分析还是运营统计,groupby都是必不可少的工具。掌握它,你就能像写SQL一样灵活地分析数据。
基础语法
1 | import pandas as pd |
常用聚合函数
单函数聚合
1 | # 求和 |
多函数agg
1 | # 对单列应用多个函数 |
多列分组
1 | # 按部门和年份分组(假设有年份列) |
transform:保持原数据结构
1 | # 计算每个部门的平均薪资 |
apply:自定义复杂逻辑
1 | # 定义自定义函数 |
过滤筛选
1 | # filter:筛选满足条件的组 |
数据透视表pivot_table
1 | # 创建更复杂的示例数据 |
实战:销售数据分析报表
1 | import pandas as pd |
性能优化技巧
1 | # 1. 分类类型加速 |
下节预告
下一课我们将学习时间序列处理,掌握日期时间数据的分析方法。
💬 加入学习交流群
扫码加入Python学习交流群,和数千名同学一起进步:
👉 点击加入交流群
群里不定期分享:
- 数据分析实战案例
- Python学习资料
- 求职面试经验
- 行业最新动态
推荐:AI Python数据分析实战营
🎁 限时福利:送《利用Python进行数据分析》实体书
👉 点击了解详情
课程导航
上一篇: Pandas数据变换-合并与连接
下一篇: Pandas数据变换-时间序列处理
PS:groupby是Pandas的灵魂。熟练掌握它,你就能应对90%的数据统计需求。
