第12讲:Excel 自动化 Skill 开发
掌握 Excel 场景的 Skill 开发,实现数据清洗、报表生成、格式转换等自动化操作,让繁琐的表格处理工作变得轻松高效。
一、场景分析
1.1 用户痛点
在日常办公中,Excel 处理是最耗时的工作之一:
- 数据清洗痛苦:从各部门收集的数据格式不统一,需要手动整理、去重、填充空值
- 报表制作繁琐:每周/每月需要重复制作相同格式的报表,复制粘贴容易出错
- 格式转换困难:需要将 Excel 转换为 PDF、CSV 等其他格式,操作步骤多
- 数据合并复杂:多个表格需要按条件合并,VLOOKUP 公式写起来头大
- 批量处理低效:几百个文件需要统一修改格式,手动操作不现实
1.2 典型应用场景
| 场景 | 需求描述 | Skill 价值 |
|---|---|---|
| 销售报表 | 汇总各区域销售数据,生成可视化图表 | 一键生成,自动更新 |
| 财务报表 | 合并多个科目表,计算汇总数据 | 减少人工计算错误 |
| 人事统计 | 统计考勤、绩效、薪资数据 | 自动化数据处理 |
| 库存管理 | 跟踪库存变动,预警低库存商品 | 实时监控,自动提醒 |
| 数据迁移 | 将旧系统数据转换为新系统格式 | 批量转换,格式校验 |
二、核心功能设计
2.1 Skill 功能清单
一个完整的 Excel 自动化 Skill 应该具备以下功能:
1 | 📊 Excel 智能助手 |
2.2 用户交互流程
1 | 用户输入 → 意图识别 → 参数提取 → 执行操作 → 结果返回 |
三、技术实现
3.1 技术选型
Excel 处理的核心技术栈:
| 平台 | 技术方案 | 特点 |
|---|---|---|
| Coze | Python + openpyxl/xlrd | 功能全面,支持复杂操作 |
| OpenClaw | Python + pandas | 数据处理能力强 |
| 飞书 CLI | 飞书表格 API | 与飞书生态深度集成 |
3.2 Coze 平台实现
3.2.1 插件配置
在 Coze 中创建 Excel 处理 Skill,需要配置以下插件:
- 代码执行节点:使用 Python 处理 Excel 文件
- 文件处理节点:读取和保存 Excel 文件
- 大模型节点:理解用户意图,提取处理参数
3.2.2 核心代码示例
数据清洗功能代码:
1 | import pandas as pd |
报表生成功能代码:
1 | def generate_report(data_file, report_config): |
多表合并功能代码:
1 | def merge_excel_files(file_list, merge_config): |
3.3 OpenClaw 平台实现
OpenClaw 的 Excel Skill 开发更加简洁:
1 | from openclaw import Skill, Tool |
3.4 飞书 CLI 实现
飞书 CLI 可以直接操作飞书表格:
1 | from lark_cli import Skill, SpreadsheetAPI |
四、Prompt 设计
4.1 系统 Prompt
1 | 你是 Excel 智能助手,专门帮助用户自动化处理 Excel 文件。 |
4.2 意图识别示例
| 用户输入 | 识别意图 | 提取参数 |
|---|---|---|
| “帮我把这个表里的重复数据删掉” | 数据清洗-去重 | 文件路径、去重列 |
| “把这三个销售表合并成一个” | 数据合并 | 文件列表、合并方式 |
| “生成一个按月份汇总的报表” | 报表生成 | 数据源、汇总维度 |
| “把 Excel 转成 PDF” | 格式转换 | 源文件、目标格式 |
五、实战案例
5.1 案例一:销售数据清洗
场景:销售部门每月收到各区域提交的 Excel 报表,需要合并并清洗。
解决方案:
1 | # Skill 执行流程 |
5.2 案例二:财务报表自动化
场景:财务每月需要从多个系统导出数据,生成管理报表。
解决方案:
1 | def generate_finance_report(config): |
六、多平台适配对比
| 功能 | Coze | OpenClaw | 飞书 CLI |
|---|---|---|---|
| 本地文件处理 | ✅ | ✅ | ❌ |
| 飞书表格操作 | ❌ | ❌ | ✅ |
| 复杂数据处理 | ✅ | ✅ | 中等 |
| 图表生成 | ✅ | ✅ | ✅ |
| PDF 转换 | ✅ | ✅ | 需插件 |
| 批量处理 | ✅ | ✅ | 中等 |
七、实战练习
练习 1:基础数据清洗
创建一个 Skill,实现以下功能:
- 读取用户上传的 Excel 文件
- 自动检测并去除重复行
- 填充所有空值为 0
- 将日期列统一为 YYYY-MM-DD 格式
- 返回清洗后的文件
练习 2:销售报表生成
创建一个 Skill,实现以下功能:
- 读取销售数据
- 按产品类别和月份生成透视表
- 生成柱状图展示销售额
- 标记销售额超过 10 万的记录
- 导出为 PDF 报表
练习 3:多表合并工具
创建一个 Skill,实现以下功能:
- 接收多个 Excel 文件
- 按指定列(如”客户ID”)合并
- 处理列名冲突(添加前缀区分来源)
- 生成合并报告(显示合并前后的行数)
- 返回合并后的文件
八、常见问题
Q1:处理大文件时内存不足怎么办?
解决方案:
- 使用
pandas.read_excel()的chunksize参数分块读取 - 只读取需要的列:
usecols=['列A', '列B'] - 考虑使用 Dask 进行分布式处理
Q2:如何保留 Excel 的格式和公式?
解决方案:
- 使用
openpyxl而不是pandas处理格式 - 读取时保留公式:
data_only=False - 复制单元格样式到新的工作簿
Q3:中文乱码怎么处理?
解决方案:
- 明确指定编码:
encoding='utf-8'或'gbk' - CSV 文件添加 BOM:
encoding='utf-8-sig' - 检查源文件的编码格式
九、下节预告
下一讲我们将学习 PDF 智能处理 Skill 开发,包括:
- PDF 内容提取与解析
- PDF 合并、拆分、旋转
- PDF 与 Word/Excel 互转
- OCR 文字识别集成
加入学习群

本讲是《AI Skills 从入门到实践》系列课程的第12讲。