大家好,我是程序员晚枫。
如果你也做口播视频,肯定被一件事折磨过:
剪口播。
一遍 20 分钟的口播,可能口误 50 次、停顿 100 次、重复 30 次。
剪映的"智能剪口播" 又有两个致命问题:
- 不懂语义——重说、纠正的内容识别不出来
- 字幕不准——专业术语(Claude Code、MCP、API)经常错
今天给大家介绍一个专门解决这两个问题的工具——videocut-skills。
一、videocut-skills 是什么?
一句话:用 Claude Code Skills 做的口播视频剪辑 Agent。
不是云端 SaaS,是本地 Claude Code 装的技能——你给一个视频文件,AI 帮你识别问题片段,人工最后确认。
二、为什么它比剪映强?
剪映做不到了,videocut-skills 做到了:
| 功能 | 说明 | 剪映 |
|---|---|---|
| 语义理解 | AI 逐句分析,识别重说/纠正/卡顿 | ❌ 只能模式匹配 |
| 静音检测 | >0.3s 自动标记,阈值可调 | ⚠️ 固定阈值 |
| 重复句检测 | 相邻句开头 ≥5 字相同 → 删前保后 | ❌ 无 |
| 句内重复 | "好我们接下来好我们接下来做" → 删重复 | ❌ 无 |
| 词典纠错 | 自定义专业术语词典 | ❌ 无 |
| 自更新 | 记住你的偏好,越用越准 | ❌ 无 |
核心武器:Claude 的语义理解 + 自定义专业词典。
三、效果演示
来自官方 README 的真实数据:
输入:19 分钟口播原片(各种口误、卡顿、重复)
输出:
- 自动识别 608 处问题(静音 114 + 口误/重复 494)
- 剪辑后视频 72MB
- 全程 AI 辅助,人工只需确认
19 分钟 → 几分钟人工确认 → 干净的视频。
📺 真实效果链接:
作者也欢迎你把使用心得提到 Issues——多看几条 Issue 就能感受真实使用场景。
四、5 个 Skill 一览
| Skill | 干什么 | 输入 | 输出 |
|---|---|---|---|
安装 | 环境准备 | 无 | 安装日志 |
剪口播 | 转录 + AI 审核 + 剪辑 | 视频文件 | 剪辑后视频 |
字幕 | 生成字幕 | 视频文件 | 带字幕视频 |
高清化 | 2-pass + 锐化导出 | 视频文件 | 高清视频 |
自更新 | 记录偏好 | 用户反馈 | 更新规则文件 |
五、3 步快速开始
第 1 步:安装 Skills
1 | # 克隆到 Claude Code skills 目录 |
第 2 步:配置 API Key
1 | cd ~/.claude/skills/videocut |
第 3 步:装环境
打开 Claude Code,输入:
1 | /videocut:安装 |
AI 自动:
- 检查 Python、FFmpeg、Node.js
- 安装 FunASR(口误识别模型,约 2GB)
- 安装 Whisper large-v3(字幕模型,约 3GB)
六、完整使用流程
1 | ┌─────────────────────────────────────────────┐ |
七、技术架构
1 | ┌──────────────────┐ ┌──────────────────┐ |
八、8 个审核规则(核心)
videocut-skills 的"魔法"在于审核规则——剪口播/用户习惯/ 目录:
| 规则 | 干什么 |
|---|---|
| 1-核心原则 | 删前保后(重复句保留后半段) |
| 2-语气词检测 | 嗯/啊/呃/哦 |
| 3-静音段处理 | >0.3s 删除(可调到 1s) |
| 4-重复句检测 | 相邻句开头 ≥5 字相同 |
| 5-卡顿词 | 那个那个、就是就是 |
| 6-句内重复检测 | A+中间+A 模式 |
| 7-连续语气词 | 嗯啊、啊呃 |
| 8-重说纠正 | 部分重复、否定纠正 |
所有规则都可以通过 /videocut:自更新 自定义。
九、自定义词典(专业术语纠错)
Whisper 默认会把 "Claude Code" 识别成 "cloud code"、"MCP" 识别成 "MC P"。
解决方案:编辑 字幕/词典.txt:
1 | Claude Code |
每行一个词。AI 转录时优先用词典里的拼写。
十、依赖
| 依赖 | 用途 | 安装方式 |
|---|---|---|
| Node.js 18+ | 跑脚本 | brew install node |
| FFmpeg | 音视频处理 | brew install ffmpeg |
| Python 3.8+ | 模型运行 | 系统自带 |
| 火山引擎 API | 语音转录 | 申请 Key |
十一、常见问题
Q: 火山引擎转录超时?
上传音频到 uguu.se(脚本默认),不要用 catbox.moe(火山引擎访问慢)。
Q: 审核网页打不开?
检查端口 8899 是否被占用:
1 | lsof -i :8899 |
Q: 剪辑后音画不同步?
脚本已用 filter_complex + trim 处理(不用 concat demuxer)。
Q: 怎么添加自定义词典?
编辑 字幕/词典.txt,每行一个词。
总结
videocut-skills = 本地 Claude Code 装的"口播剪辑 Agent"。
- 19 分钟视频 → 几小时前剪 + 几分钟人工确认
- 4 个 Skill:剪口播 + 字幕 + 高清化 + 自更新
- 懂语义 + 懂专业术语 = 比剪映强 10 倍
如果你每周都要剪口播视频,这个工具省你一天时间。
科技不高冷,AI 很好用。
我是晚枫,关注我,带你一起玩 AI!
💬 来评论区聊聊
你剪口播视频最头疼的是什么?
videocut-skills 的哪个功能你最想试?
🔗 快速链接
- 💻 GitHub:https://github.com/Ceeon/videocut-skills
- ⚡ Skills 安装:
git clone https://github.com/Ceeon/videocut-skills.git ~/.claude/skills/videocut - 🔑 火山引擎 API:https://console.volcengine.com/
- 📚 Claude Code Skills 文档:https://docs.claude.com/en/docs/claude-code/skills
本文基于 videocut-skills 官方 README(2026-06)整理。
