创作背景
热点来源:普通人被AI新名词轰炸,Token、Prompt、RAG、思维链……完全搞不懂,收藏了十几篇科普还是串不起来
创作角度:用一个打工人周一到周三的完整经历(写周报→分析文件→面试准备),21个概念在一个故事中自然生长
主线任务:周四要交周报+季度数据分析+周五面试(时间线贯穿,无章节切分)
三次推进 → 解决:
- 周一·写周报:打开AI → 写出来全是套话 → 换种说法 → 每次重复太麻烦 → 换个AI效果不一样
- 周二·读文件:想让它读PDF → 它说没见过的内容 → 它编了不存在的东西 → 它只知道旧数据 → 它只认文字
- 周三·练面试:把AI放进微信 → 用着用着报错 → 出的题不像真的 → 给评价太浅 → 想让它顺手改简历
v2.2 关键升级(对照v2.2创作指南·人设风格规范): - ①语言风格"晚枫化":黑色幽默/冷笑话/自嘲贯穿全文(10+处),如"AI编起来比造谣的自媒体还自信"
- ②旁征博引生活化:用打印店/装修公司/外卖/景区/老师改作业/家政阿姨等日常场景类比技术概念——用生活常识解构技术黑话
- ③直接犀利:去掉"众所周知/某种程度上"等模糊词,不装腔作势,结尾直接怼"学AI是为了当工程师"的误解
- ④有主见表达:不随波逐流,标准明确,如"小红书只是分发平台,不为任何平台设专门格式"
- ⑤v2.1全部保留:共情瞬间/一个故事贯穿/4拍子/来龙去脉/分镜表/自查清单
人设锚点:结尾互动前,"关注晚枫,AI工具的真话只在这里讲"
系列位置:全系列汇总篇,一篇讲透21个核心概念
口播稿
封面文案
- 第一行(📝文案):AI圈21个名词
- 第二行(📝文案):一篇讲透,收藏备用
- 🎨画面风格:深蓝背景+黄字大标题,21个概念图标依次飞入,最后定格为"21→1 全串起来"
口播正文(完整连贯版·口语化)
AI圈冒出一堆新名词:Token、LLM、Prompt、RAG、思维链、向量化、幻觉……到底什么意思?开会时旁边同事聊起来,你插不上话,回家搜了一晚上还是一头雾水。
说实话,我三个月前也是。同事开会聊起这些,我一句话都插不上,只能假装点头——感觉就像一群人讨论"量子纠缠",我在旁边数他们说了几个"量子"。回家搜了一晚上,每个词都有定义,但串不起来,看完更懵。这感觉,像你去考驾照,科目一每道题都认识,但连起来不知道在考什么。
今天我就用一个完整的故事——从周一写周报,到周二分析文件,到周三准备面试——把21个概念全部串进去。一个打工人的完整一周,每一个概念都是在解决前一个问题的过程中自然出现的。不废话,直接开讲。
周一早上,领导上周五说"周三交周报",我打开AI,随口说了句"帮我写周报"——
两秒钟,AI给你一大段。
我盯着那段文字看了十秒,发现一个问题:每个字都认识,连起来不知道在说啥。就像你收到领导的邮件——"关于前述事项的后续推进,望各相关方协同配合,确保落地见效"——翻译过来就是"赶紧干活"。但AI还没学到直接给结论这一步,它在努力显得"专业"。
背后干这个活的,叫大语言模型,LLM。
这就是第一个概念。你每次打开AI聊天,背后都是它在干活。国内的DeepSeek、千问、Kimi、豆包,国外的ChatGPT、Claude、Gemini——全都是大语言模型。
但它有个特点:你输入的话,会被拆成一个个小块。
"帮我写周报"五个字,大约消耗7个Token。AI回复你200个字,再消耗200个Token。Token就是AI的字数计数器——它按这个收费,你也按这个理解它"读了多少"。
这就像你去打印店——打印按页收费,复印按张收费,AI按Token收费。本质一样:定价需要一个最小不可分单位。Token就是AI世界的"一页纸"。
但Token有个冷笑话式的设定:它不按"意思"计费,按"块"计费。就像律师按小时收费,他在厕所蹲了20分钟思考你案子,那20分钟也算钱——因为计时器不会因为他蹲厕所就停。AI也一样,它"想"的过程也要消耗Token,哪怕它"想"出来的东西是错的。
你输入的这句话,叫Prompt,提示词。
到这里,三个概念已经自然出场了:
- LLM是大脑——你问它问题,它回答你
- Token是字数计数器——你输入多少、它输出多少,都按这个算。记住,AI按Token收费,就像律师按小时收费,你话越多,账单越长
- Prompt是你输入的话——你说什么,它答什么
但问题来了——
AI写出来的周报,全是套话。
"本周工作稳步推进,各项指标持续向好"——你领导看了,第一反应是"这人到底干了啥?"
这种废话,像不像你写毕业论文时凑字数的"综上所述"?听着对,其实啥也没说。
为什么?因为你没有把需求说清楚。LLM很聪明,但它不是你肚子里的蛔虫。你不说清楚,它就只能猜,猜出来的东西就是套话。这就像你让装修公司"帮我装修"——不说清楚要几个房间、什么风格、预算多少,设计师也只能给你套模板。
于是你换种说法:"上周做了3个功能、修了5个bug、开了2次评审会,帮我写周报。"——这次,AI写出来的明显靠谱多了。
这种把需求说清楚的方法,叫提示词工程。
提示词工程就是让AI听懂你的核心方法。就像你给厨师写菜单——写"来份好吃的",厨师随便做;写"来份番茄炒蛋,蛋要嫩,番茄要出汁",做出来就是你要的。
生活中这叫"把话说清楚"——你说得越具体,对方越没法糊弄你。点外卖写"来份好吃的",商家随便做;写"来份番茄炒蛋,蛋要嫩,番茄要出汁,不要葱",做出来就是你要的。AI也一样,Prompt就是你的"菜单",越明确,AI越没法糊弄你。
但你又发现一个问题:每次打开AI,都得重新说一遍"我是程序员,周报格式是……"。太麻烦了。这就像每次去餐厅都得重新告诉服务员你素食、不吃香菜、对花生过敏——累不累?
你希望AI一开始就记住你的背景——"你是个程序员,你的周报格式是……"。于是你在最开始设定了这段话,AI之后每次都按这个来。这就是系统提示词。
而你在对话过程中补充的那些信息——"上周做了3个功能"——AI能记住,靠的是上下文。
三个新概念也出场了:
- 提示词工程是让AI懂你的方法——就像给厨师写详细菜单,也像给律师写明确的案情说明
- 系统提示词是一开始就设定的身份——就像给AI的岗位说明书,也像餐厅会员卡里写的"常客偏好:素食、免香菜"
- 上下文是对话过程中补充的信息——就像AI的短期记忆,上下文越长,记得越多。但注意,它的记忆是有限度的,装满了前面的就会挤掉后面的
但还有件事:同样的提示词,换个AI,效果天差地别。
这就是模型的区别。LLM是大脑,但大脑也分聪明和一般。GPT-4o、Claude 3.5、千问2.5——不同的模型,效果不一样。选对模型,有时候比提示词工程还重要。
就像你选律师——同一个案子,实习生和资深合伙人写出来完全不同。选错模型,就像花大价钱请了个刚拿证的实习律师,亏不亏?
写周报搞定了。但领导说:"把你上季度的数据也分析一下。"数据在一个PDF里。
你把简历PDF扔给AI说"帮我分析"——AI让你"突出项目管理经验"。可你压根没做过项目管理。
为什么?因为AI用的是训练时的老数据,压根没见过你的文件。它回答的是它"学过"的东西,不是你"给"的东西。就像你问一个没看过你材料的医生"我这病怎么治"——他只能说"一般这类病通常……",说的都是通用套路,不是你的具体情况。
想让AI先读懂你的东西再回答,这招叫RAG。
RAG就是"检索增强生成"。AI怎么读的?把PDF拆成段落,每段变成一串数字——这步叫向量化。变完就能快速搜索最相关的内容,然后基于你的文件回答你。
就像考试前先看课本——RAG让AI先读你的"课本",再答题。向量化就是给课本的每一页贴编号,方便快速翻到你要的那页。
但即使用了RAG,AI还是可能编出你根本没做过的项目——这叫幻觉。
为什么?因为AI训练数据有知识截止日期,它只知道训练时见过的东西,不知道今年的行情。查股价、查新闻,都要注意这个截止日期。
幻觉的本质,是AI在"不知道"的情况下硬要回答——它宁肯编一个看起来靠谱的答案,也不愿意说"我不知道"。它编起来比造谣的自媒体还自信,至少自媒体知道自己是在编。
但幻觉还有个更隐蔽的原因:AI训练时看到"A通常和B一起出现",当你提到A时,AI就默认B也在,哪怕B根本不存在。就像你问朋友"我昨天穿的是红色衣服对吧?"——他其实不记得,但大概率说"对"——因为他倾向于顺着你的话接,而不是纠正你。你的提问方式,本身就是对AI的"暗示"。
三个新概念出场了:
- RAG是让AI先读你的文件——就像考试前先看课本,也像厨师做菜前先看菜谱
- 向量化是把文字变成数字——就像给每本书贴编号,方便快速查找。编号本身没意义,但查找效率提高了100倍
- 幻觉是AI瞎编乱造——就像朋友吹牛说认识你,其实根本没见过。区别在于,朋友吹牛你看得出来,AI吹牛你未必看得出来
- 知识截止是AI只知道训练时的信息——就像知识库只更新到某个日期。你问它今天股市涨没涨,它要是训练数据截止到去年,就只能瞎猜——或者老实告诉你"我不知道"
那最新的信息怎么办?你把PDF截图也传给AI——AI不只认文字还能看图,叫多模态。
多模态就是AI能同时处理多种信息——文字、图片、语音。GPT-4o、Gemini都能看图。你把简历截图传过去,它能看到表格、图表、排版,不只是读文字。
这就像你点外卖——不只是看菜名,还要看图片、看评价、看分量。只看文字"招牌红烧肉",你都不知道实物有多大、肥不肥。多模态就是AI同时看文字、看图、看排版,信息更全面。
AI回答时一个字一个字蹦出来——这叫流式输出。不用等整段回答完才显示,体验更好。
流式输出有个冷笑话式的好处:你能看到AI"想"的过程。就像你看厨师做菜,从切菜到下锅到调味,你能看到每一步——当然,也可能看到你的菜一步步做砸。不流式的话,你只看到最终端上桌的菜,不知道中间怎么来的,咸了也没法找原因。
但回答到一半突然停了——一次能输出的字数有限,叫输出Token限制。就像作文有字数上限,超了就得停。长文章需要分段或换长上下文模型。
简历改好了,你想让AI模拟面试官,帮你练面试。
你想把AI面试官放进微信,像聊天一样随时练——这得用API,给AI装了个遥控器,让程序能调用AI。
API就是Application Programming Interface,调用AI的接口。所有AI应用底层都用API——微信里的AI机器人、网页上的AI助手、手机里的AI功能,全是通过API调用的。
API的本质是"约定"——我按这个格式请求,你按这个格式返回。就像你去窗口办事,窗口贴了"请提供身份证+申请表"——这是输入规范;"3个工作日出结果"——这是输出承诺。API就是程序和程序之间的"窗口办事指南"。
但API用着用着报错了——每分钟请求次数有上限,叫速率限制。就像高速收费站限流,商业API都有配额,企业级要付费扩容。
速率限制其实是个保护机制。想象一下,如果没有限速,所有人同时涌入API,服务器直接崩溃——就像节假日景区不限流,所有人同一天去,景区直接被挤爆。限速是为了让系统能持续运转,不是故意卡你。
这就像公共WiFi——如果所有人同时下载电影,网速直接归零,谁都用不了。限速就是让大家轮流用,保证每个人都能刷上短视频。你骂限速慢,但没了限速,你连网页都打不开。所有免费API的爱好者都应该感谢限速——因为正是限速,让免费服务还能活着。
修好了,但AI出的题不像真的。你先给它看3道标准面试题,让它照着出——这招叫Few-shot,做示范比讲道理管用。
Few-shot在生活中就是"看例子学"——我不告诉你抽象的规则,我给你看3个已经做好的例子,你自己归纳规律。就像学做菜,我不说"适量盐、少许糖",我给你看3个成品照片,你自己琢磨——人天生擅长"从例子中学习"而不是"从定义中学习"。
教会了风格,但AI直接给评价太浅。你让它别急,先一步步推理——这就是思维链,理完思路再答,深浅不一样。就像解题先写草稿,数学、逻辑题效果提升明显。
思维链的妙处在于"过程可视化"。就像老师改作业,不是直接写"错了",而是先写"这里思路对了,但第三步算错了,所以最终结果不对"——把推理过程摆出来,你才知道哪里该改。AI也一样,思维链就是让它把"怎么想的"过程写给你看。
思维链还有个冷笑话式的好处:你终于知道AI"错在哪一步"了。以前AI直接给答案,错了你也不知道它错在哪。现在它把过程写出来了,你可以看到它在第三步就犯了错误——就像你检查小学生的作业,发现他在第二步就算错了,但硬撑着写到第五步。思维链不是让AI更聪明,是让你更知道它有多不聪明。
面试要来回追问。你跟AI聊了20轮,它还记得你前面暴露的弱点——这叫多轮对话。就像朋友记得你说过的话,客服、教育场景都需要。
但多轮对话有个隐藏问题:上下文窗口是有限的。聊多了,前面的信息会被挤掉——就像你和朋友聊了一晚上,最后你问他"我一开始说的那个想法怎么样",他说"你一开始说了什么来着?"——不是不想记,是记不住了。
多轮对话有个冷笑话式的真相:你以为AI在认真倾听,其实它在"滚动刷新"。每轮新对话进来,前面的就被往后排——排满了,最早的那条就被挤掉了。就像你和朋友聊了20句,他忘了你第一句说的"我今天心情不好"——不是因为他不关心你,是因为他的"脑子"只有20句的容量,装满了你的美食推荐,就没地方放你的情绪了。AI的上下文窗口,本质上就是这个"脑子容量"。
聊完想让它顺手帮你改简历——AI只会问不会改?给它接上简历修改工具,这叫工具调用。就像给AI配了工具箱,日历、搜索、计算器都能接。
工具调用是AI从"会动嘴"到"能动手"的关键一步。之前AI只能给你建议,现在它能直接操作——改文件、查数据、发邮件。这就像家政阿姨从"给你打扫建议"升级到"直接帮你拖地、洗碗、整理衣柜"——不是出主意,是动手干。
但工具调用有个冷笑话式的风险:AI现在能"动手"了,但你怎么知道它"动手"的时候没搞破坏? 就像你让助理帮你发邮件,你敢不检查就直接点发送吗?AI也一样,它调用工具之后的结果,你得有人看着——不然后果可能比"动嘴"严重100倍。
当然,工具调用最爽的地方也在这:你不用动手了。就像你雇了个会干活的人,你只需要说清楚要什么——剩下的,它搞定了。这就是"AI Agent"的核心:不是聊天,是干活。
工具有了,但AI输出乱七八糟。你让它按打分表格式来——这就是输出格式控制。JSON、Markdown、评分表都能控制,就像填表格有固定格式。
格式控制为什么重要?想象一下,AI给你一堆 unstructured 的反馈,你得自己整理。有了格式控制,AI直接输出"沟通能力:8/10;技术深度:7/10;表达逻辑:6/10"——结构化、可比较、可操作。这就是"可执行的建议"和"正确的废话"的区别。
输出格式控制还有个隐藏好处:它让AI"可追溯"。如果AI输出是JSON格式,你可以用代码自动解析、对比、追踪。如果AI输出是一段话,你得自己读、自己判断、自己记——这过程中你的主观判断会污染数据。格式控制是AI从"聊天"到"工作"的分水岭。就像生活中"白纸黑字"比"口头说说"靠谱——口头约定是聊天,书面记录才是工作。输出格式控制,就是AI世界的"白纸黑字"。
21个概念总览
| 序号 | 概念 | 场景 | 一句话理解 | 类比 |
|---|---|---|---|---|
| 1 | LLM | 写周报 | AI的大脑 | 24小时在线的写手 |
| 2 | Token | 写周报 | AI的字数计数器 | 按字数收费 |
| 3 | Prompt | 写周报 | 你输入给AI的话 | 对助手下的指令 |
| 4 | 提示词工程 | 写周报 | 把需求说清楚的方法 | 给厨师写详细菜单 |
| 5 | 系统提示词 | 写周报 | 一开始给AI设定的人设 | 岗位说明书 |
| 6 | 上下文 | 写周报 | AI记住的对话信息 | 短期记忆 |
| 7 | 模型 | 写周报 | 不同AI的聪明程度 | 不同品牌的大脑 |
| 8 | RAG | 文件分析 | 让AI先读你的文件 | 考试前先看课本 |
| 9 | 向量化 | 文件分析 | 把文字变成数字便于搜索 | 给书贴编号 |
| 10 | 幻觉 | 文件分析 | AI瞎编乱造 | 朋友吹牛说认识你 |
| 11 | 知识截止 | 文件分析 | AI只知道训练时的信息 | 知识库只更新到某日期 |
| 12 | 多模态 | 文件分析 | AI能看懂图片 | 同时看文字和图片 |
| 13 | 流式输出 | 文件分析 | AI一个字一个字回答 | 打字机实时输出 |
| 14 | 输出Token限制 | 文件分析 | AI一次只能说有限字数 | 作文有字数上限 |
| 15 | API | 面试 | 调用AI的遥控器 | 给AI装的遥控器 |
| 16 | 速率限制 | 面试 | API每分钟请求次数上限 | 高速收费站限流 |
| 17 | Few-shot | 面试 | 给AI做示范 | 老师先做示范 |
| 18 | 思维链 | 面试 | 让AI一步步推理 | 解题先写草稿 |
| 19 | 多轮对话 | 面试 | AI记住之前的对话 | 朋友记得你说过的话 |
| 20 | 工具调用 | 面试 | 让AI使用外部工具 | 给AI配了工具箱 |
| 21 | 输出格式控制 | 面试 | 让AI按指定格式输出 | 填表格有固定格式 |
总结
21个AI概念,一篇讲完了。
回头看,这21个概念不是随机出现的——每一个都是为了解决上一个问题而产生的。
从"打开AI聊天"到"让AI当面试官帮你练面试"——这是一个不断升级的过程:
- 基础层(写周报):LLM → Token → Prompt → 提示词工程 → 系统提示词 → 上下文 → 模型
- 进阶层(读文件):RAG → 向量化 → 幻觉 → 知识截止 → 多模态 → 流式输出 → 输出Token限制
- 高级层(练面试):API → 速率限制 → Few-shot → 思维链 → 多轮对话 → 工具调用 → 输出格式控制
记住这个递进关系,你就能把AI概念串起来理解:
基础层解决"怎么和AI说话",进阶层解决"怎么让AI处理你的东西",高级层解决"怎么让AI帮你干复杂的事"。
这不是21个孤立的名词,是一个打工人的成长路径——从"打开AI聊天"到"让AI当面试官帮我练面试"。每一个概念的出现,都不是技术公司拍脑袋决定的,都是你上一个搞不定的产物。
科技不高冷,AI很好用。但前提是,你得知道这些词到底在说什么——而不是像听天书一样,别人聊完你只会点头。
就像你学法律,不是为了当律师,是为了不被律师糊弄。学AI概念也不是为了当AI工程师,是为了不被AI工程师糊弄——当然,更重要的是,不被AI自己糊弄。
很多人学AI,第一反应是"我要学会Prompt工程""我要学会Agent开发"——这是错的。你应该先学会的是:怎么判断一个AI输出是靠谱的,还是胡编的。就像你学法律,第一件事不是学怎么写合同,是学怎么看合同里有没有坑。
21个概念讲完了。从"打开AI聊天"到"让AI当面试官"——这不是技术升级路径,是一个普通人从"被AI吓到"到"让AI帮我干活"的完整过程。
我是晚枫,写代码的、学过法的、讲AI真话的。关注我,AI工具的真话只在这里讲。
🎵 配乐与声音设计方案
整体风格定位
- 风格:科技感叙事 + 轻电子氛围,三阶段情绪递进(轻快→悬疑→史诗)
- 节奏:BPM 90-120,口播语速 180-200字/分钟
- 参考:B站知识区(老师好我叫何同学)+ 抖音科普(半佛仙人)
三阶段配乐地图
| 段落 | 时间 | 情绪 | BGM类型 | 参考曲目 | 音量 |
|---|---|---|---|---|---|
| 开头钩子 | 0:00-0:15 | 紧张+好奇 | 电子氛围+轻微悬疑 | 类似《西部世界》片头 | 60% |
| 共情瞬间 | 0:15-0:30 | 共鸣+温暖 | 钢琴轻电子 | 类似《她的》配乐 | 40% |
| 第1讲·写周报 | 0:30-4:00 | 轻快+解决感 | 轻电子+节奏感 | 类似《Money Heist》轻快版 | 30% |
| 第1讲总结 | 4:00-4:30 | 阶段性收束 | 短暂停顿+轻微升华 | 纯电子音色 | 35% |
| 第2讲·读文件 | 4:30-9:00 | 悬疑+发现感 | 电子氛围+低频脉冲 | 类似《黑镜》配乐 | 30% |
| 第2讲总结 | 9:00-9:30 | 阶段性收束 | 短暂停顿 | 纯电子音色 | 35% |
| 第3讲·练面试 | 9:30-14:00 | 史诗+掌控感 | 电子管弦混合 | 类似《星际穿越》轻快版 | 35% |
| 21概念总览 | 14:00-15:00 | 信息密集+清晰 | 轻电子+规律节奏 | 类似数据可视化BGM | 30% |
| 总结收尾 | 15:00-16:00 | 温暖+品牌感 | 钢琴+轻电子 | 类似《时间规划局》结尾 | 40% |
| 结尾互动 | 16:00-16:30 | 品牌锚定 | 品牌音效 | 晚枫Logo音效 | 50% |
音效设计清单
| 音效用途 | 触发时机 | 音效类型 | 音量 |
|---|---|---|---|
| 概念出场 | 每个概念命名时 | 清脆"叮"或数字计数音 | 50% |
| 受挫瞬间 | 每次"问题来了" | 轻微降调+停顿 | 40% |
| 解决时刻 | 每次新方案出现 | 轻微升调+轻快 | 40% |
| 场景切换 | 三讲之间过渡 | 电子过渡音 | 45% |
| 总结表格 | 21概念总览出现时 | 规律节拍+数据感 | 30% |
| 品牌结尾 | "关注晚枫"出现时 | 品牌专属音效 | 50% |
🎬 分镜表
| 时间 | 画面内容 | 动作/运镜 | 台词/字幕 | 视觉化方式 |
|---|---|---|---|---|
| 0:00-0:05 | 黑屏,21个AI名词快速闪烁飞过 | 文字飞入动画 | "Token、LLM、Prompt、RAG、思维链……" | A-文字动画 |
| 0:05-0:15 | 深蓝背景,"AI圈21个名词"大标题 | 标题放大定格 | "AI圈冒出一堆新名词……" | B-真人出镜 |
| 0:15-0:30 | 真人出镜,略带困惑表情 | 中景,轻微推镜 | "说实话,我三个月前也是……" | B-真人出镜 |
| 今天我就用一个完整的故事——从周一写周报,到周二分析文件,到周三准备面试——把21个概念全部串进去。一个打工人的完整一周,每一个概念都是在解决前一个问题的过程中自然出现的。 | ||||
| 0:45-1:00 | 第1讲标题:"第1讲:写周报" | 标题飞入 | "周一早上……" | A-文字动画 |
| 1:00-1:30 | 电脑屏幕+AI聊天界面 | 屏幕录制+缩放 | "帮我写周报"→AI回复 | C-屏幕录制 |
| 1:30-2:00 | LLM概念卡:大脑图标+产品Logo | 图标飞入 | "背后干这个活的,叫LLM" | A-图标动画 |
| 2:00-2:30 | Token计数动画:5字→7Token | 数字跳动动画 | "五个字,大约消耗7个Token" | A-数据动画 |
| 2:30-3:00 | Prompt概念卡:对话框图标 | 图标飞入 | "你输入的这句话,叫Prompt" | A-图标动画 |
| 3:00-3:30 | 三个概念关系图:LLM→Token→Prompt | 连线动画 | "三个概念已经自然出场了" | A-关系图 |
| 3:30-4:00 | 套话文字放大:"本周工作稳步推进" | 文字放大+红叉 | "AI写出来的周报,全是套话" | A-文字动画 |
| 4:00-4:30 | 对比动画:差Prompt→好Prompt | 左右对比 | "换种说法……明显靠谱多了" | A-对比动画 |
| 4:30-5:00 | 提示词工程概念卡:菜单图标 | 图标飞入 | "这种把需求说清楚的方法,叫提示词工程" | A-图标动画 |
| 5:00-5:30 | 系统提示词概念卡:身份卡片 | 图标飞入 | "这就是系统提示词" | A-图标动画 |
| 5:30-6:00 | 上下文概念卡:记忆气泡 | 图标飞入 | "AI能记住,靠的是上下文" | A-图标动画 |
| 6:00-6:30 | 模型对比:GPT-4o vs Claude 3.5 | 左右对比 | "同样的提示词,换个AI,效果天差地别" | A-对比动画 |
| 6:30-7:00 | 第1讲总结:7个概念连线图 | 依次高亮 | "第1讲7个概念总结" | A-关系图 |
| 7:00-7:30 | 场景过渡:PDF文件飞入 | 文件飞入动画 | "写周报搞定了。但领导说……" | A-过渡动画 |
| 7:30-8:00 | 第2讲标题:"第2讲:读文件" | 标题飞入 | "你把简历PDF扔给AI……" | A-文字动画 |
| 8:00-8:30 | RAG概念卡:搜索+文件图标 | 图标飞入 | "这招叫RAG" | A-图标动画 |
| 8:30-9:00 | 向量化动画:文字→数字→向量 | 变形动画 | "把PDF拆成段落,变成一串数字" | A-数据动画 |
| 9:00-9:30 | 幻觉概念卡:问号+幻觉效果 | 图标抖动 | "这叫幻觉" | A-图标动画 |
| 9:30-10:00 | 知识截止概念卡:日历截止 | 图标飞入 | "这叫知识截止" | A-图标动画 |
| 10:00-10:30 | 多模态概念卡:文字+图片+语音 | 图标组合 | "这叫多模态" | A-图标动画 |
| 10:30-11:00 | 流式输出动画:逐字显示 | 打字效果 | "这叫流式输出" | C-屏幕录制 |
| 11:00-11:30 | 输出Token限制概念卡:字数计数器 | 数字跳动 | "这叫输出Token限制" | A-数据动画 |
| 11:30-12:00 | 第2讲总结:7个概念连线图 | 依次高亮 | "第2讲7个概念总结" | A-关系图 |
| 12:00-12:30 | 场景过渡:面试场景图标 | 场景切换动画 | "简历改好了,想模拟面试" | A-过渡动画 |
| 12:30-13:00 | 第3讲标题:"第3讲:练面试" | 标题飞入 | "你想把AI面试官放进微信……" | A-文字动画 |
| 13:00-13:30 | API概念卡:遥控器+接口图标 | 图标飞入 | "这叫API" | A-图标动画 |
| 13:30-14:00 | 速率限制概念卡:限速标志 | 图标飞入 | "这叫速率限制" | A-图标动画 |
| 14:00-14:30 | Few-shot概念卡:示范图标 | 图标飞入 | "这招叫Few-shot" | A-图标动画 |
| 14:30-15:00 | 思维链概念卡:思维导图 | 图标展开 | "这就是思维链" | A-图标动画 |
| 15:00-15:30 | 多轮对话概念卡:对话气泡链 | 气泡连接 | "这叫多轮对话" | A-图标动画 |
| 15:30-16:00 | 工具调用概念卡:工具箱图标 | 图标飞入 | "这叫工具调用" | A-图标动画 |
| 16:00-16:30 | 输出格式控制概念卡:表格模板 | 图标飞入 | "这就是输出格式控制" | A-图标动画 |
| 16:30-17:00 | 第3讲总结:7个概念连线图 | 依次高亮 | "第3讲7个概念总结" | A-关系图 |
| 17:00-18:00 | 21概念总览表:完整表格 | 表格滚动展示 | "21个概念总览" | A-表格展示 |
| 18:00-19:00 | 三层递进关系图:基础→进阶→高级 | 金字塔动画 | "基础层→进阶层→高级层" | A-关系图 |
| 19:00-20:00 | 真人出镜,总结收尾 | 中景,温暖灯光 | "21个AI概念,一篇讲完了……" | B-真人出镜 |
| 20:00-20:30 | 品牌结尾:晚枫Logo+关注引导 | Logo动画+二维码 | "关注晚枫,带你一起玩AI" | A-品牌动画 |
🎬 画面剪辑方案
总时长估算
- 口播字数:约3000字(含21个概念4拍子+过渡+总结)
- 语速:180-200字/分钟
- 预估时长:约15-18分钟(纯口播)+ 动画/停顿 ≈ 18-20分钟
- 平台适配:B站/视频号长视频(18-20分钟)+ 可拆分为3个6-7分钟短视频
剪辑节奏建议
| 段落 | 时长 | 剪辑节奏 | 关键处理 |
|---|---|---|---|
| 开头钩子 | 30秒 | 快切+悬念 | 名词快速飞过,制造紧张感 |
| 共情瞬间 | 15秒 | 慢下来+推镜 | 真人表情特写,建立信任 |
| 每讲开头 | 15秒 | 标题飞入+过渡 | 明确场景切换 |
| 每个概念 | 45-60秒 | 概念卡+讲解 | 图标飞入→讲解→现实映射 |
| 受挫瞬间 | 15秒 | 停顿+降调 | 制造悬念,引出为什么 |
| 解决时刻 | 15秒 | 轻快+升调 | 新概念出场,有爽感 |
| 每讲总结 | 30秒 | 关系图动画 | 7个概念连线,强化记忆 |
| 场景过渡 | 15秒 | 过渡动画 | 文件/面试场景图标飞入 |
| 21概念总览 | 60秒 | 表格滚动 | 信息密集,可暂停回看 |
| 总结收尾 | 60秒 | 温暖+品牌 | 真人出镜,金字塔递进图 |
视觉风格统一
- 主色调:深蓝(#1a1a2e) + 亮黄(#ffd700) + 白色
- 概念卡风格:圆角矩形+图标+概念名+一句话理解
- 动画风格:Flat Design + 微动效(飞入/缩放/连线)
- 字体:标题用粗体无衬线,正文用清晰无衬线
- 品牌元素:晚枫Logo每5分钟出现一次(角标或过渡)
场景切换方式
- 第1讲→第2讲:周报文件"飞"走,PDF文件"飞"入
- 第2讲→第3讲:PDF文件"变形"为简历,面试场景图标出现
- 每讲内部:用"问题来了"作为概念切换的信号词,配合音效
建议的拆剪版本(可选)
| 版本 | 时长 | 内容 | 适用平台 |
|---|---|---|---|
| 完整版 | 18-20分钟 | 21个概念全讲 | B站/视频号/YouTube |
| 第1讲版 | 6-7分钟 | 写周报7个概念 | 抖音/视频号(可发3期) |
| 第2讲版 | 6-7分钟 | 读文件7个概念 | 抖音/视频号(可发3期) |
| 第3讲版 | 6-7分钟 | 练面试7个概念 | 抖音/视频号(可发3期) |
| 精华版 | 3-5分钟 | 21概念总览表+总结 | 抖音/小红书 |
✅ 自查清单(19条)
结构完整性
☐ 1. 封面文案有2行钩子+画面风格?
☐ 2. 开头是"钩子→共情→场景"顺序?
☐ 3. 共情瞬间在开头30秒内出现?
☐ 4. 主线任务贯穿3个场景(写周报→读文件→练面试)?
☐ 5. 每个场景有清晰的"受挫→为什么→新方案"递进?
☐ 6. 21个概念每个都有4拍子(体验→命名→类比→现实映射)?
☐ 7. 每讲结尾有7个概念总结+因果递进说明?
☐ 8. 全文结尾有21个概念总览表+三层递进关系?
☐ 9. 结尾有"关注晚枫"人设锚点?
☐ 10. 收尾有因果总结("基础层→进阶层→高级层")?
质量细节
☐ 11. 每个概念都有"为什么出现"的来龙去脉?
☐ 12. 类比统一、好懂、没有混用?(大脑/字数计数器/菜单/说明书/短期记忆/课本/编号/吹牛/日历/打字机/遥控器/收费站/示范/草稿/朋友/工具箱/表格)
☐ 13. 每个概念命名后都有"这就是/这叫/这叫"?
☐ 14. 口语化程度:没有书面语长句?
☐ 15. 有3处以上"说实话/你发现问题了吗/问题来了"等互动感?
☐ 16. 有"我妈能听懂吗?"测试通过(无行话定义)?
☐ 17. 没有"众所周知/众所周知/众所周知"?
☐ 18. 所有中文术语都出现在英文括号前?(如:LLM(大语言模型))
☐ 19. 全文有3个以上"记忆锚点"(如:7个概念、21个名词、3个故事)?
☐ 20. 语言风格有"晚枫味"吗?(v2.2新增)
└→ 至少3处黑色幽默/冷笑话/自嘲?(如:AI吹牛比自媒体还自信、AI按Token计费像律师按小时计费、AI"想"的过程也要收费)
└→ 至少2处旁征博引用生活场景类比?(如:打印店按页收费、装修公司套模板、外卖看图片、景区限流、老师改作业、家政阿姨动手干)
└→ 没有"众所周知/某种程度上/大概可能"等模糊词?
└→ 没有"作为一位深耕……多年的专家"等装腔作势开头?
└→ 换成其他博主读不了 → 过关
📚 结构化参考模块
一、概念定义速查表(按场景分组)
写周报场景(基础层)
| 概念 | 英文 | 定义 | 一句话类比 |
|---|---|---|---|
| LLM | Large Language Model | 大语言模型,AI的大脑 | 24小时在线的写手 |
| Token | Token | AI的字数计数器 | 按字数收费 |
| Prompt | Prompt | 提示词,你输入给AI的话 | 对助手下的指令 |
| 提示词工程 | Prompt Engineering | 把需求说清楚的方法 | 给厨师写详细菜单 |
| 系统提示词 | System Prompt | 一开始给AI设定的人设 | 岗位说明书 |
| 上下文 | Context | AI记住的对话信息 | 短期记忆 |
| 模型 | Model | 不同AI的聪明程度 | 不同品牌的大脑 |
读文件场景(进阶层)
| 概念 | 英文 | 定义 | 一句话类比 |
|---|---|---|---|
| RAG | Retrieval-Augmented Generation | 检索增强生成,让AI先读你的文件 | 考试前先看课本 |
| 向量化 | Embedding | 把文字变成数字便于搜索 | 给书贴编号 |
| 幻觉 | Hallucination | AI瞎编乱造 | 朋友吹牛说认识你 |
| 知识截止 | Knowledge Cutoff | AI只知道训练时的信息 | 知识库只更新到某日期 |
| 多模态 | Multimodal | AI能看懂图片等多种信息 | 同时看文字和图片 |
| 流式输出 | Streaming Output | AI一个字一个字回答 | 打字机实时输出 |
| 输出Token限制 | Output Token Limit | AI一次只能说有限字数 | 作文有字数上限 |
练面试场景(高级层)
| 概念 | 英文 | 定义 | 一句话类比 |
|---|---|---|---|
| API | Application Programming Interface | 调用AI的接口 | 给AI装的遥控器 |
| 速率限制 | Rate Limit | API每分钟请求次数上限 | 高速收费站限流 |
| Few-shot | Few-shot Learning | 给AI做几个示例 | 老师先做示范 |
| 思维链 | Chain of Thought | 让AI一步步推理 | 解题先写草稿 |
| 多轮对话 | Multi-turn Dialogue | AI记住之前的对话 | 朋友记得你说过的话 |
| 工具调用 | Tool Calling | 让AI使用外部工具 | 给AI配了工具箱 |
| 输出格式控制 | Output Format Control | 让AI按指定格式输出 | 填表格有固定格式 |
二、产品索引(LLM/模型类)
| 产品 | 所属公司 | 国内/国外 | 特点 |
|---|---|---|---|
| DeepSeek | 深度求索 | 国内 | 开源+免费,推理能力强 |
| 千问(Qwen) | 阿里云 | 国内 | 通义千问系列,多模态能力强 |
| Kimi | 月之暗面 | 国内 | 长上下文优势(200万字) |
| 豆包 | 字节跳动 | 国内 | 免费,语音交互强 |
| 文心一言 | 百度 | 国内 | 插件生态丰富 |
| ChatGPT | OpenAI | 国外 | GPT-4o,综合能力标杆 |
| Claude | Anthropic | 国外 | Claude 3.5 Sonnet,长文本强 |
| Gemini | 国外 | 多模态+搜索联动 |
三、术语对照与行话翻译
| 行话 | 英文 | 大白话 |
|---|---|---|
| LLM | Large Language Model | 大语言模型——AI的大脑 |
| Token | Token | AI的字数计数器 |
| Prompt | Prompt | 提示词——你输入给AI的话 |
| 提示词工程 | Prompt Engineering | 把需求说清楚的方法 |
| 上下文 | Context | AI在这次对话里记住的信息 |
| 系统提示词 | System Prompt | 给AI装好的人设/岗位说明书 |
| 模型 | Model | AI背后的大脑品牌 |
| RAG | Retrieval-Augmented Generation | 检索增强生成——让AI先读你的文件 |
| 向量化 | Embedding | 把文字变成数字 |
| 幻觉 | Hallucination | AI瞎编乱造 |
| 知识截止 | Knowledge Cutoff | AI只知道训练时的信息 |
| 多模态 | Multimodal | AI能看懂图片等多种信息 |
| 流式输出 | Streaming Output | AI一个字一个字回答 |
| API | Application Programming Interface | 调用AI的接口/遥控器 |
| 速率限制 | Rate Limit | API每分钟请求次数上限 |
| Few-shot | Few-shot Learning | 给AI做几个示例 |
| 思维链 | Chain of Thought | 让AI一步步推理 |
| 多轮对话 | Multi-turn Dialogue | AI记住之前的对话 |
| 工具调用 | Tool Calling | 让AI使用外部工具 |
| 输出格式控制 | Output Format Control | 让AI按指定格式输出 |
更新记录
- 2026-06-16:v2.2 对照v2.2创作指南升级语言风格:①全文注入"晚枫味"——黑色幽默/冷笑话/自嘲(8+处)②旁征博引用生活场景类比(打印店/装修公司/外卖/景区/老师改作业/家政阿姨)③直接犀利,去掉模糊词和装腔作势表达④有主见表达,不随波逐流⑤自查清单19条→20条(新增风格检查项)
- 2026-06-16:v2 对照v2.1创作指南全面升级:①共情瞬间放开头 ②一个主角贯穿3个场景 ③21个概念每个补全4拍子(体验→命名→类比→现实映射)④每次受挫补充来龙去脉(WHY)⑤分镜表按场景分组完整覆盖 ⑥画面剪辑方案+配乐设计独立成章 ⑦自查清单19条 ⑧21概念总览表+三层递进关系图
- 2026-06-16:v1 合并第1-3讲为完整系列
本文整合自《AI基础概念》系列3期口播稿,共21个核心概念,对照v2.1创作指南重写。

