039：AI基础概念全系列——21个核心概念一篇讲透

创作背景

热点来源：普通人被AI新名词轰炸，Token、Prompt、RAG、思维链……完全搞不懂，收藏了十几篇科普还是串不起来
创作角度：用一个打工人周一到周三的完整经历（写周报→分析文件→面试准备），21个概念在一个故事中自然生长
主线任务：周四要交周报+季度数据分析+周五面试（时间线贯穿，无章节切分）
三次推进 → 解决：

周一·写周报：打开AI → 写出来全是套话 → 换种说法 → 每次重复太麻烦 → 换个AI效果不一样
周二·读文件：想让它读PDF → 它说没见过的内容 → 它编了不存在的东西 → 它只知道旧数据 → 它只认文字
周三·练面试：把AI放进微信 → 用着用着报错 → 出的题不像真的 → 给评价太浅 → 想让它顺手改简历
v2.2 关键升级（对照v2.2创作指南·人设风格规范）：
①语言风格"晚枫化"：黑色幽默/冷笑话/自嘲贯穿全文（10+处），如"AI编起来比造谣的自媒体还自信"
②旁征博引生活化：用打印店/装修公司/外卖/景区/老师改作业/家政阿姨等日常场景类比技术概念——用生活常识解构技术黑话
③直接犀利：去掉"众所周知/某种程度上"等模糊词，不装腔作势，结尾直接怼"学AI是为了当工程师"的误解
④有主见表达：不随波逐流，标准明确，如"小红书只是分发平台，不为任何平台设专门格式"
⑤v2.1全部保留：共情瞬间/一个故事贯穿/4拍子/来龙去脉/分镜表/自查清单
人设锚点：结尾互动前，"关注晚枫，AI工具的真话只在这里讲"
系列位置：全系列汇总篇，一篇讲透21个核心概念

口播稿

封面文案

第一行（📝文案）：AI圈21个名词
第二行（📝文案）：一篇讲透，收藏备用
🎨画面风格：深蓝背景+黄字大标题，21个概念图标依次飞入，最后定格为"21→1 全串起来"

口播正文（完整连贯版·口语化）

AI圈冒出一堆新名词：Token、LLM、Prompt、RAG、思维链、向量化、幻觉……到底什么意思？开会时旁边同事聊起来，你插不上话，回家搜了一晚上还是一头雾水。

说实话，我三个月前也是。同事开会聊起这些，我一句话都插不上，只能假装点头——感觉就像一群人讨论"量子纠缠"，我在旁边数他们说了几个"量子"。回家搜了一晚上，每个词都有定义，但串不起来，看完更懵。这感觉，像你去考驾照，科目一每道题都认识，但连起来不知道在考什么。

今天我就用一个完整的故事——从周一写周报，到周二分析文件，到周三准备面试——把21个概念全部串进去。一个打工人的完整一周，每一个概念都是在解决前一个问题的过程中自然出现的。不废话，直接开讲。

周一早上，领导上周五说"周三交周报"，我打开AI，随口说了句"帮我写周报"——

两秒钟，AI给你一大段。

我盯着那段文字看了十秒，发现一个问题：每个字都认识，连起来不知道在说啥。就像你收到领导的邮件——"关于前述事项的后续推进，望各相关方协同配合，确保落地见效"——翻译过来就是"赶紧干活"。但AI还没学到直接给结论这一步，它在努力显得"专业"。

背后干这个活的，叫大语言模型，LLM。

这就是第一个概念。你每次打开AI聊天，背后都是它在干活。国内的DeepSeek、千问、Kimi、豆包，国外的ChatGPT、Claude、Gemini——全都是大语言模型。

但它有个特点：你输入的话，会被拆成一个个小块。

"帮我写周报"五个字，大约消耗7个Token。AI回复你200个字，再消耗200个Token。Token就是AI的字数计数器——它按这个收费，你也按这个理解它"读了多少"。

这就像你去打印店——打印按页收费，复印按张收费，AI按Token收费。本质一样：定价需要一个最小不可分单位。Token就是AI世界的"一页纸"。

但Token有个冷笑话式的设定：它不按"意思"计费，按"块"计费。就像律师按小时收费，他在厕所蹲了20分钟思考你案子，那20分钟也算钱——因为计时器不会因为他蹲厕所就停。AI也一样，它"想"的过程也要消耗Token，哪怕它"想"出来的东西是错的。

你输入的这句话，叫Prompt，提示词。

到这里，三个概念已经自然出场了：

LLM是大脑——你问它问题，它回答你
Token是字数计数器——你输入多少、它输出多少，都按这个算。记住，AI按Token收费，就像律师按小时收费，你话越多，账单越长
Prompt是你输入的话——你说什么，它答什么

但问题来了——

AI写出来的周报，全是套话。

"本周工作稳步推进，各项指标持续向好"——你领导看了，第一反应是"这人到底干了啥？"

这种废话，像不像你写毕业论文时凑字数的"综上所述"？听着对，其实啥也没说。

为什么？因为你没有把需求说清楚。LLM很聪明，但它不是你肚子里的蛔虫。你不说清楚，它就只能猜，猜出来的东西就是套话。这就像你让装修公司"帮我装修"——不说清楚要几个房间、什么风格、预算多少，设计师也只能给你套模板。

于是你换种说法："上周做了3个功能、修了5个bug、开了2次评审会，帮我写周报。"——这次，AI写出来的明显靠谱多了。

这种把需求说清楚的方法，叫提示词工程。

提示词工程就是让AI听懂你的核心方法。就像你给厨师写菜单——写"来份好吃的"，厨师随便做；写"来份番茄炒蛋，蛋要嫩，番茄要出汁"，做出来就是你要的。

生活中这叫"把话说清楚"——你说得越具体，对方越没法糊弄你。点外卖写"来份好吃的"，商家随便做；写"来份番茄炒蛋，蛋要嫩，番茄要出汁，不要葱"，做出来就是你要的。AI也一样，Prompt就是你的"菜单"，越明确，AI越没法糊弄你。

但你又发现一个问题：每次打开AI，都得重新说一遍"我是程序员，周报格式是……"。太麻烦了。这就像每次去餐厅都得重新告诉服务员你素食、不吃香菜、对花生过敏——累不累？

你希望AI一开始就记住你的背景——"你是个程序员，你的周报格式是……"。于是你在最开始设定了这段话，AI之后每次都按这个来。这就是系统提示词。

而你在对话过程中补充的那些信息——"上周做了3个功能"——AI能记住，靠的是上下文。

三个新概念也出场了：

提示词工程是让AI懂你的方法——就像给厨师写详细菜单，也像给律师写明确的案情说明
系统提示词是一开始就设定的身份——就像给AI的岗位说明书，也像餐厅会员卡里写的"常客偏好：素食、免香菜"
上下文是对话过程中补充的信息——就像AI的短期记忆，上下文越长，记得越多。但注意，它的记忆是有限度的，装满了前面的就会挤掉后面的

但还有件事：同样的提示词，换个AI，效果天差地别。

这就是模型的区别。LLM是大脑，但大脑也分聪明和一般。GPT-4o、Claude 3.5、千问2.5——不同的模型，效果不一样。选对模型，有时候比提示词工程还重要。

就像你选律师——同一个案子，实习生和资深合伙人写出来完全不同。选错模型，就像花大价钱请了个刚拿证的实习律师，亏不亏？

写周报搞定了。但领导说："把你上季度的数据也分析一下。"数据在一个PDF里。

你把简历PDF扔给AI说"帮我分析"——AI让你"突出项目管理经验"。可你压根没做过项目管理。

为什么？因为AI用的是训练时的老数据，压根没见过你的文件。它回答的是它"学过"的东西，不是你"给"的东西。就像你问一个没看过你材料的医生"我这病怎么治"——他只能说"一般这类病通常……"，说的都是通用套路，不是你的具体情况。

想让AI先读懂你的东西再回答，这招叫RAG。

RAG就是"检索增强生成"。AI怎么读的？把PDF拆成段落，每段变成一串数字——这步叫向量化。变完就能快速搜索最相关的内容，然后基于你的文件回答你。

就像考试前先看课本——RAG让AI先读你的"课本"，再答题。向量化就是给课本的每一页贴编号，方便快速翻到你要的那页。

但即使用了RAG，AI还是可能编出你根本没做过的项目——这叫幻觉。

为什么？因为AI训练数据有知识截止日期，它只知道训练时见过的东西，不知道今年的行情。查股价、查新闻，都要注意这个截止日期。

幻觉的本质，是AI在"不知道"的情况下硬要回答——它宁肯编一个看起来靠谱的答案，也不愿意说"我不知道"。它编起来比造谣的自媒体还自信，至少自媒体知道自己是在编。

但幻觉还有个更隐蔽的原因：AI训练时看到"A通常和B一起出现"，当你提到A时，AI就默认B也在，哪怕B根本不存在。就像你问朋友"我昨天穿的是红色衣服对吧？"——他其实不记得，但大概率说"对"——因为他倾向于顺着你的话接，而不是纠正你。你的提问方式，本身就是对AI的"暗示"。

三个新概念出场了：

RAG是让AI先读你的文件——就像考试前先看课本，也像厨师做菜前先看菜谱
向量化是把文字变成数字——就像给每本书贴编号，方便快速查找。编号本身没意义，但查找效率提高了100倍
幻觉是AI瞎编乱造——就像朋友吹牛说认识你，其实根本没见过。区别在于，朋友吹牛你看得出来，AI吹牛你未必看得出来
知识截止是AI只知道训练时的信息——就像知识库只更新到某个日期。你问它今天股市涨没涨，它要是训练数据截止到去年，就只能瞎猜——或者老实告诉你"我不知道"

那最新的信息怎么办？你把PDF截图也传给AI——AI不只认文字还能看图，叫多模态。

多模态就是AI能同时处理多种信息——文字、图片、语音。GPT-4o、Gemini都能看图。你把简历截图传过去，它能看到表格、图表、排版，不只是读文字。

这就像你点外卖——不只是看菜名，还要看图片、看评价、看分量。只看文字"招牌红烧肉"，你都不知道实物有多大、肥不肥。多模态就是AI同时看文字、看图、看排版，信息更全面。

AI回答时一个字一个字蹦出来——这叫流式输出。不用等整段回答完才显示，体验更好。

流式输出有个冷笑话式的好处：你能看到AI"想"的过程。就像你看厨师做菜，从切菜到下锅到调味，你能看到每一步——当然，也可能看到你的菜一步步做砸。不流式的话，你只看到最终端上桌的菜，不知道中间怎么来的，咸了也没法找原因。

但回答到一半突然停了——一次能输出的字数有限，叫输出Token限制。就像作文有字数上限，超了就得停。长文章需要分段或换长上下文模型。

简历改好了，你想让AI模拟面试官，帮你练面试。

你想把AI面试官放进微信，像聊天一样随时练——这得用API，给AI装了个遥控器，让程序能调用AI。

API就是Application Programming Interface，调用AI的接口。所有AI应用底层都用API——微信里的AI机器人、网页上的AI助手、手机里的AI功能，全是通过API调用的。

API的本质是"约定"——我按这个格式请求，你按这个格式返回。就像你去窗口办事，窗口贴了"请提供身份证+申请表"——这是输入规范；"3个工作日出结果"——这是输出承诺。API就是程序和程序之间的"窗口办事指南"。

但API用着用着报错了——每分钟请求次数有上限，叫速率限制。就像高速收费站限流，商业API都有配额，企业级要付费扩容。

速率限制其实是个保护机制。想象一下，如果没有限速，所有人同时涌入API，服务器直接崩溃——就像节假日景区不限流，所有人同一天去，景区直接被挤爆。限速是为了让系统能持续运转，不是故意卡你。

这就像公共WiFi——如果所有人同时下载电影，网速直接归零，谁都用不了。限速就是让大家轮流用，保证每个人都能刷上短视频。你骂限速慢，但没了限速，你连网页都打不开。所有免费API的爱好者都应该感谢限速——因为正是限速，让免费服务还能活着。

修好了，但AI出的题不像真的。你先给它看3道标准面试题，让它照着出——这招叫Few-shot，做示范比讲道理管用。

Few-shot在生活中就是"看例子学"——我不告诉你抽象的规则，我给你看3个已经做好的例子，你自己归纳规律。就像学做菜，我不说"适量盐、少许糖"，我给你看3个成品照片，你自己琢磨——人天生擅长"从例子中学习"而不是"从定义中学习"。

教会了风格，但AI直接给评价太浅。你让它别急，先一步步推理——这就是思维链，理完思路再答，深浅不一样。就像解题先写草稿，数学、逻辑题效果提升明显。

思维链的妙处在于"过程可视化"。就像老师改作业，不是直接写"错了"，而是先写"这里思路对了，但第三步算错了，所以最终结果不对"——把推理过程摆出来，你才知道哪里该改。AI也一样，思维链就是让它把"怎么想的"过程写给你看。

思维链还有个冷笑话式的好处：你终于知道AI"错在哪一步"了。以前AI直接给答案，错了你也不知道它错在哪。现在它把过程写出来了，你可以看到它在第三步就犯了错误——就像你检查小学生的作业，发现他在第二步就算错了，但硬撑着写到第五步。思维链不是让AI更聪明，是让你更知道它有多不聪明。

面试要来回追问。你跟AI聊了20轮，它还记得你前面暴露的弱点——这叫多轮对话。就像朋友记得你说过的话，客服、教育场景都需要。

但多轮对话有个隐藏问题：上下文窗口是有限的。聊多了，前面的信息会被挤掉——就像你和朋友聊了一晚上，最后你问他"我一开始说的那个想法怎么样"，他说"你一开始说了什么来着？"——不是不想记，是记不住了。

多轮对话有个冷笑话式的真相：你以为AI在认真倾听，其实它在"滚动刷新"。每轮新对话进来，前面的就被往后排——排满了，最早的那条就被挤掉了。就像你和朋友聊了20句，他忘了你第一句说的"我今天心情不好"——不是因为他不关心你，是因为他的"脑子"只有20句的容量，装满了你的美食推荐，就没地方放你的情绪了。AI的上下文窗口，本质上就是这个"脑子容量"。

聊完想让它顺手帮你改简历——AI只会问不会改？给它接上简历修改工具，这叫工具调用。就像给AI配了工具箱，日历、搜索、计算器都能接。

工具调用是AI从"会动嘴"到"能动手"的关键一步。之前AI只能给你建议，现在它能直接操作——改文件、查数据、发邮件。这就像家政阿姨从"给你打扫建议"升级到"直接帮你拖地、洗碗、整理衣柜"——不是出主意，是动手干。

但工具调用有个冷笑话式的风险：AI现在能"动手"了，但你怎么知道它"动手"的时候没搞破坏？ 就像你让助理帮你发邮件，你敢不检查就直接点发送吗？AI也一样，它调用工具之后的结果，你得有人看着——不然后果可能比"动嘴"严重100倍。

当然，工具调用最爽的地方也在这：你不用动手了。就像你雇了个会干活的人，你只需要说清楚要什么——剩下的，它搞定了。这就是"AI Agent"的核心：不是聊天，是干活。

工具有了，但AI输出乱七八糟。你让它按打分表格式来——这就是输出格式控制。JSON、Markdown、评分表都能控制，就像填表格有固定格式。

格式控制为什么重要？想象一下，AI给你一堆 unstructured 的反馈，你得自己整理。有了格式控制，AI直接输出"沟通能力：8/10；技术深度：7/10；表达逻辑：6/10"——结构化、可比较、可操作。这就是"可执行的建议"和"正确的废话"的区别。

输出格式控制还有个隐藏好处：它让AI"可追溯"。如果AI输出是JSON格式，你可以用代码自动解析、对比、追踪。如果AI输出是一段话，你得自己读、自己判断、自己记——这过程中你的主观判断会污染数据。格式控制是AI从"聊天"到"工作"的分水岭。就像生活中"白纸黑字"比"口头说说"靠谱——口头约定是聊天，书面记录才是工作。输出格式控制，就是AI世界的"白纸黑字"。

21个概念总览

序号	概念	场景	一句话理解	类比
1	LLM	写周报	AI的大脑	24小时在线的写手
2	Token	写周报	AI的字数计数器	按字数收费
3	Prompt	写周报	你输入给AI的话	对助手下的指令
4	提示词工程	写周报	把需求说清楚的方法	给厨师写详细菜单
5	系统提示词	写周报	一开始给AI设定的人设	岗位说明书
6	上下文	写周报	AI记住的对话信息	短期记忆
7	模型	写周报	不同AI的聪明程度	不同品牌的大脑
8	RAG	文件分析	让AI先读你的文件	考试前先看课本
9	向量化	文件分析	把文字变成数字便于搜索	给书贴编号
10	幻觉	文件分析	AI瞎编乱造	朋友吹牛说认识你
11	知识截止	文件分析	AI只知道训练时的信息	知识库只更新到某日期
12	多模态	文件分析	AI能看懂图片	同时看文字和图片
13	流式输出	文件分析	AI一个字一个字回答	打字机实时输出
14	输出Token限制	文件分析	AI一次只能说有限字数	作文有字数上限
15	API	面试	调用AI的遥控器	给AI装的遥控器
16	速率限制	面试	API每分钟请求次数上限	高速收费站限流
17	Few-shot	面试	给AI做示范	老师先做示范
18	思维链	面试	让AI一步步推理	解题先写草稿
19	多轮对话	面试	AI记住之前的对话	朋友记得你说过的话
20	工具调用	面试	让AI使用外部工具	给AI配了工具箱
21	输出格式控制	面试	让AI按指定格式输出	填表格有固定格式

总结

21个AI概念，一篇讲完了。

回头看，这21个概念不是随机出现的——每一个都是为了解决上一个问题而产生的。

从"打开AI聊天"到"让AI当面试官帮你练面试"——这是一个不断升级的过程：

基础层（写周报）：LLM → Token → Prompt → 提示词工程 → 系统提示词 → 上下文 → 模型
进阶层（读文件）：RAG → 向量化 → 幻觉 → 知识截止 → 多模态 → 流式输出 → 输出Token限制
高级层（练面试）：API → 速率限制 → Few-shot → 思维链 → 多轮对话 → 工具调用 → 输出格式控制

记住这个递进关系，你就能把AI概念串起来理解：

基础层解决"怎么和AI说话"，进阶层解决"怎么让AI处理你的东西"，高级层解决"怎么让AI帮你干复杂的事"。

这不是21个孤立的名词，是一个打工人的成长路径——从"打开AI聊天"到"让AI当面试官帮我练面试"。每一个概念的出现，都不是技术公司拍脑袋决定的，都是你上一个搞不定的产物。

科技不高冷，AI很好用。但前提是，你得知道这些词到底在说什么——而不是像听天书一样，别人聊完你只会点头。

就像你学法律，不是为了当律师，是为了不被律师糊弄。学AI概念也不是为了当AI工程师，是为了不被AI工程师糊弄——当然，更重要的是，不被AI自己糊弄。

很多人学AI，第一反应是"我要学会Prompt工程""我要学会Agent开发"——这是错的。你应该先学会的是：怎么判断一个AI输出是靠谱的，还是胡编的。就像你学法律，第一件事不是学怎么写合同，是学怎么看合同里有没有坑。

21个概念讲完了。从"打开AI聊天"到"让AI当面试官"——这不是技术升级路径，是一个普通人从"被AI吓到"到"让AI帮我干活"的完整过程。

我是晚枫，写代码的、学过法的、讲AI真话的。关注我，AI工具的真话只在这里讲。

🎵 配乐与声音设计方案

整体风格定位

风格：科技感叙事 + 轻电子氛围，三阶段情绪递进（轻快→悬疑→史诗）
节奏：BPM 90-120，口播语速 180-200字/分钟
参考：B站知识区（老师好我叫何同学）+ 抖音科普（半佛仙人）

三阶段配乐地图

段落	时间	情绪	BGM类型	参考曲目	音量
开头钩子	0:00-0:15	紧张+好奇	电子氛围+轻微悬疑	类似《西部世界》片头	60%
共情瞬间	0:15-0:30	共鸣+温暖	钢琴轻电子	类似《她的》配乐	40%
第1讲·写周报	0:30-4:00	轻快+解决感	轻电子+节奏感	类似《Money Heist》轻快版	30%
第1讲总结	4:00-4:30	阶段性收束	短暂停顿+轻微升华	纯电子音色	35%
第2讲·读文件	4:30-9:00	悬疑+发现感	电子氛围+低频脉冲	类似《黑镜》配乐	30%
第2讲总结	9:00-9:30	阶段性收束	短暂停顿	纯电子音色	35%
第3讲·练面试	9:30-14:00	史诗+掌控感	电子管弦混合	类似《星际穿越》轻快版	35%
21概念总览	14:00-15:00	信息密集+清晰	轻电子+规律节奏	类似数据可视化BGM	30%
总结收尾	15:00-16:00	温暖+品牌感	钢琴+轻电子	类似《时间规划局》结尾	40%
结尾互动	16:00-16:30	品牌锚定	品牌音效	晚枫Logo音效	50%

音效设计清单

音效用途	触发时机	音效类型	音量
概念出场	每个概念命名时	清脆"叮"或数字计数音	50%
受挫瞬间	每次"问题来了"	轻微降调+停顿	40%
解决时刻	每次新方案出现	轻微升调+轻快	40%
场景切换	三讲之间过渡	电子过渡音	45%
总结表格	21概念总览出现时	规律节拍+数据感	30%
品牌结尾	"关注晚枫"出现时	品牌专属音效	50%

🎬 分镜表

时间	画面内容	动作/运镜	台词/字幕	视觉化方式
0:00-0:05	黑屏，21个AI名词快速闪烁飞过	文字飞入动画	"Token、LLM、Prompt、RAG、思维链……"	A-文字动画
0:05-0:15	深蓝背景，"AI圈21个名词"大标题	标题放大定格	"AI圈冒出一堆新名词……"	B-真人出镜
0:15-0:30	真人出镜，略带困惑表情	中景，轻微推镜	"说实话，我三个月前也是……"	B-真人出镜
今天我就用一个完整的故事——从周一写周报，到周二分析文件，到周三准备面试——把21个概念全部串进去。一个打工人的完整一周，每一个概念都是在解决前一个问题的过程中自然出现的。
0:45-1:00	第1讲标题："第1讲：写周报"	标题飞入	"周一早上……"	A-文字动画
1:00-1:30	电脑屏幕+AI聊天界面	屏幕录制+缩放	"帮我写周报"→AI回复	C-屏幕录制
1:30-2:00	LLM概念卡：大脑图标+产品Logo	图标飞入	"背后干这个活的，叫LLM"	A-图标动画
2:00-2:30	Token计数动画：5字→7Token	数字跳动动画	"五个字，大约消耗7个Token"	A-数据动画
2:30-3:00	Prompt概念卡：对话框图标	图标飞入	"你输入的这句话，叫Prompt"	A-图标动画
3:00-3:30	三个概念关系图：LLM→Token→Prompt	连线动画	"三个概念已经自然出场了"	A-关系图
3:30-4:00	套话文字放大："本周工作稳步推进"	文字放大+红叉	"AI写出来的周报，全是套话"	A-文字动画
4:00-4:30	对比动画：差Prompt→好Prompt	左右对比	"换种说法……明显靠谱多了"	A-对比动画
4:30-5:00	提示词工程概念卡：菜单图标	图标飞入	"这种把需求说清楚的方法，叫提示词工程"	A-图标动画
5:00-5:30	系统提示词概念卡：身份卡片	图标飞入	"这就是系统提示词"	A-图标动画
5:30-6:00	上下文概念卡：记忆气泡	图标飞入	"AI能记住，靠的是上下文"	A-图标动画
6:00-6:30	模型对比：GPT-4o vs Claude 3.5	左右对比	"同样的提示词，换个AI，效果天差地别"	A-对比动画
6:30-7:00	第1讲总结：7个概念连线图	依次高亮	"第1讲7个概念总结"	A-关系图
7:00-7:30	场景过渡：PDF文件飞入	文件飞入动画	"写周报搞定了。但领导说……"	A-过渡动画
7:30-8:00	第2讲标题："第2讲：读文件"	标题飞入	"你把简历PDF扔给AI……"	A-文字动画
8:00-8:30	RAG概念卡：搜索+文件图标	图标飞入	"这招叫RAG"	A-图标动画
8:30-9:00	向量化动画：文字→数字→向量	变形动画	"把PDF拆成段落，变成一串数字"	A-数据动画
9:00-9:30	幻觉概念卡：问号+幻觉效果	图标抖动	"这叫幻觉"	A-图标动画
9:30-10:00	知识截止概念卡：日历截止	图标飞入	"这叫知识截止"	A-图标动画
10:00-10:30	多模态概念卡：文字+图片+语音	图标组合	"这叫多模态"	A-图标动画
10:30-11:00	流式输出动画：逐字显示	打字效果	"这叫流式输出"	C-屏幕录制
11:00-11:30	输出Token限制概念卡：字数计数器	数字跳动	"这叫输出Token限制"	A-数据动画
11:30-12:00	第2讲总结：7个概念连线图	依次高亮	"第2讲7个概念总结"	A-关系图
12:00-12:30	场景过渡：面试场景图标	场景切换动画	"简历改好了，想模拟面试"	A-过渡动画
12:30-13:00	第3讲标题："第3讲：练面试"	标题飞入	"你想把AI面试官放进微信……"	A-文字动画
13:00-13:30	API概念卡：遥控器+接口图标	图标飞入	"这叫API"	A-图标动画
13:30-14:00	速率限制概念卡：限速标志	图标飞入	"这叫速率限制"	A-图标动画
14:00-14:30	Few-shot概念卡：示范图标	图标飞入	"这招叫Few-shot"	A-图标动画
14:30-15:00	思维链概念卡：思维导图	图标展开	"这就是思维链"	A-图标动画
15:00-15:30	多轮对话概念卡：对话气泡链	气泡连接	"这叫多轮对话"	A-图标动画
15:30-16:00	工具调用概念卡：工具箱图标	图标飞入	"这叫工具调用"	A-图标动画
16:00-16:30	输出格式控制概念卡：表格模板	图标飞入	"这就是输出格式控制"	A-图标动画
16:30-17:00	第3讲总结：7个概念连线图	依次高亮	"第3讲7个概念总结"	A-关系图
17:00-18:00	21概念总览表：完整表格	表格滚动展示	"21个概念总览"	A-表格展示
18:00-19:00	三层递进关系图：基础→进阶→高级	金字塔动画	"基础层→进阶层→高级层"	A-关系图
19:00-20:00	真人出镜，总结收尾	中景，温暖灯光	"21个AI概念，一篇讲完了……"	B-真人出镜
20:00-20:30	品牌结尾：晚枫Logo+关注引导	Logo动画+二维码	"关注晚枫，带你一起玩AI"	A-品牌动画

🎬 画面剪辑方案

总时长估算

口播字数：约3000字（含21个概念4拍子+过渡+总结）
语速：180-200字/分钟
预估时长：约15-18分钟（纯口播）+ 动画/停顿 ≈ 18-20分钟
平台适配：B站/视频号长视频（18-20分钟）+ 可拆分为3个6-7分钟短视频

剪辑节奏建议

段落	时长	剪辑节奏	关键处理
开头钩子	30秒	快切+悬念	名词快速飞过，制造紧张感
共情瞬间	15秒	慢下来+推镜	真人表情特写，建立信任
每讲开头	15秒	标题飞入+过渡	明确场景切换
每个概念	45-60秒	概念卡+讲解	图标飞入→讲解→现实映射
受挫瞬间	15秒	停顿+降调	制造悬念，引出为什么
解决时刻	15秒	轻快+升调	新概念出场，有爽感
每讲总结	30秒	关系图动画	7个概念连线，强化记忆
场景过渡	15秒	过渡动画	文件/面试场景图标飞入
21概念总览	60秒	表格滚动	信息密集，可暂停回看
总结收尾	60秒	温暖+品牌	真人出镜，金字塔递进图

视觉风格统一

主色调：深蓝(#1a1a2e) + 亮黄(#ffd700) + 白色
概念卡风格：圆角矩形+图标+概念名+一句话理解
动画风格：Flat Design + 微动效（飞入/缩放/连线）
字体：标题用粗体无衬线，正文用清晰无衬线
品牌元素：晚枫Logo每5分钟出现一次（角标或过渡）

场景切换方式

第1讲→第2讲：周报文件"飞"走，PDF文件"飞"入
第2讲→第3讲：PDF文件"变形"为简历，面试场景图标出现
每讲内部：用"问题来了"作为概念切换的信号词，配合音效

建议的拆剪版本（可选）

版本	时长	内容	适用平台
完整版	18-20分钟	21个概念全讲	B站/视频号/YouTube
第1讲版	6-7分钟	写周报7个概念	抖音/视频号（可发3期）
第2讲版	6-7分钟	读文件7个概念	抖音/视频号（可发3期）
第3讲版	6-7分钟	练面试7个概念	抖音/视频号（可发3期）
精华版	3-5分钟	21概念总览表+总结	抖音/小红书

✅ 自查清单（19条）

结构完整性

☐ 1. 封面文案有2行钩子+画面风格？
☐ 2. 开头是"钩子→共情→场景"顺序？
☐ 3. 共情瞬间在开头30秒内出现？
☐ 4. 主线任务贯穿3个场景（写周报→读文件→练面试）？
☐ 5. 每个场景有清晰的"受挫→为什么→新方案"递进？
☐ 6. 21个概念每个都有4拍子（体验→命名→类比→现实映射）？
☐ 7. 每讲结尾有7个概念总结+因果递进说明？
☐ 8. 全文结尾有21个概念总览表+三层递进关系？
☐ 9. 结尾有"关注晚枫"人设锚点？
☐ 10. 收尾有因果总结（"基础层→进阶层→高级层"）？

质量细节

☐ 11. 每个概念都有"为什么出现"的来龙去脉？
☐ 12. 类比统一、好懂、没有混用？（大脑/字数计数器/菜单/说明书/短期记忆/课本/编号/吹牛/日历/打字机/遥控器/收费站/示范/草稿/朋友/工具箱/表格）
☐ 13. 每个概念命名后都有"这就是/这叫/这叫"？
☐ 14. 口语化程度：没有书面语长句？
☐ 15. 有3处以上"说实话/你发现问题了吗/问题来了"等互动感？
☐ 16. 有"我妈能听懂吗？"测试通过（无行话定义）？
☐ 17. 没有"众所周知/众所周知/众所周知"？
☐ 18. 所有中文术语都出现在英文括号前？（如：LLM（大语言模型））
☐ 19. 全文有3个以上"记忆锚点"（如：7个概念、21个名词、3个故事）？
☐ 20. 语言风格有"晚枫味"吗？（v2.2新增）
└→ 至少3处黑色幽默/冷笑话/自嘲？（如：AI吹牛比自媒体还自信、AI按Token计费像律师按小时计费、AI"想"的过程也要收费）
└→ 至少2处旁征博引用生活场景类比？（如：打印店按页收费、装修公司套模板、外卖看图片、景区限流、老师改作业、家政阿姨动手干）
└→ 没有"众所周知/某种程度上/大概可能"等模糊词？
└→ 没有"作为一位深耕……多年的专家"等装腔作势开头？
└→ 换成其他博主读不了 → 过关

📚 结构化参考模块

一、概念定义速查表（按场景分组）

写周报场景（基础层）

概念	英文	定义	一句话类比
LLM	Large Language Model	大语言模型，AI的大脑	24小时在线的写手
Token	Token	AI的字数计数器	按字数收费
Prompt	Prompt	提示词，你输入给AI的话	对助手下的指令
提示词工程	Prompt Engineering	把需求说清楚的方法	给厨师写详细菜单
系统提示词	System Prompt	一开始给AI设定的人设	岗位说明书
上下文	Context	AI记住的对话信息	短期记忆
模型	Model	不同AI的聪明程度	不同品牌的大脑

读文件场景（进阶层）

概念	英文	定义	一句话类比
RAG	Retrieval-Augmented Generation	检索增强生成，让AI先读你的文件	考试前先看课本
向量化	Embedding	把文字变成数字便于搜索	给书贴编号
幻觉	Hallucination	AI瞎编乱造	朋友吹牛说认识你
知识截止	Knowledge Cutoff	AI只知道训练时的信息	知识库只更新到某日期
多模态	Multimodal	AI能看懂图片等多种信息	同时看文字和图片
流式输出	Streaming Output	AI一个字一个字回答	打字机实时输出
输出Token限制	Output Token Limit	AI一次只能说有限字数	作文有字数上限

练面试场景（高级层）

概念	英文	定义	一句话类比
API	Application Programming Interface	调用AI的接口	给AI装的遥控器
速率限制	Rate Limit	API每分钟请求次数上限	高速收费站限流
Few-shot	Few-shot Learning	给AI做几个示例	老师先做示范
思维链	Chain of Thought	让AI一步步推理	解题先写草稿
多轮对话	Multi-turn Dialogue	AI记住之前的对话	朋友记得你说过的话
工具调用	Tool Calling	让AI使用外部工具	给AI配了工具箱
输出格式控制	Output Format Control	让AI按指定格式输出	填表格有固定格式

二、产品索引（LLM/模型类）

产品	所属公司	国内/国外	特点
DeepSeek	深度求索	国内	开源+免费，推理能力强
千问（Qwen）	阿里云	国内	通义千问系列，多模态能力强
Kimi	月之暗面	国内	长上下文优势（200万字）
豆包	字节跳动	国内	免费，语音交互强
文心一言	百度	国内	插件生态丰富
ChatGPT	OpenAI	国外	GPT-4o，综合能力标杆
Claude	Anthropic	国外	Claude 3.5 Sonnet，长文本强
Gemini	Google	国外	多模态+搜索联动

三、术语对照与行话翻译

行话	英文	大白话
LLM	Large Language Model	大语言模型——AI的大脑
Token	Token	AI的字数计数器
Prompt	Prompt	提示词——你输入给AI的话
提示词工程	Prompt Engineering	把需求说清楚的方法
上下文	Context	AI在这次对话里记住的信息
系统提示词	System Prompt	给AI装好的人设/岗位说明书
模型	Model	AI背后的大脑品牌
RAG	Retrieval-Augmented Generation	检索增强生成——让AI先读你的文件
向量化	Embedding	把文字变成数字
幻觉	Hallucination	AI瞎编乱造
知识截止	Knowledge Cutoff	AI只知道训练时的信息
多模态	Multimodal	AI能看懂图片等多种信息
流式输出	Streaming Output	AI一个字一个字回答
API	Application Programming Interface	调用AI的接口/遥控器
速率限制	Rate Limit	API每分钟请求次数上限
Few-shot	Few-shot Learning	给AI做几个示例
思维链	Chain of Thought	让AI一步步推理
多轮对话	Multi-turn Dialogue	AI记住之前的对话
工具调用	Tool Calling	让AI使用外部工具
输出格式控制	Output Format Control	让AI按指定格式输出

更新记录

2026-06-16：v2.2 对照v2.2创作指南升级语言风格：①全文注入"晚枫味"——黑色幽默/冷笑话/自嘲（8+处）②旁征博引用生活场景类比（打印店/装修公司/外卖/景区/老师改作业/家政阿姨）③直接犀利，去掉模糊词和装腔作势表达④有主见表达，不随波逐流⑤自查清单19条→20条（新增风格检查项）
2026-06-16：v2 对照v2.1创作指南全面升级：①共情瞬间放开头 ②一个主角贯穿3个场景 ③21个概念每个补全4拍子（体验→命名→类比→现实映射）④每次受挫补充来龙去脉（WHY）⑤分镜表按场景分组完整覆盖 ⑥画面剪辑方案+配乐设计独立成章 ⑦自查清单19条 ⑧21概念总览表+三层递进关系图
2026-06-16：v1 合并第1-3讲为完整系列

本文整合自《AI基础概念》系列3期口播稿，共21个核心概念，对照v2.1创作指南重写。