🎬 本文根据口播稿第 039 期改编:AI基础概念全系列——21个核心概念一篇讲透
大家好,我是程序员晚枫。
最近被问爆的一个问题:
"晚枫,AI圈的 Token、Prompt、RAG、思维链到底是啥?开会听同事聊起来,我一句话插不上,回家搜一晚上更懵。"
这感觉我太懂了。
三个月前我同事开会聊这些,我只能假装点头——感觉就像一群人讨论"量子纠缠",我在旁边数他们说了几个"量子"。
今天一次说清楚:一个打工人的一周,21个概念串起来。
周一·写周报
周一早上,领导上周五说"周三交周报"。
我打开 AI,随口说了句"帮我写周报"——
两秒钟,AI 给一大段。我盯着看了 10 秒,发现一个问题:
每个字都认识,连起来不知道在说啥。
就像你收到领导的邮件——"关于前述事项的后续推进,望各相关方协同配合"——翻译过来就是"赶紧干活"。
但 AI 还没学到这一步,它在努力显得"专业"。
背后干这个活的,叫「大语言模型」,LLM。
👉 概念 1:LLM 是 AI 的大脑——你问它问题,它回答你。ChatGPT、Claude、DeepSeek、豆包、千问、Kimi,全都是大语言模型。
第二个问题:Token 是啥?
"帮我写周报" 5 个字,大约消耗 7 个 Token。AI 回复你 200 个字,再消耗 200 个 Token。
Token 就是 AI 的"字数计数器"。
就像你去打印店——打印按页收费,复印按张收费,AI 按 Token 收费。本质一样:定价需要一个最小不可分单位。
但 Token 有个冷笑话式的设定:它不按"意思"计费,按"块"计费。
就像律师按小时收费,他在厕所蹲了 20 分钟思考你案子,那 20 分钟也算钱。AI 也一样,它"想"的过程也要消耗 Token,哪怕它"想"出来的东西是错的。
👉 概念 2:Token 是 AI 的字数计数器——你输入多少、它输出多少,都按这个算。
第三个问题:Prompt 是啥?
你输入的那句话,就叫 Prompt,提示词。
👉 概念 3:Prompt 是你输入给 AI 的话——你说什么,它答什么。
周一·继续:周报全是套话
AI 写出来的周报,全是套话。
"本周工作稳步推进,各项指标持续向好"——你领导看了,第一反应是"这人到底干了啥?"
为什么? 因为你没有把需求说清楚。
LLM 很聪明,但它不是你肚子里的蛔虫。你不说清楚,它就只能猜,猜出来就是套话。
就像你让装修公司"帮我装修"——不说清楚要几个房间、什么风格、预算多少,设计师只能给你套模板。
于是我换种说法:
"上周做了 3 个功能、修了 5 个 bug、开了 2 次评审会,帮我写周报。"
这次 AI 写出来明显靠谱多了。
这种"把需求说清楚的方法",叫「提示词工程」。
👉 概念 4:提示词工程 是让 AI 懂你的方法——就像给厨师写详细菜单,你说得越具体,AI 越没法糊弄你。
系统提示词 + 上下文
但又有个问题:每次打开 AI,都得重新说"我是程序员,周报格式是……"。
太麻烦了。
我希望 AI 一开始就记住我的背景——"你是个程序员,你的周报格式是……"。这段一开始就设的话,叫「系统提示词」。
而在对话过程中补充的信息——"上周做了 3 个功能"——AI 能记住,靠的是「上下文」。
👉 概念 5:系统提示词 是一开始给 AI 设定的人设——就像岗位说明书。
👉 概念 6:上下文 是 AI 记住的对话信息——就像 AI 的短期记忆。记忆是有限度的,装满了前面的就会挤掉后面的。
模型:选对大脑很重要
同样的提示词,换个 AI,效果天差地别。
LLM 是大脑,但大脑也分聪明和一般。GPT-4o、Claude 3.5、千问 2.5——不同的模型,效果不一样。选对模型,有时候比提示词工程还重要。
就像你选律师——同一个案子,实习生和资深合伙人写出来完全不同。选错模型,就像花大价钱请了个刚拿证的实习律师。
👉 概念 7:模型 是不同 AI 的聪明程度——选对大脑,比提示词工程更重要。
周二·读文件
领导说:"把你上季度的数据也分析一下。"数据在一个 PDF 里。
我把 PDF 扔给 AI:"帮我分析"——AI 让我"突出项目管理经验"。可我压根没做过项目管理。
为什么?因为 AI 用的是训练时的老数据,压根没见过你的文件。
就像你问一个没看过你材料的医生"我这病怎么治"——他只能说"一般这类病通常……"。
想让 AI 先读懂你的东西再回答,这招叫「RAG」。
👉 概念 8:RAG 是让 AI 先读你的文件——就像考试前先看课本。
RAG 怎么读?把 PDF 拆成段落,每段变成一串数字——这步叫「向量化」。变完就能快速搜索最相关的内容。
就像考试前先看课本——RAG 让 AI 先读你的"课本",再答题。向量化就是给课本的每一页贴编号,方便快速翻到你要的那页。
👉 概念 9:向量化 是把文字变成数字——就像给书贴编号,方便快速查找。
幻觉:AI 瞎编乱造
但即使用了 RAG,AI 还是可能编出我根本没做过的项目——这叫「幻觉」。
AI 训练数据有**「知识截止」**日期,它只知道训练时见过的东西,不知道今年的行情。
查股价、查新闻,都要注意这个截止日期。
幻觉的本质,是 AI 在"不知道"的情况下硬要回答。 它宁肯编一个看起来靠谱的答案,也不愿意说"我不知道"。
它编起来比造谣的自媒体还自信。 至少自媒体知道自己是在编。
👉 概念 10:幻觉 是 AI 瞎编乱造——它宁肯编一个,也不说"我不知道"。
👉 概念 11:知识截止 是 AI 只能知道训练时的信息——知识库只更新到某日期。
多模态 + 流式输出
最新的信息怎么办?我把 PDF 截图也传给 AI——AI 不只认文字还能看图,叫「多模态」。
👉 概念 12:多模态 是 AI 能同时处理多种信息——文字、图片、语音。
AI 回答时一个字一个字蹦出来——这叫「流式输出」。不用等整段回答完才显示,体验更好。
流式输出有个冷笑话式的好处:你能看到 AI "想"的过程。 就像你看厨师做菜,从切菜到下锅到调味,你能看到每一步。
但回答到一半突然停了——一次能输出的字数有限,叫「输出 Token 限制」。就像作文有字数上限,超了就得停。
👉 概念 13:流式输出 是 AI 实时输出——打字机式逐字显示。
👉 概念 14:输出 Token 限制 是 AI 一次只能说有限字数——作文有字数上限。
周三·练面试
简历改好了,我想让 AI 模拟面试官,帮我练面试。
我想把 AI 面试官放进微信,像聊天一样随时练——这得用「API」,给 AI 装个遥控器,让程序能调用 AI。
👉 概念 15:API 是调用 AI 的遥控器——所有 AI 应用底层都用 API。
但 API 用着用着报错了——每分钟请求次数有上限,叫「速率限制」。
就像高速收费站限流,商业 API 都有配额,企业级要付费扩容。
限速其实是个保护机制。 想象一下,如果没有限速,所有人同时涌入 API,服务器直接崩溃——就像节假日景区不限流,所有人同一天去,景区直接被挤爆。
你骂限速慢,但没了限速,你连网页都打不开。
👉 概念 16:速率限制 是 API 每分钟请求次数上限——保护服务器不崩溃。
Few-shot:看例子比讲道理管用
修好了,但 AI 出的题不像真的。
我先给它看 3 道标准面试题,让它照着出——这招叫「Few-shot」,做示范比讲道理管用。
👉 概念 17:Few-shot 是给 AI 做示范——我不告诉你抽象的规则,我给你看 3 个例子。
思维链:让 AI 一步步推理
教会了风格,但 AI 直接给评价太浅。
我让它别急,先一步步推理——这就是「思维链」,理完思路再答,深浅不一样。
👉 概念 18:思维链 是让 AI 一步步推理——解题先写草稿。
思维链的妙处在于"过程可视化"。 就像老师改作业,不是直接写"错了",而是先写"这里思路对了,但第三步算错了"。
思维链不是让 AI 更聪明,是让你更知道它有多不聪明。
多轮对话:AI 记得住吗?
面试要来回追问。我跟 AI 聊了 20 轮,它还记得我前面暴露的弱点——这叫「多轮对话」。
但多轮对话有个隐藏问题:上下文窗口是有限的。聊多了,前面的信息会被挤掉。
你以为 AI 在认真倾听,其实它在"滚动刷新"。 排满了,最早的那条就被挤掉了。
👉 概念 19:多轮对话 是 AI 记住之前的对话——但记忆是有限的。
工具调用 + 输出格式控制
聊完想让它顺手帮我改简历——AI 只会问不会改?
给它接上简历修改工具,这叫「工具调用」。就像给 AI 配了工具箱,日历、搜索、计算器都能接。
工具调用是 AI 从"会动嘴"到"能动手"的关键一步。 之前 AI 只能给你建议,现在它能直接操作——改文件、查数据、发邮件。
👉 概念 20:工具调用 是让 AI 使用外部工具——从"动嘴"到"动手"。
但 AI 输出乱七八糟。让它按打分表格式来——这就是「输出格式控制」。JSON、Markdown、评分表都能控制。
格式控制为什么重要? 想象一下,AI 给你一堆 unstructured 的反馈,你得自己整理。有了格式控制,AI 直接输出"沟通能力:8/10;技术深度:7/10"——结构化、可比较、可操作。
👉 概念 21:输出格式控制 是让 AI 按指定格式输出——这就是 AI 世界的"白纸黑字"。
21 个概念总览表
| 序号 | 概念 | 场景 | 一句话理解 |
|---|---|---|---|
| 1 | LLM | 写周报 | AI 的大脑 |
| 2 | Token | 写周报 | AI 的字数计数器 |
| 3 | Prompt | 写周报 | 你输入给 AI 的话 |
| 4 | 提示词工程 | 写周报 | 把需求说清楚的方法 |
| 5 | 系统提示词 | 写周报 | 一开始给 AI 设定的人设 |
| 6 | 上下文 | 写周报 | AI 记住的对话信息 |
| 7 | 模型 | 写周报 | 不同 AI 的聪明程度 |
| 8 | RAG | 文件分析 | 让 AI 先读你的文件 |
| 9 | 向量化 | 文件分析 | 把文字变成数字便于搜索 |
| 10 | 幻觉 | 文件分析 | AI 瞎编乱造 |
| 11 | 知识截止 | 文件分析 | AI 只能知道训练时的信息 |
| 12 | 多模态 | 文件分析 | AI 能看懂图片 |
| 13 | 流式输出 | 文件分析 | AI 实时输出 |
| 14 | 输出 Token 限制 | 文件分析 | AI 一次只能说有限字数 |
| 15 | API | 面试 | 调用 AI 的遥控器 |
| 16 | 速率限制 | 面试 | API 每分钟请求次数上限 |
| 17 | Few-shot | 面试 | 给 AI 做示范 |
| 18 | 思维链 | 面试 | 让 AI 一步步推理 |
| 19 | 多轮对话 | 面试 | AI 记住之前的对话 |
| 20 | 工具调用 | 面试 | 让 AI 使用外部工具 |
| 21 | 输出格式控制 | 面试 | 让 AI 按指定格式输出 |
这 21 个概念的 3 层关系
回头看,这 21 个概念不是随机出现的——每一个都是为了解决上一个问题而产生的:
- 基础层(写周报):LLM → Token → Prompt → 提示词工程 → 系统提示词 → 上下文 → 模型
- 进阶层(读文件):RAG → 向量化 → 幻觉 → 知识截止 → 多模态 → 流式输出 → 输出 Token 限制
- 高级层(练面试):API → 速率限制 → Few-shot → 思维链 → 多轮对话 → 工具调用 → 输出格式控制
记住这个递进关系,你就能把 AI 概念串起来理解:
基础层解决"怎么和 AI 说话",进阶层解决"怎么让 AI 处理你的东西",高级层解决"怎么让 AI 帮你干复杂的事"。
最后的最后
学 AI 不是为了当工程师,是为了用 AI 解决问题。
你不需要懂 Transformer 架构,不需要懂反向传播,你只需要知道:
- AI 能做什么
- 怎么用 AI
- AI 在哪些场景会出错
这 21 个概念,就是这 3 个问题的答案。
收藏起来,开会时再听到这些词,你就能插上话了。
相关阅读
- 2026 年学习编程,你需要的不是更多教程
- 我用AI做PPT,同事说你是PPT设计师吗
- 设计师花3天做的图,我用 AI 15分钟搞定了
- Codex 入门指南,从零基础到实战,看这一篇就够了!
- HR看简历只花6秒,我用AI让我的简历过了第一关
- 我用AI做数字人播报,老板问"你什么时候请的主播?"
科技不高冷,AI很好用。
我是晚枫,关注我,带你一起玩AI!
