大家好,这里是程序员晚枫,正在all in AI编程实战。
第15讲:RAG入门——让AI读取你的文档
什么是RAG?
RAG = Retrieval-Augmented Generation(检索增强生成)
简单说:先从你的文档里找到相关内容,再让AI基于这些内容回答问题。
为什么需要RAG?因为AI模型的知识有截止日期,而且不知道你公司的内部文档。RAG让AI"读过"你的资料再回答。
1、RAG的工作流程
1 | 用户提问 → 检索相关文档 → 把文档+问题发给AI → AI基于文档回答 |
2、简单实现:直接把文档塞给AI
文档不大时,最简单的方式:
1 | from openai import OpenAI |
3、处理大文档:分段检索
文档太大怎么办?分成小段,只检索相关的:
1 | def split_text(text, chunk_size=500): |
4、用向量检索提升效果
关键词搜索太简单,用向量搜索更智能:
1 | pip install chromadb sentence-transformers |
1 | import chromadb |
5、实战:做一个文档问答助手
1 | from openai import OpenAI |
下讲预告
学会了RAG,下一讲我们学 AI聊天机器人开发——从零开始做一个完整的聊天应用。
敬请期待!
程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。
