是什么
RAG(Retrieval-Augmented Generation)是一种让大模型先检索外部知识,再基于检索结果生成答案的方法。
一句话理解:
让模型从闭卷考试变成开卷考试。
核心结构
- Retriever(检索器)
- Generator(生成器)
典型流程:
用户问题 → 检索 → 召回文档片段 → 拼接上下文 → LLM 生成答案为什么重要
RAG 主要解决:
- 知识截止
- 幻觉
- 无法引用来源
- 对私有知识库不了解
常见组件
- 文档切块(Chunking)
- Embedding 模型
- 向量数据库
- 检索排序 / 重排序
发明人
- Patrick Lewis 等(Meta,2020)
典型应用
- 企业知识库问答
- 客服机器人
- 法律 / 医疗 / 金融问答
- 代码助手
- 学术检索