RAG:检索增强生成技术 | Retrieval-Augmented Generation

📖 术语定义 | Definition

RAG(Retrieval-Augmented Generation),即检索增强生成,是一种将信息检索系统与**大语言模型(LLM)**相结合的技术架构。RAG通过在生成回答前,先从外部知识库中检索相关信息,为LLM提供最新、最准确的上下文,从而显著提升回答质量、减少幻觉(hallucination)、并支持企业私有知识问答。

English: RAG (Retrieval-Augmented Generation) combines information retrieval systems with LLMs. Before generating answers, it retrieves relevant info from external knowledge bases, providing accurate context to reduce hallucinations and enable enterprise knowledge Q&A.


🧠 通俗解释 | Plain English

想象你在准备考试:

  • 没有RAG的LLM:只靠考前突击(预训练)记下的知识答题 → 知识可能过时,可能瞎编
  • 有RAG的LLM:考试时可以翻书查资料(检索),再结合自己的理解答题 → 更准、更新、更有据可查

RAG就是给AI装了一个实时查资料的能力,让它不再"裸考"。


⚙️ RAG工作流程 | How RAG Works

用户问题
   ↓
📄 检索(Retrieval)
   从向量数据库中查找最相关的文档片段
   ↓
🔄 增强(Augment)
   将检索结果注入Prompt上下文
   ↓
🤖 生成(Generate)
   LLM基于完整上下文生成回答
   ↓
✅ 回答

💡 为什么企业需要RAG?| Why Enterprises Need RAG

问题 LLM原生能力 RAG解决方案
知识过时 训练数据有截止日期 实时检索最新文档
幻觉 可能编造不存在的事实 答案基于检索到的真实文档
私有知识 不知道企业内部信息 检索企业内部知识库
归属不明 不知道答案来源 可追溯到具体文档
成本 微调成本高 比微调更经济、更灵活

🛠️ RAG应用场景 | Use Cases

  • 企业知识库问答:员工查制度、查流程,AI秒答
  • 客服机器人:结合产品手册提供精准解答
  • 法律/医疗:引用真实法规/文献,减少误判
  • 数据分析:让AI基于真实业务数据回答问题

🔧 RAG关键技术栈

组件 技术选型
嵌入模型 OpenAI Embeddings、国产BGE
向量数据库 Milvus、Pinecone、Chroma、Weaviate
LLM GPT-4、Claude、国产通义/智谱
框架 LangChain、LlamaIndex、RAGFlow


本文属于「AI术语科普」系列