RAG：检索增强生成技术 | Retrieval-Augmented Generation

📖 术语定义 | Definition

RAG（Retrieval-Augmented Generation），即检索增强生成，是一种将信息检索系统与**大语言模型（LLM）**相结合的技术架构。RAG通过在生成回答前，先从外部知识库中检索相关信息，为LLM提供最新、最准确的上下文，从而显著提升回答质量、减少幻觉（hallucination）、并支持企业私有知识问答。

English: RAG (Retrieval-Augmented Generation) combines information retrieval systems with LLMs. Before generating answers, it retrieves relevant info from external knowledge bases, providing accurate context to reduce hallucinations and enable enterprise knowledge Q&A.

🧠 通俗解释 | Plain English

想象你在准备考试：

没有RAG的LLM：只靠考前突击（预训练）记下的知识答题 → 知识可能过时，可能瞎编
有RAG的LLM：考试时可以翻书查资料（检索），再结合自己的理解答题 → 更准、更新、更有据可查

RAG就是给AI装了一个实时查资料的能力，让它不再"裸考"。

⚙️ RAG工作流程 | How RAG Works

用户问题
   ↓
📄 检索（Retrieval）
   从向量数据库中查找最相关的文档片段
   ↓
🔄 增强（Augment）
   将检索结果注入Prompt上下文
   ↓
🤖 生成（Generate）
   LLM基于完整上下文生成回答
   ↓
✅ 回答

💡 为什么企业需要RAG？| Why Enterprises Need RAG

问题	LLM原生能力	RAG解决方案
知识过时	训练数据有截止日期	实时检索最新文档
幻觉	可能编造不存在的事实	答案基于检索到的真实文档
私有知识	不知道企业内部信息	检索企业内部知识库
归属不明	不知道答案来源	可追溯到具体文档
成本	微调成本高	比微调更经济、更灵活

🛠️ RAG应用场景 | Use Cases

企业知识库问答：员工查制度、查流程，AI秒答
客服机器人：结合产品手册提供精准解答
法律/医疗：引用真实法规/文献，减少误判
数据分析：让AI基于真实业务数据回答问题

🔧 RAG关键技术栈

组件	技术选型
嵌入模型	OpenAI Embeddings、国产BGE
向量数据库	Milvus、Pinecone、Chroma、Weaviate
LLM	GPT-4、Claude、国产通义/智谱
框架	LangChain、LlamaIndex、RAGFlow

🔗 相关链接 | Links

本文属于「AI术语科普」系列