【SpringAIAlibaba新手村系列】（12）RAG 检索增强生成技术

news2026/4/7 22:47:50

第十二章 RAG 检索增强生成技术版本标注Spring AI:1.1.2Spring AI Alibaba:1.1.2.0章节定位本章的RetrievalAugmentationAdvisor VectorStore仍然是经典 RAG 入门方案。但 Spring AI Alibaba1.1.2.x官方代码已经进一步演进到RAG Workflow思路典型流程是Query - Rewrite - Retrieve - Prepare - Agent - Response。因此本章建议理解为“基础版 RAG”复杂业务更推荐升级为 Graph/Workflow 版本的 RAG。s01 s02 s03 s04 s05 s06 s07 s08 s09 s10 s11 [ s12 ] s13 s14 s15 s16 s17 s18先查资料, 再作回答-- RAG 的核心不是更会编, 而是更少胡说。一、为什么需要 RAG1.1 AI 的知识局限AI 大模型虽然很强但它有以下局限知识有时效性训练数据截止某个时间点之后的事不知道专业知识缺乏某些垂直领域的知识可能不准确企业内部信息它不知道你公司的业务和数据1.2 传统解决方式微调Fine-tuning让 AI 重新训练缺点成本高、需要大量数据、时间长适合通用知识需要调整的场景1.3 RAG 的诞生RAGRetrieval-Augmented Generation检索增强生成的核心思想是不改变 AI 的基础能力而是在它回答问题时先去知识库查找相关信息然后把信息连同问题一起发给 AI传统方式用户 ──→ AI ──→ 直接回答AI靠记忆 RAG方式用户 ──→ 向量搜索 ──→ 知识库查找相关信息 ──→ ──→ 把问题找到的信息一起发给 AI ──→ AI结合信息回答二、RAG 工作流程2.0 工作流化的 RAG 思路在很多入门教程里我们通常把 RAG 理解成用户提问向量检索把检索结果塞进 Prompt调用 LLM 回答这条链路没有问题但在 Spring AI Alibaba1.1.2.x的官方 workflow 示例中RAG 已经进一步升级成更可控的多步骤流程Query - Rewrite - Retrieve - Prepare - Agent - Response各步骤的含义如下Rewrite先让模型把原始问题改写成更适合检索的查询语句Retrieve基于改写后的查询做向量检索Prepare把命中的文档、用户问题、约束条件整理成更稳定的上下文Agent再交给ReactAgent或普通聊天模型生成最终答案这种做法的好处是检索命中率通常更高Prompt 注入更清晰更容易做调试、观测和节点拆分后续更容易迁移到Graph和工作流编排所以你可以把本章先学成“基础 RAG”再进一步理解成可拆分、可编排的工作流化 RAG。2.1 完整的 RAG 流程┌─────────────────────────────────────────────────────────────┐ │ RAG 完整流程 │ ├─────────────────────────────────────────────────────────────┤ │ │ │ 阶段一数据准备离线 │ │ ┌──────────┐ ┌──────────┐ ┌──────────┐ │ │ │ 文档集合 │───→│ 文本分块 │───→│ 向量化 │───→存入向量库│ │ └──────────┘ └──────────┘ └──────────┘ │ │ │ │ 阶段二问答推理在线 │ │ ┌──────────┐ ┌──────────┐ ┌──────────┐ │ │ │ 用户问题 │───→│ 向量化 │───→│ 相似度搜索│───→获取相关 │ │ └──────────┘ └──────────┘ └──────────┘ 文档 │ │ ↓ │ │ ┌──────────┐ ┌──────────┐ ┌──────────┐ │ │ │ 构建Prompt│←── │ 拼接上下文│←── │ 注入知识 │ │ │ └──────────┘ └──────────┘ └──────────┘ │ │ ↓ │ │ ┌──────────┐ │ │ │ 调用LLM │ │ │ └──────────┘ │ │ ↓ │ │ 返回结合知识后的答案 │ │ │ └─────────────────────────────────────────────────────────────┘2.2 本章场景运维故障查询这一章不是直接让大模型“凭空回答运维问题”而是先给它准备一份本地知识资料再通过 RAG 的方式让它去查资料后回答。这份资料就放在项目的resources目录下文件名通常叫ops.txt你可以把它理解成一份简化版的“运维故障知识库”。里面会提前写好一些故障编码及对应说明例如故障编码A0001故障编码C2222对应解释存储系统异常、网络不通、服务不可用等也就是说本章真正要做的事情不是“训练一个懂运维的大模型”而是先把ops.txt里的故障资料读出来将这些文本切分、向量化并存入向量数据库用户提问时先去向量库里检索最相关的故障说明再把检索结果和用户问题一起交给大模型生成答案这样一来用户在调用接口时不需要自己知道完整故障说明只需要问类似A0001 是什么故障C2222 怎么处理网络不通对应哪个故障编码系统就能先从ops.txt这份知识资料里找到相关内容再让 AI 组织成更自然的回答。所以这一章的场景准确地说应该是基于resources/ops.txt构建一个小型运维知识库然后通过 RAG 实现“查故障码、问故障原因、做运维问答”的效果。三、项目代码详解3.1 配置类package com.atguigu.study.config; import org.springframework.ai.chat.client.ChatClient; import org.springframework.ai.chat.model.ChatModel; import org.springframework.ai.embedding.EmbeddingModel; import org.springframework.ai.vectorstore.VectorStore; import org.springframework.ai.chat.client.ChatClient; import org.springframework.beans.factory.annotation.Qualifier; import org.springframework.context.annotation.Bean; import org.springframework.context.annotation.Configuration; Configuration public class SaaLLMConfig { /** * 注册 Qwen 的 ChatClient */ Bean(qwenChatClient) public ChatClient qwenChatClient(Qualifier(dashScopeChatModel) ChatModel chatModel) { return ChatClient.builder(chatModel).build(); } /** * 注入已经自动配置好的 VectorStore */ Bean public RagService ragService(ChatClient qwenChatClient, VectorStore vectorStore) { return new RagService(qwenChatClient, vectorStore); } }上面这段代码想表达的重点不是“必须手写某一种向量库实现”而是EmbeddingModel负责文本向量化VectorStore负责向量检索ChatClient Advisor负责把检索结果注入到问答链路中如果你选择 Redis、Milvus、PGVector 或其他实现核心思路都一样。3.2 RAG 控制器package com.atguigu.study.controller; import jakarta.annotation.Resource; import org.springframework.ai.chat.client.ChatClient; import org.springframework.ai.rag.advisor.RetrievalAugmentationAdvisor; import org.springframework.ai.rag.retrieval.search.VectorStoreDocumentRetriever; import org.springframework.ai.vectorstore.VectorStore; import org.springframework.web.bind.annotation.GetMapping; import org.springframework.web.bind.annotation.RestController; import reactor.core.publisher.Flux; /** * RAG 控制器 * 展示如何使用检索增强生成来回答专业问题 */ RestController public class RagController { Resource(name qwenChatClient) private ChatClient chatClient; // 注入已配置的向量数据库 Resource private VectorStore vectorStore; /** * RAG 问答接口 * * 接口http://localhost:8012/rag4aiops?msg00000 * 接口http://localhost:8012/rag4aiops?msgC2222 * * 测试步骤 * 1. 先调用 add 接口如果没有历史数据 * 2. 再调用 rag4aiops 接口询问故障码 * * param msg 用户的故障编码查询 * return AI 结合知识库返回的答案 */ GetMapping(/rag4aiops) public FluxString rag(String msg) { // 1. 定义系统提示词 // 告诉 AI 它的角色是运维工程师按照知识库中的编码给出解释 String systemInfo 你是一个运维工程师,按照给出的编码给出对应故障解释,否则回复找不到信息。 ; // 2. 创建检索增强Advisor // 这是 RAG 的核心组件 // - VectorStoreDocumentRetriever 负责从向量数据库中检索相关内容 // - RetrievalAugmentationAdvisor 负责把检索结果注入到Prompt中 RetrievalAugmentationAdvisor advisor RetrievalAugmentationAdvisor.builder() // 指定使用向量数据库进行检索 .documentRetriever( VectorStoreDocumentRetriever.builder() .vectorStore(vectorStore) .build() ) .build(); // 3. 构建并发送请求 // 在 .advisors() 中添加 RAG Advisor // 它会自动执行检索 → 注入 → 调用AI → 返回结果 return chatClient .prompt() .system(systemInfo) .user(msg) .advisors(advisor) // 关键添加RAG增强 .stream() .content(); } }四、RAG 的核心组件4.1 RetrievalAugmentationAdvisor这是 Spring AI 提供的 RAG 增强组件它的作用拦截用户请求从向量数据库检索相关信息将检索结果注入到 Prompt 中调用 AI让它基于检索结果回答返回最终答案4.2 DocumentRetriever文档检索器负责将用户问题转为向量在向量数据库中执行相似度搜索返回匹配度最高的文档五、本章小结5.1 核心概念概念说明RAG检索增强生成让AI结合知识库回答问题VectorStore向量数据库存储文档的向量RetrievalAugmentationAdvisorRAG核心组件自动检索注入DocumentRetriever从向量数据库检索文档的组件5.2 RAG 工作流程提问 → 向量化 → 相似度搜索 → 提取相关文档 → 注入Prompt → 调用AI → 返回答案5.3 应用场景企业内部知识问答产品手册查询客服问答系统专业领域知识库本章重点理解 RAG 的核心原理掌握 RetrievalAugmentationAdvisor 的使用理解 RAG 在实际场景中的应用下章剧透s13学会了 RAG 技术后下一章我们将学习 Tool Calling工具调用——让 AI 能够调用外部函数来完成真实任务编辑者Flittly更新时间2026年4月相关资源Spring AI RAG 官方文档

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2494026.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！