RAG（Retrieval-Augmented-Generation）检索增强生成

RAG（Retrieval-Augmented-Generation）检索增强生成

news2025/7/14 9:23:04

什么是RAG（检索增强生成）？

RAG是一种AI框架，结合传统的数据检索技术和LLM（大语言模型）的优势，通过将外部数据和LLM生成语言技能集合，对LLM的输出进行优化，使输出更准确、更及时，并且与您的具体需求相关。

简单来说，人在遇到认知外的问题时会去翻书和上网查找答案。同样地，当LLM遇到问题时，可能会回答虚假信息，RAG就相当于为LLM提供了一个智能检索系统，使其能够像人类一样"查阅资料"来解决问题。

RAG工作流程

在传统模式下，LLM 仅基于预训练知识和用户输入直接生成响应。RAG 系统则引入了一个关键的信息检索组件，其工作流程如下：

1.创建知识数据文档

LLM训练使用的训练集以外的数据，可以来自不同的数据源，数据库/HTML/API或doc、pdf和md文件，得到原始的数据后，就可以进行处理，可以使用嵌入语言模型的 AI 技术将数据转换为数字表示形式并将其存储在向量数据库中，会创建一个LLM可以理解的知识库。

使用Spring AI的ETL（Extract Transform Load ）提取转换加载可实现对原始数据处理。

原始数据 --> List<Document>（文档列表）--> 向量转换、存储

ETL 管道：： Spring AI 参考 --- ETL Pipeline :: Spring AI Reference

2.文档检索相关信息

实现第一步的知识库后，数据以向量格式存储（[1,2,5,1,...]）与向量数据库。

用户提问也要转换成向量格式，然后与向量数据库进行匹配。此时再提问“张三是谁？”，就会转换成向量，基于一定的搜索匹配策略与向量数据库匹配，得到结果后再进行过滤，就能得到与用户的提问“张三是谁？”匹配的文档。

用户提问 --> 向量转换 --> 匹配向量数据库

嵌入模型 API ：： Spring AI Reference --- Embeddings Model API :: Spring AI Reference

3.增强 LLM 提示

得到问题的相关文档后，接下来，RAG 模型通过在上下文中添加检索到的相关数据来增强用户输入。使用提示工程技术与 LLM 进行有效沟通。增强提示允许大型语言模型为用户查询生成准确的答案。

用户提问 --> 结合文档 --> 新的用户提问上下文 --> LLM

检索增强生成：： Spring AI 参考 --- Retrieval Augmented Generation :: Spring AI Reference

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2383784.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

黑马点评前端Nginx启动失败问题解决记录

黑马点评前端Nginx启动失败问题解决记录

Nginx启动失败问题解决记录问题描述在学习黑马Redis课程时，启动黑马点评Nginx前端项目发现： 无法访问8080端口检查Windows端口占用情况（无占用）结论：Nginx服务未成功启动错误日志分析在nginx安装目录下的logs…

阅读更多...

第12天-Python+Qt5开发实战：10大经典案例与深度解析

第12天-Python+Qt5开发实战：10大经典案例与深度解析

1. 基础窗口与信号槽机制 python 复制下载 import sys from PyQt5.QtWidgets import QApplication, QMainWindow, QPushButtonclass MainWindow(QMainWindow):def __init__(self):super().__init__()self.setWindowTitle("信号槽示例")btn = QPushButton("…

阅读更多...

人工智能培训：解锁未来职场竞争力的核心路径与课程内容解析

人工智能培训：解锁未来职场竞争力的核心路径与课程内容解析

当AI绘画工具在几秒内生成一幅媲美专业画师的作品，当AI程序员自主优化代码逻辑，当AI客服精准解答复杂问题——一个现实愈发清晰：人工智能正在重新定义“专业能力”的边界。对于普通人而言，这场变革既带来焦虑，也孕育机…

阅读更多...

深入解析Java泛型：从定义到实战应用

深入解析Java泛型：从定义到实战应用

目录 🚀前言🤔泛型的定义🐧泛型类🌟泛型接口✍️泛型方法、通配符、上下限💯泛型方法💯 通配符与上下限⚙️通配符（Wildcard）⚙️泛型上下限⚙️应用场景 🦜泛型支持的类…

阅读更多...

【开源】一个基于 Vue3 和 Electron 开发的第三方网易云音乐客户端，具有与官方客户端相似的界面布局

【开源】一个基于 Vue3 和 Electron 开发的第三方网易云音乐客户端，具有与官方客户端相似的界面布局

🎵 XCMusic：高颜值第三方网易云音乐客户端 🎶 📍 项目亮点 XCMusic 是一款基于Vue3Electron开发的开源、跨平台网易云音乐客户端。此音乐播放器基于 Electron 开发，旨在为用户提供简洁、美观、兼容多平台的音乐体验。…

阅读更多...

labview设计一个虚拟信号发生器

labview设计一个虚拟信号发生器

目标：设计一个虚拟信号发生器，通过功能键的设置可以产生正弦波、三角波、方波和锯齿波，并可以通过输入控件设置采集信号的频率、幅值、相位等参数。一、正弦波 （1）创建一个枚举 （2）点击属性后…

阅读更多...

工业路由器WiFi6+5G的作用与使用指南，和普通路由器对比

工业路由器WiFi6+5G的作用与使用指南，和普通路由器对比

工业路由器的技术优势在现代工业环境中，网络连接的可靠性与效率直接影响生产效率和数据处理能力。WiFi 6（即802.11ax）和5G技术的结合，为工业路由器注入了强大的性能，使其成为智能制造、物联网和边缘计算的理想选择。…

阅读更多...

编译Qt5.15.16并启用pdf模块

编译Qt5.15.16并启用pdf模块

编译Qt5.15.16并启用pdf模块标题1.目录设置 -q-bulid –qt-everywhere-src-5.15.16 –bulid cd bulid 必须，否则会提示Project ERROR: You cannot configure qt separately within a top-level build. create .qmake.stash and .qmake.super in build folder …

阅读更多...

Python绘制新冠疫情的知识图谱

Python绘制新冠疫情的知识图谱

from pyvis.network import Network import networkx as nx import pandas as pd import os# 修复模板路径 from pyvis import network as net_moduleos.environ["PATH"] os.pathsep os.path.dirname(net_module.__file__)# 创建紧密连接图 g nx.Graph()# 关键修…

阅读更多...

使用RUST在Arduino上进行编程（MacOS，mega板）

使用RUST在Arduino上进行编程（MacOS，mega板）

近年来，RUST成为了嵌入式编程的热门语言，本文通过实现（1）LED闪灯，以及（2）在console（终端）实现“Hello Rust World”两项功能来完成实操的入门。深入学习可以参考RUST语言…

阅读更多...

大模型微调与高效训练

大模型微调与高效训练

随着预训练大模型（如BERT、GPT、ViT、LLaMA、CLIP等）的崛起，人工智能进入了一个新的范式：预训练-微调（Pre-train, Fine-tune）。这些大模型在海量数据上学习到了通用的、强大的表示能力和世界知识。然而，要将这些通用模型应用于特定的下游任务或领域，通常还需要进行微调…

阅读更多...

OpenCv高阶（十六）——Fisherface人脸识别

OpenCv高阶（十六）——Fisherface人脸识别

文章目录前言一、Fisherface人脸识别原理1. 核心思想：LDA与Fisher准则2. 实现步骤(1) 数据预处理(2) 计算类内散布矩阵 SW对每个类别（每个人）计算均值向量 μi：(3) 计算类间散布矩阵 SB(4) 求解投影矩阵 W(5) 降维与分类 3. Fish…

阅读更多...

二分算法的补充说明

二分算法的补充说明

在上一节中我们简单介绍了二分算法，通过区分小于等于，大于或者小于，大于等于我们可以求出它们的边界值。具体方法是先看一下要求哪里的边界值，分成两部分让如果求小于等于的右边界，我们根据条件让rightmid-1,leftmid…

阅读更多...

java基础(api)

java基础(api)

包： 导包，不同包的程序名相同。但是要用两个的话可以这样子写： String String概述 String的常用方法 String使用时的注意事项 String的应用案例

阅读更多...

VSCode推出开源Github Copilot：AI编程新纪元

VSCode推出开源Github Copilot：AI编程新纪元

文章目录开源决策的背后GitHub Copilot的演进历程Copilot Chat核心功能解析1. 聊天界面集成2. 代码理解与生成3. 多文件编辑能力4. 智能代理模式开源后的影响与展望对开发者的影响对AI编程工具市场的影响未来发展方向如何开始使用GitHub Copilot结语相关学习资源在AI编程助…

阅读更多...

Mujoco 学习系列（四）官方模型仓库 mujoco_menagerie

Mujoco 学习系列（四）官方模型仓库 mujoco_menagerie

mujoco 官方在 Github 上发布了一个他们自己整理的高质量的模型仓库，这个仓库是一个持续维护的项目，里面包含了目前市面上常见的人形机器人、机械臂、底盘等模型，对于初学者而言是一个非常好的学习资料，无论是想在仿真环境中尝试还…

阅读更多...

代码走读 Go 语言 Map 的实现

代码走读 Go 语言 Map 的实现

序言在日常的开发当中，我们一定离不开一个数据结构字典。不仅可以存储关联数据对，还可以在 O(1) 的时间复杂度进行查找。很久之前在一篇文章带你实现哈希表介绍了相关的原理以及简单的实现。所以这篇文章中我们就不多赘述哈希表的原理，而…

阅读更多...

PostgreSQL14 +patroni+etcd+haproxy+keepalived 集群部署指南

PostgreSQL14 +patroni+etcd+haproxy+keepalived 集群部署指南

使用postgresql etcd patroni haproxy keepalived可以实现PG的高可用集群，其中，以postgresql做数据库，Patroni监控本地的PostgreSQL状态，并将本地PostgreSQL信息/状态写入etcd来存储集群状态，所以，patr…

阅读更多...

数据结构知识点汇总

数据结构知识点汇总

1、在数据结构中，随机访问是指能够直接访问任一元素，而不需要从特定的起始位置开始，也不需要按顺序访问其他元素。这种访问方式通常不涉及遍历。例如，数组（array）支持随机访问，你可以直接通过索…

阅读更多...

基于YOLO11深度学习的变压器漏油检测系统【Python源码+Pyqt5界面+数据集+安装使用教程+训练代码】【附下载链接】

基于YOLO11深度学习的变压器漏油检测系统【Python源码+Pyqt5界面+数据集+安装使用教程+训练代码】【附下载链接】

文章目录引言软件主界面源码目录文件说明一、环境安装(1)安装python(2)安装软件所需的依赖库二、软件核心功能介绍及效果演示(1)软件核心功能(2)软件效果演示三、模型的训练、评估与推理(1)数据集准备与训练(2)训练结果评估(3)使用训练好的模型识别四、完整相关文件及源码下…

阅读更多...

推荐文章

最新文章