Elasticsearch + Milvus 构建高效知识库问答系统《一》

news2025/6/8 0:48:40

🔍 Elasticsearch + Milvus 构建高效知识库问答系统(RAG 技术实战)

📌 目录

  1. 背景介绍
  2. Elasticsearch 在知识库检索中的作用
  3. Milvus 在知识库检索中的作用
  4. 混合检索:Elasticsearch + Milvus
  5. 完整代码实现
  6. 部署建议与优化方向
  7. 总结

背景介绍

在构建基于大语言模型(LLM)的知识增强型生成系统(RAG)中,知识库检索是整个流程的核心环节。它决定了模型是否能从庞大的文档中快速定位到相关上下文信息。

传统的 RAG 系统通常采用以下两阶段流程:

[Query] → [Retriever] → [Top-k Docs] → [LLM] → [Answer]

其中 Retriever 可以是稀疏检索(如 BM25)、稠密检索(如 Milvus),也可以是两者的混合。

本文将详细介绍如何使用 ElasticsearchMilvus 来构建一个高效的多模态检索系统,并提供可运行的 Python 示例代码。


Elasticsearch 在知识库检索中的作用

功能概述:

  • 基于关键词匹配的稀疏检索
  • 支持倒排索引和 TF-IDF/BM25 模型
  • 快速召回高相关性文档
  • 支持中文分词、拼音搜索、近义词扩展等功能

适用场景:

  • 中文医疗问答系统
  • 法律条文检索
  • 小规模 FAQ 库
  • 对语义理解要求不高的冷启动阶段

示例代码(Python)

from elasticsearch import Elasticsearch
from sentence_transformers.util import cos_sim

# 初始化 ES 客户端
es = Elasticsearch(hosts=["http://localhost:9200"])

# 插入文档
doc1 = {"content": "大模型训练需要大量高质量数据"}
doc2 = {"content": "RAG 系统通过外部知识提升回答能力"}
es.index(index="medical_kb", document=doc1)
es.index(index="medical_kb", document=doc2)

# 查询
query_body = {
    "match": {
        "content": "如何提升问答系统的准确性?"
    }
}
response = es.search(index="medical_kb", body=query_body)

# 输出结果
print("Elasticsearch 回答结果:")
for hit in response['hits']['hits']:
    print(f" - {hit['_source']['content']}")

Milvus 在知识库检索中的作用

功能概述:

  • 支持高维向量存储与相似度检索(ANN)
  • 可与 BERT、Sentence-BERT、BGE 等句向量模型结合
  • 实现语义级别的相似度计算
  • 支持大规模数据检索(亿级向量)

适用场景:

  • 大规模知识库
  • 高精度语义匹配
  • 图像/文本混合检索
  • LLM + 向量数据库联合部署

示例代码(Python + Milvus)

pip install pymilvus sentence-transformers
from sentence_transformers import SentenceTransformer
from pymilvus import connections, Collection

# 加载语义编码器
model = SentenceTransformer('paraphrase-MiniLM-L6-v2')

# 连接 Milvus
connections.connect(host='localhost', port='19530')
collection = Collection("faq_collection")

# 插入向量(假设你已建立好 collection 并导入了知识库向量化内容)

# 查询
query_text = "如何提升问答系统的准确性?"
query_vec = model.encode([query_text])

collection.load()
results = collection.search(data=query_vec, anns_field="embedding", param={"metric_type": "IP", "offset": 0}, limit=3)

# 输出结果
print("Milvus 语义检索结果:")
for result in results:
    for hit in result:
        print(f" - ID: {hit.id} Distance: {hit.distance}")

混合检索:Elasticsearch + Milvus

你可以采用如下流程来构建一个高效的 RAG 问答系统:

[用户问题]
   ↓
Elasticsearch → [Top-50 粗召回文档] 
   ↓
Milvus → [Top-10 语义相似文档]
   ↓
Reranker → [Top-3 最佳匹配段落]

✅ 混合优势:

优点描述
冷启动友好利用 ES 快速上线
语义准确Milvus 提升召回质量
高效排序结合 reranker 进一步优化输出
支持中文可选择支持中文的 embedding 模型

完整代码实现(Python 示例)

以下是一个完整的混合检索流程示例:

from elasticsearch import Elasticsearch
from sentence_transformers import SentenceTransformer
from pymilvus import connections, Collection

# 初始化组件
es = Elasticsearch(hosts=["http://localhost:9200"])
model = SentenceTransformer('paraphrase-MiniLM-L6-v2')
connections.connect(host='localhost', port='19530')
milvus_col = Collection("faq_collection")

def hybrid_retrieval(query, k=3):
    # Step 1: Elasticsearch 粗召回
    es_result = es.search(index="medical_kb", body={"match": {"content": query}})
    es_docs = [hit["_source"]["content"] for hit in es_result["hits"]["hits"]]

    # Step 2: Milvus 语义精排
    query_vec = model.encode([query])
    milvus_results = milvus_col.search(data=query_vec, anns_field="embedding", param={"metric_type": "IP"}, limit=k)
    
    # Step 3: 返回 top-k 文档
    final_docs = []
    for result in milvus_results:
        for hit in result:
            final_docs.append(es_docs[hit.id])
    return final_docs[:k]

部署建议与优化方向

1. 数据预处理建议:

  • 使用 jiebaHanLP 对中文进行分词
  • 清洗无意义符号、HTML、乱码
  • 构建统一的数据格式(如 JSON)

2. 索引构建建议:

  • Elasticsearch
    • 使用 ik-analyzer 中文分词插件
    • 设置字段类型为 textkeyword
  • Milvus
    • 使用 HNSW 或 IVF-PQ 索引加速查询
    • 设置合适的维度(如 768 / 1024)
    • 开启 GPU 加速(如支持)

3. 性能调优建议:

组件调优方式
Elasticsearch分片策略、索引合并、关闭不必要的日志
Milvus使用 ANN 索引、调整 nprobe、批量插入
Embedding 模型使用轻量模型(如 bge-small, gte-base
缓存机制Redis 缓存高频问题与答案
异步检索使用 Celery 或 FastAPI 异步接口

4. 可选高级功能:

  • Reranking:使用 BAAI/bge-reranker-base 等交叉编码器进一步打分排序
  • 向量更新机制:定期更新 Milvus 中的知识库向量
  • 混合评分融合:对 ES 和 Milvus 的结果做加权得分排序

总结

方法是否理解语义是否需训练是否支持中文是否适合大规模是否适合冷启动
Elasticsearch❌ 否❌ 否✅ 是✅ 是✅ 是
Milvus✅ 是✅ 是✅(模型决定)✅ 是❌ 否
FAISS✅ 是✅ 是✅(模型决定)⭐ 有限❌ 否
混合检索(ES+Milvus)✅ 是✅ 是✅ 是✅ 是✅ 是

✅ 推荐组合方案

方案一:纯稀疏检索(仅使用 ES)

适合冷启动或无语义模型的场景,无需 GPU 资源。

Query → Elasticsearch → Top-k Docs

方案二:纯稠密检索(仅使用 Milvus)

适合有预训练语义模型(如 BGE、Jina、OpenAI embeddings)的场景。

Query → Dense Encoder → Milvus → Top-k Docs

方案三:混合检索(ES + Milvus)

适合企业级 RAG 系统,兼顾效率与精度。

Query → Elasticsearch → Top-50 Docs
         ↓
       Milvus → Top-10 Docs
         ↓
     Reranker → Top-3 最终输出

📌 欢迎点赞、收藏,并关注我,我会持续更新更多关于 AI、LLM、视觉-语言模型等内容!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2403539.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

深入理解 transforms.Normalize():PyTorch 图像预处理中的关键一步

深入理解 transforms.Normalize():PyTorch 图像预处理中的关键一步 在使用 PyTorch 进行图像分类、目标检测等深度学习任务时,我们常常会在数据预处理部分看到如下代码: python复制编辑transform transforms.Compose([transforms.ToTensor…

爆炸仿真的学习日志

今天学习了一下【Workbench LS-DYNA中炸药在空气中爆炸的案例-哔哩哔哩】 https://b23.tv/kmXlN29 一开始 如果你的 ANSYS Workbench 工具箱(Toolbox)里 只有 SPEOS,即使尝试了 右键刷新、重置视图、显示全部 等方法仍然没有其他分析系统&a…

[华为eNSP] OSPF综合实验

目录 配置流程 画出拓扑图、标注重要接口IP 配置客户端IP 配置服务端IP 配置服务器服务 配置路由器基本信息:名称和接口IP 配置路由器ospf协议 测试结果 通过配置OSPF路由协议,实现跨多路由器的网络互通,并验证终端设备的访问能力。 …

完美搭建appium自动化环境

🍅 点击文末小卡片,免费获取软件测试全套资料,资料在手,涨薪更快 桌面版appium提供可视化操作appium主要功能的使用方式,对于初学者非常适用。 如何在windows平台安装appium桌面版呢,大体分两个步骤&…

c++中的输入输出流(标准IO,文件IO,字符串IO)

目录 &#xff08;1&#xff09;I/O概述 I/O分类 不同I/O的继承关系 不同I/O对应的头文件 &#xff08;2&#xff09;iostream 标准I/O流 iostream头文件中的IO流对象 iostream头文件中重载了<<和>> 缓冲区示意图 标准输入流 cin用法 cin&#xff1a;按空…

2025年渗透测试面试题总结-ali 春招内推电话1面(题目+回答)

安全领域各种资源&#xff0c;学习文档&#xff0c;以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具&#xff0c;欢迎关注。 目录 ali 春招内推电话1面 一、Web安全核心理解 二、熟悉漏洞及防御方案 三、UDF提权原理与防御 四、XSS Fuzz…

Reactor和Proactor

reactor的重要组件包括&#xff1a;Event事件、Reactor反应堆、Demultiplex事件分发器、Eventhandler事件处理器。

黄晓明新剧《潜渊》定档 失忆三面间谍开启谍战新维度

据悉&#xff0c;黄晓明领衔主演的谍战剧《潜渊》已于近日正式定档6月9日&#xff0c;该剧以“失忆三面间谍”梁朔为核心&#xff0c;打破传统谍战剧的框架和固有角度&#xff0c;以一种特别的视角将悬疑感推向极致。剧中&#xff0c;梁朔因头部受伤失去记忆&#xff0c;陷入身…

物联网嵌入式开发实训室建设方案探讨(高职物联网应用技术专业实训室建设)

一、建设背景与目标 在当今数字化时代&#xff0c;物联网技术正以前所未有的速度改变着人们的生活和工作方式。从智能家居到工业自动化&#xff0c;从智能交通到环境监测&#xff0c;物联网的应用场景无处不在。根据市场研究机构的数据&#xff0c;全球物联网设备连接数量预计…

集成学习三种框架

集成学习通过组合多个弱学习器构建强学习器&#xff0c;常见框架包括Bagging&#xff08;装袋&#xff09;、Boosting&#xff08;提升&#xff09; 和Stacking&#xff08;堆叠&#xff09; 一、Bagging&#xff08;自助装袋法&#xff09; 核心思想 从原始数据中通过有放回…

在UI界面内修改了对象名,在#include “ui_mainwindow.h“没更新

​原因​&#xff1a;未重新编译UI文件​​ Qt的UI文件&#xff08;.ui&#xff09;需要通过​​uic工具&#xff08;Qt的UI编译器&#xff09;​​生成对应的ui_*.h头文件。如果你在Qt Designer中修改了对象名&#xff0c;但没有​​重新构建&#xff08;Rebuild&#xff09;…

Neovim - 常用插件,提升体验(三)

文章目录 nvim-treelualineindent-blanklinetelescopegrug-far nvim-tree 官方文档&#xff1a;https://github.com/nvim-tree/nvim-tree.lua 以前我们都是通过 :e 的方式打开一个 buffer&#xff0c;但是这种方式需要记忆文件路径&#xff0c;因此这里可以通过 nvim-tree 插…

SOC-ESP32S3部分:31-ESP-LCD控制器库

飞书文档https://x509p6c8to.feishu.cn/wiki/Syy3wsqHLiIiQJkC6PucEJ7Snib ESP 系列芯片可以支持市场上常见的 LCD&#xff08;如 SPI LCD、I2C LCD、并行 LCD (Intel 8080)、RGB/SRGB LCD、MIPI DSI LCD 等&#xff09;所需的各种时序。esp_lcd 控制器为上述各类 LCD 提供了一…

【云安全】以Aliyun为例聊云厂商服务常见利用手段

目录 OSS-bucket_policy_readable OSS-object_public_access OSS-bucket_object_traversal OSS-Special Bucket Policy OSS-unrestricted_file_upload OSS-object_acl_writable ECS-SSRF 云攻防场景下对云厂商服务的利用大同小异&#xff0c;下面以阿里云为例 其他如腾…

读文献先读图:GO弦图怎么看?

GO弦图&#xff08;Gene Ontology Chord Diagram&#xff09;是一种用于展示基因功能富集结果的可视化工具&#xff0c;通过弦状连接可以更直观的展示基因与GO term&#xff08;如生物过程、分子功能等&#xff09;之间的关联。 GO弦图解读 ①内圈连线表示基因和生物过程之间的…

怎么让大语言模型(LLMs)自动生成和优化提示词:APE

怎么让大语言模型(LLMs)自动生成和优化提示词:APE https://arxiv.org/pdf/2211.01910 1. 研究目标:让机器自己学会设计提示词 问题:大语言模型(如GPT-3)很强大,但需要精心设计的“提示词”才能发挥最佳效果。过去靠人工设计提示词,费时费力,还可能因表述差异导致模…

实现单例模式的常见方式

前言 java有多种设计模式&#xff0c;如下图所示&#xff1a; 单例模式它确保一个类只有一个实例&#xff0c;并提供一个全局访问点。 1、单例模式介绍 1.1、使用原因 为什么要使用单例模式&#xff1f; 1. 控制资源访问 核心价值&#xff1a;确保对共享资源&#xff08;如…

day20 leetcode-hot100-38(二叉树3)

226. 翻转二叉树 - 力扣&#xff08;LeetCode&#xff09; 1.广度遍历 思路 这题目很简单&#xff0c;就是交换每个节点的左右子树&#xff0c;也就是相当于遍历到某个节点&#xff0c;然后交换子节点即可。 具体步骤 &#xff08;1&#xff09;创建队列&#xff0c;使用广…

OpenVINO环境配置--OpenVINO安装

TOC环境配置–OpenVINO安装 本节内容 OpenVINO 支持的安装方式有很多种&#xff0c;每一种操作系统以及语言都有对应的安装方法&#xff0c;在官网上有很详细的教程&#xff1a;   我们可以根据自己的需要&#xff0c;来点选环境配置和安装方法&#xff0c;然后网页会给出正…

黑龙江云前沿服务器租用:便捷高效的灵活之选​

服务器租用&#xff0c;即企业直接从互联网数据中心&#xff08;IDC&#xff09;提供商处租赁服务器。企业只需按照所选的服务器配置和租赁期限&#xff0c;定期支付租金&#xff0c;即可使用服务器开展业务。​ 便捷快速部署&#xff1a;租用服务器能极大地缩短服务器搭建周期…