当前位置: 首页 > news >正文

Elasticsearch + Milvus 构建高效知识库问答系统《一》

🔍 Elasticsearch + Milvus 构建高效知识库问答系统(RAG 技术实战)

📌 目录

  1. 背景介绍
  2. Elasticsearch 在知识库检索中的作用
  3. Milvus 在知识库检索中的作用
  4. 混合检索:Elasticsearch + Milvus
  5. 完整代码实现
  6. 部署建议与优化方向
  7. 总结

背景介绍

在构建基于大语言模型(LLM)的知识增强型生成系统(RAG)中,知识库检索是整个流程的核心环节。它决定了模型是否能从庞大的文档中快速定位到相关上下文信息。

传统的 RAG 系统通常采用以下两阶段流程:

[Query] → [Retriever] → [Top-k Docs] → [LLM] → [Answer]

其中 Retriever 可以是稀疏检索(如 BM25)、稠密检索(如 Milvus),也可以是两者的混合。

本文将详细介绍如何使用 ElasticsearchMilvus 来构建一个高效的多模态检索系统,并提供可运行的 Python 示例代码。


Elasticsearch 在知识库检索中的作用

功能概述:

  • 基于关键词匹配的稀疏检索
  • 支持倒排索引和 TF-IDF/BM25 模型
  • 快速召回高相关性文档
  • 支持中文分词、拼音搜索、近义词扩展等功能

适用场景:

  • 中文医疗问答系统
  • 法律条文检索
  • 小规模 FAQ 库
  • 对语义理解要求不高的冷启动阶段

示例代码(Python)

from elasticsearch import Elasticsearch
from sentence_transformers.util import cos_sim# 初始化 ES 客户端
es = Elasticsearch(hosts=["http://localhost:9200"])# 插入文档
doc1 = {"content": "大模型训练需要大量高质量数据"}
doc2 = {"content": "RAG 系统通过外部知识提升回答能力"}
es.index(index="medical_kb", document=doc1)
es.index(index="medical_kb", document=doc2)# 查询
query_body = {"match": {"content": "如何提升问答系统的准确性?"}
}
response = es.search(index="medical_kb", body=query_body)# 输出结果
print("Elasticsearch 回答结果:")
for hit in response['hits']['hits']:print(f" - {hit['_source']['content']}")

Milvus 在知识库检索中的作用

功能概述:

  • 支持高维向量存储与相似度检索(ANN)
  • 可与 BERT、Sentence-BERT、BGE 等句向量模型结合
  • 实现语义级别的相似度计算
  • 支持大规模数据检索(亿级向量)

适用场景:

  • 大规模知识库
  • 高精度语义匹配
  • 图像/文本混合检索
  • LLM + 向量数据库联合部署

示例代码(Python + Milvus)

pip install pymilvus sentence-transformers
from sentence_transformers import SentenceTransformer
from pymilvus import connections, Collection# 加载语义编码器
model = SentenceTransformer('paraphrase-MiniLM-L6-v2')# 连接 Milvus
connections.connect(host='localhost', port='19530')
collection = Collection("faq_collection")# 插入向量(假设你已建立好 collection 并导入了知识库向量化内容)# 查询
query_text = "如何提升问答系统的准确性?"
query_vec = model.encode([query_text])collection.load()
results = collection.search(data=query_vec, anns_field="embedding", param={"metric_type": "IP", "offset": 0}, limit=3)# 输出结果
print("Milvus 语义检索结果:")
for result in results:for hit in result:print(f" - ID: {hit.id} Distance: {hit.distance}")

混合检索:Elasticsearch + Milvus

你可以采用如下流程来构建一个高效的 RAG 问答系统:

[用户问题]↓
Elasticsearch → [Top-50 粗召回文档] ↓
Milvus → [Top-10 语义相似文档]↓
Reranker → [Top-3 最佳匹配段落]

✅ 混合优势:

优点描述
冷启动友好利用 ES 快速上线
语义准确Milvus 提升召回质量
高效排序结合 reranker 进一步优化输出
支持中文可选择支持中文的 embedding 模型

完整代码实现(Python 示例)

以下是一个完整的混合检索流程示例:

from elasticsearch import Elasticsearch
from sentence_transformers import SentenceTransformer
from pymilvus import connections, Collection# 初始化组件
es = Elasticsearch(hosts=["http://localhost:9200"])
model = SentenceTransformer('paraphrase-MiniLM-L6-v2')
connections.connect(host='localhost', port='19530')
milvus_col = Collection("faq_collection")def hybrid_retrieval(query, k=3):# Step 1: Elasticsearch 粗召回es_result = es.search(index="medical_kb", body={"match": {"content": query}})es_docs = [hit["_source"]["content"] for hit in es_result["hits"]["hits"]]# Step 2: Milvus 语义精排query_vec = model.encode([query])milvus_results = milvus_col.search(data=query_vec, anns_field="embedding", param={"metric_type": "IP"}, limit=k)# Step 3: 返回 top-k 文档final_docs = []for result in milvus_results:for hit in result:final_docs.append(es_docs[hit.id])return final_docs[:k]

部署建议与优化方向

1. 数据预处理建议:

  • 使用 jiebaHanLP 对中文进行分词
  • 清洗无意义符号、HTML、乱码
  • 构建统一的数据格式(如 JSON)

2. 索引构建建议:

  • Elasticsearch
    • 使用 ik-analyzer 中文分词插件
    • 设置字段类型为 textkeyword
  • Milvus
    • 使用 HNSW 或 IVF-PQ 索引加速查询
    • 设置合适的维度(如 768 / 1024)
    • 开启 GPU 加速(如支持)

3. 性能调优建议:

组件调优方式
Elasticsearch分片策略、索引合并、关闭不必要的日志
Milvus使用 ANN 索引、调整 nprobe、批量插入
Embedding 模型使用轻量模型(如 bge-small, gte-base
缓存机制Redis 缓存高频问题与答案
异步检索使用 Celery 或 FastAPI 异步接口

4. 可选高级功能:

  • Reranking:使用 BAAI/bge-reranker-base 等交叉编码器进一步打分排序
  • 向量更新机制:定期更新 Milvus 中的知识库向量
  • 混合评分融合:对 ES 和 Milvus 的结果做加权得分排序

总结

方法是否理解语义是否需训练是否支持中文是否适合大规模是否适合冷启动
Elasticsearch❌ 否❌ 否✅ 是✅ 是✅ 是
Milvus✅ 是✅ 是✅(模型决定)✅ 是❌ 否
FAISS✅ 是✅ 是✅(模型决定)⭐ 有限❌ 否
混合检索(ES+Milvus)✅ 是✅ 是✅ 是✅ 是✅ 是

✅ 推荐组合方案

方案一:纯稀疏检索(仅使用 ES)

适合冷启动或无语义模型的场景,无需 GPU 资源。

Query → Elasticsearch → Top-k Docs

方案二:纯稠密检索(仅使用 Milvus)

适合有预训练语义模型(如 BGE、Jina、OpenAI embeddings)的场景。

Query → Dense Encoder → Milvus → Top-k Docs

方案三:混合检索(ES + Milvus)

适合企业级 RAG 系统,兼顾效率与精度。

Query → Elasticsearch → Top-50 Docs↓Milvus → Top-10 Docs↓Reranker → Top-3 最终输出

📌 欢迎点赞、收藏,并关注我,我会持续更新更多关于 AI、LLM、视觉-语言模型等内容!

http://www.lqws.cn/news/97165.html

相关文章:

  • Java高级 | (二十二)快速应用开发框架——Spring Boot
  • 小白的进阶之路系列之十二----人工智能从初步到精通pytorch综合运用的讲解第五部分
  • OpenCV CUDA模块图像处理------图像融合函数blendLinear()
  • Attention Is All You Need (Transformer) 以及Transformer pytorch实现
  • 【JavaWeb】SpringBoot原理
  • SpringBoot 自定义注解实现限流
  • 【Vmware】虚拟机安装、镜像安装、Nat网络模式、本地VM8、ssh链接保姆篇(图文教程)
  • 优化 Spring Boot API 性能:利用 GZIP 压缩处理大型有效载荷
  • 托福39-1 Early Writing Systems感悟
  • Kotlin List 操作全面指南
  • RabbitMQ 监控与调优实战指南(二)
  • JavaScript性能优化实战大纲
  • Neovim - 打造一款属于自己的编辑器(一)
  • 提取 PDF 文件中的文字以及图片中的文字
  • HALCON 深度学习训练 3D 图像的几种方式优缺点
  • 论文中pdf图片文件太大怎么办
  • 关于FPGA软核的仿真(一)
  • 基于 NXP + FPGA+Debian 高可靠性工业控制器解决方案
  • 云计算 Linux Rocky day03
  • YAML文件
  • 什么是AI芯片?
  • Tailwind CSS 实战:基于 Kooboo 构建 AI 对话框页面(六):图片上传功能
  • ArcGIS Pro字段计算器与计算几何不可用,显示灰色
  • 二分查找的边界艺术:LeetCode 34 题深度解析
  • 第七部分:阶段项目 5:构建 NestJS + MySQL RESTful API 服务器
  • 基于Python学习《Head First设计模式》第五章 单件模式
  • Matlab实现LSTM-SVM回归预测,作者:机器学习之心
  • Matlab自学笔记五十七:符号运算、可变精度运算、双精度浮点型运算,三种运算精度的概念、比较、选择和应用
  • ssh登录wsl2
  • 关于 java:6. 反射机制