RAG 检索技术 - Elasticsearch

张开发
2026/4/14 2:38:44 15 分钟阅读

分享文章

RAG 检索技术 - Elasticsearch
一 什么是 ElasticsearchElasticsearchES是一个分布式搜索引擎专门用正排索引传统数据库 文档1 → [库存, 组织, ID] 文档2 → [业务, 实体, ID] 倒排索引Elasticsearch 库存 → [文档1] 组织 → [文档1] ID → [文档1, 文档2] 业务 → [文档2] 实体 → [文档2]于全文检索。️ 架构对比你的项目rank_bm25内存中的 BM25├── 所有文档加载到内存134682个├── 每次查询都要扫描所有文档└── 速度慢内存占用大Elasticsearch分布式索引├── 文档存储在磁盘倒排索引├── 只扫描包含关键词的文档└── 速度快支持海量数据 ES 的核心技术倒排索引Inverted Index查询 库存组织 时传统方式扫描所有文档慢ES 方式直接查倒排索引 → 文档1快 Elasticsearch 的优势特性rank_bm25Elasticsearch数据量几千个文档数十亿文档查询速度秒级毫秒级内存占用高全部加载低按需加载分布式❌✅持久化❌✅

更多文章