混合搜索
Hybrid Search
结合稠密向量语义搜索和稀疏 BM25 关键词匹配的混合检索策略
子问题
1.如何平衡语义相似度和关键词匹配
2.如何设置相似度阈值
3.如何融合两种检索结果
各项目的解法1 solutions
Signals
横向对比
| 维度 | agentic-rag-for-dummies |
|---|---|
| 融合方式 | Qdrant 原生 HYBRID 模式,数据库层面自动融合 |
| 稠密向量 | sentence-transformers/all-mpnet-base-v2 (384维) |
| 稀疏向量 | Qdrant/bm25 (FastEmbed 实现) |
| 阈值策略 | 硬阈值 score_threshold=0.7,低分结果直接丢弃 |
| 分层检索 | Parent-Child 双层:小块检索+大块返回 |
| 存储架构 | 双向量同 collection,稠密 COSINE + 稀疏动态维度 |
最佳实践
1.使用 Qdrant 原生混合检索模式
2.稠密向量用 sentence-transformers
3.稀疏向量用 BM25 模型
4.设置 score_threshold 过滤低质量结果