问题域/PD-571

混合搜索

Hybrid Search

结合稠密向量语义搜索和稀疏 BM25 关键词匹配的混合检索策略

子问题

1.如何平衡语义相似度和关键词匹配

2.如何设置相似度阈值

3.如何融合两种检索结果

各项目的解法1 solutions

Signals

横向对比

维度agentic-rag-for-dummies
融合方式Qdrant 原生 HYBRID 模式,数据库层面自动融合
稠密向量sentence-transformers/all-mpnet-base-v2 (384维)
稀疏向量Qdrant/bm25 (FastEmbed 实现)
阈值策略硬阈值 score_threshold=0.7,低分结果直接丢弃
分层检索Parent-Child 双层:小块检索+大块返回
存储架构双向量同 collection,稠密 COSINE + 稀疏动态维度

最佳实践

1.使用 Qdrant 原生混合检索模式

2.稠密向量用 sentence-transformers

3.稀疏向量用 BM25 模型

4.设置 score_threshold 过滤低质量结果