问题域/PD-140

多仓库管理

Multi-Repository Management

多仓库并行索引、智能选择与跨仓库检索,支持 LLM/embedding 双模式仓库路由

子问题

1.多仓库并行索引

2.LLM/embedding 仓库选择

3.filtered/full 双层索引隔离

4.仓库生命周期管理

5.跨仓库结果泄漏防护

6.仓库路由降级策略

7.索引扫描性能优化

各项目的解法1 solutions

Signals

横向对比

维度FastCode
索引架构每仓库独立 4 文件(faiss/metadata/bm25/graphs)+ 共享 repo_overviews.pkl
仓库路由LLM/embedding 双模式可配置,LLM 默认,三级降级(LLM→embedding→scope_repos)
索引隔离full/filtered 双层索引,filtered 按选中仓库动态重建,full 永不清除
安全过滤三重 repo_filter(semantic/keyword/final),防止跨仓库结果泄漏
生命周期RESTful CRUD 全覆盖:load/index/upload-zip/delete-repos/list
扫描优化采样前 100 条 metadata 估算文件数,30 秒 TTL 缓存

最佳实践

1.用 repo_overview 独立索引实现快速仓库级粗筛再精检

2.三重安全过滤(semantic/keyword/final)防止跨仓库泄漏

3.LLM 仓库选择配合模糊匹配(精确→子串→Jaccard)提高鲁棒性

4.采样估算 + TTL 缓存加速大规模索引扫描