多仓库管理
Multi-Repository Management
多仓库并行索引、智能选择与跨仓库检索,支持 LLM/embedding 双模式仓库路由
子问题
1.多仓库并行索引
2.LLM/embedding 仓库选择
3.filtered/full 双层索引隔离
4.仓库生命周期管理
5.跨仓库结果泄漏防护
6.仓库路由降级策略
7.索引扫描性能优化
各项目的解法1 solutions
Signals
横向对比
| 维度 | FastCode |
|---|---|
| 索引架构 | 每仓库独立 4 文件(faiss/metadata/bm25/graphs)+ 共享 repo_overviews.pkl |
| 仓库路由 | LLM/embedding 双模式可配置,LLM 默认,三级降级(LLM→embedding→scope_repos) |
| 索引隔离 | full/filtered 双层索引,filtered 按选中仓库动态重建,full 永不清除 |
| 安全过滤 | 三重 repo_filter(semantic/keyword/final),防止跨仓库结果泄漏 |
| 生命周期 | RESTful CRUD 全覆盖:load/index/upload-zip/delete-repos/list |
| 扫描优化 | 采样前 100 条 metadata 估算文件数,30 秒 TTL 缓存 |
最佳实践
1.用 repo_overview 独立索引实现快速仓库级粗筛再精检
2.三重安全过滤(semantic/keyword/final)防止跨仓库泄漏
3.LLM 仓库选择配合模糊匹配(精确→子串→Jaccard)提高鲁棒性
4.采样估算 + TTL 缓存加速大规模索引扫描