代码索引与参考系统
Code Index & Reference System
通过LLM分析代码仓库构建结构化索引,为代码生成提供相关参考代码的检索能力
子问题
1.代码文件摘要生成
2.文件间关系映射
3.关键词匹配与相关性评分
4.索引持久化与增量更新
5.目标结构驱动的关系映射(从计划文件提取目标文件树)
6.LLM 预过滤减少无关文件分析开销
7.多 LLM 提供商自动切换与降级
各项目的解法1 solutions
Signals
横向对比
| 维度 | DeepCode |
|---|---|
| 索引架构 | LLM 驱动两阶段索引:预过滤→摘要→关系发现,JSON 持久化 |
| 检索方式 | 文件名+类型+关键词三维评分,无向量数据库 |
| 关系建模 | 4 级关系类型(direct_match/partial_match/reference/utility)+ 置信度 |
| 并发策略 | asyncio.Semaphore 限流并发,失败自动降级为顺序处理 |
| 配置驱动 | 6 域 YAML 配置(paths/llm/relationships/performance/debug/output) |
| 工具化接口 | FastMCP 统一搜索工具,单次调用完成加载+搜索+格式化 |
最佳实践
1.使用LLM生成高质量文件摘要
2.统一搜索接口合并目录加载和搜索步骤
3.两阶段索引解耦文件分析和关系发现降低单次 LLM 调用复杂度
4.并发处理失败时自动降级为顺序处理保证可靠性
5.通过 MCP 工具化暴露搜索接口让 Agent 直接消费索引