问题域/PD-95

代码索引与参考系统

Code Index & Reference System

通过LLM分析代码仓库构建结构化索引,为代码生成提供相关参考代码的检索能力

子问题

1.代码文件摘要生成

2.文件间关系映射

3.关键词匹配与相关性评分

4.索引持久化与增量更新

5.目标结构驱动的关系映射(从计划文件提取目标文件树)

6.LLM 预过滤减少无关文件分析开销

7.多 LLM 提供商自动切换与降级

各项目的解法1 solutions

Signals

横向对比

维度DeepCode
索引架构LLM 驱动两阶段索引:预过滤→摘要→关系发现,JSON 持久化
检索方式文件名+类型+关键词三维评分,无向量数据库
关系建模4 级关系类型(direct_match/partial_match/reference/utility)+ 置信度
并发策略asyncio.Semaphore 限流并发,失败自动降级为顺序处理
配置驱动6 域 YAML 配置(paths/llm/relationships/performance/debug/output)
工具化接口FastMCP 统一搜索工具,单次调用完成加载+搜索+格式化

最佳实践

1.使用LLM生成高质量文件摘要

2.统一搜索接口合并目录加载和搜索步骤

3.两阶段索引解耦文件分析和关系发现降低单次 LLM 调用复杂度

4.并发处理失败时自动降级为顺序处理保证可靠性

5.通过 MCP 工具化暴露搜索接口让 Agent 直接消费索引