问题域/PD-229

经验反思学习

Experience Reflection & Learning

交易后反思盈亏原因,将经验写入记忆库供后续决策参考

子问题

1.反思 prompt 设计

2.盈亏归因分析

3.经验存储与检索

4.跨角色独立记忆管理

5.反思触发时机选择(同步/异步/批量)

6.记忆库冷启动问题(无历史时的决策质量)

7.BM25 vs 向量检索的精度-成本权衡

各项目的解法1 solutions

Signals

横向对比

维度TradingAgents
反思触发机制外部显式调用,传入盈亏数值作为客观反馈
反思生成方式LLM 4段式结构化反思(归因→改进→总结→精炼)
经验存储引擎BM25Okapi 词法索引,纯内存,无向量数据库
记忆隔离策略五角色独立实例,Bull/Bear/Trader/Judge/Risk 互不污染
经验注入方式Prompt 拼接注入 top-2 历史反思到角色决策 prompt
持久化能力无持久化,进程重启记忆丢失

最佳实践

1.LLM 生成结构化反思 + BM25 记忆检索,每个角色维护独立记忆实例

2.4段式反思 prompt(归因→改进→总结→精炼)确保输出结构化可检索

3.客观结果指标(盈亏值)作为反思输入,避免 LLM 自评估偏差