经验反思学习
Experience Reflection & Learning
交易后反思盈亏原因,将经验写入记忆库供后续决策参考
子问题
1.反思 prompt 设计
2.盈亏归因分析
3.经验存储与检索
4.跨角色独立记忆管理
5.反思触发时机选择(同步/异步/批量)
6.记忆库冷启动问题(无历史时的决策质量)
7.BM25 vs 向量检索的精度-成本权衡
各项目的解法1 solutions
Signals
横向对比
| 维度 | TradingAgents |
|---|---|
| 反思触发机制 | 外部显式调用,传入盈亏数值作为客观反馈 |
| 反思生成方式 | LLM 4段式结构化反思(归因→改进→总结→精炼) |
| 经验存储引擎 | BM25Okapi 词法索引,纯内存,无向量数据库 |
| 记忆隔离策略 | 五角色独立实例,Bull/Bear/Trader/Judge/Risk 互不污染 |
| 经验注入方式 | Prompt 拼接注入 top-2 历史反思到角色决策 prompt |
| 持久化能力 | 无持久化,进程重启记忆丢失 |
最佳实践
1.LLM 生成结构化反思 + BM25 记忆检索,每个角色维护独立记忆实例
2.4段式反思 prompt(归因→改进→总结→精炼)确保输出结构化可检索
3.客观结果指标(盈亏值)作为反思输入,避免 LLM 自评估偏差