经验反思学习

Experience Reflection & Learning

交易后反思盈亏原因，将经验写入记忆库供后续决策参考

子问题

1.反思 prompt 设计

2.盈亏归因分析

3.经验存储与检索

4.跨角色独立记忆管理

5.反思触发时机选择（同步/异步/批量）

6.记忆库冷启动问题（无历史时的决策质量）

7.BM25 vs 向量检索的精度-成本权衡

Signals

维度	TradingAgents
反思触发机制	外部显式调用，传入盈亏数值作为客观反馈
反思生成方式	LLM 4段式结构化反思（归因→改进→总结→精炼）
经验存储引擎	BM25Okapi 词法索引，纯内存，无向量数据库
记忆隔离策略	五角色独立实例，Bull/Bear/Trader/Judge/Risk 互不污染
经验注入方式	Prompt 拼接注入 top-2 历史反思到角色决策 prompt
持久化能力	无持久化，进程重启记忆丢失

1.LLM 生成结构化反思 + BM25 记忆检索，每个角色维护独立记忆实例

2.4段式反思 prompt（归因→改进→总结→精炼）确保输出结构化可检索

3.客观结果指标（盈亏值）作为反思输入，避免 LLM 自评估偏差