反思学习机制

Reflection & Learning Mechanism

Agent 交易后自动反思决策质量，将教训存入记忆供未来相似情境检索

子问题

1.反思 prompt 设计

2.多角色独立反思

3.记忆检索与应用

4.经验积累与遗忘

5.反思触发时机与外部信号（收益/亏损）的耦合

6.BM25 词频匹配在金融术语场景下的检索精度

Signals

维度	TradingAgents
反思触发	交易后显式调用，传入真实收益/亏损值
反思粒度	5 角色独立反思，每角色提取各自决策历史
记忆检索	BM25 词频匹配，4 份市场报告拼接为查询 key
记忆注入	top-2 历史教训拼接到 Agent prompt 尾部
反思模板	统一 4 维框架：Reasoning/Improvement/Summary/Query
持久化	纯内存，进程结束即丢失

1.每个角色维护独立记忆避免交叉污染

2.反思时提供客观市场数据作为参照

3.用统一反思模板保证多角色反思质量一致性

4.将 4 份市场报告拼接为情境 key 确保检索语义对齐

5.使用 quick_thinking_llm 执行反思以控制成本