对抗辩论决策

Adversarial Debate Decision Making

通过多角色对抗辩论提升 LLM 集体决策质量

子问题

1.辩论轮次控制与终止条件

2.角色立场设计与 prompt 工程

3.裁判综合评判机制

4.辩论历史管理

5.双层辩论的串行衔接与状态传递

6.辩手与裁判的模型分级策略(quick vs deep)

Signals

维度	TradingAgents
辩论架构	两层串行：2方投资辩论 → 3方风险辩论，各层独立裁判
轮次控制	count计数器 × 参与人数，配置化 max_rounds
角色设计	5辩手(Bull/Bear/Aggressive/Conservative/Neutral) + 2裁判
裁判机制	独立裁判不参与辩论，使用 deep_thinking_llm 深度推理
记忆集成	BM25检索历史反思经验注入辩手prompt，跨决策学习
状态管理	TypedDict双状态(InvestDebateState/RiskDebateState)独立追踪

1.设计对立角色(Bull/Bear)确保观点多样性，配置辩论轮次平衡质量与成本

2.裁判使用更强模型(deep_thinking_llm)而辩手用快速模型平衡质量与成本

3.三方辩论用latest_speaker字段实现固定顺序循环路由