问题域/PD-225

对抗辩论决策

Adversarial Debate Decision Making

通过多角色对抗辩论提升 LLM 集体决策质量

子问题

1.辩论轮次控制与终止条件

2.角色立场设计与 prompt 工程

3.裁判综合评判机制

4.辩论历史管理

5.双层辩论的串行衔接与状态传递

6.辩手与裁判的模型分级策略(quick vs deep)

各项目的解法1 solutions

Signals

横向对比

维度TradingAgents
辩论架构两层串行:2方投资辩论 → 3方风险辩论,各层独立裁判
轮次控制count计数器 × 参与人数,配置化 max_rounds
角色设计5辩手(Bull/Bear/Aggressive/Conservative/Neutral) + 2裁判
裁判机制独立裁判不参与辩论,使用 deep_thinking_llm 深度推理
记忆集成BM25检索历史反思经验注入辩手prompt,跨决策学习
状态管理TypedDict双状态(InvestDebateState/RiskDebateState)独立追踪

最佳实践

1.设计对立角色(Bull/Bear)确保观点多样性,配置辩论轮次平衡质量与成本

2.裁判使用更强模型(deep_thinking_llm)而辩手用快速模型平衡质量与成本

3.三方辩论用latest_speaker字段实现固定顺序循环路由