问题域/PD-549

自适应批处理

Adaptive Batch Processing

根据模型 token 限制自动分批 AI 调用,双重约束贪心分组

子问题

1.双重约束分批(input+output token)

2.60K Hard Cap 防止 TTFT 过高

3.容错隔离(部分成功返回)

4.并发批次执行与进度回调

5.system prompt 每批重复发送的 token 开销扣除

6.Error-driven Discovery 从 API 错误中自动学习模型限制

7.多业务模块复用同一泛型批处理器的接口设计

各项目的解法1 solutions

Signals

横向对比

维度moyin-creator
分批策略双重约束贪心分组(input+output token),60K Hard Cap
模型感知三层查找注册表 + Error-driven Discovery 自动学习限制
并发模型runStaggered 信号量 + 定时错开启动(staggerMs=5000)
容错隔离PromiseSettledResult 部分成功返回 + TOKEN_BUDGET_EXCEEDED 短路
泛型复用processBatched<TItem, TResult> 泛型接口,5 个业务模块复用
预算计算inputBudget=min(ctx×0.6, 60K), outputBudget=maxOutput×0.8

最佳实践

1.贪心分组保证每批至少1个item

2.TOKEN_BUDGET_EXCEEDED 不重试节省成本

3.runStaggered 错开启动避免 API 突发

4.预算留 40% 余量给 system prompt 和格式开销

5.estimateTokens 用字符/1.5 高估避免前端引入重型 tokenizer

6.单个 item 超预算仍独立成批防止死循环