问题域/PD-316

多格式报告生成

Multi-format Report Generation

支持多种报告类型和导出格式,结构化报告生成流水线,内联AI图片和引用管理

子问题

1.报告类型路由

2.结构化内容组装

3.多格式导出

4.引用和图片嵌入

5.写作语气控制与 Tone 枚举注入

6.图片路径双轨制(web URL vs 绝对路径)适配不同导出格式

7.多阶段报告的子主题去重与已有标题传递

各项目的解法1 solutions

Signals

横向对比

维度GPT-Researcher
报告类型体系7 种枚举类型 + report_type_mapping 字典路由到 PromptFamily 方法
内容组装模式分段 LLM 调用(引言/正文/结论独立生成)+ 字符串拼接组装
导出格式Markdown/PDF(md2pdf+CSS)/Word(mistune+htmldocx) 三格式
图片嵌入双模式:预生成(asyncio.gather并行) + 占位符后处理([IMAGE:]正则替换)
引用管理APA 格式内联引用 + 尾部 References 列表自动追加
语气控制17 种 Tone 枚举,通过 prompt 注入控制写作风格
多阶段报告DetailedReport 四阶段流水线:初始研究→子主题拆分→逐子主题写作→组装

最佳实践

1.枚举定义报告类型确保类型安全

2.报告生成与研究过程解耦

3.PromptFamily 方法名映射实现报告类型与 prompt 解耦,支持多 prompt 家族(如 Granite)

4.LLM 调用降级:system+user 双消息失败后合并为单条 user 消息重试

5.图片预生成策略:研究阶段并行生成图片,写报告时通过 prompt 注入可用图片列表