多格式报告生成
Multi-format Report Generation
支持多种报告类型和导出格式,结构化报告生成流水线,内联AI图片和引用管理
子问题
1.报告类型路由
2.结构化内容组装
3.多格式导出
4.引用和图片嵌入
5.写作语气控制与 Tone 枚举注入
6.图片路径双轨制(web URL vs 绝对路径)适配不同导出格式
7.多阶段报告的子主题去重与已有标题传递
各项目的解法1 solutions
Signals
横向对比
| 维度 | GPT-Researcher |
|---|---|
| 报告类型体系 | 7 种枚举类型 + report_type_mapping 字典路由到 PromptFamily 方法 |
| 内容组装模式 | 分段 LLM 调用(引言/正文/结论独立生成)+ 字符串拼接组装 |
| 导出格式 | Markdown/PDF(md2pdf+CSS)/Word(mistune+htmldocx) 三格式 |
| 图片嵌入 | 双模式:预生成(asyncio.gather并行) + 占位符后处理([IMAGE:]正则替换) |
| 引用管理 | APA 格式内联引用 + 尾部 References 列表自动追加 |
| 语气控制 | 17 种 Tone 枚举,通过 prompt 注入控制写作风格 |
| 多阶段报告 | DetailedReport 四阶段流水线:初始研究→子主题拆分→逐子主题写作→组装 |
最佳实践
1.枚举定义报告类型确保类型安全
2.报告生成与研究过程解耦
3.PromptFamily 方法名映射实现报告类型与 prompt 解耦,支持多 prompt 家族(如 Granite)
4.LLM 调用降级:system+user 双消息失败后合并为单条 user 消息重试
5.图片预生成策略:研究阶段并行生成图片,写报告时通过 prompt 注入可用图片列表