问题域/PD-257

内容去AI化

Content Humanization

两阶段去AI味处理:确定性文本清理+LLM驱动改写,使AI生成内容更自然

子问题

1.AI文本特征识别

2.确定性清理规则

3.LLM改写策略

4.风格一致性保持

5.引用占位符在改写过程中的完整性保护

6.LLM JSON输出的多层解析容错

7.改写后字数守恒与内容膨胀控制

各项目的解法1 solutions

Signals

横向对比

维度vibe-blog
检测方式5维度50分制LLM评分(直接性/节奏/信任度/真实性/精炼度)
清理架构两阶段串行:10步正则确定性清理 → LLM评分门控diff改写
改写策略diff替换模式(old/new精确子串),非全文重写
成本控制评分门控(≥40分跳过)+ 正则零成本前置 + 并行处理
安全防护占位符完整性校验 + 字数±10%守恒 + 异常降级原文
规则覆盖10类中文AI痕迹:填充词/强化词/同义词堆砌/Meta评论/冗余短语/过度自信/词汇单一/时间幻觉/Markdown/空白

最佳实践

1.先用正则做确定性清理(零成本)再用LLM改写

2.异常时降级返回原始内容

3.用diff替换模式(old/new精确子串)代替全文重写,精确控制修改范围

4.评分门控跳过已自然的内容,避免不必要的LLM调用

5.词汇多样化从第4次出现开始轮换,保留前3次的自然重复