内容去AI化
Content Humanization
两阶段去AI味处理:确定性文本清理+LLM驱动改写,使AI生成内容更自然
子问题
1.AI文本特征识别
2.确定性清理规则
3.LLM改写策略
4.风格一致性保持
5.引用占位符在改写过程中的完整性保护
6.LLM JSON输出的多层解析容错
7.改写后字数守恒与内容膨胀控制
各项目的解法1 solutions
Signals
横向对比
| 维度 | vibe-blog |
|---|---|
| 检测方式 | 5维度50分制LLM评分(直接性/节奏/信任度/真实性/精炼度) |
| 清理架构 | 两阶段串行:10步正则确定性清理 → LLM评分门控diff改写 |
| 改写策略 | diff替换模式(old/new精确子串),非全文重写 |
| 成本控制 | 评分门控(≥40分跳过)+ 正则零成本前置 + 并行处理 |
| 安全防护 | 占位符完整性校验 + 字数±10%守恒 + 异常降级原文 |
| 规则覆盖 | 10类中文AI痕迹:填充词/强化词/同义词堆砌/Meta评论/冗余短语/过度自信/词汇单一/时间幻觉/Markdown/空白 |
最佳实践
1.先用正则做确定性清理(零成本)再用LLM改写
2.异常时降级返回原始内容
3.用diff替换模式(old/new精确子串)代替全文重写,精确控制修改范围
4.评分门控跳过已自然的内容,避免不必要的LLM调用
5.词汇多样化从第4次出现开始轮换,保留前3次的自然重复