问题域/PD-181

隐私与数据过滤

Privacy & Data Filtering

在数据采集层实现隐私标签过滤、敏感内容剥离和 ReDoS 防护

子问题

1.用户级隐私标签识别与剥离

2.系统级递归存储防护

3.正则表达式拒绝服务防护

4.边缘处理 vs 中心处理架构选择

5.全量隐私 vs 部分隐私的判定与差异化处理

6.工具调用输入输出中的隐私标签清洗

各项目的解法1 solutions

Signals

横向对比

维度claude-mem
过滤架构Hook 层边缘过滤,敏感数据不穿越处理管道
标签体系双标签语义分离:<private> 用户级 + <claude-mem-context> 系统级
ReDoS 防护MAX_TAG_COUNT=100 预检 + 非贪婪正则,超限仍处理但告警
隐私粒度全量隐私(跳过整个 prompt)+ 部分隐私(仅存公开部分)
校验层数双层校验:init 阶段剥离 + observation/summarize 阶段二次校验

最佳实践

1.在数据入口层(hook/edge)而非存储层过滤敏感内容

2.双标签语义分离:用户级与系统级标签独立定义,共享剥离逻辑

3.超限时优雅降级(仍处理但记录告警)而非直接拒绝