隐私与数据过滤

Privacy & Data Filtering

在数据采集层实现隐私标签过滤、敏感内容剥离和 ReDoS 防护

子问题

1.用户级隐私标签识别与剥离

2.系统级递归存储防护

3.正则表达式拒绝服务防护

4.边缘处理 vs 中心处理架构选择

5.全量隐私 vs 部分隐私的判定与差异化处理

6.工具调用输入输出中的隐私标签清洗

Signals

维度	claude-mem
过滤架构	Hook 层边缘过滤，敏感数据不穿越处理管道
标签体系	双标签语义分离：<private> 用户级 + <claude-mem-context> 系统级
ReDoS 防护	MAX_TAG_COUNT=100 预检 + 非贪婪正则，超限仍处理但告警
隐私粒度	全量隐私（跳过整个 prompt）+ 部分隐私（仅存公开部分）
校验层数	双层校验：init 阶段剥离 + observation/summarize 阶段二次校验

1.在数据入口层(hook/edge)而非存储层过滤敏感内容

2.双标签语义分离：用户级与系统级标签独立定义，共享剥离逻辑

3.超限时优雅降级（仍处理但记录告警）而非直接拒绝