隐私与数据过滤
Privacy & Data Filtering
在数据采集层实现隐私标签过滤、敏感内容剥离和 ReDoS 防护
子问题
1.用户级隐私标签识别与剥离
2.系统级递归存储防护
3.正则表达式拒绝服务防护
4.边缘处理 vs 中心处理架构选择
5.全量隐私 vs 部分隐私的判定与差异化处理
6.工具调用输入输出中的隐私标签清洗
各项目的解法1 solutions
Signals
横向对比
| 维度 | claude-mem |
|---|---|
| 过滤架构 | Hook 层边缘过滤,敏感数据不穿越处理管道 |
| 标签体系 | 双标签语义分离:<private> 用户级 + <claude-mem-context> 系统级 |
| ReDoS 防护 | MAX_TAG_COUNT=100 预检 + 非贪婪正则,超限仍处理但告警 |
| 隐私粒度 | 全量隐私(跳过整个 prompt)+ 部分隐私(仅存公开部分) |
| 校验层数 | 双层校验:init 阶段剥离 + observation/summarize 阶段二次校验 |
最佳实践
1.在数据入口层(hook/edge)而非存储层过滤敏感内容
2.双标签语义分离:用户级与系统级标签独立定义,共享剥离逻辑
3.超限时优雅降级(仍处理但记录告警)而非直接拒绝