最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

数据仓库之数据脱敏方法论

[复制链接]
跳转到指定楼层
楼主
发表于 2019-9-30 19:54:16 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

数据脱敏

  • 对数据敏感程度进行安全级别划分
    • 绝密
    • 高保密
    • 保密
    • 可公开

  • 敏感数据梳理
    • 用户维度
      • 手机号码、邮件地址、账号、地址、固定电话号码等信息(此外个人隐私数据相关还有如:种族、政治观点、宗教信仰、基因等)

    • 用户终端维度
      • 能够可能标识终端的唯一性字段,如设备id。

    • 公司角度
      • 交易金额、代金卷密码、充值码等


  • 确定脱敏处理方法
    • 替换
      • 如统一将女性用户名替换为F,这种方法更像“障眼法”,对内部人员可以完全保持信息完整性,但易破解。

    • 重排
      • 序号12345重排为54321,按照一定的顺序进行打乱,很像“替换”, 可以在需要时方便还原信息,但同样易破解。

    • 加密
      • 编号12345加密为23456,安全程度取决于采用哪种加密算法,一般根据实际情况而定

    • 截断
      • 13811001111截断为138,舍弃必要信息来保证数据的模糊性,是比较常用的脱敏方法,但往往对生产不够友好。

    • 掩码
      • 123456 -> 1xxxx6,保留了部分信息,并且保证了信息的长度不变性,对信息持有者更易辨别, 如火车票上得身份信息。

    • 日期偏移取整
      • 20130520 12:30:45 -> 20130520 12:00:00,舍弃精度来保证原始数据的安全性,一般此种方法可以保护数据的时间分布密度。


  • 数据脱敏原则
    • 尽可能的为脱敏后的应用,保留脱敏前的有意义信息
    • 最大程度上防止黑客进行破解

  • 确定实施范围和步骤
    • 数据脱敏发生在服务层
    • 实际
      • 数据维度层 dim
      • 基础服务数据层 fact

    • 步骤
      • 确定需要脱敏的数据和流程
      • 对设计到数据脱敏的表的下游流程进行修改,避免因数据脱敏造成的数据误差
        • 即确认数据格式和数据源工作

      • 根据脱敏方法进行脱敏处理

    • 注意
      • 只是对用于非正常产出的时候需要数据脱敏
楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-2 14:13

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表