最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

数据脱敏:数据大爆炸时代的隐私保护利器

[复制链接]
跳转到指定楼层
楼主
发表于 2015-9-17 18:23:59 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

作者为 亚信科技(中国)有限公司网络安全事业部 尹雯玉

数据脱敏(Data Masking),又称数据漂白、数据去隐私化或数据变形。百度百科对数据脱敏的定义为:指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。这样,就可以在开发、测试和其它非生产环境以及外包环境中安全地使用脱敏后的真实数据集。

可以看到数据脱敏具有几个关键点:敏感数据、脱敏规则、使用环境。

敏感数据,又称隐私数据,常见的敏感数据有: 姓名、身份证号码、地址、电话号码、银行账号、邮箱地址、所属城市、邮编、密码类 ( 如账户查询密码、取款密码、登录密码等 )、组织机构名称、营业执照号码、银行帐号、交易日期、交易金额等。

随着大数据时代的到来,大数据商业价值的挖掘,用户的精准定位,大数据中蕴藏的巨大商业价值被逐步挖掘出来,但是同时也带来了巨大的挑战--个人隐私信息的保护。个人信息与个人行为(比如位置信息、消费行为、网络访问行为)等,这些都是人的隐私,也是我们所关注的一类敏感信息,在大数据价值挖掘的基础上如何保护人的隐私信息,也将是数据脱敏必须解决的难题。

脱敏规则,一般的脱敏规则分类为可恢复与不可恢复两类。

可恢复类,指脱敏后的数据可以通过一定的方式,可以恢复成原来的敏感数据,此类脱敏规则主要指各类加解密算法规则。

不可恢复类,指脱敏后的数据被脱敏的部分使用任何方式都不能恢复出。一般可分为替换算法和生成算法两大类。替换算法即将需要脱敏的部分使用定义好的字符或字符串替换,生成类算法则更复杂一些,要求脱敏后的数据符合逻辑规则,即是“看起来很真实的假数据”。

使用环境,主要指脱敏之后的数据在哪些环境中使用。普遍按照生产环境和非生产环境(开发、测试、外包、数据分析等)进行划分。

在最近一期的Gartner关于数据脱敏的报告(Magic Quadrant for Data Masking Technology-2014年12月)中根据数据脱敏产品应用场景的将数据脱敏划分为静态数据脱敏(static data masking[SDM])和动态数据脱敏(dynamic data masking[DDM])。

静态数据脱敏(SDM)与动态数据脱敏(DDM)主要的区别是:是否在使用敏感数据当时进行脱敏。

静态数据脱敏(SDM)一般用在非生产环境,在敏感数据从生产环境脱敏完毕之后再在非生产环境使用,一般用于解决测试、开发库需要生产库的数据量与数据间的关联,以排查问题或进行数据分析等,但又不能将敏感数据存储于非生产环境的问题。

动态数据脱敏(DDM)一般用在生产环境,在访问敏感数据当时进行脱敏,一般用来解决在生产环境需要根据不同情况对同一敏感数据读取时需要进行不同级别脱敏的问题。

在上文中提到的Gartner是全球最具权威的IT市场与顾问咨询公司,就IT的研究、发展、评估、应用、市场等领域,为客户提供客观、公正的论证报告及市场调研报告,协助客户进行市场分析、技术选择、项目论证、投资决策。Gartner每年都在关键领域,采用“魔力象限图”对主要厂商进行定位,是在某一特定时间内的对市场情况进行的图形化描述。魔力象限的四个象限依次分别为领导者(Leaders)、挑战者(Challengers)、有远见者(Visionaries)和特定领域者(Niche Players)。

数据脱敏首次作为一个单独的魔力象限被Gartner发布是在2012年12月,每年的12月Gartner会发布当年数据脱敏方面的分析报告,迄今为止一共发布了3期。

我们在这三份报告的基础上分析近年来数据脱敏方面的变化,并对未来的发展进行展望。

1、数据脱敏市场定义与描述比较(Market Definition/Description)

可以看出,关于在最近一期的报告中,并没有把“结构化/非结构化”(即是否是关系型数据类型)单独作为一个分类的标准,而是将“实时/非实时”以及“生产/非生产”作为了关键指标。没有强调非结构化数据(Data redaction masks)作为一个单独分类。

2、评价标准比较

Gartner对数据脱敏产品的评价,主要分为执行能力和完整的愿景两方面,具体的方面见下图:

比较近三年的报告,上图中红色部分的评价标准发生了变化,具体内容如下:

可以看到,在13年评价标准发生了一个较大的变化,就是从原来的关注SDM转变为SDM与DDM均有,并且开始关注大数据与云数据安全。在13年产品与服务类别,评价中考虑是否提供了其他的安全产品相配合;而到14年数据智能被提到更重要的位置上作为产品与服务的评价项目。

3、象限位置定义

对于象限的定义上,13年与14年没有什么差别,而12年的差别也是在于12年从SDM上考虑的多,而DDM几乎没有被考虑,这里不再进行比较。在分析了14年的报告以后,得出的象限标准如下图:

在过去的几年,层出不穷的隐私数据泄密事件已经证明,企业和政府机构的数据安全,内部人的泄密比外部黑客攻击后果更严重。

近年来数据脱敏历经了一个从重视静态数据脱敏(SDM)到静态数据脱敏(SDM)、动态数据脱敏(DDM)同样重视的程度,即覆盖面正在从非生产系统到生产系统。

随着大数据、云平台的发展,大数据平台与云平台上数据隐私保护的研究与产品也将长足发展,同时敏感数据的智能探测、智能分析与统计、智能处理也将会被作为一个重要的产品发展方向。

亚信NSG紧跟时代的步伐,正致力于各类数据的脱敏,目标成为数据脱敏产品行业的专家。关于Oracle数据库的动态数据脱敏(DDM)产品已落地,可以帮助客户有效的保护生产环境中传统数据库的敏感数据;并且正在积极开展静态数据脱敏(SDM)的研究与落地;同时,我们紧跟时代步伐,致力于研究将DDM、SDM产品应用于大数据、云平台方面,为数据保驾护航!



楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-7 16:09

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表