全球最具影响力的数据智能产业服务和职业发展平台

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
开启左侧

[数据治理体系] 漫谈数据资产分类

[复制链接]
发表于 2019-9-30 17:26:40 | 显示全部楼层 |阅读模式
本帖最后由 168主编 于 2019-9-30 17:44 编辑

“一个组织如果没有认识到管理数据和信息如同管理有形资产一样极其重要,那么它在新经济时代将无法生存”。                                                  --汤姆·彼得斯,2001
  01  
前言
当前,在大数据背景下,数据是数字经济的关键要素,其作为基础性资源、生产资料已经得到广泛认同,世界主要国家已经在实施大数据战略。数据被认为是一项重要的企业资产,有助于实现企业目标,因此需要被精心管理。那么,什么是数据资产?数据资产分为哪几类?数据资产管理的内涵?怎样管理数据资产?如何评估数据管理能力?等一系列问题需要我们回答,今天我们主要探讨数据资产分类。
首先让我们了解下基础概念,在此共识基础上开始本次话题。▶ 数据资源(Data Resource)是指在生产、经营和决策过程所生成或使用的内、外部各类数据。
▶ 数据资源管理(data resource management)是指应用数据库管理、数据仓库等信息系统技术和其他数据管理工具,完成组织数据资源管理任务,满足企业股东信息需求的管理活动。
▶ 数据资产(Data Asset)是指由企业拥有或者控制的,能够为企业带来未来经济利益的,以物理或电子的方式记录的数据资源,如文件资料、电子数据等。在企业中并非所有的数据都构成数据资产,数据资产是能够为企业产生价值的数据资源。
▶ 数据资产管理(DAM, Data Asset Management)是指规划、控制和提供数据及信息资产的一组业务职能,包括开发、执行和监督有关数据的计划、政策、方案、项目、流程、方法和程序,从而控制、保护、交付和提高数据资产的价值。数据资产管理需要充分融合业务技术和管理,以确保数据资产保值增值。 从数据资源管理到数据资产管理,主要区别体现在数据价值(收益)创造,从数据资产的分类、使用频次、使用对象、使用效果和共享流通等方面计量。要有效地实施数据资产管理,首先必须对数据进行分类。

数据资产分类是指根据数据资产的属性或特征,将其按照一定的原则和方法进行区分和归类,并建立起一定的分类体系和排列顺序,以便更好地管理和使用数据资产的过程。
02 分类的意义和目的
数据资产分类可以使一个企业针对不同类型的数据,有针对性的开展管理活动。
如安全角度,安全系统如加密、数据丢失预防、文件管理、案例信息和事件管理、邮件防御系统等,在只有对数据资产进行有效分类,才可以识别知识产权等相关风险,比如数据正在向外输送、发往未经授权的接受人或存在异常活动。分类后,便可以对数据进行标签化管理,使许多事物可以实现自动化,比如加密、访问控制和识别异常行为等。


再如标准角度,每类数据资产所关注的属性不同,在分类后可针对不同类型的数据设置不同的属性,标准制定过程中,可制定不同的模板,便于信息收集和属性定义;在标准落地中,依据数据类型采取不同的实施策略。


数据资产分类的目的在于建立一个企业级的数据资产管理制度和框架,数据资产分类决定数据保护的安全控制水平和数据资产管理水平。


03 分类的方法
当前我们探讨更多的是从数据格式、数据来源、数据产生方式等角度进行分类。


▶ 格式上进行分类

结构化数据:通常我们用来描述通过传统的ER模型描述,可以利用二维表存储技术(基于行列存储结构的关系型数据库)进行存储和检索的数据。
半结构化数据:局部具备结构化特性,局部具备非结构化特性的数据,最典型的就是XML格式的数据。其实它有语义模型定义,也就是我们说的Schema,也就每个区域和段落分别代表什么业务含义,采用类结构化Json存储,可以采用类SQL访问的方式进行处理。局部具备非结构化特征的数据而可以采用非结构化数据处理的方法和手段。
非结构化数据:其实在IT领域没有绝对的非结构化数据,例如所有格式的图片、视频、音频资料,只要对应有解析器,就必须有格式定义,否则解析器怎么能够把它蕴含的数据内容呈现出来呢?所以非结构化本质上只是相对于结构化数据和半结构化数据而言的;是内容不便于基于SQL检索和分析处理的;是需要通过专用技术引擎去处理的数据。


▶ 数据来源上进行分类
按照是从企业内部业务系统作业产生还是外部获取的来源不同分为内部、外部数据。
▶ 数据产生方式上进行分类
结合企业业务的互联网化变革,把企业通过线上拓展业务产生的数据,更多特指接触和感知用户行为的数据叫做线上数据,而其他数据则统称线下数据。除了这些数据通常被理解的分类外,我们重点探讨的是结构化数据资产的分类方法,这是通常我们在企业大数据集成、应用、分析处理领域,以及数据资产管理角度关注的数据分类方法,例如:


▶ 参考DCMM国标进行分类《数据管理能力成熟度评估模型(DCMM)》(GB/T36073-2018)是全国信息技术标准化技术委员会于2018年3月数据管理领域首个正式发布的国家标准,充分借鉴国际理论框架、方法,并结合了国内数据发展的现实情况。


该标准中将数据资产分为如下五类:
业务术语:是企业中业务概念的描述,包括中文名称、英文名称、术语定义等内容。业务术语管理就是制定统一的管理制度和流程,并对业务术语的创建、维护和发布进行统一的管理,进而推动业务术语的共享和组织内部的应用。
数据元:是用一组属性描述其定义、标识、表示和允许值的数据单元。通过对组织中核心数据元的标准,使数据的拥有者和使用者对数据有一致的理解。
指标数据:面向特定业务系统的设计,是企业在经营分析过程中衡量某一个目标或事物的数据,一般由指标名称、时间和数值等组成。参考数据:是用于将其他数据进行分类的数据。参考数据管理是对定义的数据值域进行管理,包括标准化术语、代码值和其他唯一标识符,每个取值的业务定义,数据值域列表内部和跨不同列表之间的业务关系的控制,并对相关参考数据的一致、共享使用。
主数据:是企业中需要跨系统、跨部门共享的核心业务实体数据。主数据管理是对主数据标准和内容进行管理,实现主数据跨系统的一致、共享使用。


▶ 按照业务进行分类
参照数据资产所涉及的知识范畴,将XXX政府数据按照业务进行划分,有主题和行业两个维度。

1.主题维度,采取大类、中类和小类三级分类法。大类包括:经济、政治、军事、文化、资源、能源、生物、交通、旅游、环境、工业、农业、商业、教育、科技、质量、食品、医疗、就业、人力资源、社会民生、公共安全、信息技术。基础大类主题之外的其他主题可以作为扩展主题,依照主题分类方法进行分类。对于每一个大类主题,按线分类法划分中类。对于每个中类,按照线分类法划分小类。

2.行业维度,根据数据资产所涉及的行业领域范畴,参照GB/T 4754-2011,删除了第四级类目,制定了本分类。大类包括:农林牧渔业、采矿业、制造业、电力燃气及水的生产和供应业、建筑业、交通运输、仓储和邮政业、信息传输计算机服务和软件业、批发零售业、住宿和餐饮业、金融业、房地产业、租赁和商务服务业、科学研究、技术服务和地质勘查业、水利、环境和公共设施管理业、教育、卫生、社会保障和社会福利业、文化、体育和娱乐业、公共管理和社会组织、国际组织。对于每一个大类行业,按线分类法划分中类。对于每个中类,按照线分类法划分小类。


04 强制驱动因素
开展数据资产分类,除方便数据使用、提升管理效率等因素外,还存在强制驱动因素,典型的是满足监管和法律法规要求。


2010年3月25日,国资委公布施行《中央企业商业秘密保护暂行规定》,明确规定中央企业商业秘密保护的机构、职责和措施,要求企业建立法人代表人负责制。各单位组织开展商业秘密保护教育培训、保密检查、保密技术防护和泄密事件查处等工作,有力地推动了中央企业商业秘密保护工作。根据《暂行规定》,中央企业商业秘密的保护范围主要包括:战略规划、管理方法、商业模式、改制上市、并购重组、产权交易、财务信息、投融资决策、产购销策略、资源储备、客户信息、招投标事项等经营信息,设计、程序、产品配方、制作工艺、制作方法、技术诀窍等技术信息。


2016年11月7日由全国人民代表大会常务委员会发布的《中华人民共和国网络安全法》,定义了敏感信息,如下图:

2018年5月25日,欧洲联盟出台《通用数据保护条例》。根据GDPR涉及以下一种或一种以上类别的个人数据视为敏感数据:
1.种族或民族出身
2.政治观点
3.宗教/哲学信仰
4.工会成员身份
5.涉及健康、性生活或性取向的数据
6.基因数据(新)
7.经处理可识别特定个人的生物识别数据(新)


05 综述
数据是资产,价值是目的,分类是基础。角度不同,分类方法不同,可多种方式相结合。
来源:御数坊

楼主热帖
168大数据(www.bi168.cn)是国内首家系统性关注大数据科学与人工智能的社区媒体!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2019-10-18 10:05 , Processed in 0.108285 second(s), 18 queries , Xcache On.

Powered by BI168社区

© 2012-2014 海鸥科技

快速回复 返回顶部 返回列表