马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
来源:御数坊
前言 John Wiley & Sons 公司(约翰威立父子出版公司)1807年创立于美国,是全球历史最悠久、最知名的学术出版商之一,享有世界第一大独立学术图书出版商和第三大学术期刊出版商的美誉。顺应互联网发展和数字化趋势,Wiley Online Library(威立在线图书馆)应运而生,其上有1600多种经同行评审的学术期刊,20000本电子图书,170多种在线参考工具书,580多种在线参考书,19种生物学、生命科学和生物医学的实验室指南(Current Protocols),17种化学、光谱和循证医学数据库(Cochrane Library)。数据无疑是威立公司在全世界范围内运营这一知识宝库的重要基础,然而与其他公司类似,数据质量问题以及相关挑战对公司的基础报表和分析决策造成了障碍。 本文介绍了威立公司以数据质量作为切入点开展数据治理和认责的一些关键环节和做法,包括数据认责工作模型、数据治理框架以及构建在此之上的数据质量改善机制和数据问题管理流程。相关资料来源于威立公司数据治理顾问委员会高级经理Sara Willovit 女士在企业数据世界(EDW)大会上的一次演讲。根据笔者的实践经验,数据质量同样是目前国内企业开展数据认责的一个最自然切入点,并以数据质量的改善和提升作为数据认责成效的主要衡量。因此,威立公司的这个案例对于国内开展数据认责的企业可能颇具参考和借鉴意义。 数据认责工作模型 威立公司的数据认责工作模型比较简单、直接,如下图所示,即按照业务板块构建了数个数据管理专员工作组,组内的业务数据管理专员通过业务联系人与对应的业务板块紧密连接;而所有的工作组都在企业数据治理顾问委员会的领导下开展工作,这个顾问委员会由一名高级经理负责召集,并集合了各个业务数据所有者的代表。这同时也是威立公司开展数据治理的组织骨干。 按照威立公司的数据认责工作模型: 数据治理顾问委员会是在公司管理层对数据集的认责,拥有决策权,特别是资源分配的优先决策授权,主要负责行政协调,并优先考虑和解决跨业务的数据质量问题。 数据管理专员工作组是在流程与操作层面的认责,核心使命是保证数据能够满足业务使用的需求,其主要职责包括识别关键数据、定义业务术语、解决数据和质量事件和问题,并持续改进数据。业务数据管理专员由业务数据的所有者来指定。 数据治理框架 再来看威立公司的数据治理框架,其实就是一张改进清单,并不是我们通常认为的那种抽象而恢弘的顶层设计。它主要列出了企业数据治理中关于最为紧要的三方面现实问题,并提出具有针对性且可执行的目标或对策,以此作为指导数据治理工作开展的“框架”。 当前状态 | | 无明确的认责以及清晰的职责: * 据存在数据多头创建、审核或者管理的情况 * 没有规范化的数据管理专员角色以及职责定义 * 难以确定谁对数据负责 | 建立数据认责: * 将数据的创建/维护工作集中化 * 定义数据所有者和管理专员的角色并授权 * 开发数据治理/数据管理专员控制台 * 考核数据管理专员 | 数据质量问题救火队: * 被动的数据监控 * 紊乱的数据问题修复方法 * 零碎的工具运用 * 专注于问题的发现和修复而不是根因分析 * 没有标准化的跟踪/报表指标 | 规范化的数据问题管理(提升数据质量): * 定义数据问题,确定问题优先级,跟踪和上报 * 就数据问题的影响分析开展小组讨论 * 由管理专员制定刻画数据的业务规则 * 制定和实施数据质量标准 * 数据质量指标报告和记分卡 | 不一致的主数据且无变更控制: * 存在个产品标识 * 在多个系统中创建/维护数据 * 未经批准或未与利益相关者沟通,就在生产中对主数据进行重大更改 * 难以生成多层次精细度的报表 * 对黑盒式的源系统所做的变更 | 主数据管理实现变更控制: * 通用化的产品标识 * 确定关键数据的权威来源 * 制定主数据标准和变更控制流程 * 变更得到批准、测试和沟通 * 定义一致的数据模型并从数据的源端落实遵从 |
数据治理从业者对表格左侧这些现状是一定不会感到陌生,甚至还有几分共鸣。所以,企业在组建数据团队、开展数据治理时,所面临的挑战其实大同小异,这也是让每一位数据治理从业者足够挠头的艰巨任务。再看表格右侧,对于有着3、5年经验的从业者而言,一样是熟悉的配方、熟悉的味道,但……问题依旧在那里。这里所列的每一项目标或者对策在实施过程中都不那么简单,各有各的实际情况,但成败的关键也就在执行和落地上。 例如“定义数据所有者和管理专员的角色并授权”,实践中常常是角色都定义好了,但是却没有得到足够的授权,导致工作难以推进。同时,这种重责任而轻授权的认责通常会使认责对象认为是一种单纯的压力,特别是在目前数据管理专员通常是以兼职形式出任的情况下,认责对其而言更成为某种程度上的负担。 又如数据问题的管理,实践中大多也会讲“闭环”,有的浮于表面,单求问题记录的发现和消除,但却很少去刨问题的根子,甚至很少区分问题解决的轻重缓急,导致数据质量问题成为“顽疾”,耗费太多资源,甚至还为业务工作带来负担。 认责与治理助力数据质量改善 按照 Sara 的解释,威立公司是以改善数据质量为契机启动数据治理和数据认责的。在上面的数据认责工作模型和数据治理框架中也体现了围绕数据质量、问题导向的思路。下面是对“用数据决策”这样一个业务目标而展开的场景分析: 值得注意的是,在此案例中,数据管理专员既承担了数据质量相关影响要素的改进目标,同时也对数据集的最终质量状况负责,具有某种自洽性。另一点值得注意的是,此案例与《房地美的数据认责实战案例》(本公众号2月18日发表)的一个相似之处是将数据标准化放在了一个十分重要的位置上。反观国内的一些实践,认为数据标准化“曲高和寡”的并不少见。 数据问题管理流程 既然是奔着数据质量去的,那么规范化的数据问题管理流程一定是不可或缺的。在上文的当前状态分析中也提到“数据质量问题的救火队”,因此这也是认责与数据质量的契合之处——定责就要履责,而履责就要解决实际问题;工作滚动起来、问题消解下去,责任才就算落了地。 上图的流程已无需赘述。笔者认为有必要提及的一点是,这个数据问题管理流程蕴含了一些敏捷的思想和技术,例如在评估环节确定力量投入和优先级,在测试环节对期望的满足度进行评审、确认,以及请求者的参与、改进计划的逐步求精、工作进展的跟踪和信息发布等,并最终实现利益相关方的价值最大化。 案例启示 笔者认为本案例最大的特点就是实用主义——开展认责工作,包括定义认责的工作模型、组织形式、数据管理专员的职责以及工作流程的编排,无不是围绕着数据质量问题的解决,以适用、够用的原则而设计,快速构建起一个可运转且有效的机制,从而形成一个具有生命力的认责内核。然后呢?迭代、迭代、再迭代(锤炼 + 扩展)! 最后在附赠一个小彩蛋——数据治理从业者在企业内启动数据治理计划的时候,免不了要将治理方案推销给各个利益相关方,以争取最大的共识和支持,以下是几点小贴士: 60秒电梯演说; 用简单的实例取得高层的支持; 开展数据质量试点; 展示数据治理和认责的成功案例; 定义不一致影响报告。
|