最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

[实践案例] 经验分享 :数据治理中的有趣发现

[复制链接]
跳转到指定楼层
楼主
发表于 2019-9-26 19:42:49 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本文整理自老树之见公众号,作者胡晨川,原文分数据治理中的有趣发现(一)与(二)组成,本文将两篇文章整理加工在一起发文

数据治理,一般来说,涉及数据获取的治理、数据流程治理、数仓模型治理、数据权限治理、指标体系治理、数据应用能力提升、分析框架治理、数据可视化方案治理等范畴。有着内容涵盖广,琐碎的细节多,外在体感弱,成效周期长,人员心力要求高的特点。
随着近期工作中对数据治理的深入,尤其是在指标治理范畴下,过去的许多认知,在深层次上被刷新了;同时,随着执行中各种细节的碰撞,也有了不少新的发现和观点。酝酿多时,打算甄选若干,希望对大家有所帮助。
(当然,本人目前的观点,仅来自本地生活场景下的实践,难免有些片面,读者们请批判地吸收。)
观点一:“数据治理,从最初的最初,就要有所设计。这话看起来较费解,何谓最初的最初?如果你是一个创业者,那么你在团队成立的第一天,你就得规划,做些什么样的事,能让你不仅拥有数据,还能正确高效地使用数据。以我对身边朋友的观察,大部分人,会想到要拥有数据,但以为初期有这就够了
如果你是一个经理人或者决策层,你需要在一个新业务的起步阶段,即在业务规划中,就准备好以“精准量化分析”为目的的一整套的数据治理方案,而不要仅仅罗列几个指标,作为KPI,以体现所谓的“数据驱动”。
如果你是一个项目经理、产品经理或者业务运营,你需要在kickoff阶段,就有方案,以保证健全的数据获取通道,准确稳定的指标口径,多方一致的评价及分析方式。而不是认准领导的绩效,硬拼凑一个本质上也许毫无关联的评价指标。
以我目前的观察,在业务启动初期,数据治理方案的缺失,会使得数据混乱的发展速度,远高于业务发展速度。回过神来你会发现,你以为能靠数据结果给予决策支持,但实际上,你会有一堆的混乱结论。你想有座灯塔,可实际上是一片迷雾。观点二:如果你是一个leader,当你不能准确了解你所使用的指标口径,就不要推动所谓的“用数据说话”。
乍一看,这个观点或许有些极端,但自测一下这个问题,或许你会猛醒:

“你工作中经常查看的报表和数据,你能说清楚他们明确的计算口径么?所属的业务主题、计算的方式、统计周期、限制条件、维度组合、字段定义等?

如果这个问题你答不全,那么你并不具备指标治理的意识(指标治理是数据治理中,与管理决策最为相关的部分),换个角度说,就是你还没有准备好使用数据。可怕的是,若leader不能清晰地回答,那么下属、分析师、产品经理等角色,基本上对口径也是一笔糊涂账。这样的结果就是:
  • 管理决策从相对可靠的经验判断,变成依据不准确的数据进行推测;虽然不能说这样的改变有多负面,但有些本优秀的决策者,往往被模棱两可的数据解读挤出自己擅长的领域,以更多的疑虑面对决策,会表现得更“依赖”数据结果,前瞻性决策的能力会变得平庸。
  • 模糊的数据口径,给了“用数据说谎”、“用指标逃避责任”的空间,大大增加了组织的管理成本。相对的,模糊的口径,也确实能带来一些“柔性”协作的效果,毕竟,任何组织里都有“和稀泥”的价值。
  • 各协同部门之间,一旦涉及指标的应用,就一定少不了“对数据”,至少开4次“会”:

    第一次,暴露问题,拉群,越拉人越多,伴随各种推脱后,终于,最痛的那一方,万般无奈地作为owner;第二次,搞清楚“owner方”的数据口径;第三次,搞清楚“对方”的数据口径;第四次,确定到底谁的是对的,商量怎么办。往往还有第五次,即由boss们来决定,怎么办。

    这里的协同成本,十分可怕。

    ----分割线---


在上面文中,我抛出了以下两个观点:
  • 数据治理,从业务的最初阶段,就要开始设计。
  • 如果你不了解所使用的各种数据结果的口径,就不要推动所谓的“用数据说话”。

第二个观点换个角度说,就是数据的消费方,一定要有“数据严谨性”的意识,尤其当你是一个leader的时候。第二篇中,我继续抛出一些观点。

  • 知识沉淀的健全与否,决定了数据治理的执行成本


数据治理项目,不仅需要深挖各种细节的业务定义,还需要有许多的“决断”(比如确定一版大家都能有共识的口径),需要协同的人,牵扯的部门往往很多。我们先不谈人配合意愿的问题(许多时候,数据治理会触碰协作方的“安全边界”,这是一种寓情于理都可以理解的沟通障碍),我们假设所有协作方都无条件配合的情况下,仍然有极大概率出现的困难,那就是:“谁都说不清某个关键的细节”
为什么呢?因为知道的人已经走了,或者时间久了忘了,且没有历史记录沉淀下来。在业务变化快,人员流动大的互联网公司,这种情况尤其普遍。

如何解决该问题?道理其实很简单,就是加强业务知识管理;但执行基本很扯淡,因为谁都不愿意“打杂”。所以我有两个明确的建议:
  • 每个有明确的组织边界的团队,都要建立《新人上手指南》,由公司HR部门全程监督:内容制作详细且定期更新,每次更新发布,都由两个以上协作团队进行审核;HR跟踪部门新人对《新人上手指南》的评价,该评价计入该部门各层级的KPI考核中。
  • 公司内部,从leader开始,应用任务协作和文档管理工具。目前市面上的协作工具已经很多,私有部署的和saas模式都有,无论大小公司,都能找到适合自己价位的工具。但心理预期要降低,工具的应用,并不能立马解决问题;工具的应用,只是一个起点,能够使整个团队,开始建立知识管理和协作提效的意识


  • 我们可能正在透支整个社会的“数据应用能力”

这个观点在我脑中有段时间了。出现的当时,我自己很诧异,但仔细想了想,也许这真的是事实。为什么我们大力招人,却鲜有合适的人选?尤其是高段位人才。高段位固然是稀缺的,但稀缺的情况能够改善么?目前似乎看不到好的信号。

首先,整个大的公共教育环境,对数据分析、数据科学人才的培养是非常滞后的。虽然近年来大力投入资源,但是一是起步晚了,人才补充到市场还需要时间。二是培养方式不够脚踏实地。高校里,缺乏有实战经验的老师设计课程体系,导致“堆砌”理论,学生的商业感知和动手能力都不够好。市场上的培训机构呢,基本上急功近利,拿入门级的知识当专业课,让学生挂几个“包”,跑几个“函数”,尝试几个kaggle案例,就收一笔学费,不论效果如何。

在这两个大背景下,我们大量的“用人单位”,只管招人干活,不管人的培养(许多都是自由生长,尤其是与上一个观点相呼应,当知识沉淀很差时,人才的成长更难达预期)。在门槛越抬越高的情况下,公司内部的小伙伴却没有清晰的成长路径和辅导。那么结果就是,有一定工作年限的所谓的“高阶数据分析人才”,泡沫越来越大。而正在努力的行业新人,却不能在正确的方向上,用合理的时间达到必要的高度。“既然是泡沫,终究是要破灭的!当泡沫破灭,所有人认清了现实以后。国内的数据分析高阶人才市场,有可能出现信心危机。极有可能造成“高阶大数据人才信任感缺失”的情况,市场信心的恢复,可要花点时间。这与金融危机,是一个道理。
“以我个人招聘的经历来说(完全达到了大样本要求):数据分析领域,在正确的发展路径上的,3-7年工作经验是最有价值的。更长工作年限的人选,适配性可能不好,薪资要求也会偏高。”

回过头来,有资源,有能力的大厂,应该正视这个问题。格局应该高一点,不管人才能不能长期留住,都要以“为中国经济发展,以自身业务场景为基础,培养数据分析人才。”为责任。踏踏实实分析现有的业务需求和人才成长模型,设计务实、分阶段、可量化、有积累效应的人才成长体系。
目前在数据领域打拼多年,资历颇深的伙伴们,尤其是处在团队管理岗位的伙伴,也应正视这个问题。你们的未来,并不取决于你有多稀缺,有多少好的offer,这些都是暂时的。好好培养身边的新人们,给予更多的引导和帮助。只有帮助他们提高,市场对“数据分析人才”的信心才能维持,整个市场的人才梯度更健康,才能挤压水分,消除泡沫。从长远来看,才有利于行业内所有人的生存。

楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-9 05:18

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表