最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

数据中台建设五步法

[复制链接]
跳转到指定楼层
楼主
发表于 2021-10-31 11:17:19 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

数据中台建设五步法是我们在十几个数据中台项目落地实践中总结出的一套方法论。在数据中台项目落地中,我们可以根据具体项目情况对其中的一个或者几个部分的内容做重点的加强或者减弱,甚至可以只在其中一个方面做重点突破和攻关。

第一步:数据资源的盘点与规划

数据化的基础是信息化或者信息化所产生的数据。这些数据本就有数据化的含义,同时这些数据又会进入数据化框架体系,继续通过计算产出更多的数据和更大的价值。所以,对企业数据资源的盘点是数据化建设的前提和基础。一份完整、准确的数据资源是后续数据化建设的有力保障。

数据资源的盘点与规划需要达到以下目的:

(1)对现有数据资源盘点和统计。

(2)对企业可以拥有或者应该拥有的数据资源进行规划。

(3)构建盘点体系并使用必要工具,保证盘点的成果能够始终与真实情况相符。

第二步:数据应用规划与设计

企业要基于现有的技术条件和方案,进行相对完整的数据应用规划。这个步骤可以回答如下问题。

1. 企业中有哪些数据需求

我们要从业务线、业务层级到最细粒度的岗位,梳理数据需求。

2. 企业应该构建哪些数据应用

我们要围绕数据需求进行数据应用的整体规划和设计。

3. 应该按照什么顺序实现这些数据应用

我们要对数据应用建立评估模型,评估的维度包括数据应用是否可以实现、数据应用的业务价值、数据应用的实现成本这三个主要方面。通过评定结果,我们可以确定数据应用的实现路径。

第三步:数据资产建设

数据资产的建设要依托数据中台的核心产品完成。数据资产是企业数据化建设的关键基础。所有的数据化建设最后都以数据资产为基础,并且围绕这个基础展开。数据资产将是企业在全面数据化建设前期中投入最多、见效最慢的基础层模块。关于数据中台的种种探讨和争议以及妥协的很大一部分原因是这个基础建设庞大、复杂和投入高。

数据资产建设的内容包括以下几个方面。

1. 技术建设

(1)产品选型。产品选型包括如何选择数据中台产品、数据中台产品应该具备的功能以及技术参数指标。

(2)技术架构设计。技术架构设计包括数据中台产品如何部署、如何替换传统的数据仓库或者与之并行、数据中台如何抽取当前的应用数据。

2. 标准和数据仓库模型构建

(1)建模及开发规范。建模及开发规范包括数据仓库模型设计规范的制定,数据开发规范的制定,如何避免当前较为常见的数据开发混乱、难以运维的情况。

(2)数据建模。数据建模包括进行数据仓库模型构建,并提交评审。

3. 数据抽取、数据开发、任务监控与运维

(1)数据抽取。数据抽取包括从数据资源层抽取数据进入ODS层。

(2)数据开发。数据开发包括进行数据任务开发,进行数据清洗、数据计算。

(3)任务监控与运维。任务监控与运维包括监控所有数据任务,对异常和错误任务进行必要的人工干预和处理。

4. 数据质量校验

数据质量校验包括对当前发现的数据质量问题进行校验和处理,推动数据治理工作开展和持续优化。

5. 数据应用支撑

数据应用支撑包括为当前的数据应用开发提供支撑开发平台。

第四步:数据应用的详细设计与实现

不管是使用瀑布模型还是敏捷模型,数据应用的设计大体上都可以遵循传统信息化应用设计的过程和理念。数据应用中的数据开发一般在数据库或者数据仓库中完成。数据应用的内容展示可以采用BI分析工具展现,例如可视化大屏或者定制化开发应用。数据应用还可以通过API接口服务提供数据成果,让其他外部应用按需调用。数据应用的开发与传统信息化应用的开发有以下不同之处。

1. 数据应用关注数据源的内容和质量

我们在数据应用实施前应该充分了解企业当前的数据源情况,包括数据种类、每种数据的具体属性、数据内容的质量等问题。大部分落地失败的数据应用,都是由数据源的各种问题引起的,比如数据缺失或者数据质量问题。

2. 复杂的数据开发需要不断调优和迭代

随着机器学习、深度学习等算法的引入,数据模型的构建手段越来越丰富。但是在通常情况下,最终业务价值的产生是一个复杂的过程,不仅需要数据的支撑,还需要管理的配合。

3. 数据应用的结果数据的验证工作量占比高

论证数据结果的正确与否或者评估数据应用的效果,是一项费时、费力的工作。即使相对简单的指标计算,最后也经常会占用全部过程中1/3以上的时间进行正确性验证。甚至很多算法类项目,需要提前构建成果评估模型,并首先获得甲方企业的认可,然后才能开始进行数据开发。

4. 数据应用的运维难度大

因为数据中的各种异常情况往往是不可知或者意想不到的,所以数据运维需要有强大的人工保障,以保持任务的运转。

5. 数据应用的成果需要运营

数据应用的开发完成只是数据发挥价值的第一步,如何让业务部门理解模型、用好数据才是后续的关键。尤其是在刚刚引入新的数据,且尚未显现业务价值的时候,企业更需要对数据进行深入运营。

第五步:数据化组织规划

企业数据化应该是在未来一个时期内具有企业战略高度的事情,数据化需要一个具有同等战略高度的组织负责推进。无论是从传统的IT部门转型还是由战略部门或者类似部门介

入都是很好的选择。组织是保障数据中台顺利落地的一个核心,也是推动企业数据化进程的人员抓手。

作者简介

张旭

袋鼠云合伙人、高级副总裁;阿里云MVP;用友集团应用集成业务部原总经理、主数据管理专家及业务带头人。企业应用集成解决方案专家,企业主数据管理解决方案专家,企业数据中台解决方案专家。成功主导过中国葛洲坝集团、中国建筑总公司第五工程局,国药集团、上海医药集团、碧桂园、万科、茅台集团、李宁、飞鹤乳业、全友家私、隆平高科等众多国内大型知名企业的数据化相关项目。

本文内容节选自《数据中台架构——企业数据化最佳实践》(张旭,戴丽,訚赛华等著,电子工业出版社出版)


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-4 22:43

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表