最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

数据中台VS数据仓库,究竟谁优谁劣?

[复制链接]
跳转到指定楼层
楼主
发表于 2020-3-12 17:04:24 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 168主编 于 2020-3-12 17:12 编辑

前  言
要说当下在企服领域什么字眼最火?一定是数字化转型。什么又代表数字化转型?应该当属是中台战略。而“业务中台”“数据中台”俨然成为企业数字化转型的不二法门,类似指导数字化建设的方法论体系了。中台的目标是提升效能、数据化运营、更好支持业务发展和创新,是多领域、多BU、多系统的协同;中台是平台化的自然演进,这种演进带来“去中心化“的组织模式,突出对能力复用和协调控制的能力。大部分业务中台通过构建共享中心模式进行,相当于重新做组织的流程化分工。

相对于业务中台来讲,数据中台跟企业的业务有较强的关联性,是企业业务和数据的沉淀,如果在烟囱林立的各财务业务系统之上搭建共享的数据中台,其不仅能降低重复建设和减少烟囱式协作的成本,也是企业差异化竞争优势所在。然而,当说到数据中台这里,很多人就有了疑问,以前没有数据中台这个概念时,企业不是也建设了数据仓库、商业分析、数据湖之类的东西吗?对比这个有什么区别?不就是换了个概念和马甲吗?

咱们今天就这个话题来做个分享。

数据中台与数仓的区别
其实,数据中台从某个意义来说属于数仓的一种,都是要把数据抽进来建立一个数据仓库,两者在很多技术使用上是一样的,比如ETL工具,可视化框架等。
但是两者的数据来源和建立数仓的目标以及数据应用的方向都存在很大的差异。
数据中台不单单指系统或者工具,而是一个职能部门,通过一系列平台、工具、流程、规范来为整个组织提供数据资产管理和服务的职能部门。数据中台负责全域数据采集、数据资产加工和管理、并向前台业务部门和决策部门提供数据服务。所以,数据中台的核心应该是数据资产管理和数据赋能,通俗的讲就是数据弹药库。

首先,从数据来源来说,数据中台的数据来源期望是全域数据包括业务数据库,日志数据,埋点数据,爬虫数据,外部数据等,数据的来源可以是结构化数据或者非结构化的数据。而传统数仓的数据来源主要是业务数据库,数据格式是以结构化数据为主。
其次,建立数据中台的目标是为了融合整个企业的全部数据,打通数据之间的隔阂,消除数据标准和口径不一致的问题。数据中台通常会对来自多方面的的基础数据进行清洗,按照主题域概念建立多个以事物为主的主题域。比如用户主题域,商品主题域,渠道主题域,门店主题域等等。数据中台遵循三个One的概念:One Data, One ID, One Service,就是说数据中台不仅仅是汇聚企业各种数据,而且让这些数据遵循相同的标准和口径,对事物的标识能统一或者相互关联,并且提供统一的数据服务接口。就像做菜一样,按照标准化的菜名,先把所有可能用到的材料都准备好。而传统的数仓主要用来做BI的报表,目的性很单一,只抽取和清洗相关需要使用到的基础数据,进行建仓,然后再用来做领域分析,有的时候可能因为新增一张报表,就要从底层到上层再做一次加工和处理。
然后,在数据应用方面,建立在数据中台上的数据应用不仅仅只是面向于BI报表,更多面向营销推荐,用户画像,AI决策分析,风险评估等。这些应用的特点比较轻,容易快速开发出来,因为重要的数据分析工作在数据中台已经完成并且沉淀,所以之前工作成果都能被多个应用共享;而传统的数据仓库主要是面向报表或者高级可视化,数据应用的建设一般是面对相对确定的主题内容,在诸如数据建模,进行数据追踪与探查,深度挖掘层面存在较大的局限性。
最后,数据中台一般都是建立在分布式计算平台和存储平台,理论上可以无限扩充平台的计算和存储能力。而多数的传统数仓工具只是建立在传统关系数据库和单一服务器部署的基础上,一旦数据量变大,很容易出现存储、效率、计算的问题,其后续扩充存在较大的成本和时间。

数据中台经历的阶段
通过上面的简单分析,我认为还是可以把数据中台理解为是数据仓库技术的继承与发扬。
恰好搜到一篇文章是讲阿里数据中台发展历程的,经历4个阶段:

  • 数据库阶段,主要是OLTP(联机事务处理)的需求;
  • 数据仓库阶段,OLAP(联机分析处理)成为主要需求;
  • 数据平台阶段,主要解决BI和报表需求的技术问题;
  • 数据中台阶段,通过系统来对接OLTP(事务处理)和OLAP(报表分析)的需求,强调数据业务化的能力。



那么,数据中台这个阶段有什么特征?
其显著的特征就是数据量的指数级增长,从PB迈向了EB级别。
这个数量级的变化主要来源于IOT(物联网)的发展起来,带动了视图声(视频、图像、声音)数据的增长,这些数据需要视觉计算技术、图像解析的引擎+视频解析的引擎+音频解析的引擎来转换成结构化数据;来源于线下要想和线上一样,通过数据来改善业务,就要和线上一样能做到行为可监测,数据可收集,这是前提。线下最大量的就是视图声数据,依靠IOT技术和算法的进步,最终会通过智能端来自动化获取数据;要使用这些数据,光有视觉算法和智能端也不行,还要有云来存储和处理这些数据,以及打通其他领域的数据。

综合这个阶段特征,我们看到依靠传统的数据仓库方法已经全然不能满足企业大数据量、非结构化、分布式存储的需求。还需要基于IOT设备收集数据、基于云端存储数据、基于AI算法和云计算进行应用。未来的数据中台,一定是AI驱动的数据中台。这个中台包括计算平台+算法模型+智能硬件,帮助企业去打通业务数据,最终建立线上线下触达和服务消费者的能力。真正做到一切业务数据化,一切数据业务化

后记

未来的数据中台最重要的不单是数据的存储和计算能力,而是要能从各个角度和业务结合,帮助企业从数据中获取价值,沉淀数据资产,最终用数据赚钱。阿里巴巴向外发布了DT时代的提法,用Data Technology(DT,数据技术)替代了Information Technology(IT,信息科技),强调数据技术将成为未来商业的驱动力。
DT时代,数据分析师,数据分析技术将成为商业最主要的生产要素,你准备好了么?

作者: 许艳涛 华科诚信董事长 中国首席财务官研究院财务智能化研究所副所长
来源:华科诚信许艳涛
楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-6 03:06

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表