最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

谈笑间学会-数仓技术架构设计

[复制链接]
跳转到指定楼层
楼主
发表于 2021-10-29 20:24:59 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
1、前言
  • 为何要谈数据仓库技术架构设计呢?
    技术架构设计是建设数仓的必备因素之一,分层架构为我们捋清了数据的架构及分层规范,并没有真正落地到具体的实施?
    有人说技术架构有什么好设计的?直接开整呗?

事实上并不是如此,成功始于计划,终于变化~
总而言之,言而总之,数仓设计是需要有技术方案来落地的。那么主要包含哪些呢?
离线、实时、离线+实时呗
2、离线技术架构
  • 首先我们来看一波架构图吧

  • 小结
    • 离线技术架构无非包括以下几块内容的技术选型
      • 数据采集:datax、sqoop、flume
      • 数据存储:HDFS、Hive
      • 数据计算:MapReduce、Sparksql、spark、hive、kylin、presto、impala
      • 任务调度:Oozie、crontab、azkaban


3、离线+实时 技术架构
  • 小结:
    • 离线技术架构无非包括以下几块内容的技术选型
      • 数据采集:datax、sqoop、flume
      • 数据存储:HDFS、Hive、kafka、hbase、Redis、RDBMS
      • 数据计算:MapReduce、sparksql、spark、hive、sparkMlib、SparkStreaming、kylin、presto、impala
      • 任务调度:Oozie、crontab、azkaban、dolphin等等


4、实时技术架构

  • 实时引擎对比
  • 小结
    • 实时数仓是一种理想化的目标,大部分实时数仓还是和离线进行结合在一起的。
    • 实时任务目前支持的业务复杂度有限,如果既要追求毫秒级响应,又要增加逻辑复杂度还是需要多思量、多思量呢
  • 下面来描述一下实时数仓的技术选型
    • 数据采集:flume、canal、Maxwell、ogg、CDC
    • 数据存储:Hbase、Es、kafka、Kudu、hive+impala/kylin/presto
    • 数据计算:storm、sparkstreaming、structstreaming、flink、flinkSQL、kylin、presto、impala
    • 任务调度:Oozie、crontab、azkaban、dolphin等等

个人建议
  • 如果离线能满足业务那就使用离线,如果离线实在满足不了,那么可以考虑准实时,如果准实时也满足不了,在考虑实时吧。
  • 为什么这样讲呢?
    • 1、在追求速率的时候也会迎面而来一种挑战——资源问题,实时作业可不是运行一下就可以了呦,是一直占用着资源的呦,如果建设实时数仓,那么机器、服务器资源问题需要优先考虑呦。
    • 2、实时数仓建设最好选择落盘到k-v数据库中。为什么呢?为了merge操作,你懂得,哈哈哈…

参考链接:
https://tech.meituan.com/2018/10/18/meishi-data-flink.html
https://developer.aliyun.com/article/691541

楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-2 11:23

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表