最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

[ClickHouse] ClickHouse应用架构VS典型的大数据架构

[复制链接]
跳转到指定楼层
楼主
发表于 2021-6-21 19:35:37 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
ClickHouse应用架构VS典型的大数据架构
一、企业大数据平台架构
企业的大数据平台是基于数据仓库建设,经典的大数据架构经典的大数据架构基本都是基于hadoop生态的,基本的架构及技术的选型都是围绕大数据产生,采集,合理组织,有效使用整个流程来的,大概可以简单分为6步
第一步:数据源
第二步:数据同步,采集
第三步:消费队列缓冲,解耦,发布订阅
第四步:实时逻辑计算
第五步:离线数据仓库分层建模
第六步:数据应用
关于大数据平台的构建,不仅仅是将以上的流程串联起来,更多的是将组件工具化;工具平台化;平台服务化;平台产品化。这里不是讲大数据平台建设的,这里给出一个大数据业界的简单架构,有兴趣的朋友可以加我,一起探讨如何构建优秀的企业级大数据平台
经典大数据平台架构图(简单版):
大数据数据仓库架构图(简单版):
二、Clickhouse企业大数据应用架构
关于Clickhouse的使用架构,大概可以分为三种:
第一种:单独使用
第二种:结合大数据架构使用
结合大数据使用第一种架构
结合大数据使用第二种架构
在企业的使用中,Clickhouse大多是结合大数据平台来做的,因为使用Clickhouse做OLAP,数据源基本都是来自Hive离线仓库或者消息队列,基本的使用就是
一:实时流式处理:通过flink或者Spark消费消息队列数据,做实时逻辑计算,结果写入Clickhouse,提供实时的数据查询
二:离线数据处理:通过对Hive数仓中的数据进行预聚合,或者字段平铺,然后使用waterdrop或者clickhouse-client命令行导入Clickhouse,提供OLAP数据查询分析
实战经验总结:
因为Clickhouse在大数据级别的多表的join性能有不佳,建议能在Hive中做数据预聚合的,提前在hive做预聚合,能提前在导入或者导入过程做字段平铺的做字段平铺,避免在Clickhouse中做字段解析离线的数据导入Clickhouse为了提升导入的性能,如果使用的是Clickhouse-client,可以考虑多进程并发写入,提高导入效率;也可以使用简单配置易用的waterdrop进行Clickhouse数据导入

三、Clickhouse大数据架构和典型的大数据架构区别和整合
Clickhouse大数据处理架构
Clickhouse与大数据平台整合处理大数据的架构
四、Clickhouse和一些常用的OLAP的对比分析

楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-4-24 05:45

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表