最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

MPP架构知识整理

[复制链接]
跳转到指定楼层
楼主
发表于 2021-6-4 15:14:41 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
什么是MPPMassively Parallel Processing, 即大规模并行处理

一般用来指多个SQL数据库节点搭建的数据仓库系统。执行查询的时候,查询可以分散到多个SQL数据库节点上执行,然后汇总返回给用户

MPP的核心
  • 减少资源的共享,尽力达到Shared Nothing。 MPP并不会进行远程计算,每个节点都有自己独立的CPU,内存和磁盘资源
  • 并行,MPP并没有像并行度这样的概念,而是每个节点都在进行相同的工作。所以对MPP架构进行水平扩容无法提升并行度
上面说的就是纯粹的MPP架构,但现在MPP架构和Sql on hadoop的区别也变得模糊,比如,为了提高并行度引入类似并行度的概念,为了降低单个节点宕机的影响,引入副本的概念等。
MPP的优缺点MPP解决了单个SQL数据库不能存放海量数据的问题,但是也存在一些问题,例如:
  • 当节点数达到100左右时,MPP有些仍会遇到SQScalability的问题,速度变慢,或者不稳定。
  • 当增加或者删除节点的时候,需要的维护工作仍然比较大,集群会遇到数据迁移和重新平衡的问题
Sql on Hadoop架构特征SQL over Processing Framework"Hadoop通用计算框架+SQL解析引擎", 存储层,执行引擎层,SQL解析层三者分离,可以方便替换执行引擎,对使用者而言,同一份数据可以采用不同并行执行引擎来分析。优点是灵活性高,支持细粒度容错,集群扩展性好,缺点是效率无法保证
OLAP over Hadoop预计算,即数据都以时间序列的方式进入系统并经过数据预聚合和建立索引,因为是预计算,所以应对多维查询时速度非常快,且稳定,支持高并发,支持集群扩展。缺点是灵活性较差
MPP和Sql on Hadoop的区别
  • MPP数据库适合存储高密度价值数据,并且是长期存储和多次使用,所以MPP并行数据库会花大量的精力在Load阶段,把数据处理成适合分析格式。带来的优点就是从查询速度快,通常在秒级甚至毫秒级以内就可以返回查询结果。缺点是不支持细粒度的容错。
  • SQL on Hadoop是利用Hadoop平台存储数据,在其之上实现SQL查询引擎。最大的特点和Scalability非常好,可以支持超过1000个节点的集群。但是由于Hadoop的特点,很多查询还是需要做大量的数据扫描操作,因此查询速度往往比MPP要慢,而且支持的同时并发查询数一般也比较低。
样例产品MPPGreenPlum,Presto等
elasticsearch
SQL on HadoopHive,Spark
参考
  • https://zhuanlan.zhihu.com/p/148621151
  • https://www.zhihu.com/question/27589901
  • https://laptrinhx.com/apache-hawq-next-step-in-massively-parallel-processing-3942821226/



作者:ShootHzj
链接:https://www.jianshu.com/p/fc80d5b2d919
来源:简书


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-6-18 17:36

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表