最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

[综合] HAWQ--简介

[复制链接]
跳转到指定楼层
楼主
发表于 2018-12-27 16:40:58 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

HAWQ是hadoop原生SQL查询引擎,结合了MPP数据库的关键技术优势和Hadoop的可扩展性和便捷性。HAWQ从HDFS本地读取数据并将数据写入HDFS。

HAWQ提供业界领先的性能和线性可伸缩性。它为用户提供了自信和成功地与petabyte range数据集交互的工具。HAWQ为用户提供了一个完整的、符合标准的SQL接口。更具体地说,HAWQ有以下特点:

  • 本地或云部署
  • 健壮的ANSI SQL遵从:SQL-92, SQL-99, SQL-2003, OLAP扩展
  • 极高的性能——比其他Hadoop SQL引擎快很多倍
  • 世界级的并行优化器
  • 完整的事务处理能力和一致性保证:ACID
  • 基于高速UDP的互连的动态数据流引擎
  • 弹性执行引擎基于按需虚拟段和数据局部性
  • 支持多级分区和基于列表/范围的分区表。
  • 多重压缩方法支持:snappy, gzip
  • 多语言用户定义函数支持ython, Perl, Java, C/C++, R
  • 基于MADLib的高级机器学习和数据挖掘功能
  • 动态节点扩展:以秒为单位
  • 最先进的三级资源管理:集成YARN分层资源队列。
  • 轻松访问所有HDFS数据和外部系统数据(例如,HBase)
  • 原生Hadoop:从存储(HDFS)、资源管理(YARN)到部署(Ambari)。
  • 身份验证和粒度授权:Kerberos、SSL和基于角色的访问
  • HDFS和YARN的高级C/ c++访问库:libhdfs3和libYARN
  • 对大多数第三方工具的支持:Tableau, SAS等。
  • 标准接口:JDBC/ODBC

HAWQ将复杂的查询分解为小任务,并将它们分发给MPP查询处理单元执行。

HAWQ并行度的基本单位是段实例。一个并行查询处理系统由服务器上的多个工作段实例形成。优化过的查询提交给HAWQ,被分解为更小的组件,并被分派到一起工作的段实例,并生成单个结果集。所有关联操作(如表扫描、连接、聚合和排序)同时在各段并行执行。来自动态管道中上游组件的数据通过可伸缩用户数据报协议(UDP)连接并传输到下游组件。

基于Hadoop分布式存储,HAWQ不存在单点故障,支持全自动在线恢复。系统状态在持续监控,因此如果一个段失败,将自动从集群中删除。在此过程中,系统能继续客户查询服务,必要时可以重新添加回系统。





楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-4-25 19:49

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表