HAWQ是Hadoop原生SQL查询引擎,结合了MPP数据库的关键技术优势和Hadoop的可扩展性和便捷性。HAWQ从HDFS本地读取数据并将数据写入HDFS。
HAWQ提供业界领先的性能和线性可伸缩性。它为用户提供了自信和成功地与petabyte range数据集交互的工具。HAWQ为用户提供了一个完整的、符合标准的SQL接口。更具体地说,HAWQ有以下特点:
HAWQ将复杂的查询分解为小任务,并将它们分发给MPP查询处理单元执行。
HAWQ并行度的基本单位是段实例。一个并行查询处理系统由服务器上的多个工作段实例形成。优化过的查询提交给HAWQ,被分解为更小的组件,并被分派到一起工作的段实例,并生成单个结果集。所有关联操作(如表扫描、连接、聚合和排序)同时在各段并行执行。来自动态管道中上游组件的数据通过可伸缩用户数据报协议(UDP)连接并传输到下游组件。
基于Hadoop分布式存储,HAWQ不存在单点故障,支持全自动在线恢复。系统状态在持续监控,因此如果一个段失败,将自动从集群中删除。在此过程中,系统能继续客户查询服务,必要时可以重新添加回系统。
欢迎光临 168大数据 (http://www.bi168.cn/) | Powered by Discuz! X3.2 |