168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

1 2 3 4 5
开启左侧

Hubble:大规模高并发支持灵活查询的国产HTAP数据库

[复制链接]
发表于 2018-6-13 19:58:05 | 显示全部楼层 |阅读模式

人工智能大数据一直作为孪生兄弟相互支撑,生产与离线分析各自独立的传统信息化结构已经无法支撑AI的发展,每个异构数据库产品之间的同步和数据冗余;业务的实时性需要流数据框架;ML越来越多作为核心业务部件被部署在流程中自动化完成……这些都会带来很多问题,因此限制了大数据企业应用的发展。新一代数据驱动业务提出了数据湖等全新架构,而数据湖不仅仅是低成本的存储,更应是面向生产交易等数据科学处理的核心计算框架。

凭借7年来在分布式计算集群的沉淀,及三家大型银行核心交易系统的实践验证,天云大数据推出了百万原生代码规模的HTAP数据库产品:Hubble,可以实现混合交易分析处理。

Hubble:既能支持OLTP,又能支持OLAP的数据库

Hubble对SQL进行了全面支持,并具备NoSQL的能力,采用大数据高扩展、高可用的架构,可以满足不同的业务企业级应用,对实时、高性能的需求,并提供多种交互接口。

Hubble底层采用Hdfs做数据为存储介质,具备存储海量数据的能力,具备集群的横向动态扩展能力,在安全性方面利用HDFS的三副本机制来保证整个集群的稳定运行。

分片服务会将预写日志直接持久化到磁盘,以保证事务,而不是放在内存中,避免使用内存导致事务出错的风险,并提高事务的可靠性。通过Mem Storage作为数据缓冲层,HDFS Storage将数据序列化到HDFS中,并从API层级支持数据的批量加载,每个shard作为哈勃逻辑层面的最小单元。

Hubble可以使用JAVA SDK、JDBC客户端、SQL等多种访问方式为前端应用提供数据的访问。

Hubble的目标就是做国产的HTAP数据库。在使用hubble时,无论业务规模大小,始终都与小型应用阶段相同,无需改变使用习惯,当业务规模扩大时,只需要添加新的节点,提升数据库的能力,就可以适应业务变化的需要,每个阶段无需付出额外的成本。

Hubble三大特性:实时离线高速入库、超高并发、全部SQL标准

Hubble有三个大的目标 :

第一是支持实时、离线高速入库,满足各种入库需要,并支持实时入库,支持离线批量加载,并支持多节点的ACID

第二支持超高并发,即支持大规模用户访问,支持上万用户在线实时高并发修改和查询。

第三是支持全部标准SQL的语法,提供各种分类、汇总等统计公式,及OLAP分析。

下面对hubble的性能对比及FAB三个维度进行分析

Hubble与MPP数据库impala,还有内存计算Spark的对比,可以看到,50万条、5千万条和5亿条记录的3个测试维度,无论哪个查询,hubble都存在着巨大的优势,hubble基本都是毫秒级响应,而无论是impala还是spark都是分钟级的响应速度。

Hubble的重要特性包括,对SQL的全面支持,即全面支持TPC-DS,TPC-H的SQL语法,并支持PL/SQL存储过程。

数据存储在HDFS上,支持数据的批量入库,凭借HDFS的多副本机制,确保数据的高可用性,保证数据不丢失,并具备天然的高扩展性。对ACID的支持,数据的高一致性,确保新增、修改、删除时数据的一致性,并支持联机操作。利用快照技术,方便记录数据的当前状态,随时对数据对数据进行快照恢复。可以监控集群和Hubble的状态信息,方便数据库管理进行维护和监控。

Hubble的作用主要包括,使用灵活,无需太多额外的成本,对传统应用的迁移,只需要替换jdbc使用的驱动即可。自诞生起就基于hadoop之上,天生支持海量存储,支持对TB甚至PB级的数据。

既支持OLTP又支持OLAP,一站式的解决联机查询问题,无需部署众多的数据库组件,只需要使用Hubble,就可以涵盖大部分的业务需求。

可以利用快照技术,对任一时间的数据进行备份,随时恢复,有效的保障了数据的安全性。

在小型应用方面,企业为节省成本,可能选择OLTP数据库,在数据规模小时,可以运转的很好。到了中型应用阶段,就会面临资源不够用的问题,这个时候开始做读写分离,分式复用。到了大型应用时期,读写数据开始跑不动,越来越复杂的SQL,这时开始做分库分表操作,并引入了分析型数据库。到了巨型应用阶段,开始对不同业务选择不同数据库入口,管理复杂度极高。

这个时候Hubble数据库的引入,就有效解决以上众多问题,降低使用者的门槛,减小开发的投入,方便原有系统的迁移,运行稳定,不需要额外的维护成本。

并且系统在大规模数据量下仍然支持高并发实时响应,减小查询等待时间,从而提升了用户体验,提高了效率。

Hubble成功实现核心交易减负,保障全量数据在线

Hubble的典型应用场景包括,历史数据查询,全量数据存储,统一格式查询,从而实现对核心交易的减负,并保障全量数据的在线。

在游戏和电商数据分析,可以支持海量的游戏、电商数据的存储,方便对用户进行画像,实现精准营销,并提供秒级的响应速度。

在基础设施监控方面,提供准实时入库,对基础实时数据进行流处理,并实时的提供对基础设施数据的监控。

在IOT及传感器数据方面,也可以通过实时入库,对物联网数据进行存储、查询及挖掘。


楼主热帖
168大数据(www.bi168.cn)是国内首家系统性关注大数据与数据科学的社区媒体与产业服务平台!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

企业信息化选型咨询

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2018-8-17 22:53 , Processed in 0.089253 second(s), 17 queries , Xcache On.

Powered by BI168社区

© 2012-2014 海鸥科技

快速回复 返回顶部 返回列表