全球预见者分享平台、领先的数据科学社区媒体和职业发展平台

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
开启左侧

[NOSQL基础] NoSql数据模型简介

[复制链接]
发表于 2019-3-5 19:14:43 | 显示全部楼层 |阅读模式
一、NoSql数据模型简介
1.1 传统模型
E-R图:一对多,多对一,多对多


1.2 Nosql设计
BSON - 是一种类json的一种二进制形式的存储格式,简称 Binary JSON,和JSON一样支持内嵌的文档对象和数组。


Nosql - 聚合模型


分布式事务是支持不了太多的并发的


1.3 聚合模型 - 数据类型
键值对
BSON
列族 - 按列存储数据的,最大的特点是方便存储结构化半结构化数据,方便数据压缩,针对某一列或几列查询有非常大的IO有事。
图形
二、数据库的四大分类
2.1 KV键值:典型介绍
新浪: BerkeleyDB+redis
美团:redis+tair
阿里、百度:memcache+redis
2.2 文档型数据库(BSON格式比较多):典型介绍
CouchDB
MongDB
是一个机遇分布式文件存储的数据库。有C++语言编写,为WEB应用提供可扩展的高性能数据存储解决方案。介于关系数据库和非关系数据库之间的产品,是非关系数据库中功能最丰富最像关系数据库的。
2.3 列存储数据库
Cassandra,HBase
分布式文件系统


2.4 图关系数据库
不是放图形的,放的是关系(如:朋友圈社交网络、广告推荐系统)
专注构建关系图谱
Neo4J,InfoGrid


2.5 四者对比



三、在分布式数据库中CAP原理:CAP+BASE
3.1 传统的ACID
A(Atomicity)原子性
C(Consistency)一致性
I(Isolation)独立性
D(Durability)持久性
3.2 CAP
C:Consistency(强一致性)


A:Availability(可用性)


P:Partition tolerance(分区容错性)


核心理论:
一个分布式系统不可能同时很好地满足一致性,可用性和分区容错性,最多只能同时较好的满足两个。分区容忍性是我们必须实现的,所以只能下载一致性和可用性之间权衡。


3.3 CAP的3进2
大部分网站:弱一致性 + 分布式容忍性
事务一致性
任何大量数据量的web系统,都非常忌讳多个达标关联查询。特别是SNS类型的网站,从需求及产品设计角度,避免产生。往往更多的只是单表查询,及单表的简单条件分页查询,sql功能被极大地弱化。
3.4 BASE
解决关系数据库强一致性引起的问题而引起的可用性性能而提出的解决方案。
基本可用(Basically Available)、如软状态(Soft state)、最终一致性(Eventually consistent)
他的思想是通过让系统放松对某一时刻数据一致性的要求换取系统整体伸缩性和性能上的改观。
3.5 分布式 + 集群简介
3.51 负载均衡
3.52 分布式系统(distributed system)
由多台计算机和通信的软件组件通过计算机网络连接(本地网络或局域网)组成。分布式系统时间里在网络之上的软件系统。正是因为软件的特性,所以分布式系统具有高度的内举行和透明性。因此,网络和分布式系统之间的区别更多的在与高层软件(特别是操作系统),而不是硬件。分布式系统可以应用在不同的平台上如:pc、工作站、局域网和广域网等


简单来讲:
1. 分布式: 不同的多服务器上部署不同的服务模块(工程),他们之间通过Rpc/Rmi之间通信和调用,对外不提供服务和组内协作.
2. 集群: 不同的多条服务器上部署相同服务模块,同构分布式调度软件进行统一调度,对外提供服务和访问。
---------------------
作者:lijwen
原文:https://blog.csdn.net/java_18945106612/article/details/80969198

楼主热帖
168大数据(www.bi168.cn)是国内首家系统性关注大数据科学与人工智能的社区媒体!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2019-3-24 02:08 , Processed in 0.111883 second(s), 18 queries , Xcache On.

Powered by BI168社区

© 2012-2014 海鸥科技

快速回复 返回顶部 返回列表