168大数据

标题: 史上最全的“大数据”学习资源整理 [打印本页]

作者: 168主编    时间: 2017-5-17 15:52
标题: 史上最全的“大数据”学习资源整理

当前,整个互联网正在从IT时代向DT时代演进,大数据技术也正在助力企业和公众敲开DT世界大门。当今“大数据”一词的重点其实已经不仅在于数据规模的定义,它更代表着信息技术发展进入了一个新的时代,代表着爆炸性的数据信息给传统的计算技术和信息技术带来的技术挑战和困难,代表着大数据处理所需的新的技术和方法,也代表着大数据分析和应用所带来的新发明、新服务和新的发展机遇。

为了帮助大家更好深入了解大数据,云栖社区组织翻译了GitHub Awesome Big Data资源,供大家参考。本资源类型主要包括:大数据框架、论文等实用资源集合。

资源列表:

关系数据库管理系统(RDBMS)

框架

分布式编程

分布式文件系统

文件数据模型

Key Map 数据模型

注意:业内存在一些术语混乱,有两个不同的东西都叫做“列式数据库”。这里列出的有一些是围绕“key-map”数据模型而建的分布式、持续型数据库,其中所有的数据都有(可能综合了)键,并与映射中的键-值对相关联。在一些系统中,多个这样的值映射可以与键相关联,并且这些映射被称为“列族”(具有映射值的键被称为“列”)。

另一组也可称为“列式数据库”的技术因其存储数据的方式而有别于前一组,它在磁盘上或在存储器中——而不是以传统方式,即所有既定键的键值都相邻着、逐行存储。这些系统也彼此相邻来存储所有列值,但是要得到给定列的所有值却不需要以前那么繁复的工作。

前一组在这里被称为“key map数据模型”,这两者和Key-value 数据模型之间的界限是相当模糊的。后者对数据模型有更多的存储格式,可在列式数据库中列出。若想了解更多关于这两种模型的区分,可阅读Daniel Abadi的博客:Distinguishing two major types of Column Stores

键-值数据模型

图形数据模型

NewSQL数据库

列式数据库

注意:请在键-值数据模型 阅读相关注释。

时间序列数据库

类SQL处理

数据摄取

服务编程

调度

机器学习

基准测试

安全性

系统部署

应用程序

搜索引擎与框架

MySQL的分支和演化

PostgreSQL的分支和演化

Memcached的分支和演化

嵌入式数据库

商业智能

数据可视化

物联网和传感器

文章推荐

论文

2015 - 2016

2013 - 2014

2011 - 2012

2001 - 2010

视频

数据可视化

【编译自:https://github.com/onurakpolat/awesome-bigdata,译者:刘崇鑫   校对:王殿进,来源于云栖社区】







欢迎光临 168大数据 (http://www.bi168.cn/) Powered by Discuz! X3.2