最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

技术是永远的干货 2014年Hadoop大事件盘点

[复制链接]
跳转到指定楼层
楼主
发表于 2014-12-23 22:32:57 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
2014年转眼就要结束了,从hadoop 2005年加入Apache开始,这头小象也转眼就要十岁了。在2014年整个一年里,Hadoop技术有什么重要发展?商用Hadoop供应商都干了啥?Hadoop市场又有哪些大事发生?让我们来盘点一下吧。
Hadoop版本更新
今年四次版本更新都是围绕HDFS和Yarn进行的。详细信息见Hadoop更新路线图。

2014年2月,Hadoop 2.3.0发布,新特性包括支持HDFS的混合存储分级,可以集中管理HDFS内存里的缓存数据,通过HDFS中的YARN分布式缓存简化MapReduce分配及一些Bug修正。

2014年4月,Hadoop 2.4.0发布。包括HDFS支持ACL权限控制机制、容易升级、支持支持https访问、支持ResourceManager因故障挂掉重启后,可以恢复之前正在运行的应用程序(用户不需重新提交)、增加了Yarn共享信息存储模块ATS等。

2014年8月,Hadoop 2.5.0发布。新特性包括扩展文件属性、改进 HDFS 的 Web UI,提升 Yarn共享信息存储模块ATS 安全性,更丰富的 YARN REST API 等。

2014年11月,Hadoop 2.6.0发布。增加了基于HadoopKeyProvider API编写的密钥管理服务器Hadoop Key Management Server(KMS)、HDFS实现了一个透明的,端到端的加密方式、长期存在的服务可以在YARN中运行、支持Docker容器中的本机应用程序等。

Hadoop 2 的逐步更新是不是意味着Hadoop已经走向成熟的企业级技术了呢?其实它还有很长的路要走。

SQL-on-Hadoop
如果不能使用SQL语言,Hadoop无疑是在构建下一个数据孤岛,因此SQL-on-Hadoop获得了越来越多的关注。

Apache Hive 0.13发布。Hive是最早的基于Hadoop的SQL引擎。

Apache 基金会宣布Apache Drill升级成为基金会的顶级项目。Drill包含SQL解析器,兼容SQL环境和Hive。

除此之外,还有很多SQL引擎可供选择。

数据库领域初创公司Splice Machine上周宣布,发布SQL-on-Hadoop数据库,官方宣称它可以在HDFS(Hadoop分布式文件系统)中运行SQL查询和ACID事务。

喧嚣与骚动
Hadoop市场从未像今年这样热闹过,商用版Hadoop供应商纷纷抱大腿,很多传统厂商也来分一杯羹。

Cloudera
因特尔放弃了自己研发的Hadoop发行版,转而支持Cloudera,以7.4亿美元收购Cloudera 18%的股份。

红帽和Cloudera联盟,一起开发包括数据集成和应用开发工具,以及数据平台在内的软件解决方案。

Cloudera成立中国分公司,取名“肯睿(上海)软件有限公司”,正式入华。

Hortonworks
惠普投资5000万美元与Hortonworks达成战略性合作关系,二者联手开发Hadoop技术,使其在惠普的Haven大数据平台上运行。

EMC分拆公司Pivotal和Hortonworks合作,联手打造Hadoop标准管理工具Apache Ambari。

Teradata
Teradata收购数据咨询公司Think Big Analytics,借此获得Hadoop业务能力

Teradata与MapR合作,获得MapR软件、专业服务及客户支持服务的经销权,并作为同时使用Teradata及MapR解决方案客户的单点联系方提供服务。

Oracle最新推出的SQL扩展方案——Oracle大数据SQL(Big Data SQL)能实现一条SQL查询来从Cloudera Hadoop(CDH)和Oracle NoSQL数据库中调取数据,同时也支持Exadata上运行的Oracle关系型数据库。

应用案例
很多CIO非常关心Hadoop技术发展到什么程度了,还有没有成熟。其实CIO更应该关心的是自己的企业发展到什么程度了,适不适合使用Hadoop。没有完全成熟的技术,只有能否满足业务需求的产品。很多公司都应用了Hadoop技术,来看看今年曝光的应用案例吧!

美国电商eBay每天要处理100PB的数据,其中包括50TB的机器数据。它采用了三层平台战略,其中第三层平台就是Hadoop,eBay部署了两个2万节点的Hadoop集群,能处理80PB的数据。

数字媒体软件供应商Adobe公司运用SAP Data Service将Hadoop数据加载到SAP内存数据库HANA上。

思科首席数据架构师Bhargava带领他的团队从事开发Hadoop的工作,一些Hadoop用户案例已经投入市场,比如集成线下和线上客户信息。虽然现在Hadoop的规模还很小,但在接下来两年里,它会呈指数增长。

最后的最后:
程序员有福了!Hadoop从业者的年收入最高,134500元。是数据库从业者中收入最高的,超过了NoSQL从业者和Oracle DBA。新的一年是不是又有新的选择了?

文章出处:网络大数据


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-4-27 06:26

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表