最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

Hadoop大数据分析获本地R语言支持

[复制链接]
跳转到指定楼层
楼主
发表于 2014-9-23 20:45:21 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
随着大家对大数据分析越来越感兴趣,软件供应商Revolution Analytics改进了其R语言统计功能旗舰产品,使它能够与hadoop数据处理平台运行。
这个新的Revolution R Enterprise 7(RRE 7)还能够使R在Teradata数据库内运行。
R语言提供了一种方法来对一组数据运行常用统计测试(例如线性和非线性建模、时间序列分析、分类和聚类),通常结果是以图形的形式出现。
R越来越多地用于复杂的数据分析,即那些超出标准商业智能程序包范围的数据分析。Revolution Analytics公司预计全世界有超过200万人在使用R。
RRE7包含R算法库——可以跨多个节点并行运行,这与Hadoop管理大数据集的方式相同。RRE7可以被添加到Cloudera CDH3和CDH4 Hadoop发行版,以及Hortonworks数据平台1.3。
这个新的R库保护最常用的统计和预测分析算法,用于数据处理、数据采样、描述性统计、统计测试、数据可视化、仿真、机器学习和预测模型等任务。
通过分析节点内的数据,而不是移动数据到其他位置进行分析,基于R的数据分析可以更快地进行。它还允许对一整组数据进行分析,而不是数据的子集或者摘要–企业数据仓库(EDW)通常是采用这样的方式。
Revolution Analytics希望将R加入到Hadoop和Teradata数据库可以拓宽该语言的使用范围。该公司还设计了一个新的工作流程界面,其中不需要知道如何部署特定的R算法。这缓解了使用Java或者其他语言编程R的麻烦,让其在Hadoop平台运行。
除了支持这些新的平台,RRE7还采用了一些新的算法和流程。其一是建立Decision Forests的模型集,Decision Forests是用于预测未来结果的机器学习技术。新的Stepwise Regression功能还可以帮助我们自动化选择用于预测模型中最重要的变量。新的Decision Tree可视化可以提供图形化的方式来描述数据集内复杂的关系和相关性。
via:cnw


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-4-19 16:30

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表