168大数据

标题: Apache Spark 2.2.0 正式发布,建议所有2.x用户升级 [打印本页]

作者: 168主编    时间: 2017-7-14 13:38
标题: Apache Spark 2.2.0 正式发布,建议所有2.x用户升级
Apache Spark 2.2.0 是2.x系列的第三个版本,该发行版移除了Structured Streaming的实验标签,处理了1100多个问题,更关注可用性、稳定性和性能优化。
建议所有2.x用户更新至2.2.0版本,点击访问下载页面,用户可以在JIRA中查询更多细节。以下按照主要模块,对更新内容进行了分组:
核心 & Spark SQL
API升级
性能及稳定性
其他值得注意的变化
编程指南:Spark Programming Guide and Spark SQL, DataFrames and Datasets Guide
Structured Streaming
General Availablity
Kafka改进
API升级
其他值得注意的变化
编程指南:Structured Streaming Programming Guide
MLlib
DataFrame API新增算法
已有算法添至 Python & R APIs
主要错误修复
编程指南:Machine Learning Library (MLlib) Guide
SparkR
2.2.0版本中SparkR的主要焦点在于对Spark SQL现有特性提供了广泛支持:
主要特性
编程指南:SparkR (R on Spark)
GraphX
漏洞修复
优化
编程指南:GraphX Programming Guide
过期功能
MLlib
SparkR
行为变化
MLlib
SparkR
已知问题
参考链接:






欢迎光临 168大数据 (http://www.bi168.cn/) Powered by Discuz! X3.2