马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
1.常用的转换#假设rdd的元素是: {1,2,2,3}
应用于pairRdd
假设rdd的元素是:{1, 2, 3},other元素是:{3, 4, 5} 2.常用操作接口#假设rdd的元素是:{1, 2, 3, 3} 3.创建RDD#有两种方式:读取外部数据集,以及在驱动器程序中对一个集合进行并行化
parallelize 集合并行化
textFile 本地文件或者HDFS文件 4.map()函数 和 take()函数#map(func)
take(num)
回复帖子,然后刷新页面即可查看隐藏内容
版权声明:原创作品,允许转载,转载时务必以超链接的形式表明出处和作者信息。否则将追究法律责任。来自海牛部落-青牛,http://hainiubl.com/topics/192
|