假设rdd的元素是: {1,2,2,3}
应用于pairRdd
假设rdd的元素是:{1, 2, 3},other元素是:{3, 4, 5}
假设rdd的元素是:{1, 2, 3, 3}
3.创建RDD#有两种方式:读取外部数据集,以及在驱动器程序中对一个集合进行并行化
parallelize 集合并行化
textFile 本地文件或者HDFS文件
map(func)
take(num)
欢迎光临 168大数据 (http://www.bi168.cn/) | Powered by Discuz! X3.2 |