168大数据
标题:
在算子内部使用sparksession对象
[打印本页]
作者:
九月的六叔
时间:
2016-12-16 10:55
标题:
在算子内部使用sparksession对象
val spark = SparkSession.builder().config(conf).getOrCreate()
在一个算子内部得到一个list值,需要对其groupbykey,所以需要转换成rdd,借助spark对象,通过broadcast广播至算子内部
spark.createDataset(value.toSeq)(org.apache.spark.sql.Encoders.kryo).rdd.keyBy { x => x.get(1) }
然后,就没有然后了
一直卡在那里,既不报错也没法调试
求解,求更好的解决方式
欢迎光临 168大数据 (http://www.bi168.cn/)
Powered by Discuz! X3.2