只需一步,快速开始
您需要 登录 才可以下载或查看,没有帐号?立即注册
自定义比较类用于key
用Spark rdd实现二次排序
程序结果
借助之前封装的orcutil,把结果保存为ORC格式的文件,注意输出hadoop格式时要将rdd转成pairrdd
程序运行结果
使用道具 举报
本版积分规则 发表回复 回帖并转播 回帖后跳转到最后一页
查看 »
与数十万数据精英亲密接触
关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号 ) |申请友情链接
GMT+8, 2024-4-27 02:32
Powered by BI168大数据社区
© 2012-2014 168大数据