马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
下面这个案例主要介绍如何对媒体进行分级。分级不同与分类,通过聚类分析将物或人分成几类,只是根据相似性定义的,没有哪类好哪类坏之分。而分级则是定义优劣级别。不过案例对媒体分级的方法仍然使用的是聚类算法,也只有在特定场景下,才可以通过聚类对对象进行分级。
下面讲述的案例是关于一家专门做网络游戏广告投放的广告公司。这家广告公司有1万多个网络广告位,帮助游戏公司投放广告,以往都是由他们的媒介专家(媒介经理或者媒介总监)选择满足客户目标最大化的媒介组合,这显然不是一件容易,为了提高筛选媒介组合的效率,该公司借助我们的数据挖掘工具对其媒介进行分级,以便快速找到最优的媒介组合,这个工作只是他们分析中的一部分。工作流如下:
1、商业目标
业务理解:数据名称《媒体信息.xlsx》。该案例所用的数据是一份关于媒体投放的数据,该数据文件包含媒体名称、平时单价以及假日单价、项目购买金额、参与项目数等信息。如下:
表1:数据视图
业务目标:对媒体进行分级,评价媒体投放收益。
数据挖掘目标:通过聚类的方式对现有的媒体进行分级。
2、建模第一步,选择K-Means聚类进行分析。将媒体分成5类,节点配置如下:
聚类结果如下:
再使用饼图探索每类的大小分布,结果如下:
第二步,探索每类的重要性。我们仍然使用饼图进行探索,分析每类媒体参与项目的情况,节点配置如下:
每类平均参与项目次数的情况如下:
从图中可以看出cluster_2中的媒体平均使用次数最多,其次是cluster_3、cluster_4、cluster_1、cluster_0。由于每次广告的媒体投放的媒介组合都是由媒介经理或者媒介总监这些专家认真选择的,因此,如果我们默认每次广告投放使用的媒介组合都是正确的,那么使用越多,则可以说明这些媒体越好用,也就越好。由此,我们把平均使用次数越多的类别定义为更高(好)的级别。我们可以将cluster_2、cluster_3、cluster_4、cluster_1、cluster_0分别定义为A级、B级、C级、D级、E级。
第三步,定义媒体级别。
首先,使用创建表节点定义聚类类别和级别值的对应表。配置如下:
其次,使用单元格替换节点替换原表中的聚类类别,配置如下:
然后,再使用列重命名节点对Cluster字段重命名。配置如下:
最后,您可以使用交互表格节点查看分级结果,如下:
另外,您还可以使用多系条形图探索每个级别的特征,如图所示:
3、小结通过该案例,我们掌握如何使用聚类算法进行分级,分级的方法有很多,尤其在零售业经常用到客户分级,这里就不一一介绍了,以后再逐一分享。但是值得注意的是,聚类算法本身并不用于分级,仅当聚类的结果结合实际业务具有优劣特性时才可以采用聚类的结果建立分级规则。
本文源自:http://wiki.smartbi.com.cn/pages/viewpage.action?pageId=13599857
|