最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

Smartbi数据挖掘示例--媒体分级

[复制链接]
跳转到指定楼层
楼主
发表于 2015-8-11 19:52:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

下面这个案例主要介绍如何对媒体进行分级。分级不同与分类,通过聚类分析将物或人分成几类,只是根据相似性定义的,没有哪类好哪类坏之分。而分级则是定义优劣级别。不过案例对媒体分级的方法仍然使用的是聚类算法,也只有在特定场景下,才可以通过聚类对对象进行分级。


下面讲述的案例是关于一家专门做网络游戏广告投放的广告公司。这家广告公司有1万多个网络广告位,帮助游戏公司投放广告,以往都是由他们的媒介专家(媒介经理或者媒介总监)选择满足客户目标最大化的媒介组合,这显然不是一件容易,为了提高筛选媒介组合的效率,该公司借助我们的数据挖掘工具对其媒介进行分级,以便快速找到最优的媒介组合,这个工作只是他们分析中的一部分。工作流如下:



1、商业目标
业务理解:数据名称《媒体信息.xlsx》。该案例所用的数据是一份关于媒体投放的数据,该数据文件包含媒体名称、平时单价以及假日单价、项目购买金额、参与项目数等信息。如下:


表1:数据视图
业务目标:对媒体进行分级,评价媒体投放收益。
数据挖掘目标:通过聚类的方式对现有的媒体进行分级。

2、建模

第一步,选择K-Means聚类进行分析。将媒体分成5类,节点配置如下:





聚类结果如下:


再使用饼图探索每类的大小分布,结果如下:


第二步,探索每类的重要性。我们仍然使用饼图进行探索,分析每类媒体参与项目的情况,节点配置如下:


每类平均参与项目次数的情况如下:


从图中可以看出cluster_2中的媒体平均使用次数最多,其次是cluster_3、cluster_4、cluster_1、cluster_0。由于每次广告的媒体投放的媒介组合都是由媒介经理或者媒介总监这些专家认真选择的,因此,如果我们默认每次广告投放使用的媒介组合都是正确的,那么使用越多,则可以说明这些媒体越好用,也就越好。由此,我们把平均使用次数越多的类别定义为更高(好)的级别。我们可以将cluster_2、cluster_3、cluster_4、cluster_1、cluster_0分别定义为A级、B级、C级、D级、E级。

第三步,定义媒体级别。
首先,使用创建表节点定义聚类类别和级别值的对应表。配置如下:


其次,使用单元格替换节点替换原表中的聚类类别,配置如下:


然后,再使用列重命名节点对Cluster字段重命名。配置如下:


最后,您可以使用交互表格节点查看分级结果,如下:


另外,您还可以使用多系条形图探索每个级别的特征,如图所示:

3、小结

通过该案例,我们掌握如何使用聚类算法进行分级,分级的方法有很多,尤其在零售业经常用到客户分级,这里就不一一介绍了,以后再逐一分享。但是值得注意的是,聚类算法本身并不用于分级,仅当聚类的结果结合实际业务具有优劣特性时才可以采用聚类的结果建立分级规则。


本文源自:http://wiki.smartbi.com.cn/pages/viewpage.action?pageId=13599857



楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-15 23:01

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表