最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

基于腾讯信鸽平台的手游流失用户预测模型概览

[复制链接]
跳转到指定楼层
楼主
发表于 2015-6-14 16:09:09 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
摘要:本文由腾讯大数据团队技术人员撰写,介绍依托腾讯信鸽平台做手游用户的流失预测。文章着眼于数据、算法和系统三个方面,总结了一套手游通用的业务流失预测模型。本次流失预测的建模中采用了LR模型。
【编者按】借助大数据和机器学习做用户流失的预测分析是当前的一个应用趋势。本文由腾讯大数据团队技术人员撰写,介绍依托腾讯信鸽平台做手游用户的流失预测。文章着眼于数据、算法和系统三个方面,总结了一套手游通用的业务流失预测模型。本次流失预测的建模中采用了LR模型。
背景
随着游戏市场竞争的日趋激烈,越来越多的游戏运营服务选择借助大数据挖掘出更多更细的用户群来进行精细化,个性化运营,从而更好的抓住用户,获得更大的收益。在游戏运营中,无论是流失挽留,还是拉新,以及付费用户预测都是游戏运营的重要内容。
本文将着重介绍手游用户的流失预测。对于游戏运营者,如果能够尽早的发现可能流失的用户,尽早的有针对性的对这些用户进行适当的干预,从而最大限度的延长用户在游戏中的停留时间,使得游戏运营者获得更大的收益。
本文中介绍的手游流失预测主要依托于腾讯信鸽这个平台,为这个平台提供精准定位即将流失用户的功能。腾讯信鸽是专业的移动应用推送平台,支持百亿级的通知/消息秒级触达移动用户。开发者可以方便地通过嵌入SDK,通过API调用或者Web端可视化操作,实现对特定用户发送通知/消息,提升用户活跃度,挽回潜在流失用户,并实时查看推送效果。
我们在这三面都有深入研究,取得了不错的效果。
需求的挑战 海量的用户行为
目前该套流失预测系统,每天最高时承接着480亿条上报的用户行为记录。
海量的用户
在已经接入的游戏中,每天活跃着一亿左右的用户。
模型的通用性
流失预测的实际应用中,不仅仅包含了公司内的游戏,还有公司外的游戏,以及各种各样的应用。每个应用上报的自定义事件更是各不相同,但算法还要统一接入。
应用接入压力
目前实际已经介入100多款公司内游戏应用,几乎囊括了公司内大部分主力手机游戏,包括天天炫斗,天天德州等。
鉴于上述的挑战性,结合了腾讯大数据精准推荐平台以“数据+算法+系统”的3方面打法,我们针对手游也总结了一套通用的业务流失预测模型。

下面是3个部分的展开介绍。
系统--TRC平台
TRC的全称是Tencent Real-time Computing,是大数据精准推荐平台专为海量数据实时处理而构建的提供基础计算能力的服务平台,从全流程的实时计算体系的角度看,整个TRC由核心的平台支撑层和扩展的平台应用层构成。
平台支撑层主要包括实时数据接入、实时数据处理、实时数据存储;平台应用层主要包括实时算法预测,实时模型训练,实时效果统计,实时系统监控实时数据展示。总体结构如所示:
TRC平台经过两年多的现网运营,已经逐步成熟稳定,该平台每天支撑公司2,000多亿实时数据接入,每天26,000多亿次实时计算,每天5,000多亿次数据访问,已经在广点通广告推荐,电商物品推荐,视频推荐,新闻推荐,微信业务性能监控并实时统计等产品中大规模使用。
数据
在机器学习,算法建模中,数据是输入,也是起点。数据的质量的高低,优劣,将直接影响着最终的算法效果。对于数据的研究和分析,往往耗费了研究者大量的时间和精力。
在流失预测模型运用到的数据中,存在着优势和劣势。
优势是数据量大,每天高达百亿级别的用户行为记录,日活跃一亿左右用户。并且有着丰富的用户行为。比如,登录,打怪,升级,加血,得分,领取金币等,还有着更为丰富的各个游戏,应用的自定义事件。
劣势也非常明显。虽然行为丰富,但是每个应用上报的具体数据内容无法规范统一,特别是自定义事件更无法控制,同时,还要达到无论是公司内部手游,外部手游,还是各类应用都要模型通用,只能从这众多丰富的数据中抽取它们共性的且有效的特征
在本算法中,考虑到,通用性,有效性,并且易拓展性,具体抽取的特征有:登录天数,登录频次,最后登录时间,登录时长,等级等特征
算法
在本次流失预测的建模中,采用了LR模型。在这里简单介绍一下LR模型。Logistic regression (逻辑回归)是当前业界比较常用的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。
Logistic回归为概率型回归模型,是研究分类观察结果y与一些影响因素x(单变量,多变量都可以)之间关系的一种分析方法 。
在流失预测模型中,具体输入的用户特征为登录天数,登录频次,最后登录时间,登录时长,目前等级等特征,输出为用户的流失可能性。同时,通过算法的结果的准确率,和召回率来评价算法效果。
流失预测的整体流程如所示,从公司内外部游戏以及各类应用中抽取各类用户,日常的登录天数,登录频次,最后登录时间等特征,以及最后的流失状况,来训练LR模型。然后根据每天用户相应特征,使用训练好的模型来进行预测,得到最可能流失的用户。

算法效果
基于玩家的在线时长,使用频率等特征,建立流失用户预测模型,精准预测潜在流失用户。在公司外游戏美人国的AB Test中,预测覆盖率超过85%,准确率超过91%。利用信鸽对该用户群推送针对性的营销活动,回流率比随机推送提升120%。
在腾讯内部XX游戏的AB Test中,我们的算法的预测覆盖率达到79.847%,准确率达到85.646%。利用信鸽对该用户群推送针对性的营销活动,回流率比随机推送提升326%。
通过实践证明:充分利用大数据的优势,帮助游戏大幅提升玩家留存率,同时减少对玩家的骚扰,保障用户体验。   
结语
游戏市场的竞争日趋激烈,新游戏产品增速逐渐放缓,越来越多的游戏运营开始借助于大数据,机器学习,来挖掘出更多更细的用户群,从而更有针对性的进行运营活动,能够帮助游戏大幅提升玩家留存率,减少对玩家的骚扰,保障良好的用户体验。

楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-4-25 09:35

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表