最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
开启左侧

大数据分析中,有哪些常见的大数据分析模型?

[复制链接]
发表于 2018-8-23 17:05:12 | 显示全部楼层 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
作者:宋天龙
链接:https://www.zhihu.com/question/36360374/answer/223773441
来源:知乎


数据模型可以从数据和业务两个角度做区分。
一、数据模型
数据角度的模型一般指的是统计或数据挖掘、机器学习、人工智能等类型的模型,是纯粹从科学角度出发定义的。
1. 降维
在面对海量数据或大数据进行数据挖掘时,通常会面临“维度灾难”,原因是数据集的维度可以不断增加直至无穷多,但计算机的处理能力和速度却是有限的;另外,数据集的大量维度之间可能存在共线性的关系,这会直接导致学习模型的健壮性不够,甚至很多时候算法结果会失效。因此,我们需要降低维度数量并降低维度间共线性影响。
数据降维也被成为数据归约或数据约减,其目的是减少参与数据计算和建模维度的数量。数据降维的思路有两类:一类是基于特征选择的降维,一类是是基于维度转换的降维。
2. 回归
回归是研究自变量x对因变量y影响的一种数据分析方法。最简单的回归模型是一元线性回归(只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示),可以表示为Y=β0+β1x+ε,其中Y为因变量,x为自变量,β1为影响系数,β0为截距,ε为随机误差。
回归分析按照自变量的个数分为一元回归模型和多元回归模型;按照影响是否线性分为线性回归和非线性回归。
3. 聚类
聚类是数据挖掘和计算中的基本任务,聚类是将大量数据集中具有“相似”特征的数据点划分为统一类别,并最终生成多个类的方法。聚类分析的基本思想是“物以类聚、人以群分”,因此大量的数据集中必然存在相似的数据点,基于这个假设就可以将数据区分出来,并发现每个数据集(分类)的特征。
4. 分类
分类算法通过对已知类别训练集的计算和分析,从中发现类别规则,以此预测新数据的类别的一类算法。分类算法是解决分类问题的方法,是数据挖掘、机器学习和模式识别中一个重要的研究领域。
5. 关联
关联规则学习通过寻找最能够解释数据变量之间关系的规则,来找出大量多元数据集中有用的关联规则,它是从大量数据中发现多种数据之间关系的一种方法,另外,它还可以基于时间序列对多种数据间的关系进行挖掘。关联分析的典型案例是“啤酒和尿布”的捆绑销售,即买了尿布的用户还会一起买啤酒。
6. 时间序列
时间序列是用来研究数据随时间变化趋势而变化的一类算法,它是一种常用的回归预测方法。它的原理是事物的连续性,所谓连续性是指客观事物的发展具有合乎规律的连续性,事物发展是按照它本身固有的规律进行的。在一定条件下,只要规律赖以发生作用的条件不产生质的变化,则事物的基本发展趋势在未来就还会延续下去。
7. 异常检测
大多数数据挖掘或数据工作中,异常值都会在数据的预处理过程中被认为是“噪音”而剔除,以避免其对总体数据评估和分析挖掘的影响。但某些情况下,如果数据工作的目标就是围绕异常值,那么这些异常值会成为数据工作的焦点。
数据集中的异常数据通常被成为异常点、离群点或孤立点等,典型特征是这些数据的特征或规则与大多数数据不一致,呈现出“异常”的特点,而检测这些数据的方法被称为异常检测。
8. 协同过滤
协同过滤(Collaborative Filtering,CF))是利用集体智慧的一个典型方法,常被用于分辨特定对象(通常是人)可能感兴趣的项目(项目可能是商品、资讯、书籍、音乐、帖子等),这些感兴趣的内容来源于其他类似人群的兴趣和爱好,然后被作为推荐内容推荐给特定对象。
9. 主题模型
主题模型(Topic Model),是提炼出文字中隐含主题的一种建模方法。在统计学中,主题就是词汇表或特定词语的词语概率分布模型。所谓主题,是文字(文章、话语、句子)所表达的中心思想或核心概念。
10. 路径、漏斗、归因模型
路径分析、漏斗分析、归因分析和热力图分析原本是网站数据分析的常用分析方法,但随着认知计算、机器学习、深度学习等方法的应用,原本很难衡量的线下用户行为正在被识别、分析、关联、打通,使得这些方法也可以应用到线下客户行为和转化分析。


二、业务模型
业务模型指的是针对某个业务场景而定义的,用于解决问题的一些模型,这些模型跟上面模型的区别在于场景化的应用。
1.会员数据化运营分析模型
会员细分模型、会员价值度模型、会员活跃度模型、会员流失预测模型、会员特征分析模型和营销响应预测模型
2.商品数据化运营分析模型
商品价格敏感度模型、新产品市场定位模型、销售预测模型、商品关联销售模型、异常订单检测模型、商品规划的最优组合
3.流量数据化运营分析模型
流量波动检测、渠道特征聚类、广告整合传播模型、流量预测模型。
4.内容数据化运营分析模型
情感分析模型、搜索优化模型、文章关键字模型、主题模型、垃圾信息检测模型。


作者:赵素卫
链接:https://www.zhihu.com/question/36360374/answer/144703208
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

数据分析中,  产品经理经常会用AARRR模型来进行数据分析。著名的《增长黑客》里面的数据分析基础,也是以这个模型为基础的。2A3R理论包括:
  • 获取(Acquisition):用户如何发现(并来到)你的产品?
  • 激活(Activation):用户的第一次使用体验如何?
  • 留存(Retention):用户是否还会回到产品(重复使用)?
  • 收入(Retention):产品怎样(通过用户)赚钱?
  • 传播(Retention):用户是否愿意告诉其他用户?
AARRR用户运营模型是在海盗理论模型基础上简化了,把用户细分,不同类型的用户对应的处理方式不同,用户分为新增、活跃、流失三类,分别对应的业务如下图:

运营人员需要全面掌握站点、商品、用户的信息的同时,更重要的是通过对三者的干预来实现运营目标,不论是增加粉丝、拉升销量还是扩大品牌效应。但是有一点需要我们注意的是,我们实际能直接干预的是站点和商品、对用户我们基本是通过站点和商品来实现的间接影响。
AARRR模型,一般用作用户运营分析,解决用户的问题。但是对各种活动来说, 并不能有效的指导活动,活动针对的是商品和体验,这一点从99click CEPO标准获客分析模型中可以体现出。


从CEPO标准获客分析模型可以看出用户从看到广告到注册成功这一流程,经过5个环节,分别对应不同的数据指标,那用户对站点的而体验表现在从吸引,兴趣、转化、引导这些,以内容和体验为主要,因此站点体验影响了用户的转化。根据这些找出问题所在,并进行优化,达到提升销量的目的。

作者:coco
链接:https://www.zhihu.com/question/36360374/answer/219560559
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

【项目】某线上预定鲜奶平台,欲提高订单量
【用户使用场景还原】用户将一件商品添加到购物车,有可能经过5分钟用户还在网站中但没有付款;还有可能5分钟之后用户没有完成支付并离开网站,面对这两种不同的情况,诸葛io可通过不同的手段实现用户触达,
比如:给用户推送一条短信,内容可以是“您的某某商品放在购物车,如果现在订购,我们明天即可送给你”。这只是一个例子,总之,智能触达就是在适当的时机给用户一个适当的信息,从而促进用户转化。
【解决方案】
1、注册用户未购买
注册成功用户一天内未创建订单的,即可通过发送红包、推送短信或者其他方式来刺激并激活用户。通过诸葛io智能触达,实现了让“准流失用户”再次转化付费的“神话”,具体是如何操作的呢?
首先,光明随心订APP通过诸葛io采集到的用户行为数据,筛选出在APP上注册未购买的用户,考虑到业务场景,已下载APP的用户一定是有购买意愿的,更何况已注册的用户,之所以未完成购买行为,很有可能是忘记或者注册时不方便下单,故通过诸葛io智能触达平台,创建一个活动:凡触发了“注册”事件且在次日未完成订单支付的用户,即推送一条短信:一个价值128元的红包已存入您的账户,记得尽快使用哦!

【触达效果】最终将付费转化率提升近10%,也就是,假设注册未购买用户有100人,通过诸葛io自动化的智能触达后,即有10人完成下单,客单均价如果是400元的话,那么直接为企业带来4000元交易额。
总之,运营触达,在合适的时间给用户需要的内容从而促进转化。比如,有些商品的成单是冲动性消费带来的,当用户产生冲动时,一定要给他一个信息(刺激),引导他完成下单支付。无需复杂的分析,让增长即刻看到。

2、创建订单未支付
用户创建订单后2小时内未完成支付,即可通过一条短信提醒用户尽快付款。
3、查看商品未提交
有些用户可能反复在查看某一商品,可能登陆了网站或APP好多次,每次都去搜索某些关键字,并查看商品详情页,可能一天看了3次、5次,但就是没有下定决心去购买支付。此时,可为用户推荐同类型产品,通过各种创意来实现转化。

所以,本质上来说运营触达包括市场运营,可分为两部分:
1、诸葛io提供一套科学的方法,基于对用户行为的衡量,进而确定目标并实现提升。
2、传统营销公司主要提供创意内容,而创意与科学的营销方法密不可分。此前诸葛io服务的一家车企——宝马。每个月针对宝马会员推送的EDM创意会有800种之多,即,每个会员可能看到的内容都不太一样。创意内容是基于会员购买的车系,购买的时间地点、价格,有无金融计划等属性,宝马会提供上百种创意方案。但即使宝马拥有很棒的创新能力,但如果没有科学的方法,也是很难评估哪一类创意对哪一类会员最有效。

诸葛io智能触达的核心逻辑大致包括:先找到一批精准的用户,所谓精准的用户,即,先定义出待推荐的产品或服务,然后筛选用户,男/女、北京/上海,收入,用户习惯(搜索记录购买记录)等。

所以,先找到精准的用户,然后基于诸葛io的SDK采集到企业官网/APP上的用户行为数据,最后寻找一个合适的时机(这个时机可能是用户触发A行为后,也有可能是用户做了某一动作之后多长时间再触发),在一个正确的渠道(短信、邮件、APP的推送、电话等多种方式),但每一个方式它适合的场景和最终带来的转化率是不一样的,诸葛io将基于用户人群的时机和渠道以及最合适的内容去触达用户,最后形成一个闭环。


每一次触达都有量化的衡量,如果有衡量即可有优化,最终的目标是要优化整个流程的效率/效果。总之,整个智能触达的操作流程很简单,简单的拖拽即可实现创建一个智能触达的活动,并且能直观的、实时的看到这个活动的最终效果。







楼主热帖
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-3-29 16:26

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表