168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

1 2 3 4 5
开启左侧

【视频】神策数据创始人:如何从0到1用数据驱动产品和运营?

[复制链接]
发表于 2018-5-15 11:02:22 | 显示全部楼层 |阅读模式
本帖最后由 168主编 于 2018-5-15 11:09 编辑

本文来源微信公众号:盒饭财经(ID:daxiongfan)

口述丨桑文锋

神策数据创始人、CEO。2007年进入百度,从在“百度知道”做研发,到开始组建并带领团队,从0到1搭建了百度用户日志大数据平台。历任软件工程师,高级软件工程师,项目经理,高级项目经理,技术经理。2015年离职百度,创办了神策数据。

1.jpg

4月27日,在今今乐道读书会全国总部,神策数据创始人、CEO桑文锋做了《数据驱动》的分享。以下是盒饭财经对其口述进行整理编辑:

2007年,我从浙大研究生毕业后去了百度,之后是在百度做了8年。头一年是在百度知道做研发,从第二年开始做数据相关的事情,这一做就做了十年,在百度干了七年多数据的事情,从0到1去做百度的数据平台。

2015年4月我从百度离开,开始创业,创业做的事情还是围绕用户行为分析、大数据分析这个方向,可以说这十年时间对数据的认识越来越深刻,因为跟许多企业打交道交流比较多,对它的价值、实际的应用场景,也看得更加清楚一些。

今天我给大家分享的内容,主要是五个方面。

一是数据思维到底是怎么一回事。很多非技术出身的朋友,或者之前没有做过大数据,如果我直接将技术,中间跨度太大了,需要有一个缓冲地带,我希望这个缓冲地带能帮大家导入进去,之后会讲数据分析的价值。我们谈大数据,谈数据分析,到底它有什么样的价值,我给大家聊一下。

之后讲一个相对枯燥一点的内容,但是又是必须要了解的,就是数据分析,它整个环节是怎么一回事,让大家不管是不是要从事这一块,比如你做一个产品经理,做一个业务人员,在跟技术打交道的时候,你知道它是会按照怎么样的思路去做下来。

其次,是围绕两个角度,一个就是我们在做产品的时候,数据怎么帮到你。另外是我们在做运营的时候,数据怎么帮到你,最后,我也会讲一个,结合互联网金融的一个场景,详细讲一个数据分析的例子。

穿越历史看数据思维

首先讲一讲穿越历史看数据思维。我本身是一个工科学生,研究的就是可以说是技术类的东西,同时我又比较喜欢历史,我对历史的东西研究也非常多,特别喜欢的一段是楚汉争霸,到近现代,最近半年我还学了半年党史,看了一段《毛选》。

在这个过程中我发现,数据分析、数据思维、大数据这些词,给人最直观的感受,是这些东西都是从国外来的,中国人自己是不提这些东西的。但不提这些东西,是不是就代表我们在这些历史上就没有人这么运用呢?我研究之后发现不是这么一回事,在中国历史上,其实有很多人,或多或少在用数据帮到他,只是他不会用数据这个词。

咱们先来看一个人物,萧何。刘邦去打败项羽,可以说依赖了三个人,一个是张良给他运筹帷幄、出谋划策,一个是韩信,给他攻城掠地,另外还有一个,就是萧何,给他治理国家,就是真正去帮助他运营的。

当时刘邦是比项羽先打到咸阳的,打到咸阳之后,刘邦手下许多都是无赖,上去之后就是抢金银珠宝去了,但是只有萧何没有干这样的事情,他是直接去了一些丞相御史家里面去,不是去抢金银珠宝,而是去抢书,抢这些材料去了、之前这种税收记录、地图、各地的统计数据,他都拿过去了。拿回去之后呢,搬到了自己军营里面去,之后就开始做研究。

等到后来项羽并没有把刘邦封为秦王,只是把巴蜀、四川那一带给了他。其实这个时候,刘邦是很愤怒的,说按照之前楚怀王的意见,那我应该是做秦王的,你现在只给了我一个边角料的地方,所以就想反了,然后其他人劝不住。

后来萧何就跟他说,你是愿意死呢,还是愿意去做一个巴蜀的王呢?他说这我怎么死了?我跟他拼一拼。他说你跟项羽去打,你的胜算如何?刘邦想一想,不行。然后萧何就给他分析,虽然巴蜀这个地方是比较偏,但是我通过研究这些材料,发现其实这些地方整个税收情况,交税,整个经营情况还是不错的。如果我们在这块,借助这块地方,我能保证带着你一块儿再去打回去。

并且给他提了一个建议,他说我发现汉中这个地方,当时叫南郑,这个地方不大,但是它的战略意义比较厉害,并且这块聚集了很多人,如果我们能拿下这块地方,那对他之后,咱们再往外打,这个就非常重要了。

结果刘邦就拿了一笔钱,金银珠宝,给了张良,张良又拿着一笔钱给了项伯,项伯又拿着这笔钱然后找项羽去了,说项羽,你看本来也没给人家做秦王,现在把南郑那一块地方给他行不行?

然后项羽这一介武夫过去就知道烧杀抢掠,根本不知道每一块地方,到底实际数据情况怎么样的。好了,就把这一块给他了。结果刘邦就几个月之后,明修栈道暗度陈仓打了过去,然后又过了几年,把整个天下都打下来了。其实这就是数据的作用。

萧何就知道要及时去收集这些数据,还要分析这些数据。那这里呢,我就总结了一下,萧何他作为一个当时的丞相,其实他是承担了很大的数据分析师的作用,他在哪些地方做的比较好呢?

我总结有三点:

第一点重视数据收集。不是说等到你要用这个数据的时候,你才知道数据太重要了。而是在开始的时候,每去干一件事情的时候,都在想这里有哪些数据我能收集起来,以备后用。

第二点,重视数据分析。不是等到刘邦说,萧何你过去把这个数分析一下,看看里面有什么结论可以用的,那不是等指导他的时候,他去做。而是刘邦没有指导他之前,他自己就已经在做这些分析了。只是说刘邦正好遇到事的时候,萧何把自己分析的结果给他,直接让他用。

第三点,提供决策指导。不只是说把这些数据呈现给老板就行,你还告诉他该怎么决策,直接提供指导性的建议,并且在这些实际建议中去付诸实践。

后来刘邦跟项羽打的过程,可以说十战十败,许多的时候都是打的光杆司令一个,但没有关系啊,萧何在关中,直接给他运钱,运粮,运兵员,让他源源不断地打过去。但是项羽呢,就是流寇,后面没有根据地,没有人给他搞运营,没有人给他搞数据分析,这个结果就是很不一样的。

“毛邓”数据观

咱再看近一点的,毛泽东很厉害,这个毋庸置疑,大家有没有想过这个问题啊,我因为做数据的,然后我最近半年又因为看了《毛选》,所以我就在思考里面到底有什么共性的关系,然后我就发现一点。

其实毛泽东在数据分析上是非常牛的。有一篇文章,至少80后应该在课本上都学过,就是没有调查,就没有发言权,那是一个节选,就是节选这个《反对本本主义》这篇文章。

这篇文章讲的核心观点,就是你不能拍脑袋,你应该基于调查研究,并且里面说了一句话,就是调查就像十月怀胎,解决问题就像一朝分娩,调查就是解决问题。

他讲的很清楚,许多时候,我们调查研究,做的只要足够充分了,答案有时候很明显了,但是如果你没有做这些事情,前面就来到一个地方,什么情况也不知道就拍脑袋,那这个问题就非常严重了。

大家如果看《毛选》的话能够看到,最开始几篇是讲什么呢,中国社会各阶级分析,湖南农民运动考察报告,还有包括没有加入到毛选里面的,像雄武调查,还有其他的一些调查,就是毛泽东早期的时候,其实做了很多的调查研究。

我问大家一个问题,调查是什么东西?调查其实就是数据收集。我做了这十年数据的事情,抽象来讲,数据分析是很简单的,它只有两个步骤,一个步骤就是数据采集,一个步骤就是数据分析。

其实我们许多时候,我们自己在做决策的时候,大家可以想一想,你是怎么做决策的,你是不是先要去搜集一些情况,了解一些信息,然后再去做决策,就像当年红军打仗一样,前面要攻打一个县城,你带了一个连的兵力,然后不知道前面什么情况,来,兄弟们跟我上,然后冲进去了,结果人家里面驻扎了两个团,一进去,被人家灭了。或者说,你这个看到前面一个城不敢打,说咱们后援部队没来,这个等来了一块去打,结果他实际里面可能没驻扎军队,你这个过去之后,直接就一百多个人,就把县城给拿下了。

所以这里面为什么会有这样的一个不确定性呢,这里面就是数据的差异,你掌握信息,掌握数据,跟你做决策,那是完全不一样的。

其实对于什么是数据,其实数据就是信息,什么是信息呢?现在是信息时代,信息时代是谁开创的?是一个叫香农的人开创的,香农是信息论之父,咱们现在下载一些东西都是Bit,Bit单位是香农定义出来的。他是定义了一个信息的单位,每一个最小信息单位就是一个Bit,然后他对数据做了一个定义,对信息做了一个定义,信息是个什么东西?信息是一种消除不确定性的东西。

比如说,我手里握了一个硬币,我问你,这个是正面朝上还是反面朝上,你没办法判断这个东西,你可能猜50%可能是正面,可能50%是反面。但是呢,如果给你一Bit信息,就是已经告诉你正面朝上了,那你猜的时候100%是对的,你直接就拿到这个结论,其实这里面就是有了一Bit的信息,就是因为你掌握了一点信息,然后你对这个事情的判断,要精确了很多,这个就是数据的价值,信息的价值,就是消除不确定性。

我就发现毛泽东有三点做的比较厉害的。

第一点,重视调查,没有调查就没有发言权,就是你不管干什么事,先做一下调查,不要拍脑袋,不要凭感觉去做,不要乱说一通,先调查一下情况。

第二点,就是雾里看花的本领,你收集了很多数据,收集了很多材料,往那儿一摆,然后你看着晕了,看不出门道来,毛泽东就不一样,他就看到里面一些特点。

当时军阀之间混战,今天湘系跟桂系打,明天桂系跟粤系打,打来打去,大家看不出个门道来,但毛泽东他就看到一点,这些打来打去,归根到底,是因为后面的帝国主义不一样,他们之间是争夺利益的,这些打斗的过程,其实是一个军阀割据的局面,只要他们长期打下去,中间就会有夹缝,有夹缝就有革命的根据地,就有地方,所以他就要在夹缝中建立革命根据地,这是他看到的。

等到抗日战争的时候,许多人觉得中国完了,打不过,有些人又觉得我们坚持一下,很快就要胜利了,也不出三个月,半年我们就能胜,都是这样的观点,但毛泽东总结,局面不是这样的,日本国力是很强大的,但是他个头比较小,中国是比较贫弱,但是地方比较大,这个情况,如果它打过来,咱往后退一退,打一打往后退一退,退到一定程度,他的兵力就分散了,分散到一定程度,他就强弩之末了,我们反过来去攻打他,所以这样会是一个比较持久的过程,所以他判断整个趋势是持久战。

这是毛泽东很厉害的一点,就是不只是说他去调查研究去搜集这些情况,你还要看到这些情况,这里面有一些特别的地方,就是值得利用的。

第三点,是革命乐观主义,光有前两点,整个革命过程不是说一帆风顺的,很多时候是负面的信息多,许多时候都不行了,就像林彪觉得红旗到底能扛多久,但是毛泽东看来就是星星之火可以燎原,同样一个事,看法是不一样的。

创业其实也一样,我自己创业这三年,我自己总结都是,好消息一个,坏消息一个,或者十条消息里面八条是坏消息,那你怎么办?不过了吗?这个不是这样的。你要去自己去激励自己,激励自己的团队,就是觉得这种局面一定是可以改变的。

另外,邓小平数据思维也挺牛的。1978年,解放思想,实事求是,团结一致向前看,他自己写的文章。其实邓小平确定了一点,就是以经济建设为中心。那怎么以经济建设为中心呢?他又提了一个数据指标,GDP,就看这个数,不管黑猫白猫抓住老鼠就是好猫,你只要把这个数弄上去就可以了。

咱看一看效果啊,这是我从国家统计局上面截出来的数据,1978年的时候GDP,然后到现在2017年,每年8%往前涨,涨到现在,一年产生的GDP是1978年的225倍,你说这个差距有多大。那现在当然大家觉得这个生活确实比之前好了,你说数据有没有起到作用。

虽然说,当然我们定一个指标,比如污染,或者其他方面带来了问题,但是你如果没定这些指标,你可能什么也没搞起来。

再来说一个小例子,我今年春节的时候,去参加了自己学校一个入学20周年(聚会),我1998年上高中,当时整个高中是一年差不多入学的有500多人,后来学生越来越多,因为我们是最好的县高中了,许多学生都挤到哪儿去。所以它就得扩招,越扩越多,等到最近那几年,一年收2400个高一学生,这量就很大了,后来一个学校就撑不住了,就开始分成两个学校,新校区和老校区,当时一个是老师分成了两组,然后一个新校一个老校,两个校长挑人,你挑一个老师,我挑一个老师,这样分开了,学生也分成两组,新进来的学生按成绩排名,第一名在A学校,第二名在B学校,第三名在B学校,第四名在A学校,就这样尽量平均的分开。分开之后,等到三年之后,高考看成绩,两边升学率是有比较大的差距的,那说明什么?说明整个两个老师队伍其实是有差距的,你要说学生都是平均分的学生,这是一个很简单的数据分析例子,对比AB测试。

还有我去年8月份的时候,去敦煌参加过一次创业戈壁行,就是三天走一百公里,出发的那一段,就是当年唐僧西天取经出国的那一段,很苦,整个就是戈壁滩,沙漠,在这种环境下,然后每天平均来说30多公里,跑过马拉松的知道这种难度有多难,如果没有跑过的,其实我说很难,但是你很难理解。但是大家在实际在做一些高强度运动的时候,肯定会有感觉,比如说你脚上起泡了,这起泡其实就是一个关键的指标。我当时就做了一下统计分析,一共参加了有200个人,我没事的时候,我就找他们问,我说你脚上起了几个泡,第一天起了几个,第二天起了几个,第三天起了几个,左脚起了几个,右脚起了几个,我就拿一个手机,用这个Evernote就记了一下,让大家把这个数据报给我。

我一共差不多问了30多个人,当然没有全部去问,但这里面也看了一些有趣的规律。第一天的时间平均一个人脚上起一个泡,两只脚。第二天的时候呢,平均有两个泡,第三天有三个泡,并且发现呢,右脚起的泡,平均比左脚要多一些,那是不是大家在走路的时候,右脚更容易用力呢,这当然是有可能。其实这就是用数据去说话的一个例子。我们有一个简单的数据,大家看一看,是不是我说强度很大,我用数据说话,你就知道,你自己想一想,你自己走路的时候,什么时候起脚泡了,这个强度就出来了,这就是数据的威力。

前面不管从历史上还是从现代,从我个人,讲了几个例子,大家可能对数据分析能有一个认识,就是数据分析这种东西,不是一个高不可攀的东西,它的威力,可能高到国家层面,也可能低到你生活的琐事里面去,其实数据它是一个普遍存在的东西,而数据这种方法呢,也很简单,数据采集,数据分析,采集的手段,有可能用机器去采,有可能去人工去采,比如去开个调查会也可以去采集,或者我这儿问一下,也可以去采集,但是方法也不重要。

重要的是有你这种数据思维。就是你在这些工作生活里面去,你能去想到,我用数据帮助你,去解答这个问题,它更加科学,更加理性去看待它。

数据分析的价值与现状

接下来我们就看数据分析到底有什么样的价值,然后我们现在都会遇到什么样的问题。其实我在百度,因为整个做数据过程中,又加上创业之后,我自己直接打交道的就有几百家创业公司,打交道的过程中,我就慢慢在总结,数据的价值到底是什么。我总结了两点,一点就是数据去驱动决策,就是帮助你拍板的,我前面讲的这些历史上的这种例子,都是说我有了数据之后,更好好的去做决策。

不管做一些商业决策,产品中战略上的东西,或者说我们做一些产品的迭代,产品设计,这种运营监控的事情,有了数据之后,就帮到你更好的做决策,然后比如销售,一个销售的情况怎么样,我们这种团队管理,都可以去用一些数据来说话。当然更多的就是给人去使用,有数据之后,然后你去拍板,去做这个决定。

但在我看来,这只能发挥数据20%的作用,数据更大一个作用呢,在另外一块,就是数据驱动产品智能,那什么是产品智能,或者说什么是智能,现在人工智能比较火,大家怎么理解什么是智能呢?比如说一个门,它上面装了一个弹簧,我推它一下,它开了,然后它自动又合上去了,这叫不叫一种智能,那什么叫智能呢?其实我总结智能是这么一个模式,首先有了一堆基础数据,然后在这上面套上一定的策略算法,再把结果回馈到产品里面去,这让产品本身具有一种学习能力,就是自我迭代,比如典型的例子就是今日头条。今日头条,因为你看了几个花边新闻,它就专给你推花边新闻,它训练你这个模型,你点的越多,他就知道你对这一类的感兴趣,然后把这些地方就强化,去强化你这个,用专业话讲,去做推荐。这其实就是典型例子。

比如说百度去做竞争广告,你收的东西进来给你匹配感兴趣的广告,这里面都是用了这种学习,这种产品智能的方式。所以这一块,跟前面说的去驱动决策有什么区别就是,一个是给人用的,一个是给机器用的,就像今日头条,不是说后面有个编辑,整天给你匹配到底有什么新闻,发给你,不是这样的,是它是靠机器学习,自动的做这些事情。

因为产品本身引用了数据,里面用到了数据,用到了这种产品智能的价值,那就跟之前我们去看一个新浪新闻、搜狐新闻有本质区别了,这是今日头条现在它的市值,一个估值已经非常高的状态,就是它实实在在的在创造新的价值。

所以这就是说,我们谈这个数据的价值,在我看来就这两点。那我们在想这种大数据时代,这种数据分析,对我来说,对你个人来说,到底有什么用,就是这两点。就是你要考虑的是,在你的工作,在你的生活里边,特别是工作里边,我们怎么能用数据帮助你更好的做决策呢,我们怎么能让我们产品本身,让因为有了数据,价值更加高呢,这就是我们思考的点。然后那我们真正去让一个企业去实现数据驱动,让数据分析真正帮到你,而不是说我这个公司,我能出几张报表,就叫数据驱动的,不是这样的,它是一个逐步渗透的过程。

那么理想状态我觉得是应该,一个是全决策,我们期望再一个企业里面,不管是产品也好,运营也好,市场也好,销售也好,就是各种各样的决策,大家都能用数据去说话,数据去帮到你。

第二点,就是全渠道,那我们现在,线上就不用说了,互联网这些公司,用数据用的比较好,线下其实许多时候我们是用不好的,为什么用不好呢?因为你数据采集条件不具备,许多时候数据搜集不上来,搜集不上来你后面怎么去用呢?当然这种局面,也是在变化的,现在就是各种摄像头技术,我觉得也就两、三年的时间,两、三年之后,可能整个通过图样识别去解决一些,比如咱们今天开这个会,大家不用签到,自动识别一下,就帮大家都统计出来了,这个事都会变得非常容易,只是现在这个技术还没那么成熟。但总之呢,我们会期望,怎么去把线上线下这些所有渠道的这种数据,都能给它收集起来。

第三点,就是说全流程,就是我们期望任何一个企业,其实你都是一系列的环节,你的工作都可以总结为一个流程,比如就拿我们神策数据来说,我们就是前面有市场,去吸引潜在的客户,有销售去做转化,转化之后,我们有交付团队去做交付,后面有客户成功,然后保证客户去用好,它就是一个流程的过程,那我们就需要考虑的是,这个过程各个环节,我们能不能通过数据去帮到你,然后真的让你这一块的业务变得更加的好,这就是说这个数据一个全流程,全决策,全渠道,去实现数据驱动。

但是在实际过程中,在我们真正去做的时候,问题就非常多了,比如说,你只有宏观的数据,然后我们看一些整体的情况,但是等到比如昨天,我们活跃用户数跌了20%,你又会想查,这20%到底是怎么跌下来的,那你就要去看一些细的例子的数据,比如我们按照渠道拆开,按照地域拆开,去看这些数据,但是这个时候如果你没办法去看一些精细化的数据,那你就没办法去决定到底这个问题出在哪里。也有可能是,你不同的部门,市场部门掌握了一部分数据,然后销售部门掌握了一部分数据,或者产品团队掌握了一部分数据,等到你想用的时候,要跟各个部门打交道,去审批数据的权限,等审批到了之后,又发现这个数据ID又没有打通,我们又没办法把这些数据真正的关联到一起去使用,这些都是实实在在的问题,就是它真正在一个企业去落地的时候,挑战还是非常大的。

就像我自己,我在2015年,最早考虑创业,我觉得我未来要去把中国的数据底子打好,去重构中国互联网的数据根基,经过这三年的努力,如果说开始的时候我觉得离目标有十万里,现在我觉得有十万八千里,就是真正接触下来之后,发现其实这个数据底子比我想的其实要更差一些。然后大家的数据意识呢,还是要更弱一些,这里我们要做的工作就更加多了。

那理想状态是什么?理想状态我总结就是说,真正的自助式的数据分析,就是让业务人员真正去掌握数据,不是说好一个公司里面,老板想看数据的时候,由工程师帮你跑数据,然后其他一个产品经理,运营经理想看数据的时候,就没数据了,或者提了数据之后,过一个月才给他这个结果,你说这个效率是怎么样的。

更好的情况是,我们一个公司里面,业务人员各个角色,大家想用数据的时候,都能够去进行交互式、自助式的就去完成这些事情,那这个效率就要高很多了。

那这个常见的一种模式,我就把它归结为是需求驱动,往往是有人提出来数据分析的需求,有工程师,从杂乱的数据里面想办法去满足需求,然后整个交互过程,整个周期可能花几天、几周才能满足一个需求。

更理想的状态就是我们反着来,就是我们先要有数据基础,应该把数据底子怎么更全更细的做好,去采集好,然后在这个基础上,提出自助式的分析平台,之后让业务人员可以自助式的去完成这些数据分析的事情,从一个几天去满足一个需求,变成几分钟,几秒钟去满足需求,那这个效率就高很多了。

我觉得互联网思维最核心的就是迭代,不是说你做一个东西别人做不到,而是说你比别人迭代的快,就是这个手机,比如现在智能手机,大家会觉得,好像再往前发展,没啥发展了,它发展到一定程度确实会那样,就笔记本电脑,到底发展到哪一步,下一步会是怎么样的。它一种技术发展到一定程度,会进入一个理想状态。

其实整个过程拼的就是谁更快的到那个理想状态去了。人家苹果就是比你安卓的许多手机就是更快一些,那它就能收割,就是在一路迭代的过程中,他能卖五千,你只能卖两千,所以在这个过程里面,那迭代速度快与慢,那就是取决于你整个决策过程,决策的速度是不是够快,整个在产品开发,在做运营活动,这个环节里面,是不是通过这些数据,让你比别人更精确的很快找到下一步该是什么。而不是说花了六个月踩了一个坑,然后又花三个月,又从坑里面爬出来,那你这个速度从哪里来。这里面就是我们通过这种数据驱动的方式,让你效率变得更加高。

数据分析的四个关键环节

前面讲了数据分析的价值,还有我们现在存在的问题,接下来,我们看真正的数据分析,它有哪几个环节,简单来看,数据分析就两个环节,数据采集,数据分析,实际真正在去做数据分析的业务,其实我们会把它进一步去划分,可以划分成四个环节。

第一个环节就是数据采集,我们要把数据搜集上来;第二个环节,就是说我们要对数据建模,你不能说收集过来,就一个仓库,杂乱的把他们都丢进去,等到你用这个数据的时候,发现你找不到这个数据,你想要的东西拿不出来,这个也不行,所以这个时候,我们要对数据进行组织,我们要把它规范好,然后我也方便后面去用;第三个环节就是各种数据分析方法,围绕我们做数据分析的时候,围绕比如说漏斗分析,流程分析,围绕拉新客户,围绕流程客户,围绕其他的运营事情,我们通过数据分析去帮到你,这样的方法可能说有各种各样的。再往上一层就是指标,就是一些数据指标。比如对国家来说GDP就是一个数据指标,我们不能每天都要从源头去看看数据一条一条的剥离一下,看看问题在那儿,这个效率太低了。

更多的时候我们是期望定义几个指标,把它标记出来,然后我们就看着几个指标,如果没问题,那就问题不大。就像开车,前面有个仪表盘,仪表盘里面不亮红灯,开吧,问题不大。这指标就起到这么一个作用,我们把许多事情去简化了,通过几个简单的数,我们就知道整体运营的情况。

那我们先来看这个数据采集,大家都听过大数据,什么是大数据呢,我们怎么理解什么是大数据?其实这个问题,因为我自己就是从事大数据的,经常会有人问我,我回老家,一些亲戚,他们什么硬件、什么软件都不知道,现在又来了一个概念大数据,给我讲讲什么是大数据,你说我怎么跟他讲,讲起来难度是很大的。但是我也一直不断的在总结,也是在看书,包括对我影响比较大的是吴军,吴军讲《浪潮之巅》,讲《硅谷之谜》,讲许多东西。

其实我都在思考数据,什么是大数据,现在我对大数据的理解,两个层面,一个层面是从价值的角度来看,就是我前面讲的数据分析的价值,就是驱动决策和驱动产品智能,那是从价值,如果从物理层面呢,我又把它总结成四个字,就是大,全,细,时,就是数据分析这个概念,不是一个新概念,他可能已经存在几百年了,两三百年肯定是要有的,因为统计学出来的更早。

现在我们提的大数据,跟之前又有什么区别呢?其实就是说底层的数据源变了,其中一点,就是大,那大是什么大,比如说,我们把全国各个地级市今天的苹果价格,这个数收起来,每个地级市收一条,这个数一共加起来,可能两道大小,但是相反,我们如果把内蒙古草原上一台风机,它的振动数我们收集起来,一天可能有50个GB,因为那个数大?可能是内蒙古风机更大,是不是?但是内蒙古风机在我看来,它不是一个典型的大数据场景。因为你只能看到这一个点,就是它的情况你可以了解一下。但是,如果我们全国各个地级市苹果的价格,我们有一车苹果要运到哪儿去,你就可以做一个智能的调动系统了,这个价值就要大很多。

第二点就是说全,就是你许多时间了解一部分数据,你这个答案是有问题的,你可能偏了,你比如说去年的时候美国大选,大选之前,整个结果就是希拉里获胜的概率70%多,川普获胜的概率20%多,整体整个市场,它网上的调研,许多都是这么一个结论,结果出来之后,川普赢了,许多人都在分析问题出在那儿,后来分析其中一个原因就是美国中部许多农民,这些农民是不上网的,但是他们是支持川普的,你光在网上做这些调研,那你能调研准吗?实际情况你没调研准。

在我们实际工作中也是一样的,有时候你就是只看了部分的数据,或者有时候觉得老板不公平,老板就听谁说了两句坏话,就按照他的思路来做了,那这里面问题出在哪,就是因为你没有去把这些数据很全的搜集过来,你只是看了一部分。就像最近我在看一本书,叫《原则》,《原则》里面其实讲了一点概念就是极度求真,极度透明,就是说我们要把这些信息,尽量真实的去搜集起来,实质情况收集起来,尽量让大家共享出来,大家都能看到这个数据,咱再基于这个数据再去做决定,不要自己看了一两条信息,听了片面之词,然后就去做决策了,那种决策是不是就很容易出问题呢。

第三点就是细,比如说,咱们许多都是做业务的,我问大家一个问题,在你们公司业务里面,不同身高的人,他们在消费上有什么区别?你可能回答不了这个问题,为什么呢?因为你没有搜集身高这么一个维度,你后面就没有办法做这个分析了。所以说同样是数据,如果我们掌握的这种维度比较多,我们就可以围绕这个维度进行交叉分析,看里面有什么样的规律,然后去研究他,但是如果没有搜集,你就做不到这一点。

第四点,就是时,时效性,同样一个东西,同样一个数字,现在告诉你,跟两年之后告诉你,结果能一样吗?它是很不一样的。比如说美国发生金融危机了,如果你提前半年知道金融危机,你就可以做空,或者做多一些东西,你是不是就可以利用这个价值。双十一,然后你上午投的广告,很快发现效果不行,马上就调,这个广告不要投了,换其他渠道去投,是不是就省着等到当天晚上12点的时候,你发现咱们其实投错渠道了,这渠道根本没用,这是不是同样是一个数,时效性他这个作用是不一样的。

那这个前面是说数据,我们其实真正去做好数据,就是在考虑,如何去把数据更全更细更加时效性的收集起来,这是一个基础。

那收集数据有什么样的手段?因为我的背景主要还是做线上相关的,线上在数据采集的时候,我总结有三种方式。可能有一些偏技术的,大家简单了解一下就可以了。

一种就是通过可视化埋点,全埋点这种方式去自动去给他收集,然后去填进去,然后让他自动去采,这种方式好处就是不需要工程师过多干预,让这些产品经理,运营经理,自己需要就在上面配就可以了。

但是呢它有它的弊端,弊端就是数据搜的不够细,比如来说右下角有一个提交按纽,左上角有一个打七折,自动搜的时候,不知道打七折是一个有用的东西啊,但是你如果分析的时候,这就是很关键的一个因素。

第二种就是一个代码埋点,我们去在程序里面,客户端也好,服务端也好,在它关键逻辑里面,去嵌入进去,比如来说,用户提交了,提交运费是多少,成本价格是多少,这些都是维度信息,我们都去把它记录下来,记录下来之后,你做分析的时候,就方便了。

并且你许多时候采集数据的时候,从前端采跟后端采它是有差异的,为什么呢?前端容易丢数据,用户进行交互的时候,可能网络断了,网络不通畅,那可能就让你丢失了一页数据,但是另一方面,通过后台,如果这些系统之间,后台服务器之间交货,可能就没这个问题。

第三种就是说我们用工具导,比如来说你数据库里面的数据,比如说你从第三方拿到的数据,或者说你线下人工去输入的数据,其实这些都是有价值的数据,你也要把它引入进来,你就用工具去批量的,实时的把它导入进来,这就是互联网数据收集的方式。

然后当然线下会有一些区别,线下比如说通过摄像头,通过WIFI信号,通过红外线,通过其他等等,通过激光,通过各种方式去搜集,但本质其实没有区别,都是说我们要想一些办法,通过一些手段去把数据收集起来。接下来那就是数据要进行建模,进行组织,那正常来说,其实我们公司业务,你后面都会有一个数据库,数据库里面放了很多张表,表里面比如这个定单表,或者用户表等等,这个表里面存在了很多有价值的信息,那当然我们可以要求业务人员,你学习一下使用数据库吧,你学会使用SQL,怎么去做分析,那这是一种方式,当然这里面对于许多业务人员掌握这个东西太难了,因为你经常变,后台这些数据经常变,变了之后,后面就没办法去用这些东西了,所以我们要对数据进行一个再组织,对于互联网这种产品来说,比较好的一种方式,就是多维数据模型,就是OLAP。

比如说,这个是维度,这一个概念,比如北京,天津,上海,这是城市的维度,他有一些曲直,然后操作系统,他有MAC OS、IOS、安卓,它也是一些维度,然后这些维度之间可以交叉,交叉之后呢,可以去看一些指标,比如销售额,注册用户数,这样的话,就是我们不只是说能看一些宏观的数据,还可以看一些精细化的数据,比如来自天津的使用IOS的数据是怎么样的,注册用户数是怎么样的,这样的话,就是说我们又能看宏观的,又能建森林,又能建树木,那对你去做决策,价值就大很多了。

然后对于互联网产品,其实都可以去做一些抽象,比如用户去注册,浏览,下单,支付,收货,这是一个典型的电商的一个产品流程,其他的,互金的等等都是类似的。那在这里面呢,我们就需要去把用户,他进行的这些动作,都给它记录下来,包括一些维度,时间,地域,渠道,商品类别,商品单价等等,这维度都记下来,记下来,就形成下面这种表,一张宽表,有这个维度之后,我们就可以分析了。比如想分析来自江苏省的,然后看这个小米平板的,这些人到底有多少,你就可以灵活,但是如果你这个维度信息没有记录下来,你后面是不是就没办法做这个分析了,这就是说对数据要进行建模,就是进行组织。

之后就是数据分析,其实数据分析这种方法,有各种各样的,毕竟它不断的在扩展。那我们可以去从广度、从深度上来去看。广度上来说,我们是看一个用户的,还是看一组用户的,还是看整个全体用户的,这广度是不一样的。另外是深度不一样,我们是看一个用户的某一类操作,比如浏览操作是怎么样的,还是说我们要看这个序列,它先浏览,再支付,再收货,有这些序列行为的,这又是一种思维方式,就是分析方式。所以就是说我们会有各种各样的分析方法,解决这些各种分析的广度深度问题。

咱看一个简单的例子,这也是之前的一个例子,就是开眼,开眼是一个视频APP,他们当时就发现一点,他们去朋友圈,去微信群去分享的一些视频,但是真正去下载的时候发现安卓这种APP下载率是要远低于IOS这种APP的,然后他们就想分析这个原因是在那里,这个时候呢,那最直观的感受,我们就要切这个数据啊,看看安卓过来的,他们再切分一下,看看是不是有哪些渠道跌下去了,或者有其他这种特殊的维度带来这个问题,他们当时就做了一个分析,按照屏幕的宽高去拆开,然后拆开之后,就发现有某些屏幕宽高的下来率几乎为零,这个量是很低的,然后他们就去还原这个场景,还原之后,发现这种屏幕宽高的情况下,左边下载按纽是在第二屏的,第一屏就显示不出来,然后用户得翻下去才会下载,这时候自然点击量就低了嘛,但这些情况就是如果你不进行这种多维的数据分析,你就不知道问题在哪,这就是说,这种多维的数据分析带来的价值。

另外呢,比如来说我们做留存分析,我们其实许多时候花了钱,把这个用户拉过来,咱可不是想这个用户来了一次就走了,就再也不过来了,就这一锤子买卖,其实我们期望的是他后面会不断的留下来,比如次日他会不会过来,次周会不会过来,次月会不会过来,我们期望每来一个用户,巴不得他一直过来的,所以这个时候呢,我们就可以去做这种留存的分析,但是后面我会详细讲这一块,然后可以分渠道,比如不同的渠道,这个用户的留存是怎么样的。

然后我们也可以做这种漏斗分析。因为用户比如来说到你这个官网去浏览,去注册,然后最后购买,它都是一个流程,这个流程里面,它会进行一步步的,它是一个漏斗,一环一环的往下漏下去的,那可能某一个环节,用户就卡到哪儿了,卡到哪儿导致大量的流失,如果我们没有去做这个监控的话,我们不知道,我只知道这个整体这个用户好像来了之后没啥用,但你不知道某一环节,就是因为你那里让人家绑定银行卡,人家没绑定,就导致很多流失了,这个时候呢,我们就需要做这种漏斗分析,去解决这个问题。

数据分析的指标体系

再往上一层那就是指标,我们去看一些数据的时候,我们还是不能说什么事都自底向上这么搞一遍,那这个效率太低了,我们还是期望平常针对这个业务,去把它抽象一系列指标,在互联网另外有一本书,我推荐大家可以看一看,叫《精益数据分析》,它就是讲互联网产品如何做数据分析的。

他里面讲了一个核心观点,就是第一关键指标。就是对于一个产品来说,你在一个阶段,不能胡子眉毛一把抓,就是什么东西都抓,就像邓小平在搞中国建设,社会主义建设,他就抓一点,经济建设,以经济建设为中心,其实我们创业更是如此,你什么也想要,那你能得到什么,那这里其实就有一个问题,比如说你一个团队,大家对这个目标的认识,这个指标的认识是不是一致的,

我曾经做了一个调查,这是我去服务的其中有一个客户,它是一个在线教育产品,我说你们现在最关心的指标是什么?三个人,我说你们各说各的,一个说日活,一个说订单量,还有一个说访问深度,就是平均关键行为次数,然后我说,其实你看咱们就这么小的一个团队,其实大家的思路还是很不一致的,不一致的时候,大家努力的时候,去花工夫是不是花到不同点子上面去了,那所以这个时候呢,就是我们需要有这样一个第一关键指标,或者北极星指标,这个指标咱全公司这个阶段就是围绕他的,咱就提升订单量,好,大家努力,都是怎么去把这个订单量。创业公司嘛,你很小一个团队,更是要集中火力,大家围绕一个目标去努力。

我觉得它有三个阶段,你比如最开始的时候,你MVP,就是你产品没成型,就是在做一个Demo的时候,做一个最小可用产品的时候,你关心的指标是什么,等到你快速增长的时候,你关心的指标又是什么,等到后面你用户基数已经非常大了,你关心的东西又是什么,其实这个每一个阶段,它是不一样的。我们要考虑,我们自己的产品,我们自己的业务,现在所处的阶段是怎么样的,我们到底最关心的是哪一个,让大家集中精力,围绕这一点去做,比如像三只松鼠,这是一个在网上去卖零食的一个APP,那它比如刚做出来这个APP,还没什么用户,它应该关心什么指标?或者像Keep这样的产品,它已经用户数一个多亿了,在这种情况下,它关心的指标又应该是什么样的,其实它就会不一样。你不能说别人关心什么,你在你自己产品里面也这么去用,那这就完蛋了,这就是说你用的力,使的点是不对的。

刚才是讲第一关键指标,我们找最关键的指标,那另外一种思路呢,就是我们按照运营的五个视角去看,这种呢,就是海盗指标法,就是这个PirateMetrics,这是2007年的时候,一个叫Dave McClure一个人,他提出来的思路,到现在过了11年了,其实一点都不过时,我觉得他这个抽象还是非常牛的。

这里围绕用户,我们可以抽象成五件事情:

第一件就是触达,比如我们做广告,让客户知道你。

第二点事情激活,怎么让用户变成你真实有效的用户。

第三点就是留存,我们怎么把用户去留下来。

第四点是引荐,我怎么去让老用户给我推荐新用户。

第五点就是营收,我们就不用说了,最关心的可能就是钱了,我们整体销售额情况怎么样,这些自然就是跟数去打交道的。

这是他2007年的时候画了一个图,我直接拿过来了,其实就是当时因为也移动互联网也没发展,其实这个用户比如通过PR啊,通过SEM、SEO去把这个用户获取过来,获取过来最后想办法去把他转化,比如变成一个注册的用户,然后之后呢,我们想着怎么去把他推荐其他的用户,去让他留下来,再从他身上赚到钱,这就是说,他牵扯到这个环节,那这个环节呢,我们都应该用数据去监控起来,看看我们这个产品,到底那个环节出问题了。

比如一个互联网金融的产品,我们围绕用户触达,激活留存等等,这些各个环节,其实我们都能定义出来一系列的指标。然后通过这些指标,我们就可以去监控整体去监控这个产品,不然的话,你只是凭感觉,我今天想到我们应该看看这个数,明天想到看看那个数,那你都不会对你的产品建立一个系统的监控,系统的监控,就是按照这种方法论去梳理,去看你到底那些指标,哪些关键环节出了问题。

如何“激活”用户

前面其实就讲了整个数据分析的四个环节,这个环节大家大致了解是怎么一回事就可以了。接下来咱们看一些具体的例子,然后看实际过程中,我们到底怎么去用数据。

首先来说产品迭代,那我们想一想,我们正常怎么做产品,是不是可以总结这么一个模式,就是我们拍脑袋想到一个点子,做了之后,再拍脑袋,再想到一个点子,再继续做,基本上就是你这个过程,这个过程呢,对于一些牛的人,确实挺厉害的,就是他总是能拍对,他的感知很牛,他许多时候,他能去做出来。

但是对一个新手呢,让他拍一下,错了,拍一下,错了。有可能经常做一些错误的结论。那这为什么会这样呢?就是因为咱开始讲那个问题,你没有利用数据思维嘛,有没有有什么东西支撑你,让你拍的更准一些。

这里面我们就需要用数据分析,我们要把这两环变成一个三环的过程,就是首先我们去学习,学习不管你从经验,或者说从其他方式中,有一个原始的起点,然后我们学习,有了一个点子,然后开始研发这个功能,研发功能之后呢,不是马上就去做新的点子了,去提新的功能了。

而是我们要做数据分析,我们做的这些功能,我们要用数据去衡量一下,到底符合不符合预期,然后哪些地方,哪些环节有问题,然后我们要把他做一个分析,分析之后呢,我们又得到了一些新的点子,在这个基础上,我们再去开发新的功能。所以这个过程,就让一个拍脑袋的过程,变成一个科学决策的过程。

互联网思维核心是迭代,迭代也是有科学依据的,就是你许多事物的发展,就是一个螺旋式上升,它是通过一个往前不断迭代的过程,我们在做产品迭代的时候,就通过数据分析去引入进去,让他这个过程变成一个科学的过程。

看一个例子,比如我之前是在百度知道,后来在2012年的时候,整个百度内部都要推移动化,许多产品都做了一些APP,当时百度知道也做了一个APP,然后当时就发现一个问题,其实百度知道上很多都是中小学生提问题的,就是他们问作业,发现里面有10%的人是问作业的,这就是通过数据分析发现了规律,发现了之后呢,我们就可以对产品做一个改进,怎么改进呢?我们加个按纽,让他专门问作业,点一下就直接问作业了,回答问题的人,也能直接去回答这个问题,这里显示有一点问题。后来加了这个按纽之后,就发现有30%的问题量是作业相关的,不是说人家之前问周杰伦的变成问作业了,肯定不是这样的,就是之前那些问其他的还是在正常的问的,但是问作业的就变多了。

有了这个数据之后,就可以进一步往前迭代了,于是专门做了一个APP,叫作业帮,专门就让你问作业了。结果这个产品独立出去之后,半年的时间,增长了500%,现在也是从百度分离出来的一个创业公司,发展的也非常好。其实这就是说,因为有了数据,然后你及时对一个公司来说做这个决策,它都是有据可依的,不是拍脑袋,凭感觉,去做这个决策。

那我们接下来再看运营,运营是什么,其实就是我们前面讲的,因为互联网产品重要的就是用户运营,不管运营的用户也好,客户也好,都是这些,对于一个产品,其实现在我建议一些创业者,我一般都会问他三个问题:

你的客户是怎么来的?

你怎么把客户留下来的?

你怎么从他身上赚钱的?

就这三个问题的,这三个问题我问了之后,我就大致知道他这个业务情况怎么样,这个运转的是不是良好,问题出在那儿。

这里面只是把那三个问题细化,就是细化了一下,比如触达,激活,引荐,这些都是如何获客的,留存就是怎么把客户留下来的,营收就是怎么赚钱的,我们在这种分析的时候,我们做运营活动的时候,就是在关心这些点,只是说我们可以去把它,在这些环节怎么去做的更好一些。

我重点讲激活跟留存环节。首先来说激活,我们考虑一个问题,什么是激活,比如说一个互联网金融的产品,一个用户到你这个产品里面装了APP,这叫不叫激活,或者一个视频网站,他到了你的首页,然后浏览了两下,也没看视频,这叫不叫激活?然后一个电商网站,他过来溜了一圈,然后什么也没买,这叫不叫激活,或者说一个图片编辑的产品,他上去之后,就看了几张图片,没有做什么动作,这叫不叫激活,但实际情况呢,我们看我们的市场团队,就在以我刚才说的那些方式在衡量效果的,衡量做的好与不好的,我们看市场推广,花了一些钱,就看装机量,装机量就多了,但装机了就代表是你的用户了吗?这是不一定的,有些就是被这种积分墙或者什么产品,就网上装上去了,但实际如果你分析的话,许多用户他根本没有真正去用它。

所以那什么是激活呢?不是说装了APP,启动这就叫激活了,而是说一个用户,一定要体验到你产品的核心功能,那比如说12306这么一个产品,必须说买了票,他才知道12306原来这么有用。一个视频网站,必须让他看视频,看5分钟,他如果不看5分钟,他那知道这个产品好与不好呢?质量怎么样呢,所以这个过程,就是我们说所谓的激活,就是我们要千方百计想办法,更快的让客户感知到你的核心价值。

那我们在做一些市场活动的时候,我们在做一些运营活动的时候,就要以这个为目标,我们怎么能以这个去衡量,我们做的到底好与不好,不要只看一些虚的,一些虚荣的指标,实际到后面就打架了。比如市场团队觉得这个拉了很多线索,然后销售团队觉得你这个拉的什么线索,一个也转化不了,市场觉得销售你这个销售能力不行,销售觉得你市场这个做的不行,那为什么会出现这样的问题呢?关键是没有衔接起来,中间还差个坑呢,他光把APP安装了,就觉得市场就觉得完成任务了,销售后面还要做很多事情呢,这个体验的用户,他连体验都没有体验,感受不到这个核心价值,那你怎么去做这个,到后面去转化这个就非常难了,这个客户也不容易留下来,所以我们就要去思考,我们怎么去把用户去有效的激活起来。

这里面其实围绕这个用户激活,我们肯定能通过一些动作来去衡量,就是在一个产品里面,比如来说播放视频,超过5分钟,或者说他要发消息,就是说我们都有一些关键的动作,我们围绕产品,对这个用户的研究,我们会慢慢的就会发现,只要做了这些关键的动作,用户就更容易留下来。这里就会产生一个概念,或者一个称号,就是Magic Number,这个经验的数字,比如这个实际的例子,比如像Facebook,Facebook研究之后就发现,一个新用户,如果他十天之内关注超过七个好友,他就更容易留下来,更容易变成一个有效的用户,如果一个Twitter帐号,如果他follow了超过30个用户,他就更容易留下来,去观察他。

还有像Slik这样的产品,一个团队里面,他如果发送超过2000条消息他就更容易变成一个有效的团队,就是一个企业用户,大家思考一下这个背后的原因。其实你像Facebook,它本来主要是看朋友动态的,如果你连个朋友都没加,你看谁的动态去啊,这个Twitter,它是一个发新闻,或者说这些信息的,然后你都没关注人,你看什么新闻啊。Slik是一个团队协作的,都没人发消息,没人陪着你一起去,互相的交互,你能变成一个有效的用户吗?

其实看着很神奇,背后一个原因就是说,我们真的让用户变成一个有效的用户,让他尽快的体验到你产品的核心体验,所以我们要引导客户,赶快加好友,赶快让他follow一批人,赶快让他发一些消息,邀请他的同伴,让他们过来一起去聊一聊。所以通过这些过程,就是说我们让一个用户变成一个有效的用户,这就是激活。

以神策数据自己的官网来说,我们官网这么一个产品,然后用户来到这里可以浏览一下,看一看,可以体验我们的Demo,那你说,这个用户什么叫激活呢?他到我们官网浏览了一下,在百度上搜数据分析,然后跳到我们网站,这叫不叫一个激活的用户呢,那肯定不是了。他过来之后,注册之后,叫不叫呢?可能还不是。那我期望的是他要体验我们的Demo,那所以我们对一些产品改进的时候,我们就是要衡量这个东西,你不能衡量只是浏览量,好,我们上来一个新页面,看他浏览量是不是变多了,就觉得这一次改版是成功的,那这就不对了,我们一定要去衡量,我们一些关键的行为.

比如提交申请,这么一个过程,当然其实这里还是只是一个层面,我们可以更深的一层,比如到他这个体验Demo的程度,我们去把这些环节给他通过漏斗分析去记录下来,记录下来之后我们就分析,新上的这个版本跟老的版本,它之间是不是有一个大的变化,是不是真的在一些环节提高了,提高之后,那我们说,这次改版,它是值得的。

所以这个就是说我们关心的指标,在一些特别是引流,吸引新用户的过程中,我们就要千方百计把这个用户去,真正转化成一个有效的用户,这个有效的用户怎么定义,那不同的产品有不同的定义方法,还要结合自己的产品来去体验。然后前面讲的激活,激活是对用户触达,到变成一个真实的有效的用户,里面最关键的环节,我们要想办法,让它变成一个激活的。

如何把用户留下来

接下来一个问题就是留存,就是我们怎么去把客户留下来。那什么是留存,刚才我也给大家讲了概念,比如次日留存,周留存,复购率,这都是留存相关的指标,就是我们期望他不断的留下来,这个不断的回头客。对于留存,我们应该做什么?我总结有三点,第一点要关注留存,第二点要提升留存,第三点要利用留存。

首先来说,关注留存,我们为什么要关注留存,这里面就有一个简单的公式,我们是期望客户获取成本,是小于客户生命周期价值的,这个道理很简单,我们花一百块钱买了一个用户,结果你只能从他身上赚50块钱,然后你亏了50,这就是许多2014年的时候,O2O这些项目就是这个结果,做一单亏一单,做一单亏一单,做得越多,亏得越多,这其实就是问题。

我们许多时候我们是花钱买用户,但我们买用户是一个前提条件,我们是期望最终能从他身上赚到钱的,那这里呢,就是我们期望LTV,就是客户生命周期价值,是要大于这个CAC的,所以这里面呢,如果它大的,那我们就能够让客户,每一个客户过来,我们都是一个正向的滚动,相反那就是越来越亏,所以这个就是说一个基本的观念,所以我们要关心这个用户的留存。

比如来说像Keep这么样一个产品,它头一年半涨了5000万用户,Keep也是我们自己的一个客户,发展的非常好,反正我自己锻炼的时候,经常用Keep,就是那这个用户来了之后,那你其实不只是说来了,大家知道健身,瘦身这些东西是很难坚持的,装了APP,3分钟热度,练不了几天就坚持不下去了,那其实这个留存率就没那么好了。那所以我就看到这个Keep这样的产品,三天两头改版,引导上,激励上,他想各种各样的方法,怎么能激励你,让你留下来,让你坚持下来,然后给你换不同的花样,这个就是说你要去做这样的事情,挖掘这个用户整个生命周期的价值。

第二点就是提升留存。我们怎么能把留存提升上去,核心点其实就是两点,我觉得第一点,就是满足客户需求,你这个东西得是有用的,第二点,提升用户体验,实际上第一点就很直接,就是如果你这个东西没用,你即使通过一些花招的手段,把用户吸引过来,骗上来了,你觉得他会留下来吗?

2015年的时候发生了一件事,有一个小的产品叫足迹,就是发了一个电影海报一样的东西,下面加了一句话,你就可以把一张照片做出这样的一个东西,当时火了一阵,但后来没消息了,为啥没消息了呢?就是这个产品太单薄了,你发两条,体验了一下挺好玩的,然后玩了一下之后,你觉得没啥用啊,你不能整天发那个东西,然后那接下来呢,这个用户用的动力就没那么大了,所以许多产品就是这样,如果你给客户带来不了价值,用户用你没有什么用,他为什么要天天过来呢,为什么要反复去用你那个东西呢。

另外,就是用户体验要好,那有用还不行吗?还得有用户体验。这个问题就在这里,就是互联网产品,往往不是你一家来做的,往往是一堆在做的,你要做个共享单车,一堆做共享单车的,然后你要做个充电宝,哗一下,全地球都在做充电宝了。它许多时候,是有很多家做同一件事情,互联网的竞争它有一个特点,就是它不是零和一的竞争,就是有的东西只有你能做,别人做不了,往往是大家都能做,但是这里有区别,有的是60分,有的是90分,最终90分干掉了60分,不是说你做一个60分,人家90分,6比9这个市场份额,往往是1比99,你就只能占一丁点,所以这里面呢,就是体验要好,除非你这个产品是12306,独家的,垄断的,你不用我不行,你不用我,你就没办法买票了,这个它只要满足有用就可以了。

即使如此,大家有没有发现,大家发现12306迭代的也不错,最近我看加了一个功能,可以选座了,之前就不能选座,人家也是在想着怎么去把这个产品体验做得更好一些,所以许多时候,大家想着要国家有一些公共设施做得不够好,就千方百计先让他引到网上去,先按照互联网的玩法玩起来再说,玩了之后呢,就能改了,就有一个迭代的基础了。

那我们怎么去提升留存,其实提升留存有一些各种各样的手段,当然我这里只是随便列了几点,这个没办法穷尽,可以说有各种各样的方法,围绕你自己的产品去考虑。

比如来说做消息推送,我们到月底了,发现月活没满足需求,给他们推个色情新闻,哗一下这个量上起来了,但是这里有伤害,你光推这些东西,许多人一看,我又不喜欢看这些东西,我又给你卸了,把你这个推众给关了,你这里就得不偿失了。

其实这里面每一条动作,你不要觉得给客户发一个消息是免费的,然后这是没有成本的,其实你伤害的是客户的感情,这里面你要衡量成本,衡量价值,就是你到底给客户带来多大的价值,多大的伤害,需要评估这个东西,不能乱来。另外就是前面讲的魔力数字,就是激活的用户更容易留下来。

我们在分析留存的时候要考虑,我们怎么能让用户真正的使用起来,这是一个前提条件,所以我们要去改进产品的体验,要让这个过程更加流畅,让他更快的体验到产品的核心功能,那比如来说用户分群,我们要针对一些不同的用户,采用不同的策略,比如之前频度非常高的,现在频度忽然变低了,针对他们采用一个策略,或者说之前没怎么用的,现在忽然用起来了,针对他们又要采用什么样的策略,就是要把它用户分起来。

运营这个事情,理想状态就是针对不同的群体采用不同的策略,最极端的情况就是针对一个人采用一个策略,然后通过这种方式,把它定制化的去操作,去运营,比如流失的挽回,比如一些用户,已经半年没过来了,给他们发个优惠券,或者说采用一些搞活动,给他们打个电话,去咨询一下,通过一些方式,把这个用户去吸引过来。那这里就有一个问题,那留存到底提高到多少,我们当然期望一个用户来了就被黏住了,就像这个滚雪球一样,只要粘上去,就掉不下来了,这是理想状态,但是实际状况呢,没那么理想。

许多时候,只要有一步操作,就可能流失一部分,那到底提升多少算好,这个没有一个绝对的标准,我们基本上业内的标准就是涨到不能再涨了,并且是不同的产品形态,它这个标准也是不一样的。你比如来说对于微信这样的产品,一个月里面,有25天活跃,这就算一个不活跃的用户,但是对京东这样的产品,一个月你过来4次,这就不错,这就是一个好用户,所以你不能把这种不同的产品形态给它硬是对比,对比这个留存率,人家留存率80%多,我的怎么才5%呢,你5%说不定也是行业内最好的了,还是要同类的产品去比较,然后去看,到底多少算好。

如果留存提升不上去了,怎么办?我们还可以去利用留存,去利用它的一些规律,然后从这些规律里面去发掘这个价值,那比如来说,像Worktile这样的产品,他们其实就发现一点,就是这个周留存率比较高的这些用户,他就更容易变成一个付费的用户,那好,销售资源有限,然后就针对这些用户,专门给他们定制化的,给他约访,然后请他吃饭,或者各种方式,然后给他去做交流,然后把他们想变化去转化,这样就更加精准了。

你不是说胡子眉毛一把抓,都给大家一样的服务,那你许多都浪费掉了。那再比如我们自己的官网,这些用户到我们官网上去申请体验Demo,我们这个数据上就发现,第一天有70%的人会体验这个Demo,第二天变成百分之十几,第三天变成百分之八点几,第四天就低于5%了,后面就不怎么用了,不怎么体验了Demo,那这告诉我们什么呢?我们必须在前三天就应该联系他了,就应该跟他打交道了,如果过半个月再跟他聊,人家早就忘了,早就不记得在你上面用的怎么样,然后有什么样的问题,早就忘了。

所以你的产品,留存的规律是怎么样的呢,你要利用这种规律,这种规律怎么能帮到你,你要去利用这种用户的动作的特征,或者说你发现这个用户,一直没过来了,忽然之间又登陆了一次,十有八九这个要变成真实的用户了,你要把这种用户给他捞出来,要单独的去处理。

所以我总结一下,这里面咱做运营的事情,业内的一句行话就是先做好留存,再做拉新,就是说许多时候不要急着去做大规模的推广,怎么去吸引更多的用户,你要考虑如果你用户吸引过来都跑了,你不就是狗熊掰玉米,掰得挺多的,但是最后就留了两穗,但是如果你留存做得好,就变成滚雪球了,你是越滚越大的,你老的都被黏住,这个威力就非常大了,那另外一句话呢,就是留存的前提是激活,这是我自己总结的一句话,就是一个用户为什么更容易留下来,就是说你要先想办法变成一个激活的用户,就先让他体验到你产品的价值,只有体验到你产品价值,最终才容易留下来,这是我总结的这两句观点。

好产品要学会减功能

接下来咱们去看一个行业的案例。然后比如来这个互联网金融的,最近这几年消费金融都比较火,这一块就是说咱看都要关注什么东西,你对一个互金产品,可能要关心用户运营,每一个都是钱相关的,每一个客户你可能花一千块钱买过来的,你能不好好运营他们。

这些用户的转化,我们去通过一些渠道来的用户,他转化情况怎么样呢,来了一个新用户,我们出了一些理财产品,他整个转化过程是怎么样的呢?是不是有许多人都买了呢,这个过程跟其他第三方去进行交互,有这个资金端,资产端,之间交互的通畅度是怎么样的呢?我们是不是要去做分析,然后这些渠道,不同的渠道情况怎么样的,我们去搞了一些活动,它又是怎么样的。

我们要通过各种各样的视角,我们需要去分析,这些过程都需要用到数据,我们想办法用起来它。然后我们可以围绕一些产品,围绕用户,围绕一些标的,我们去定一些指标,去监控他们,去分析他们,比如围绕这种产品的,整体日活啊,这种PV、UV,还有产品注册率,开户率,转化率这些东西,用户这一块,投资的用户,或者说复投的这种情况,我们要去定一些指标出来,然后去整体的去监控到你这个产品。

然后我们就可以看一看怎么去优化他,比如说这是正常的一个互联网金融类的产品,用户来了之后,比如先去激活,这里的激活不是我定义的激活,而是说正常行业内一般是这么定义的,反正装了APP启动,这就叫激活了,总之他启动了。

启动之后呢,开始注册,注册之后开户,然后充值然后投资,这是一个正常的流程。那这个流程里边呢,每一步可以说用户都可能流失掉,比如说正常的一个产品,这是一个互金的产品,开始一般一个产品安装之后,他会有一个欢迎页,有些连让你跳转出去都没有,你得看完,那我这里就问大家一个问题,你说欢迎页有用吗?就是你会看欢迎页吗?你装一个APP之后。

许多时候我都是跳过去的,并且你看这个欢迎页,你翻许多都是拼凑出来的,可能就是产品经理觉得我们应该有个欢迎页,在反正上面填充点东西,就这么做上去了,但是你们要知道一点,你每多一步操作,用户都会在这一步有可能流失掉。

所以如果让我在看这个问题,那就要考虑,是不是这些欢迎页是没用的,我们是不是要做一些数据测试,去对比一下,有欢迎页跟没有欢迎页,他们之间有什么样的差异,或者欢迎页,我们是不是对有些用户,他不想看的,能够让他很快的能跳出这一步来,那我们要对他进行改进。

等到他进到这个产品之后,那你想引导他什么,你想让他更方便的登陆,还是更方便的注册,还是更方便的购买,这个环节我们都要去进行研究,那其实这就是这个当时我们分析这个问题之后,就对它进行改造。

比如来说最简单的,我们这个欢迎页,每个页都让他可以跳到注册这个页面去,不要让用户找不到,翻翻翻,翻到一定程度还找不到入口,我前一段还看了一个银行类的产品,前面欢迎页七页,中间根本就没有跳出的地方,或者有些就把那个跳出设的很小,你点点错了,就这个情况,我不知道你目的是什么,你目的难道不是为了让用户真正更快的体验到你的产品核心功能嘛,还是说你想设置一些障碍,让客户像玩挑战赛一样,非得做很多挑战,才能体验到你这个产品的价值,所以通过这些改进之后,我们就发现,这个数据从之前这个百分之九十三点几转化,到后面变成百分之九十九点几,那你这些改进其实很简单,但是它的效果,威力是很大的,你就轻松的做了一点操作,然后到后面,你就让整个用户情况,变得好很多。

另外呢,就是通过这个数据分析发现,许多用户,我们本来是想一个新用户他过来之后,点注册,然后注册之后,然后去做其他的一些操作,后来发现许多用户点到了个人中心,点了个人中心之后,他又没找到注册,又做了一些操作,这个过程呢,如果我们去看到这些数据,就发现你做一个产品经理,你就需要考虑了,这跟你设想的一样吗?这用户的操作流程,跟你想的是不是一样的,所以你要去引导,你要去改进这个产品,怎么能让一些客户按照你所设想的一些思路去改,比如来说这些新手,围绕这些新手的,我们就给他突出一点,还有前面这个Banner,就是说这上面,大家用一些APP,可能都能感受到,APP上面有几个滚动的广告图,你会看那个广告图吗?其实很多时候你是不看的,所以这里面许多时候,我们看了一些想当然的功能,做上去,但不代表它真正有用。

这个过程就是我们在做产品的时候,是要去做数据分析的,通过这些数据分析去看,到底问题出在哪里。比如来说,我们是以新手引导为目的,那我们就把新手引导这一块要做的非常突出,我自己出国的时候,我就对比,比如去美国的时候,谷歌的Uber,还有谷歌地图,这些产品跟国内的一些产品之间的差异,我发现一点,就是美国那些产品设计的时候,他追求一种极简,就是尽量让那个操作一眼就看出来,就那一个按纽,好购买,整个页面就出来一个按纽,购买,点一下就可以了,做这个操作就可以了。

而国内呢,许多东西就是做的花里胡哨,就生怕你找到那个你想干的事,这里面为什么会这样呢?其实你没有数据支撑,都是凭感觉在做的,就是你根本,这个我总结就是一个初级的产品经理就知道加功能,也不知道减功能,反正一直往上加,有客户提需求我就加上去,有客户提需求,那牛逼的产品经理,他就知道减功能,你比如说像微信,微信之前往下拉一下,是让你拍短视频的,后来发现这个东西经常许多人误操作,然后微信就干脆把那个禁掉了,你往下拉也拍不了短视频,但是现在变成显示小程序了,那又用于其他作用了。

就是说一个好的产品,那绝对不是说只加功能不减功能的,肯定还是要去研究这些东西,哪些东西对客户有用的那留下了,没用的让它靠边站,或者就把它下线掉,要做这样的操作。

那我们也可以去分析这个用户的路径操作,就是你要分析这个用户,他一步一步怎么操作的,然后那个环节是怎么样的,从全局上去跟踪他,这个我就不详细讲了。

那还有这个用户,比如来了之后,我们一个用户注册成功了之后,我们是不是想着用户,赶快去购买点东西呢,你在这个流程里面,要做对应的引导,让他做完这一步,就紧接着顺畅的到下一步去,到了下一步,比如他自己购买理财了之后,还可以再去,让他邀请一下好友,你邀请好友,我给你这个奖励,你又能去邀请好友,所以这个过程呢,你就要进行设计,设计整个过程,让他操作非常流畅,又能达到你想要的诉求,所以这里面都是需要数据分析去支撑,先看环节,哪些环节出了问题,然后去提出来一些假设的思路,然后这些思路本身还是要经过数据检验的,通过数据之后,我们看到问题出在那里。

最终,其实我们是期望回到咱们主题上,我们期望在一个业务里面,我们是希望各个决策,各个渠道,就是各个流程环节,都能去把数据引入进来,然后这个环节里面,不只是说营销端的,还有针对销售的,针对产品的,针对管理层的,我们在一个企业里面,把数据分析这件事情去做好,我们要去思考你整个流程里面有哪些环节,把自己的业务流程图画出来,把自己这种决策去画出来,我们去看那些环节,我们通过数据能帮到他,能够变得更好,这些就是你努力的方向。

总结一下今天讲的内容的话。第一点,那就是说培养数据意识,就是数据驱动的意识,我觉得用什么工具不重要,或者你掌握的数据分析的方法多少,其实都没那么重要,重要的是,你在平常的工作里面,生活里面,你知不知道用数据去证明你的观点,用数据去说话,这一点是个前提,这个特别是对一个企业创始人来说,这一点尤为重要。

如果下面的人给你费了很大劲,整理了一个报表交给你,你连看都不看,我觉得是怎么样的,我感觉咱们应该怎么做,你又拍下来了,让下面的人什么感受,下次就不整数据了,或者简单给你整一整,交给你就拉倒了,反正你又不看。所以这种数据意识再一个企业的落地,重要的还是从自上而下的,一定是从最高层,大家有这种数据意识,用数据说话的能力,然后在这种情况下,整个公司他很容易变成这样的。

第二点是要重视数据采集,我相信今天讲的内容,大家应该能感受到,就是数据采集这个太重要了,没有数据采集,你后面就是拍脑袋了,就没有一个根据。第三点就是说要借助一些数据分析的工具,通过一些工具去提升效率,而不是说每个数,你都得自己写本子,然后用一个excel,千方百计去整这些东西,花了很大代价,通过一些工具肯定是能把这个效率去提升的。

最后再给大家推荐一些书,一个是《精益创业》,其实我刚才讲产品的时候,讲到了一点,就是我们要把数据分析,引入到产品迭代里面,这个观点呢,就是《精益创业》这本书里面提出来的,它里面就是讲互联网产品怎么做的,怎么通过这种迭代这种方式去做下来的,这本书非常好,特别对于这种,之前不是互联网从业者,大家去学这一块,就能了解这些互联网产品到底大概是怎么一步步迭代出来的。

第二本就是《精益数据分析》,就是我们去针对一个产品,我们怎么去定义自己应该关心那些指标,这个呢,是这本书写的比较好。那第三本就是我自己的书《数据驱动》,我讲的东西呢,大家能感觉到,更加系统性一些,就是从数据的采集到追踪的数据可视化就一条流,而不是只是围绕某一个视角去讲。

当然如果你想更系统的去学数据分析的知识,那就需要了解一些专业技能了,这里面不管涉及到数据模型的这种,数据仓库的这种书,还是说数据挖掘的书,概率统计的,数据库的,这些都需要做一些学习,学习之后,你对整个知识面,那就非常全了,那当然对于只是做业务的,其他的剩下的这五本书那就没必要,就是它太专业,太技术了。

本文来源盒饭财经
楼主热帖
168大数据(www.bi168.cn)是国内首家系统性关注大数据与数据科学的社区媒体与产业服务平台!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

企业信息化选型咨询

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2018-5-24 06:25 , Processed in 0.124223 second(s), 24 queries , Xcache On.

Powered by BI168社区

© 2012-2014 海鸥科技

快速回复 返回顶部 返回列表