最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

产业互联网时代的O2O核心——快的大数据的应用

[复制链接]
跳转到指定楼层
楼主
发表于 2014-12-21 22:31:53 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
主讲人:朱磊 快的打车技术副总裁

朱磊,负责快的打车商业体系、大数据、基础架构和新业务等方向。毕业于上海交通大学,清华大学。历经百度产品体系与商业体系,曾任百度高级架构师、主任架构师、NS技术委员会主席、百度云计算总负责人。

以下为朱磊演讲全文:

大家好,很高兴今天在这儿跟大家分享一下我们最近做的一些事情。刚才沈总讲的时候,我自己也是感触特别深,特别讲到一个数据团队架构的时候,因为我们在建设整个团队的时候,遇到的问题差不多,基本角色、场景都差不多。我今天跟大家分享一下从快的打车的角度,如何看待O2O行业。

首先自我介绍一下,我是今年8月份加入快的打车,之前一直在百度,做过百度的产品体与商业体系,后来做云计算和大数据相关的事情。最近感触很深,这几年我们接触的概念比较多,比如云计算,比如大数据、O2O,我自己感受就是概念都比较大,偏虚。例如提了两三年的大数据,大家知道这个大数据到底是什么意思,在哪些产品里或者场景里应用,为什么概念这么火,大家一致认为的方向性的行业?我跟大家讲一下我自己的看法,不一定对,从场景上分析一下。


我感觉2013年应该是一个分水岭,也是互联网从业人员应该在整个大潮里跟上一个大势的机会。我们内部划分的时候,2013年之前,一般把它叫做传统互联网时代,2013年以后从2014年开始,进入产业互联网时代,也就是我们说的O2O行业。

什么意思?就是说之前的大家看到的一些产品,不管是腾讯阿里百度也好,他们做的产品基本上还是以用户产品,娱乐功能性为主。比如最早大家看到的论坛BBS,后来的交流工具,再到图片,视频,基本都是以个人娱乐需求为主。

2013年风向突然就转了,我觉得2013年在中国互联网历史上绝对是浓墨重彩的一年,它定了一个基调,传统互联网向产业互联网的快速转变。这种变化速度之快,连我们身处其中的人,都感觉超过预期,原因是什么?大家知道O2O在中国落地时候,或者全球范围内落地的时候,在两个行业里面首先起来,这两个也是目前为止看到的最成功的O2O模式,第一个就是团购。我个人特别羡慕团购,赶上了第一波大潮。

另外一个行业就是我自己现在正在从事的行业,打车相关的出行业务,我判断的标准之一是资本市场对这两个行业的认可。目前资本市场对团购与打车行业的估值分别在几十亿美金到几百亿美金,从时间来看,对打车行业两年时间估值几百亿美金的案例历史上绝无仅有。而对新兴的大数据市场,未来预估市场规模在万亿级别。这个体量的行业,不免让人浮想联翩。这个钱是怎么算出来的?大数据市场,大部分人连大数据场景都没搞明白,市场估值这么高有没有问题?这点很奇怪,我们也希望与大家分享一下商业角度如何来看大数据的价值。


首先看一张图,这个图说明从2015年开始到2020年整个数据增长量是几何级的增长,在前十年甚至20年,数据量增长非常缓慢,但未来的五六年数据增长量超过以前十几年的增长量,数据量井喷式的爆发带来的是市场的爆发。

数据自互联网诞生以来就一直演进,为什么在2013年以后,在O2O行业起步后,数据价值被挖掘的这么淋漓尽致。这是因为O2O行业里面数据解决一个核心问题,供给方与需求方的智能匹配。在传统领域,如百度阿里腾讯做数据分析的时候,局限于互联网产品本身较多,与实体产业结合较弱,O2O出来以后,这一点快速被颠覆。


比如我是卖东西的,你是买东西的,我来给你做一个匹配,我进商场的时候,跟售货员谈多少钱便宜点,售货员说最低多少可以卖,我们互相谈判达成共识。这个场景落在互联网O2O时,也是同样问题。我是供给方你是需求方,我所有的数据模型,不管产品层面、商业层面还是运营层面都在做智能匹配。下面给大家作场景介绍时,也是基于这个逻辑来谈。


这张图预测了从2012年到2027年整个出行方式占比,第一个是步行,第二个是自驾,第三个是一些公共交通,大家坐的地铁,公交等。这张图最典型的变化就是自驾出行与公共交通出行,在2027年时,达到97%左右。这就带来两个问题,第一,自驾场景怎么解决,第二,我如果坐公共交通,比如出租车大巴火车,如何能最佳匹配我的需求。


除此之外,即除去大数据对产品层面的支持,我们再来看大数据对商业的支持。在O2O领域里面作为商家,我想挣钱的话有一个基本的逻辑,就是你们口袋里的每一分钱我都拿过来最好,但是做到这一点在以前不可能。原因是信息太不对称,而在基于大数据分析的O2O领域不能说完全做到,但是非常接近,我们一会看一下商业场景案例。

下面从场景架构角度看一下大数据应用到的基础技术。


这个是快的整个打车软件的数据场景,从数据源开始做大数据的处理,包括整个报表分析,基本上是通用的场景,大家看一下就明白。


结合之前做过的云计算与大数据项目,这个我们认为技术整体沉淀下来是非常完整的,从数据源到分布式处理,到实时计算处理,到上层的报表统计数据、挖掘数据分析,是涵盖云计算与大数据两大领域的基础设施建设。我这里给出一张技术全图,里面涉及很多技术部分。内部的一些平台涉及机密不方便给出,我都以开源方案代替,包括耳熟能详的hadoop、hive、storm等相关组件的应用解决方案。这张图可以帮助大家建立大数据架构的整体概念。

接下来我跟大家分享一下实际案例,就是之前说的大数据支持产品、商业、运营三个方向。第一:数据支持产品层面,第二:商业模式。大数据如何建立O2O的商业模式,如何实现利润最大化以及消费者剩余为0.第三:运营层面,大家知道,O2O领域里面,产品运营各占一半,就是要不停的宣传。例如团购包括大家刚才提到的美甲,洗车,互联网金融、教育等等。都依赖于运营体系对于用户习惯的训练,而这里的工作不能像传统那样全部依赖于人,如何在这里进行精准影响,也是大数据智能方案的一个大课题。


首先,从产品层面的打车场景开始,比如快的打车,国内外都比较一致,我不知道在座各位有多少用过出租车打车和专车打车方案?专车推出来时间不长。但是感觉好多朋友都已经体验过。推出打车专车,首先就在做用户定位,这个很好理解,比如我买衣服,衣服可能有几百块钱几千块钱或者上万块钱,针对不同消费人群。在出行领域,也有定位,基于服务定位,普通的人群可能是一个打车的服务,高端的人群对车的服务质量要求变高,衍生出专车服务。这种定位就是我们进行产品划分的前提,用户画像的建立。


这里提到一个比较实际的问题,对用户群划分,或者人物画像作划分的时候,维度应该是哪些?简单来说,有钱没钱,这是最基本的,然后性别年龄,喜欢干嘛等等。一般分为两个维度,第一是信息数据,我们一般称为静态数据,属于一个人的基本属性信息,另一部分是行为数据,例如我们与阿里合作,了解用户的消费层次,购买洗好,信用记录等。这些内容结合这个人一年或者每天大概打车的消费额是多少,用户的住址,常规活动区域等。就能基本上判断出这个人消费的倾向。比如我们做IT互联网的集中在上地、西二旗,做金融的都集中在国贸和复兴门金融街那边。根据这些信息我们可以精确的把人群做一个聚类,聚焦一个人或一个人群,这个人群的消费能力,活动范围,信用记录,这些都将被抽象出来支持产品、商业与运营层面。

举一个实际打车场景遇到的基于数据分析的案例。


比如我要从A点到B点,发送单子后,想司机进行请求推送。这里面涉及一个简单问题,我怎么告诉周围的司机最方面?最简单的策略是什么?好,有同学说是距离,非常正确!这个逻辑非常简单而且特别高效,但是有没有问题?当然有问题!我给大家举一个badcase,南京这个城市,中间有一条长江,有江南和江北,我划一个圈计算离用户最近的司机,系统自认为聪明的把这个单推给了江对面的司机,实际上这里根本没桥,直线距离五分钟,而实际过去的话,要绕两个小时。这是典型的逻辑障碍,这该如何解决?这里就需要完善的路径规划能力,路况信息,路网信息,车辆信息,更细节甚至风向风速都要考虑。这就诞生了产品层面对大数据分析的最接地气的需求,我们内部叫智能订单推送系统,订单不再是这么简单的或者比较笨的方法按照距离往外推送,而是结合了路况、路径规划,天气、车辆状况,车速,方向等一系列因素考虑。这套系统非常方便的实现了乘客需求与司机接单的智能匹配方案。


第二个部分,我们讲一下大数据如何支持商业模式,这个也是特别有意思的一件事情,互联网搞了这么多年,一直提免费,大家用的很的东西也是免费的,但是所有公司又在挣钱,是怎么挣钱的,大家应该耳熟能详,广告、佣金等等,那么O2O领域,产品往下沉的时候,这个商业模式应该是什么?

我们首先思考一个问题,大家知道最理想的商业模式是什么?什么叫最理想?比如我是一个顾客,你是一个商家,这个东西你想赚我一百块钱,我也最高能出一百块钱,然后我们以100的价格成交,这个在经济学上,对商家来说就是最理想的商业模式。也就是说,对商家而言,此时的消费者剩余为0。那么现实生活中到底存不存在这样的理想商业模式呢?大家先想一想

好,没有同学回答,其实是一个非常经典的延续了人类千年历史的模式。就是宗教,寺庙模式!寺庙模式是经济学中关于理想商业模式的完美阐释。比如说拜佛的人,他去寺庙,他要许个愿,他愿意拿多少钱,他最终就会付多少钱。寺庙真正实现了童叟无欺,你愿意付出的心理预期就是最终的成交价格。大家想想,还有比这更完美的商业模式了嘛!

而这个场景在现实生活中的其它领域完全做不到,原因是什么?是因为我根本就不知道消费者心理预期,消费者也无法知道服务或者产品的实际价值。这种信息不对等也就形成了定价的两难。

大家首先要了解一点,产品或者说服务的价格不是由它本身的价值决定,而是由消费者愿意付出的价格决定。我们无法定义商品值多少钱,定义的是消费者的承受能力,他愿意付多少钱。


这张图就是在呈现最理想的商业模式场景,即消费者的剩余价值为零。我们看怎么搞这个事情,以打车为例。比如北京,二环三环四环五环,每个区域集中度不同时间都不一样,你说这里堵车那里可能没堵车,这个点司机愿意去,那个点司机不愿意去,早晨司机不愿意往城里走,因为会堵车,这是服务方的心理状态,但是对于消费者而言,他特别烦,我早上在这,比如西直门,或者雍和宫,打不着车,特别郁闷,典型的有需求,但供给方不愿意,因为觉得收益不对等,这是典型的两难焦灼状态。有需求,有供给,但是匹配不上,根源在于价格调节不合理。

再比如今天刘德华开演唱会,在工体,集中很多人,7点9点大家都在听,9点的时候,下雨了,这时候我想回家,我愿意付一百块钱,从那个地方打五六公里到我家,但是还是没车,没有人愿意去做,司机那时随便一个单就走了。对于司机来说,从强需求的场景里面并没有拿到最大的钱,他本来可以挣更多的钱但是没有拿到更多的钱,对于乘客来说,他愿意付出更多的钱却没有渠道通知供给方,最终没有形成交易。

这就是大数据商业模式的最大机会。我们希望整个O2O场景里面,能做到智能定价,我的价格是浮动的,就是根据你的需求情况,比如地理位置,三环以内还是二环以内,交通是不是拥挤,天气怎么样,是不是周围有突发性事件。首先形成智能价格推荐给消费者,按照这个价格打,你原来十块钱打不着车,二十块钱或者三十块钱能打到车,这样能实现商业领域供需双方的价格自动匹配。这个二十块钱三十块钱我们怎么计算出来的?通过分析历史数据,分析整个人的消费能力,消费记录,信用记录来完成。这个桥梁搭起来的时候,大家就会发现,司机说这个事情他愿意出30块钱对我来讲有的赚我能接受就去了,消费者最高出30块钱,两边达成一致成交!

理论上来说,我们真的找到了临界点,就是我刚才讲的寺庙模式,心理预期多少成交多少。这就是最理想的商业模式。回到刚才说的大数据这个市场为什么大家估值这么高,就是因为商业模式调节这一块,基本上打破了大家以前的传统概念,可以把消费者剩余充分挖掘,使之为零,这种颠覆是划时代的颠覆,跟以前不是一个概念。

刚才从产品、商业层面来谈大数据,最后我们看一下运营层面,精准营销。如何把最合适的产品推给一个最需要这个产品的人,对于有一些消费能力的人,比如年薪百万的人,推送专车的时候,他更愿意接受这样的信息,但是对于刚毕业的同学,可能无法承受这些东西,如何把这些人群区分出来,是大数据营销特别关键的事情。

打车软件大战的时候,比较狠的一天烧1、2个亿,这些钱花掉以后,达不到预期效果是损失很大的事情。假设O2O领域我们今天站的角度还是平台方的角度,要满足整个市场需求,大家角色首先和我保持一致,都是平台方。不然你肯定跟我是对立的,我们都站在平台方角度做用户精准定位,如果我花两个亿出去只得到五千万的效果,这个肯定是没法接受的。对于教育也好医疗也好,没有一个行业不是砸钱,这个钱砸下去能不能取得预期效果,这是在大数据运营集中首要考虑的事情,

基于上面讲的内容,三个层面都是要做大数据支持,产品、商业、运营的核心基础都是大数据。


最后跟大家过一下大数据工程架构。一般都会有数据中心,都会有产品,但是这两个之间是无法直接顺畅交流的。中间得有一个对接,不管是支持产品层面、运营层面还是商业层面,大数据方案策略出来不能直接运用于产品上,需要有一个过渡期,所以这套架构在传统的互联网里面,叫做A/B testing,在O2O领域,就变成了最core的东西,没有这一套,数据分析与应用根本玩不转,所以这块的数据工程架构非常关键。


比如线上流量划分,能不能精准的把北京工体附近的,直接定位到目标人群,优惠券直接发给这些人群,比如刚才讲刘德华在工体开演唱会,能不能预测,根据我的系统分析出来在7点到9点只对首体附近的人群什么年龄段的人群发精准营销的信息,这个在线上做定量划分,在整个系统架构上对具体流量做切分。下面这张图就是刚才讲的实际的案例,用户流量是怎么过来的。


之前就是跟大家讲了三个方面,数据如何支持产品、商业与运营。

最后我们看一下大数据前景的展望和一些挑战,这个我觉得还是很关键的,第一个点就是大数据的基础架构的支持,未来的数据增长是十倍或者百倍,大数据架构能否熟练的运用起来,这个是实施关键。第二点是生态圈的覆盖,谈到大数据你不要把自己封闭,我们跟阿里合作或者跟高德或者百度地图合作,尽量开放,实现共赢,你的核心价值是什么,他的核心价值是什么,大家做一个交换。第三点:跨行业合作如何基于数据统一去做。

对于大数据面临的挑战,首先要考虑用户隐私,我刚才讲的时候,大家有没有疑问,我能精确定位客户住哪、消费、信用等等一些信息,这些信息泄露出来对人的影响非常大,这个在最早设计的时候,就要想到,我们要尽量模糊个体,不要定位到单个人,但可以定位到一群人,例如不定位张三这个人是搞金融的,但是国贸这一群人是搞金融的人,这样可以有效的保护用户隐私,第三是整个数据架构的设计,因为之前讲的加固已经比较多,就不重复了。

我今天的分享就到这里,谢谢大家。


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-29 16:48

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表