最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

揭开阿里数据天团的神秘面纱【实践】

[复制链接]
跳转到指定楼层
楼主
发表于 2015-11-21 11:21:04 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
作者丨陈曦
编辑丨郑育杰
来源丨电商在线(原卖家网)随着生意参谋一统数据江湖,阿里数据团队的神秘再次被大家所关注,此次,《卖家》杂志记者对话阿里副总裁、数据委员会会长车品觉,一起走进这个神秘的团队,并且看看数据部门都在忙什么。
对话车品觉:阿里的数据天团都在想什么?

阿里副总裁、数据委员会会长车品觉问:数据团队很神秘,是个怎样的团队?都在做什么工作?

车:团队大概是400人左右,主要有四种岗位,当中有很多分析师,基本全集团各个部门的分析师都在这里,分析师聚在一起能做出东西并且不会太零散,很多部门发现分析师打散了会没有凝聚力,会变成打杂,不是去想分析的部分。

另外有很多数据工程师,这些同事最主要是让数据进来稳定,对数据进行规范、计量,然后每天输送出去;他们下面就有产品经理,开发产品,一种给小二使用一种给卖家们使用。所以不会因为双11,卖家们就看不到数据,有独立团队。

此外,还有数据科学家,当每一个部门需要算法的东西,他们会去协同,一些未来的产品都需要数据科学家做算法。总结一下他们的工作,有些是做数据服务,有些做产品服务,还有些做分析服务和算法研究。

问:解决问题需要用多少数据?如何用大数据来解决问题?实际运用场景是怎样的?

车:我是个实用主义者,我要解决一个问题,一般来说都会找一个最简单成本最低的方法,除非不能解决,才会使用一些更转折的方法。这个时候就需要更多数据量来解决,甚至还有一些今天没有准备好的数据。

其实大数据应用是商业问题,不是技术问题。商业应用上,如果有一些很简单的结构性数据,大概能解决这个事情的80%,就不要寻找用很难的方法去解决另外20%。我不需要用阿里那么多数据来解决,我用很简单的方法都能解决这个事情,我觉得可以了。
  
当然,一部分困难问题,我们需要用比较复杂的方法来解决,分为两种,一种使用很复杂的算法来解决,一个是用更多的数据来解决。以打车软件为例,打车软件如何更容易打车,那个时候就研究怎么样把算法提炼到很快找到出租车。在数据不变之下,算法可以更精准。等算法到了瓶颈,会发现有些情况是之前没有考虑到的,就要去搜集这些数据,可能包括天气,只要下大雨出租车就会减少需求就会增加。

大数据其实是一个全局观的分析。需要全局观解决问题的时候,别人的知识对你很重要,不能只依靠自己解决,所以我们要和其他东西关联起来。关联性对大数据来说和物联网一样,不关联价值会降低,关联价值会增大,只是要考虑到个人隐私和数据安全两条维度,数据开放性会增加更多关联性,也会增加数据安全问题,需要注意平衡。

问:数据部门在双11主要负责什么?数据如何保障?压力是什么?

车:双11需要准备的数据和数据大屏都是我们负责。数据人的压力,就是数据要准确,数据不准其他都是浮云,最担心的是数据不能及时出来。双11整个数据的回传、计算,都要做很多方案去确保数据不要停滞。因为数据是实时计算的,卡在任何位置都是可能的。每年双11的每一秒都可能破记录,所以要提前几个礼拜模仿这种压力,以及在压力下会出什么问题,我们叫抗压测试。

数据有个麻烦是需要归总,万一源头出错了,后续都出错,出错之后更正需要时间,更正回来再回去就慢了,所以我们要确保24小时的数据没出错,所以压力很大。去年很顺利,过去几年很顺利。今年新突破是我们在卖家端开通了数据作战室大屏,今年他们能看到的数据量大很多。


以往只有阿里集团的屏幕,现在是这么多卖家这么多大屏,每个都可能卡住。数据实时就是最大的挑战,一旦实时就暴露了数据的不稳定,以往数据晚了15分钟进来你没感觉,但实时数据1秒不动我们都会有感知。实时挑战的是整个数据团队的合作性,哪个环节掉了链子,所有全盘就都不动了。

对话朋新宇:参谋长亲口告诉你无线应该怎么玩


[size=1em]阿里巴巴数据技术及产品部总监朋新宇问:今年数据产品方面变化非常大,背后的逻辑是什么?希望为卖家提供了什么服务?

朋:过去量子恒道、数据魔方都是很有名的数据产品,但是现在零售电商市场的业态已经发生了很多变化。从用户购买终端来说,无线端已经超过PC端,而原来的数据产品普遍缺乏无线端的分析;从零售业务形态来说,淘宝原来业态很小、很单一,但现在包罗万象,商家有着聚划算、天猫、淘抢购等不同业务出口,数据业务的源头具有多样性,今天多个数据产品、多个数据出口给商家造成了很大的困扰,也给小二造成了困扰,究竟哪个数据才是准确的。所以这次生意参谋是从数据的底层做整合和统一,对商家、小二、ISV都是一个口径。

生意参谋并不是一个新的产品,而是肩负阿里官方统一数据平台的使命,囊括了原来量子、数据魔方等优秀数据服务,它是个平台,里面由很多子产品组成,整个平台是站在零售电商业务经营全链路的角度来设计的,覆盖流量、商品、交易、营销、服务、仓储、物流、客户关系等各个商家前后台业务环节,同时每个环节都以诊断、分析、建议、优化、预测为业务逻辑主线来构思设计子产品,来帮助商家提升在每个业务环节的经营能力。因此它是一个产品群,我们不需要给商家很多品牌,就一个生意参谋的品牌足够了,用一句话来说就是“生意弹指间,参谋在身边”。

为此,在产品方面,经过努力从原来30多个数据产品精简到现在15个产品,未来还会精简到9个。产品不在多,而是要切中要害和痛点,第一要站在业务的角度,理解商家对数据的迫切度,做好最基本的数据服务,力争每天早上到办公室一打开生意参谋就能看到最新的经营数据,在这个服务背后我们有着一群近200人的数据产品团队24*7不间断保障着;第二是稍作一个提前和超越,让数据先行于业务,因此在无线业务起来的同时,生意参谋就推出了无线数据分析,帮助商家面对无线新环境的挑战;第三要给一些惊喜,基于此团队在数据应用场景上进行创新,推出了TV端子产品-“数据作战室”帮助商家进行全局指挥、实时监控、团队激励及数据化品牌宣传,获得了TOP商家的热烈追捧。

问:无线端现阶段有哪些特征?在无线数据方面生意参谋是如何帮助商家的,具体都能看到什么?

朋:无线端有几个特点,第一是消费者购物时间碎片化,用户随时随地可能在线;第二个,打开手机APP更加便捷,消费者的购物频次更高;第三在线时间更长,无论是上班在工作单位,还是下班回到家中。曾经商家工作时间在晚上10点是个高峰期,现在可以看到无线兴起之后,商家工作时间都延后一个半小时,对商家来说客户无论是消费者是在工作单位还是在家中床上都要去服务。基于这几个特征,商家的服务模式、客服模式、售后模式都要调整。如果不掌握无线时代消费者的购物行为特征,玩不转。

曾经有个游戏相关的商家,其客户群体主要从下午两点出现,而此前,他和别人一样客服每天早上8点到岗,一上午没事干,下午就忙。通过生意参谋的无线访客分析,他看到了无线端的集中消费时段在下午2-4点,晚上9-12点。原来配了很多客服都显得多余,后来采用时薪制的e客服,时间点到了就服务,很多成本跟着也下降了。通过数据你会发现,有些事情是有规律可循的。

那么无线端起来之后,生意参谋也紧跟着这个趋势迅速的推出了无线端数据分析,基本上在整个平台大部分子产品中都有无线端数据分析,比如无线流量来源跟踪分析的流量地图、无线端用户行为特征的访客分析、无线端市场大盘分析的市场行情等,很好的帮助商家从多个维度、多个环节进行无线业务相关的数据分析与经营决策。

目前商家们的非常关注的问题是能不能再细分一下无线的来源,原来PC端来源很简单,主要来自搜索、百度和引流,但是今天App有那么多,商家在到处投放广告引流,一大笔的预算投下去了,效果怎么样要清楚的知道,因此无线就要再细分。

比如说从手淘哪里来的?搜索 banner还是从直通车或者活动会场页面;再比如做站外营销,到底是从哪个媒体广告位、哪个社交媒体大V转发贴来的,这些对商家来说都很重要,因为这涉及了如何调配手上的广告投放预算。今天生意参谋在无线端已经细分出识别了上百个流量来源,包括淘系免费流量、淘系付费流量、自主访问、站外流量四种类型,同时我们也建立了商家流量健康识别体系,持续优化保障商家全网流量来源监测效果,这也是今天商家在广告投放时越来越重视参考生意参谋无线数据,因为我们提供的是权威、独立、可信任的零售电商流量数据监测服务。

问:大中小卖家对数据的要求都是怎样的?有什么产品比较适合小卖家们?

朋:小卖家目前来看,不太关注数据,主要关注活下来的问题,一天发10个包裹就很开心,而10个包裹不需要用到数据;第二类中等卖家,刚刚起来,在遇到到挑战问题困境时候心态就会有所转变,比如说上了活动爆仓了、上了活动却卖不动,这时候他们会寻找解决方案,这个时候就想到了数据;第三就是大中型卖家,今天阿里的有些能力已经满足不了他们的需求,他们已经在布局下一个市场,如何在同行竞争中保持领先,如何去制造下一季的制高点。

数据的运用主要是分析、诊断、建议、决策、优化、预测几个层级,头部商家已经是预测方面了,预测除了数据、算法,还要加上商业感觉和对行业的理解,有些预测还要加上赌性和对客观事实的判断。

佛山有个卖实木家具的卖家,家族主要做巴西原木出口生意,前几年不好开始转内销,产品质量确实不错,但是询问的人多购买的少。后来通过生意参谋数据,他分析了一下,发现咨询最多的问题是包邮吗?送货上门吗?包安装吗?售后呢?但是此前他都不提供,而且发现很多人搜索家具都带送货上门等关键词。后面他就根据淘宝做匹配,在全国重点城市发展了了一些送货到家和上门安装的服务合作商。现在生意不错。

对于小卖家们,我们建议先用好基本的功能模块,比如流量地图跟踪自己店铺的流量来源,解决店铺引流渠道的问题;再比如商品分析透视店铺每个商品销售情况,了解自己的销货情况;这些基础的功能一定要学好、用好,做扎实了,生意自然会好起来;数据确实是有门槛的,我们的团队也在尝试降低小卖家使用数据的门槛,比如商品温度计这个小工具,小卖家选择一个商品进行测试之后,我们会告诉他和同行的差距,关键词、标题需要怎样优化,哪一些更适合你的行业;还有图片很大,会提醒你要去压缩,也可以一键实现优化压缩;还可以告诉商家同行的详情页通常是多少屏,提醒你的是太长还是太短,直接把结论给到他,然后直接行动就行了。

问:双11的工作是怎样的?扮演的角色和背负的压力。

朋:全球狂欢大屏很炫酷,也是重点要保障的。今年数据工作三个战区,第一战区是媒体,力求准确、稳定、实时、灵动,因为会有很多政要以及媒体来观战,要在酷炫高科技的同时显示出背后淳朴的数据,今年还要在水立方和晚会上运用大屏,这些都是压力;第二个战区,阿里小二们,每个行业类目小二以及主管都要步步为营调整计划和做决策,对内要确保准确、效率;第三个战区,商家,生意参谋推出数据作战室,把阿里的能力、技术和氛围让商家能享受到。三大战区同等重要。

这么多年双11了,一年比一年淡定和轻松,淡定的是我们的数据团队在社会媒体、阿里内部、商家端战场打过一场又一场的硬仗,带来了心态上的从容;轻松的是我们的数据团队在大数据实时计算、离线计算、数据公共层、数据产品体验上沉淀出一套又一套的框架与方法,带来了效率的提升;到目前为止,一切进展顺利,希望通过大数据为这次的“双十一全球购物节”增色,也预祝买家朋友买得开心、商家朋友卖得开心、媒体朋友写得开心。


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-4-29 10:58

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表