最具影响力的数字化技术在线社区

168主编 发表于 2016-10-28 18:40:32

168大数据专访易观首席技术官郭炜:大数据大咖是如何炼成的?

编者注:易观A10大数据峰会上168大数据应邀出席并专访易观首席技术官郭炜先生。168大数据作为国内最具影响力的学习型大数据社群媒体与职业发展平台,将推出大数据精英专访栏目,专访大数据领域的技术专家、行业专家、创业者、企业家等人物,等你来约!约访小秘书微信:huiqiaodata

记者:咱们算是老朋友了,您是我一直很景仰的大数据领域专家,首先,请您介绍下这些年您在大数据领域的经验阅历和成就吧?郭炜:我本科是在北大,后来研究生也在北大,选的方向就是数据挖掘和分析。我在2000年的时候,很少人在说数据挖掘这些东西,当时还在普及,后来毕业以后去了Teradata(英)和IBM,Teradata也是很大的数据分析的厂商,后来去了中金,做分析模型和数据采集。再就是万达电商,负责万达电商大数据平台搭建,包括现在的智能WIFI项目,实时数据采集和智能场景推荐,后来加入联想研究院,现在在易观。

记者:目前您作为易观的首席技术官,请您介绍一下易观主要的大数据产品线以及这些产品线主要使用什么先进性的技术架构和大数据架构?您目前主要负责是哪些方面的工作?
郭炜:现在易观的产品线有四条,一个博阅,是易观比较传统的数据报告业务,但是由于现在电子化,整个都是电子化的数据报告,包括背后的分析师在使用的数据,过去的时候大家都知道,很久以前传统调研公司或者分析师通过抽样调查的方式,现在易观不是。易观现在有10亿客户端的覆盖,通过10亿用户他的分析情况,到分析师那里查询,通过相关的模型,形成分析报告。
    易观千帆现在做到T+3对外公布的数据,每天能看到前三天全互联网APP活跃的情况,他的黏性,他的停留时长,这相关的指标在易观千下能看到,底层是大数据的采集、加工、处理、分析最后形成相关的展现。
    易观方舟现在主要是给开发者来使用的,我们叫应用内的分析,能够看到APP内部情况,他的这些用户究竟从哪儿来到哪儿去,转换的时候是怎么转换的,这些用户流失究竟为什么流失,流失去哪里,针对某一款APP做相关的分析。
    还有一个是万像,我们刚推出是广告万像,它给广告商使用,你在选择投放人群时,比如说我想看到年轻人,90后,他去投放相关的广告时,应该选哪些APP作为你的投放渠道,这些其实是在万像这块做的。它是基于大数据的用户画像做相关的服务,现在是给广告商做广告万像。
    我的工作主要是做技术框架和大数据的支持,从我们SDK的采集到的原始数据经过实时计算到最后的展现,以及整个技术架构的掌控。
    记者:您刚刚在大会上分享的主题是有关实时数据分析的,您觉目前易观千帆的T+3更新频率是不是还有提升的空间?
    郭炜:是的。现在我们能看到的,我在从业的时候,每个数据从业人员都是从数据仓库、大数据平台,其实现在在这个阶段,我们已经处于一个传统大数据平台不能满足需求,要做实时大数据平台,再往下走做人工智能,做人工智能的时候必经之路一定做到实时采集、实时反馈,这个阶段是要做成实时化。现在易观也是在做这个实时分析平台这部分,它可能在某个产品里面体现出来。
   记者:我了解到您之前在联想研究院、万达电商都待过,目前在易观,一个是在企业内部做,一个是第三方的大数据分析服务公司,您觉得这两个方向的公司有什么最大的不同吗?
    郭炜:从数据的角度来讲,其实它更加的平台化,比如说你在一个企业里面,他只能看到这个企业纵向的相关数据,包括他的分析,对易观这种第三方的企业来讲,第一个数据要非常的公正,对于我们来讲压力会更大一些,因为你的数据会影响整个互联网的评估,甚至一些企业的估值和股票。    第二,你面向的面更广一些,你可能过去只是在某一个行业,比如说电商或者是在制造业,现在你会接触到各行各业的这些企业,会发现每一个企业所需要的数据的场景也不同,怎样能通过比较好的产品能服务这么多的客户,这个其实对于我们来讲也是比较大的挑战。s怎么凝集好产品需求,对我们来讲是非常重要的。
记者:你刚才提到了数据的公正性,数据采集一个是公正性,一个是准确性,作为第三方公司是怎么保证的呢?
    郭炜:有几个方法,第一个,我们建立了多个合作伙伴渠道,我们做数据的时候,实际的数据端不是单一渠道,这样是有偏颇的。我们会谨慎的选择不同的合作伙伴的渠道,保证人群覆盖是不偏的。第二,数据拿来以后,我们还要做到一些,我们叫做精确算法,去掉其中我们认为是有风险,或者有欺诈、刷量嫌疑,通过一些模型把这些去掉。    第三,我们的数据源做到混合数据源,从APPSDK采集,包括其他合作伙伴的数据汇总到这里,通过模型把它汇总加工,从而做到不偏不倚。数据的来源是多融合的,算法是经过分析师精炼过的。
    记者:作为大数据领域的资深大咖,在职业规划与选择方面,对初入大数据行业的小伙伴们有什么建议和指导?
    郭炜:大数据这个领域非常大,刚开始接触大数据的小伙伴,要选择自己精专的一个点,而不要想全,“全”这件事情是需要经验的积累,和你每一个领域有所涉及以后才能做起来。有的做大数据小伙伴,就做大数据相关的采集,你把它做到极致也是做的非常好,或者你做大数据的处理,把这块做到非常好,能做到批量,能做到实时,这个人是非常厉害,要么做挖掘的算法,你把算法做的查询率非常高,要么做大数据的反馈响应,实时的引擎,实时场景引擎的时候,不仅有自己的数据来源加工模型还有一个反馈,把这块做的非常好也可以。不要大而全,不要想我是做一个大数据,大家都觉得不知道你做什么的,但是你说我做大数据处理的,我做大数据算法的,我做大数据实时反馈的,对于刚刚接触大数据的小伙伴更有针对性,对于我们选择人才来讲,我也能够更理解他做的事情。
    记者:您也了解,168大数据是专注于大数据领域的社群媒体和职业发展平台,您对我们有什么建议?或者有什么话想对168大数据的会员们说呢?
    郭炜:刚才在演讲当中,我没有聊。现在从我的观察来看,中国的大数据从业开发者,包括底层的核心技术,其实在层层速递的,在中国范围里面,用中国大数据平台或者组件的非常小。这个时候,我的观点是,现在中国大数据行业在崛起,这些人才也在崛起,像咱们社群,能够培养出来更精专的一些大数据人才,如果有可能,和一些机构组织分享,让中国大数据的组件全球范围做起来,这样中国大数据影响力在全球范围都有所提升。越来越多的华人出现在大数据世界级领域里面的项目里面,越来越多华人的面孔,易观也是帮助华人企业能够走上世界,或者在世界级的大数据的项目,在中国做一些交流,这也是我们易观愿意去做的事情。    记者:168大数据会经常组织一些线下干货分享活动,到时候欢迎您过来分享,多谢。




页: [1]
查看完整版本: 168大数据专访易观首席技术官郭炜:大数据大咖是如何炼成的?