最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

【图文直播】2015中国大数据应用论坛:大数据开启大未来

[复制链接]
跳转到指定楼层
楼主
发表于 2015-7-23 09:51:06 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
13:20【数据观】2015中国互联网大会大数据应用论坛——大数据开启大未来即将开始,数据观 将为您进行现场直播。


13:30【数据观】本次大数据应用论坛的主持人是北京大学新媒体营销研究中心研究员马旗戟。


13:35【主持人】各位领导、各位嘉宾,非常欢迎大家来到中国互联网协会举办,缔元信网络数据承办的大数据开启大未来。大未来是一个非常值得期待的名词,而大数据如何开启大未来又是一个非常具有想象力和台站的话题,今天上午我在整个国际会议中心会场大概有八场左右的论坛,每一场论坛基本上有一半以上的主讲、发言人在发言过程当中都要提到大数据,今天中午我和几位嘉宾聊的时候非常有感受,将大数据这个话题、这个方向称之为当今互联网+必不可少的方向。大数据应用、大数据产业的发展离不开政府、技术提供商、应用服务商、社区、公众和客户的多方协同,因此我们今天请到了方方面面的精英、企业领袖、政府主管部门官员等等齐聚这里,跟我们分享大数据的未来,大数据对于中国经济发展的驱动力量。

13:38【主持人】下面请允许我介绍今天到场的各位尊贵的嘉宾,他们是:中国互联网协会秘书长石现升先生,中共贵阳市委常委、副市长刘春成先生,中国国际公共关系协会常务副会长兼秘书长赵大地(音)先生,阿里巴巴集团副总裁、数据委员会会长车品觉先生,缔元信网络数据CEO秦雯女士,阿里巴巴数据技术及产品部高级产品专家邓中华女士,微软(中国)有限公司开发者体验事业部技术平台顾问梁健先生,中国电信号码百事通副总经理钮钢先生,晶赞科技CEO汤奇峰先生,搜狗广告研发部总经理李刚先生,壁合科技创始人赵征先生,秒针系统媒体业务副总裁赵洁女士,世界邦旅行网创始人张平合先生,平安金融科技业务发展中心总经理彭涛女士,友盟CEO叶谦先生,360大数据中心副总经理傅志华先生。

13:40【主持人】今天下午分成三个环节,首先几位专家、领袖、行业精英分享他们对于大数据产业、大数据发展和大数据未来的观点;第二部分是一部分实践的公司分享他们的案例;最后将由360数据中心傅总和阿里巴巴的车品觉老师进行精彩对话。品觉老师是我非常尊重的大数据方面的专家。在这个过程中,大家可以扫二维码进行提问,进行挑战,进行答辩。在整个环节结束之后将抽出幸运观众。今天的论坛为大家准备了丰富的数据思想盛宴,首先请互联网协会秘书长石现升先生为大会致辞。

13:42【石现升】谢谢主持人马旗戟老师,马老师是一个非常有趣,也是非常有学问的人,主持风格稍微有一点矜持,其实他的主持比我们浙江卫视某些主持高明的多,在大数据的时代,希望能够更放开一些。

尊敬的各位嘉宾、女士们、先生们、朋友们,大家好!欢迎来到大数据应用论坛,首先我代表主办方——中国互联网协会对各位嘉宾的到来表示诚挚的欢迎,对本次论坛的承办方——秦雯女士和她的缔元信公司表示真挚的谢意。产业之间应用互联网技术进行了融合,能够积累起大量的数据,不同业务之间的互联共享将从这些数据中挖掘出更多的价值资源,可以说以数据为驱动力的技术革命等带领人类社会迈向大数据时代。大数据正在开启大未来,今天齐聚一堂共享数据盛宴,共谋数据产业发展,用大数据成就跨越梦想。

13:45【石现升】在这场席卷全球的技术浪潮中,云计算、移动互联网、物联网齐头并进、相互叠加,渗透到社会生产、生活中,积累了大量的数据,大数据由此成为技术创新的一个金矿,利用好大数据、开发好大数据,使大数据成为我国实现产业升级转型的强有力抓手,对在座各位是机遇也是挑战,为此中国互联网协会专门成立了大数据工作组,构建涵盖企业、政府、研究机构的交流平台,从数据的应用、共享、标准、信用、保护等方面促进我国数据产业的发展。本次论坛主题是“大数据开启大未来”,主要目的是探讨和交流如何将大数据战略落实到应用领域。大数据应用的战略意义在于通过对庞大海量的数据进行专业化处理和分析挖掘,使各行各业都能进一步分享信息化建设的红利,将我们的洞察力、决策水平、执行力和竞争力提高到一个新的高度,进而推动我国互联网+进程,推动网络强国梦早日实现。我想在各位心中对大数据都有一个美好的期待,我还是希望大家要高度重视大数据应用可能带来新的问题,尤其是移动互联网数据部分与个人工作生活、活动紧密相关,大数据应用当中的数据安全和隐私保护问题将更为突出,数据的潜力巨大,但数据的共享还需要从标准信用等各方面进行培育,所以大数据开启大未来不仅需要有高属于的数据处理和挖掘技术,还需要有良好的应用开发环境和数据管理制度,包括数据开发制度、数据保护制度、数据治理规则和机制等,我们期待光临本次论坛的专家委我们奉献有关大数据应用方面的高水平理论成果和最佳实践,我们也期待在接下来发言中能使我们对大数据有更清醒的认识和理解。谢谢!

13:47【主持人】石秘书长事情比较多,前两天半夜将近天黑还给我打电话,问我能不能去一趟哈尔滨?我说为什么?他说这边的会排得满满的,哈尔滨那边要演讲、有发言,找人能不能帮忙。他说今天只能录10分钟的视频发过去。他经常不是去大数据的路上,就是在为大数据公司出谋划策,能来到这里我们也很感激。刚才他也从协会的角度对这个产业的意义、现实、问题和建设讲了很多。我们再次掌声感谢一下石秘书长。

接下来进入行业专家专门演讲环节,隆重请出赛“蔡明”的毒舌代表——缔元信CEO秦雯女士,她对于互联网营销、互联网数据、互联网媒体以及互联网治理和建设方面嘴非常毒,今天听一听她的演讲。

13:50【秦雯】因为今天我们是东道主,代表会议组织者感谢各位发言嘉宾,以及所有到现场来关注大数据、支持互联网大会大数据应用论坛的所有朋友,谢谢你们。当然你们的到来让我也很振奋,有这么多人关注大数据,所以我们是前途无量的。另外想借此机会感谢一下我们公司市场部团队,我们公司市场部团队3个人,以他们为主,在其他公司小伙伴的支持和帮助下,组织了这样一场大会。因为是东道主,我起一个抛砖引玉的作用,跟年初我们自己大数据年会上一样,真正精彩是后面各位的分享,尤其是基于应用实践的分享。我一直在强调缔元信组织会议一定是干货,要让大家有收获,相信今天一定也不会让大家失望。

13:55【秦雯】很多媒体问我感觉到大数据产业或大数据的应用有没有什么变化?我想做一个从我个人出发的总结,无论大家是认同还是不认同,希望对大家有所启发。所以我用的词相对来讲比较沉重,“山高水长,任重道远”。

总体上看,大数据经过前两三年概念的宣传、传播、推广,在2015年我们看到很明显的一个进展是开始落地。我用了一个舆情数据,虽然也能够看得到有一些研究机构报一些大数据产业规模有多大,但是我这个人是不用我不相信的数据的,我们临时做了一些舆情分析,把最近跟大数据相关的新闻抽出几千条,看到今年一个很大的变化是跟大数据的概念、理念、知识背景和大数据本身产业技术相关的新闻大概占到了27%,剩下73%都是各行各业的应用。因为去年没有做这样的统计工作,但凭我们的感觉,其实这是一个挺大的变化。所有跟行业相关的大数据应用里,统计出来的基本上大的方面涉及到30个行业,其中主要的是金融,有一些相对比较丰富的,像娱乐、交通、营销、电商等等,从这一点来看,这个趋势是大数据所谓落地就要跟行业应用结合。另一点也反映的一个趋势是今天会议的主题发言,在座有些朋友可能参加过1月份我们大数据年会,当时我们做那个年会时还很难找到一个行业应用相对来讲有成功的案例可以分享,当时我们挑的都是一些媒体形态和网站形态的嘉宾来分享,但今天已经出现了很多不同行业的应用,这个应用成果我们把时间留给后面的嘉宾。这是一个大的变化。

13:58【秦雯】这个变化如何产生的?整个大数据有三个推手、六大抓手,所谓六大抓手就是落到应用上的六个抓手,归纳成三个角色在推动大数据落地,政府、DT服务商(对应原来的IT服务商)、企业,当然很多企业实际上是在一个大的产业环境下寻找创新应用的机会。从政府来讲,抓手分两块,第一块是开放数据,即政府、社会公共数据的开放,第二块是智慧城市的推进,这两个是政府推动大数据应用的抓手。DT服务商一个是云计算,另外一个是数据处理的技术和方法。企业的大数据是落在数据化运营、企业的创新应用。

14:00【秦雯】开放数据这件事情实际上从2009年开始,美国倡议,后来到2011年G8跟进,从2013年,英国一个机构开始用一系列指数衡量国家数据开放度。看一下中国,从本身公共数据的开放程度来讲,中国在全球,2014年大概排在第57名,各项主要约定开放的数据来看,水平相对比较低,虽然从国家整体水平来讲不尽如人意,但一些地方已经在推进开放数据,其中典型的是北京和上海。北京有一个www.bjdata.gov.cn的门户,上还有一个www.shdata.gov.cn的门户。我上周碰到北京统计局的人,他们已经有项目在做开放数据的准备和服务,这是一个方面。另外一个方面是智慧城市,今年上半年智慧城市已经如火如荼,尤其以阿里和百度为代表的两家大的平台在全面切入智慧城市的解决方案。从国家层面,住建部推行的智慧城市试点已经有500多个,当然其中有其本身的问题,但自上而下的推进,还是对大数据的应用推动起到了积极作用。

14:03【秦雯】DT服务商,整个云计算的发展基本上主要推动因素是多元化的终端,当我们终端变得越来越小的时候,所有的数据处理和计算对云的依赖程度越来越高,只不过在中国整个云计算发展的构成目前还是以基础设施为主,在平台层面和服务层面还占有非常小的比例。但从另外一方面来看,这也是未来有很大得逞长空间。另外大数据处理技术日趋成熟,能够帮助产业和企业赋予它数据管理和数据应用的能力,以缔元信大数据处理流程为例,讲一下大数据处理的思路。从收集到数据的清洗、加工、处理,这个环节把数据转化成信息的环节,然后再到上层的数据应用,这个环节是把信息转化成策略的环节,再对接就是业务。这个技术和方法不断成熟所带来的是企业如果想把自己的数据用起来的话,变成在技术上的可能。

企业,数据化运营是企业大数据应用的基础应用,针对于现有业务基于互联网+的成长,用大数据提高业务的运营效率。数据化运营本身的内涵,在我看来首先要有明确的运营目标,其次要制定好运营策略。在执行过程中,用数据不断去优化运营的过程和运营效果,这就叫数据化运营。之所以把这张图提出来,是我们在跟很多客户接触过程中,发现很多企业数据用不起来,最主要的原因是运营目标不清晰。所以很多企业用数据时变成业务和数据系两层皮,数据也用,数据工具也用,但这个工具只是停留在看看报表,还不能够把数据和业务结合起来,让数据真的去改进业务,这是目前企业在大数据应用当中存在的一个问题。

14:05【秦雯】我们基于这个数据,如何去创造新的应用?这半年下来,有很多这样的例子在各行各业,有的大、有的小,今天上午媒体采访我的时候,非让我举一个例子,我马上想到的是今年上半年线上级大数据驱动的创新应用是阿里的芝麻信用。我再举一个小例子,大家理解一下什么叫数据驱动的创新应用,是我们研究互联网保险行业时发现的一个案例,有一家互联网保险公司卖航空延误险,一般保险公司可能相对比较长的一段时间,比较短的是卖3天,但这家公司能按单次航班卖,还能够即时赔付,如何做到这一点?实际上关联了另外一个应用,这个应用是航班管理软件。这样一个关联能够让他有能力做到实时的业务处理。基于这样一个航班延误场景,可能派生出来的服务包括在延误候机时提供的服务。整个场景化应用已经不仅仅是保险了,关键是跟各种关联应用的管理数据,这是一个典型的用数据来驱动的创新应用。

前面讲了一下这半年我们规定出来大数据的一些进展和推动力,还是有一些问题,有一些基本层面、意识层面、操作层面如果没有做到位的话,或者没有具备这个条件的话,大数据的发展还是很难健康起来的。我把这些问题分成三个层次:

第一层次是社会共识,这个词很虚,所谓社会共识,可以具体理解为行业的一些标准共识,包括整个大数据元数据标准,即数据分类的标准,现在是很混乱的,可能缔元信有缔元信的,秒针有秒针的,阿里有阿里的,这是需要达成共识、统一标准的;技术规范,在数据处理过程当中需要用到或一些方法论的东西需要有规范;法律法规,法律法规和开放机制是相辅相成的,数据应该如何开放?今天上午跟媒体谈的时候也说未来数据要考虑分级开放或分级共享。前一段时间有一个网民告百度,说百度精准营销推广侵犯了他的个人隐私,一审判决百度败诉,认为侵犯了,后来百度上诉,二审判决百度赢了,大致判决书上说的意思就是因为收集碎片化的行为数据不能标识到个人,所以二审法庭认为这个不算是侵犯个人隐私。一审和二审之间的矛盾,说明在法律上没有清晰的界定。

第二个层次是组织文化。作为一个企业级、产业级大数据应用的保障条件是三个,我一直强调一个企业要把大数据用好的话,首先要有数据信仰,要相信数据真的能改变我们和改变世界;要有对应的组织结构调整;业务一定要有目标导向,如果缺这三条的话,一个企业也很难把大数据应用起来。

第三层次是应用策略。数据本身管理和应用层面要有顶层设计;长效管理;业务互动。

这是目前大数据应用不太成熟,需要做这三个工作。最终构建整个数据管理应用体系,从平台到系统,到报表,到工具,到引擎,完成一个企业级的大数据应用的闭环,实际上当下整个企业还停留在报表层,所以山高水长、任重道远,让我们一起努力。谢谢!



14:08【主持人】很多专家或很多学者可以30分钟完成一个PPT或完成一个演讲,但是有勇气、有胆敢于用一夜才去做完它的人少之又少,为这样的秦总给一点掌声。秦总讲到三个推手、六个抓手,这是她今天发言当中最值得关注的,虽然时间关系没有展开,不过缔元信每个月都有大数据的沙龙、论坛,大家可以关注一下。下面隆重请出的嘉宾是中共贵阳市委常委、副市长刘春成,他为我们演讲的题目是政府大数据应用的贵阳实践和探索。

14:10【刘春成】感谢主持人,也非常感谢中国互联网协会和本次论坛的主办方给我这样一个机会和大家分享一下贵阳市在大数据发展方面的一些经验。刚才主持人作了非常好的开场白,秘书长作了非常好的演讲,美女老总作了大数据非常系统和全面的介绍,相信后面还有很多专家会有很多技术方面深刻的沟通和理解。在这里想把贵阳在大数据方面实践的一些思考和做法介绍一下,作为一个地方城市,如何为产业的发展、为企业的发展、为企业美好的理想和尖端技术寻找一个展示的平台,建设一个盈利,能够不断创业、就业,靠更多人的聪明才智创造价值的行业。

14:11【刘春成】大数据在2012年之前,很多人还是知道这样一个事情,2012年之后大家实践的比较多。贵阳本身不是一个发达的地方,我们从2013年开始进入到大数据领域,并且真真实实进行实践。今年5月26号-29号举办了全球首个大数据的博览会,通过这个博览会想展示一种理解,即大数据作为一种新的技术,可能带来新的业态、新的实践,可能带来巨大的财富的想象空间和实现的可能,需要有这么一个完整的地域提供实践的平台。所以贵阳搞大数据,现在很多人都知道,但是我们并不强调贵阳大数据,而是希望给做大数据的人、研究大数据的人和应用大数据来创造价值的人形成一个共享、交流和实践的平台。

14:13【刘春成】接下来想从产业方面、公共服务方面、政府行为方面,乃至于大家如何共同发展这样一个新的概念,把这样一个新的概念真的能够变成一个新的技术时代和产业时代进行沟通。

第一部分:关于如何利用大数据驱动产业的升级。

任何一个新的技术、新的一种思想必须要变成财富才有价值。我们认为数据是一种资源,而大数据这种资源正如很多专家讲的一样,是一种新的资源,似乎和以往我们不同的是,不是自然资源应用越少,只要大家善加利用,这种资源可以再生和不断增值的。我们认为大数据实践过程中技术是关键,没有技术的突破就不存在大数据这样一个数据时代的概念。我们认为即使有好的资源、关键的技术,如果不能够善加利用也是不可能达成目的的。我们觉得应用是大数据发展过程中的核心,而产业应该是我们实现价值很重要的目的。

我们不得不承认大数据是一个非常敏感的资源,这种资源一旦污染,可能比水资源、比空气的污染对我们危害还要大,所以在我们做大数据之初,是把安全放在第一。今年我们大数据博览会上首先提出“大数据安全与发展”,最初很多专家给我们出的主意是发展与安全,前后顺序颠倒,至少体现价值观和大数据发展的一种认识。

14:16【刘春成】如何做好大数据?我们做了所有的四抓和四促。“四抓”:

1、抓好平台促开放,主要抓技术平台、交易平台和安全平台。我们抓的平台不是政府做,政府做不了,我们可以用一个完整的空间进行全省空间范围为我们大数据的技术平台、交易平台、安全平台提供支撑。今天特别高兴有这么多对大数据感兴趣的各方精英,如果就一个相对落后的省份自己来搞大数据,没有前途,如果我们建立一个开放的平台,让所有龙头企业、中流砥柱的企业、新兴的企业和很多梦想成为企业家的人才一起努力,我们这几个平台就会有价值。

2、抓两头、促中间。所谓两头,我们认为第一头是数据中心,第二头是呼叫中心,因为这两头分别是和掌握大数据的机构,另一方面是无数个拥有数据和使用数据、依靠数据服务的个体之间的联系。所以我们通过这两头进而向中间来带动大数据软硬件的开发、应用服务,希望这些企业聚集到我们这儿。我进入这个会场丝毫不感到陌生,无论是嘉宾还是参加活动的很多都是我们贵阳的朋友,很多朋友已经在我们这儿建立企业,有很多新兴的技术正在我们这儿实践。来北京这两天,昨天下午刚刚去到中关村,我们和一些新兴企业签约,就是数据的评估中心,数据作为一种资产,能否进入资产负债表?大家都在探讨。贵阳现在作为国家级认定的大数据产业的集聚区,作为科技部认定的大数据创新示范区,我们有这个责任,也有这样一种信心,为大家提供这样一个评价。也许我们会有一些弯路或不尽完善,但很多标准的制定总要在应用中才能验证,否则就是一个学术论文。

3、抓软件、促硬件。到了大数据的时代,硬件已经成为服务软件的一个支撑和载体,所以我们觉得从软件入手也比较容易和世界走近,世界顶级服务器的制造商、顶级储存的制造商大量生产线都被中国人采购了,但是我们如何能够在软件上和世界走到同一个时刻,我们愿意为这些有这方面能力,也有这方面愿望的企业、机构和个人提供支撑的平台。

4、抓产业、促发展。如果把大数据和资本政策、园区等要素紧密融合,它就能够变成现实的经济实力。贵阳有国家级经济开发区、国家级综合物流保税园区,我们是国家大数据产业聚集区,还是国家级大数据创新示范区,我们同时还拥有全球首个大数据的博览会和大数据产业峰会这样一些高端的交流撇太,在这里大家可以低成本交朋友、获得资源、实现共同发展。

14:18【刘春成】做实“6789”计划。分别针对如何用大数据提升政府能力,如何用大数据提升整个城市大数据基础设施,如何用大数据改善民生,如何用大数据提升现代制造业。我们之所以拿出这个计划,并非政府又要投钱来做什么,而是我们认为这些领域中将涉及目前方方面面不同观点、不同流域的企业和投资商,乃至于产业的共同价值。我们结合这样一个完整的城市载体,希望为大家提供实现产业梦想的基地,我们希望打造一个真正的大数据的产业生态环境城市。

第二部分:如何利用大数据铸牢智慧城市的建设。

智慧城市已经是很热的词,热了很多年,但只有当大数据技术变得实用的时候,这个才变得有点象样子。正如我前面讲到一样,贵阳在这方面同样是搭起了一个系统平台的架构,我们欢迎方方面面的有识之士共同实践。这个系统平台简单叫1526,“1”是一个城市的运营中心;“5”是五大云工程,贵阳目前实施7+N的云工程,我们和阿里、腾讯、富士康、浪潮、中软等等很多;“26”是我们目前做了26项应用示范,26可以变成36,也许可以变成360,我相信这个速度的增加不是一个新的想法,一个新的主意,而是我们真的希望每一个增加都意味着后面是十个、百个创业团队的成功,是以新的技术、新的理念在不破坏环境、不破坏自然,用最小的能源消耗获得价值新的发展模式。

14:20【刘春成】在智慧生活方面我们做了很多,山体滑坡,通过大数据技术,当时大家怀疑可能底下压了很多辆车,但通过大数据的判断,我们认为底下只有一辆车,而且车主已经逃出来了,所以动用大型设备进行清障,事实证明大数据确确实实比所谓的目击者还要准确,在滑坡的大量泥沙底下没有大量被掩埋的,就是一辆受伤的车,这在非常关键交通要道发生事故以后迅速得以清理,这个发挥的价值是非常典型的。

在智能医疗方面,我们目前也在和方方面面的企业在合作,我们和惠普公司打造“全民医疗”,我们通过各种精确的计算,各种推算,同时智能医疗方面我们准备实施的结果有指标列出来了。

在智能交通方面,我们搭建了公共出行信息平台,贵阳通过大数据,能够准确判断出黑车的情况。因为黑车是很难清理、很难治理的,我们通过大数据对车辆行为的特征,结合我们其他各种已有技术手段,能够准确作出判断。接下来正如其他城市一样,我们也会在这方面欢迎有技术、有新的商业模式、有新的管理方式的人进行合作,我们是完全开放的一个想法。2014年开始,贵阳市公安局、交通局建立了交通大数据云计算中心,在这方面还可以有很多可做的事情。

在智能教育方面,我们也在积极做,各种模式相信后面也会有专家讲。

这些平台,按照目前可能找得到的,我们能听得到的,我们主动获得的,我们经过专家判断是可行的一些领域,我们努力把平台搭建起来。

在智慧管理方面,建立了城市管理百姓拍。我市打造的“百姓拍”APP,旨在拓宽市民群众监督城市管理工作、参与城市管理互动的渠道,提高老百姓参与城市管理的积极性,不断提升城市管理民生服务水平。“百姓拍”APP主要应用包括:百姓拍、我的百姓拍、最新、我评城管、城管便民服务、城管动态、首页等7个功能模块。在百姓拍模块,市民通过拍照、语音、文字、视频等方式上报问题后,形成论坛界面形式,其他市民可以参与跟帖讨论,城管各级部门在接收到问题后,在处理问题的同时,同样可以参与跟帖,形成良好互动;我的百姓拍模块。市民群众可以通过这个功能模块对自己上报的信息处理过程进行全程监督,实时了解信息的办理情况;我评城管模块。市民根据贵阳城市无线WIFI、地图定位或者道路等关键字查询,点击坐标小人后弹出类似于监管责任信息的评分表,根据公共绿化、环境卫生、市政设施、市容秩序方面打分,留有文字评价框。后台地理位置对应网格可对网格,分类评分对应分类责任人。后台数据分析系统根据评分情况,统计出问题高发区。城管部门根据大数据分析做出管理服务决策;城管便民服务模块。嵌入贵阳市地图服务,为市民提供城市管理相关便民服务点、办公地点等兴趣点查询;城管动态模块。提供便民信息、城管动态、城管手机报的内容等等。通过城市管理“百姓拍”APP的开发建设,拓宽了城市管理信息采集渠道,实现360°无死角管理。实时掌握了城市管理症结,为城市管理决策提供了参考。建立了良好互动,增加老百姓对城市管理工作的了解和参与积极性。

在智能旅游方面。坚持政府引导与市场主体相结合,着力加强规划指导和政策引导,推进智慧旅游公共服务体系建设,加大智慧旅游公共服务方面的基础设施建设投入。依托“701工程”,完善各景区免费WIFI覆盖工作,建设以贵阳为中心,辐射全省的智慧旅游手机APP。着眼于游客的落地服务建设“爽游在线”旅游电商平台、加强与OTA企业的合作,与IT制造业、金融业、服务业进行对接,进而带动智慧旅游产业整体的发展。

14:23【刘春成】第三部分:利用大数据推动政府转型。

2014年,贵阳按照《贵州省政府信息公开暂行规定》的要求,决定运用大数据编制制约权力的“铁笼子”,即用大数据“把权力关进制度的笼子里”,打造了独一无二的“数据铁笼”贵阳模式。该模式的核心在于依托大数据产业优势加快网上政务建设,把能够纳入网络的形成权力全部纳入网络运行,通过制定统一的数据技术标准,优化、细化、固化权力运行流程和办理环节,合理、合法地分配各项职责,实现网上办公、网上审批、网上执法,权力运行全程电子化、处处留“痕迹”,让权力在“阳光”下清晰、透明、规范运行,确保“把权力关进制度的笼子里”。

编织“数据铁笼”,加强对权力运行的制约和监督,不但能及时查处和纠正发生在权力行使过程中的违法违纪行为,更可以再运行中发现问题,以提高公共服务效率为旨归。通过公开权力清单、行政审批、行政处罚、公共资源配置信息以及公共服务信息,引导权力改革,完善各项相关制度,不断织劳制约权力的笼子。逐步建立“用数据说话、用数据决策、用数据管理、用数据创新”的管理机制,推进管理型政府向透明、高效、廉洁的服务型、责任型政府转变,形成“人在干,云在算”的工作格局。

我们深知,在一个相对落后的地方发展一个处于世界前沿的产业,走出一条西部欠发达城市生态改善和经济发展的“双赢之路”绝不是一件容易的事。实际上,这相当于要实现贵阳的再创业,不可避免,前面将有无数的荆棘和挫折的等着我们。但是我们更对前途始终抱有坚定的信念,决心咬定青山不放松、一张蓝图绘到底。我们贵州、贵阳真诚地希望能与中国互联网大会、中国互联网协会建立起良好的合作关系,共同谋划大数据时代下的经济社会全面发展,尤其是运用大数据提高政府公共服务能力方面的探索。

以上就是今天我跟大家分享的主要内容,感谢中国互联网协会和缔元信。网络数据的邀请,以及在座各位嘉宾的倾听,不足之处还望各位指导、海涵。

最后,请各位领导、嘉宾允许本人借此次大会之机,为我们贵阳做一下宣传和推介。目前贵阳市正在总结2015年数博会的经验与不足,并已着手筹备第二届数博会的相关工作。在此,我代表贵阳市政府诚挚欢迎各位专家、学者明年数博会期间能莅临贵阳建言献策,助推贵州、贵阳大数据进一步发展。

谢谢!

14:25【主持人】百姓拍才是真的拍,才是真实拍,才是真心拍,所以大家的鼓掌来自于这儿。从促进产业发展到提供公共服务,到政府的转型,刘市长给我们简单梳理了一下,在新中国成立之前,我们是北望延安,因为那是圣地,改革开放的时候是南望深圳,因为焕发出了中国经济的活力,在以电子商务为代表的过去十几年当中我们是东望杭州,阿里巴巴在杭州那边为我们的互联网经济带来了活力,现在的说法是大数据时代要西南望看贵阳。所以我代表刘市长邀请大家明年5月份去贵阳好好看一下博览会,真的很有收获,但是我今年没去,因为事情冲突了。下面有请阿里巴巴数据技术与产品部高级数据专家邓中华女士,她跟我们分享的是“大数据产品之道”。

14:26【邓中华】各位同学好,各位朋友好,在我正式跟大家做分享之前,先跟播放一个视频,都是干干的货。

(播放视频)刚刚看到的是我们在过去两到三年过程中所做工作高度的凝练,在整个体系上面最直观能够感受到的主要是大数据产品,所以我今天跟大家分享的课题是大数据产品之道。分为几方面:大数据能力和顶层思考;大数据产品的内外兼修,内在和外在分别是什么;基于以上的分享,想给今天这么热情的朋友们一些关于大数据建设的几点建议。

如图,大数据这两年炒的非常非常热,到底什么叫大数据?各家都有各家的看法,我们认为大数据应该是具有施瓦辛格的身材,爱因斯坦的脑袋。大数据的能力可以分为四层:第一层叫做骨骼,大家通常知道的硬件和存储的计算能力,相当于我们如何把数据的计算、存储、服务等处理好;第二层在硬件和存储之上流淌着的血液,关于数据建模和管理能力,包括数据如何进行采集、如何进行建模,以及如何最快的计算和最高效的存储等等;第三层真正数据要发挥价值的,其中非常重要的一块,不管是有形还是无形的都是数据产品,分为两层,第一是我们对业务的理解和算法能力,很多算法工程师、科学家用大数据的时候可以作出很多关于用户的标签画像,其实这一部分正是他们对于业务的理解和算法能力的体现,但是仅仅这样还不够,大数据应用过程中需要一个系统、体系完整的解决方案。告诉你今天的数据表现是什么样,问题是什么,未来你可以做一些什么,做完之后的效果会是怎么样,因为这个效果可以做什么样的改善,这本身就是一个非常复杂完整的体系,我们叫做“大脑”,大脑进行产品的设计以及很好的服务能力。这四者结合起来,分别表示着大数据的基础建设能力和数据产品能力。

14:27【邓中华】看起来很酷很炫,但其实能力背后意味着非常巨大的挑战,大数据挑战本身也是一个非常完整的闭环,会在基础建设方面,包括如何进行很好的数据采集,如果你的数据只有几百个T或1PB左右,采集起来不那么难,如果面临几百个PB的数据如何采集,在无线时代已经到来的时候,无线的采集应该如何做?在计算环节,采集之后非常重要的是计算,去年双十一的时候,阿里巴巴在零点刚刚过的时候向全世界公布这次双十一交易额是571亿,这时候大数据告诉你等一等,明天这个数据是570亿,就没什么好玩的了。

数据计算,如果把数据采集、计算都做得很好,可是上面的应用根本没有很好的方法,快速和有效拿到这些数据来使用,其实前面所有的工作都是白费的。

14:29【邓中华】关于采集、计算、服务是大数据基础建设方面的挑战,所有这些工作最终都要在上面浮现出来,就是我们所理解的数据产品,我们希望数据产品给到大家真的不只是一个报表,而是希望我们真的用数据产品去理解商业,理解它的目标,并且把数据不是枯燥的以一个表格的方式呈现给用户,而是告诉你这个数据的含义是什么,如何解读它,在这个过程中去追求数据价值的最大化。我们提炼出来,关于基础建设和数据产品价值两大块挑战的关键词就是质量、效率和价值。

关于大数据的能力看起来非常具有想象空间,挑战也是巨大的,这是非常复杂的事情,复杂的事情一定要用复杂的方法去解决,如果背后的逻辑也非常复杂,这个事情也就没法玩了,所以我们需要有简单、清晰、明确的顶层设计。我们在过去两年,做阿里巴巴大数据实战过程中的一个顶层设计,下面我们做好数据的基础建设,包括数据采集计算以及服务,上面我们面临的客户数据方面首先是阿里自己的小二,要有能力用好数据做数据化营运,第二块是我们非常紧密的伙伴,即商家。我们在做这件事情顶层设计时,同步考虑阿里的小二和商家如何同时用好数据。数据基础建设方面做好one data和one service,数据上面一块做好对内和对外能够共享的one Platform。解决的是关于大数据本身背后的挑战,基础建设和价值两块的挑战。

14:31【邓中华】大数据产品解决的不仅仅是产品自身的问题,一定要同步去解决内在的数据基础建设的问题,所以大数据产品务必做到内外兼修。我们现在正在做的一款产品或一个平台叫生意参谋平,里面就几十款产品。在逍遥子接受采访时曾经说过我们有这样一个团队,叫数据技术及产品部,有几百个人,要去思考的就是大数据的能力,大数据怎么样设计好,能够应用到我们的具体业务上。生意参谋就来自于这样一个团队,目标就是要用数据解决电商经营中的各种痛点。

这个我们整个产品最顶端的一个架构图,下面的准备和服务就是我们的基础建设,上面才是我们的数据产品,数据产品有三架马车,第一架马车,很多商家很辛苦,数据本身那么枯燥无味,看了也不明白到底代表什么,也没有那么多时间,我们希望把很多经验沉淀下来,以一种产品的方式给到我们的商家,在这个产品中会帮助用户披露直接简单的数据,告诉他这个数据背后意味着你当前存在的问题是什么,我给你一些优化的建议,然后给你  一站式可以去操作的功能点,之后再回过头来看看你的效果怎么样。这样闭环操作工作在整个商家经营链路中都会走过去,我们叫做经营决策。第二架马车叫做数据小库,每一个商家一定会有一些长尾需求,商家中还会有一些大商家,一定会有自己非常特殊的运营经验是不愿意透露给你的,这时候最好的方式不是你给他开发1000张报表,而是给他一个专属他自己的库,可以在这个地方上传、下载数据,用我们提供的工具或者第三方给他提供的工具做分析。第三架马车叫数据学院,无论数据开放做得多么好,数据本身就是一个成本,我们需要告诉商家怎么样提高数据能力,提高数据化运营每个环节,我们把这个叫做数据学院。这三块合在一起就是我们的三架马车的理念。

我们为什么说生意参谋平台的多端?我们搭建这个平台时,同步推出的是有PC端、无线端、TV端、APP端等等,并且还有一个叫小站,要求所有商家必须到这里来,其实太专制了,在发布产品、装修店铺时,能不能在我眼前正在做的时候告诉我一些数据?所以我们会有小站,小站和主站之间形成闭环。所有的做法希望能够为商家伴梦成长。我们有关于商家的业务数据化探索,马总在很多地方说数据重要的价值就是要实现业务数据化,阿里巴巴怎么可能做自己业务数据化的时候忘掉商家呢,我们探索这件业务的起步根本不晚于我们当时做阿里的数据化。我们整个业务的流程、选品、采购、推广、销售、物流,以及整个环节中都会涉及到的服务。生意参谋做的事情就是在每一个环节中围绕你的都是直接解决这个环节过程中问题的产品,最重要做到的事情就是用各个产品在每一个业务流程中,帮他去实现你的品类管理的数据化、营销的数据化、品牌宣传的数据化、服务的数据化等等。

14:33【邓中华】关于品牌宣传数据化的例子,我们即将会推出来数据作战室,无论在淘宝、天猫开店,所有店铺状况可以告诉我手下每个人你可以做什么,不可以做什么,并且可以邀请媒体参观采访,这就是我们要去做数据作战室的初衷,要做的事情最终面向的是企业,特别是高管,帮助它成为一个有影响力的企业。核心价值:帮助做核心监控和团队管理,我们告诉他多店铺的全局数据,合在一块跟市场上,特别是你的竞争对手之间的关系,通过大屏的方式,许多屏组合在一起,与它的经营各个链路进行连接,可以快速直达每一个管理层的每一级人员。后面一个核心价值就是帮助他们做企业品牌的数据化宣传,我们最终回以PC大屏投影等一些广播媒介类产品承载这样一个产品。如果有20、30个店铺,可以看到整个状况,由于数据安全要求,虽然这是一个视觉稿,我依然把店铺名隐藏掉。第二个屏,在这个屏过程中,企业的高管,特别是董事长、CEO可以快速知道当前整个店铺的经营状况在全国各地哪一个地方好,哪一个地方弱一些。这个产品面向的主要是高端商家。

每天都有100万到200万左右商家在使用,但是我们始终有一些坚持,这个坚持从几年前开始一直走到今天,就是帮助中低部商家生存下来,但凡占比比较多的中低部商家的产品,成本可以控制的都是免费,希望阿里巴巴的业务数据化能够和商家的业务数据化同步推进,这个过程中涉及到阿里和商家用的数据是不是同样的,服务是不是同样的?基础建设,统一技术平台是云计算,上面的存、通、用就是大数据,真正存方面叫做集团的数据公共层,整个这一块会涉及到20个团队,有点类似于一个子公司,大概几千人到上万人,能够协同20多个团队把这样一件事情做完,可见我们当时的决心和坚持。这个过程中所用到的方法论就是one data的体系,我们会用这样一个体系去保障数据从开始就是规范、标准、统一的,数据在建设过程中有非常层次分明的模型设计,数据研发过程中也能够很好保障、计算、存储、同步等等工作。最终要实现的目标,目前没有百分之百地实现,但至少在我们内部现在已经走在非常好的路线上,即标准的、服务的,让业务很爽的点,另外是两个双伸,安全和共享的,这是技术这一块非常好的点。

14:35【邓中华】我们没有做这个事情之前,每和球球,大的小的分别代表一个BU数据百分比,它就像我们小时候在各个地方大街小巷能够看到的一种景象,数据流没有方向,数据的管理没有序,而且是失控的。当我们做完之后,我们做公共层时,把数据的基础管控起来,中间层建设起来,再往上业务能够百花齐放,最后出来的结果是基础层是很好的流向,中间层会是这样一个流向,因此最后的结果其实挺像我们现在看到的样子,数据流有方向、有序、可控。

总结下来,大数据的产品之道就是要有内在的魅力:基础建设;要有外在的魅力:数据产品;生意参谋就是这样一种尝试、一种诠释我们愿意与所有对产品有兴趣的同学一起做分享。

在前面分享中,关于大数据的意识、大数据的战略都有提到,这里特别想提的是大数据的人才,在座绝大部分都是大数据领域里面已经是人才或者非常感兴趣想进入这个领域的人才,我特别写了两个词,believe,相信这个事,才会把枯燥的数据从金矿下面发掘出来,所以才会一整夜不睡觉写PPT生病了一直坚持来上班,有一个idea马上组建一个项目做成,这就是believe的力量,之后会有很多crazy的想法和行动,于是大数据才会慢慢的越走越好,我们非常希望接下来有非常多的同学能跟我们一起进行互动和交流。

如果有任何同学、朋友对大数据感兴趣的话,都可以直接与我联系。关于生意参谋的订阅号和体验大家都可以感受一下,我们只需想一想到底大数据如何能够发挥价值,这才是我们想要探索的大数据产品之道。谢谢大家!

14:38【主持人】我对中华发言最好的评价,她讲的内容争取让全国做大数据的人多听几遍,但这个女孩子要看好,别被人挖走了。下面有请微软(中国)开发者体验事业部技术平台顾问梁健先生,为我们带来的演讲题目是“物联之上,移动优先,云为先”。

14:39【梁健】大家下午好!我一来就被会场热情高涨的同学们感染了,今天时间关系,因为内容特别多,又讲端,又讲云,别给大家讲得云里雾里了。今天跟大家讲一讲IOT,谁不知道IOT?不说IOT,我们说物联网,一说物联网大家可能就明白怎么回事。大家都觉得M2M无非就是设备上网,设备之间互相认识,今天讲三块,IOT给我们的互联网+时代带来什么样的机遇。

14:40【梁健】IOT,现在很多物体、很多设备都可以上网,但是大家觉得IOT这个词很高深,从去年开始热起来了。其实IOT与我们生活息息相关,相信在座很多朋友都用过支付宝给家里的电表充值,电表就是IOT;天气预报,实际上是非常好的IOT的一个场景。但为什么今天突然又强调IOT?因为现在整个环境给IOT创造了一个非常好的发展机会,之前五年我们说移动互联网的快速发展,如果你的公司或未来工作、事业没有跟移动互联网挂钩,一定要跟IOT的发展挂钩?因为硬件设备更便宜,连接无处不在,3G、4G非常普及,5G的标准测试都出来了,还有快速开发,现在有各种各样跨平台开发、云端开发,还有用户的需求,用户希望企业更智能化,企业的数据更智能,同时用户希望有更多的创新场景。如图,2010年我们聊IOT、物联网,其实很多设备都是耳熟能详的,甚至大家平时都在用的。2015年的时候IOT设备种类非常丰富,甚至过两天你身边的事物,甚至平常用的照相机、监控摄象头、电表等等都可以连到物联网里,所以物联网有一个非常快速的发展,是一个直线的上升。

14:42【梁健】为什么未来五年物联网会快速发展?IOT会快速发展?我们看到一些官方的数据,Gartenr给出的数据:2020年会有250亿设备连接到网络里。对于企业来说有巨大的赚钱的机会,到2020年,全球IOT收入7.2万亿美元。很多朋友还想了解IOT到底是什么?我知道设备能上网,除了设备上网以外,从商业角度来说,IOT会有几个阶段或者什么样的商业模式能够给我带来一些利益?第一阶段,我的设备联网了,联网目的是什么?人才很值钱,21世纪数据也很值钱,数据的目的是了解我的设备状态。举例,电梯的厂家需要知道这个电梯是否正常运转,会不会出现突然峰值,我知道这个电梯要坏了,提前更换这些设备,知道它的疲劳度,这个比较容易理解。拿到这个数据要做一个智能的分析,更智能的商业,通过这个进行分析,举例,一个餐厅知道什么时候开门,什么时间准备餐饮的服务队用户有帮助,或者对农业进行灌溉,知道什么温度、湿度进行灌溉,不要浪费水,水多了农业就死了,让你的商业更智能化。

最近有一个片子很火,《煎饼侠》,在赌吴君如的时候,就是用了预测,当然那个不是用物联网,是用人的预测。最后这部电影里结束的时候,几个明星说你的《煎饼侠》没有意思,拍《煎饼侠》的过程很有意思,通过IOT能够拿到你的服务。做制造业的制造商,也许机器不赚钱,但是把我的机器提供出去,提供我的服务,通过一些大数据拿到这个信息,通过IOT的信息去分析也许我卖设备不赚钱,提供服务更赚钱,提供软件会更赚钱,可以拓展你的转业,有更多的合作机会。

14:45【梁健】微软是云+端的平台,无论在端windows,相信在座没有一个人说没用过windows,windows不仅仅在你的电脑上,在手机上,其实windows无处不在,我们每天到地铁上刷卡,闸机里面跑的就是windows,取钱的ATM机都是windows。同时还有我们的云服务,我们有大量的数据收集过来以后,会把数据放在云端进行分析。云+端的平台如何帮助大家推动物联网IOT的发展?首先看云端,有朋友有时候也问我,云端对物联网有什么帮助,如何利用我的云服务去促进IOT的发展?有三块:第一比较好理解,设备连接,需要连接这个设备,把信息收集起来。第二要分析,要知道这个商业怎么更智能。第三拓展业务,根据数据拓展你的业务。

如图有设备、有云、项目管理,有些设备比较智能,会直接把数据通过可以上网的一些设备把信息发给云端,云端有Hub会收集数据,单个Hub可以收集1百万设备。大量设备可以把信息发到Gateway,但是很多设备很小,一个传感器怎么把信息发过去?这里还有一种Fleld Gateway,举例办公室有很多船跟其,楼里有很多传感器,把信息给到局域的gateway,信息会更安全,进行加密处理。现在很多物联网设备通信协议标准不一样,发到云端时可以进行一个转换,把协议进行转换,转成标准的HTTP、AMQP协议,传到云端进行处理。我们提供Azure IOT一个套件,这里有一个IOT Hub帮助大家可以注册这个设备,控制这些设备,同时大家可以看到是双向的,同时支持更多的扩展。同时在云端的服务我们提供了各种各样的API,无论这端的设备是网页、PC、windows设备、安卓的设备、iOS的设备,或传统的设备,我们都有多种多样的接口,可以让IOT的设备方便连到云端进行双向的交互。

14:47【梁健】之后是分析,第一种是可视化的,把所有IOT拿到的数据进行快速分析,变成可视化报表,大家可以知道电梯运行状态,哪里有问题,直接的数据可以看到。还有数据流,对数据流进行快速的分析,知道哪块有风险,或者做一个快速的预测,这是对数据实时分析。还有做后期分析,把历史数据存储起来,做新业务服务的拓展、新业务的分析,实际上这一块是我们说到数据以后进行进一步的分析。实际上每一块都非常重要,因为数据收集不到不能分析,影响商业的方向。

有了这些数据希望给到我的老板、合作伙伴、投资人去看,最后一块就是展现,Azure上提供非常丰富的服务,让数据分析完了之后有很好的展现,这时候你的合伙人高兴了、投资人高兴了,传统企业知道你的业务方向的,因为老板很清晰看到这些数据,在各种各样的设备商,包括office以及各种各样的设备。这张图完整诠释了Azure IOT的架构。六个过程,是整个物联网IOT完整的过程,做数据分析、存储、展现。

在Azure微软云平台提供了各种各样的服务,方便大家实现这些功能,无论是设备的连接、存储、分析、展现,由于时间关系无法一一讲解,但是大家可以把这张图照下来,可以到搜索引擎上bing上搜索每个关键词,每一个功能、每一个服务都可能拿出来讲至少一个小时。

刚才讲了云端的Azure如何助力大家开展IOT的业务,再看看windows10,最近windows10非常热。windows10其实不仅仅是运行在传统的笔记本上、平板上、手机上,可以助力IOT。在windows平台上,微软一直致力于一件事情,融合。如图是整个windows发展历程,现在在windows10上,把所有的内核进行融合,不仅仅是内核,开发模式、开发平台、SDK、服务都是统一一致的,包括IOT,甚至到很流行的全新的眼镜。

还有一个平台叫Universal为 windows platform,在这个平台上,我们支持各种各样不同的设备,从IOT设备到Surface Hub,上面跑着各种各样的服务。开发者可以在一个工程里面开发一个应用,跑在所有的设备商,这个界面是自适应的,开发成本大大降低。还有一个自然的用户输入,触碰、语音。

14:50【梁健】我们在这个平台下提供的是一个商店+一个开发者中心,很多产品经理都非常高兴,这个开发成本大大降低了。

这些对IOT有什么好处?我开发的应用可以很方便地跑在IOT的设备上,windows10 IOT的优点,通用的应用,我的应用可以在手机上开发、在电脑上开发,可以跑在我的小本子上。通用windows驱动,开发了一个打印机,能连到windows10的电脑上,优点是在机场、医院打印很方便。自然对IOT非常有用,大家知道电表每次都是够着看剩多少电,如果用windows10的IOT设备,可以问电表剩了多少电,电表告诉你剩了10元,通过语音跟我的电表进行交互。

IOT有大量的设备连接,安全性非常重要,windows10除了可以变成一个IOT设备以外,还可以变成一个网关,网关有企业级的安全级别,甚至多用户的登陆,这个网关上,IOT设备上可以有不同的用户,空调的管理员看他的界面和普通员工的界面就不一样,这个非常好实现。windows10和Azure有非常好的连接,内置很多API,还有IOT设备的部署管理,MDM的管理在windows平台上是完全一致的,无论是PC、手机都是完全一致的。在windows10设备上,全面支持ALLJoyn的标准。

windows10 IOT有三个版本,有industry devices,有mobile devices和Core,很方便让这些设备跟其他不同的设备进行连接,海尔推出这个标准,让他的冰箱、洗衣机、净化器能跟其他设备进行连接。

ALLJoyn这个标准对于IOT非常重要,现在许多物联网的设备不兼容,windows10在所有设备、所有版本上完全支持这个标准,同时内嵌ALLJoyn的API,不用担心如何集成这个库。

谢谢大家!

14:55【主持人】下面有请中国电信号码百事通副总经理钮钢为我们演讲,题目是“大数据:从浩瀚到价值”。

14:56【钮钢】我们说大数据很多年了,也有很多人说运营商有很多数据,我们坐在金矿上,今天主要跟大家分享的是我们大数据团队近几年来做的事情,特别是怎样从大数据金矿上挖掘它的一些价值。

如图,不同的时代,工业革命时代,主要是自然资源,互联网时代主要是芯片,包括光纤、存储,今天很多人说大数据时代,数据已经成为一种资产,或者我们在做很多互联网的项目时都说数据要成为一种思维,将来真正在运营时,一切业务都在数据化。怎样真正把数据从金矿变成炼金术,今天利用我们团队做的事情跟大家一起分享我们在这方面的一些实践。

14:58【钮钢】的的确确电信数据非常多。1、个人基本信息。我们有基本的姓名、地址、号码,包括身份证号码,还有很多来自于帐务系统,套餐的信息,以及享受的一些增值服务,这是相对结构化的数据。还有终端的数据,这里有一个自注册平台,使用每部手机,装了新的手机以后,我们知道你的手机型号,使用华为还是苹果,根据每个型号可以看到上面装了什么APP,这些APP的使用情况、打开的情况等等,这些数据涉及到跟终端相关的数据。还有你的通信行为,这方面的数据非常有价值,比如你经常上宽带,在浏览什么网站、浏览时长,这些数据都在网上,包括你的APP使用情况,不同使用时间点,使用的次数、频率等等,这些数据通过我们各种基地业务的平台,特别是我们有一个DPI的数据集都能采集到,这些数据非常有价值,也的确需要得到保护,因为涉及到用户的隐私,涉及到你的信息、涉及到你看的内容。未来随着物联网的发展,很多物都在网上,物的传感都可以定位,同时在刻划你的轨迹。这些数据被描述出来就是你的行为轨迹。还有很多客户的信息,比如投诉情况,用户对什么不满意,包括114,尽管在座的人很少用它,但每年有15亿次的通话,我们挖掘出来80%,跟老百姓的生活密切相关。原来只是满足一个需求,帮你查到号或转接一个服务,但如果把数据挖掘出来就会发现哪些数据是有价值的。很多人没有用过,我去年在114平台上挂了600万次的号,可能我们仅次于挂号网,仔细分析一下这些数据很有价值,通过这600万次挂号,看到了人群的分布,看到了挂号的行为,比如上海、北京、广州是三甲医院最集中的地方,要去挂这些号的地方有1/3不是来自于上海、北京,来自于江浙、东北地区去北京、上海挂号,这些数据如果被挖掘出来是非常有价值的。而且我们看到哪些科室挂的最多,比如妇科、儿科,我们通过一些业务慢慢把数据挖掘出来。

15:01【钮钢】我们看到其他一些信息,特别是我们原来做黄页,库积累了6500万企业的基本信息,这些信息从原来意义上讲只有名字号,现在加的微信公众号、微博号,包括POI信息进行整理和加工,原来只看到企业信息,但今天可以在地图上看到你。今天你想要查到一个企业,更多跟它的产品、服务密切相关,所以这些数据要拿到。包括自己做的一些应用,商旅服务方面现在有4000万商旅信息,最近做挖掘,做交叉分析以后发现原来是简单完成一次订票,把这些人群分析以后会发现他们有一定规律,出行的规律、订酒店偏好包括其他的数据,这就是来自于我们现在能看到的一些数据。用一句话总结,它是人与现实社会的触点,应该说电信数据是有价值的,最关键在这个浩瀚的大数据里面用什么方法把数据提炼出来,或者怎样把数据更好应用。我不能简单说卖数据,也不能简单输出数据,大量数据是个人隐私,现在国家对这方面非常严格,但是这些数据能力怎样更好提炼出来,这是我们下面要去做的。

电信的数据很符合我们一直讲的大数据的4个V,海量,有数以亿计的活跃用户,每天千万级的更新操作,每年10PB级的数据存储。将来各个物之间传递各种信息,数据量是非常大规模的。多样性,大数据是一个结构化数据和非结构化数据的组合,结构化的很多基本信息,但更多是半结构化的,特别是有些能力和有些数据是运营商所特有的,比如信令能力,在没有互联网的且一下,你打一个电话,我们知道你的电话情况。还有很多非结构化的数据,也就是说在网络上跑的所有可以挖掘出来、可以提炼出来的数据,比如上宽带,大部分家里都已经有网关,下一步还会不断提升,我们会做一些网关数据的提炼,现在我们看到很多看到IPTV,看到你上网的一些行为,但未来相信随着智能家居的推进,将来在网关上跑的数据内容还会更多,可能会有各种家电的信息,空调信息以及其他一些接入到网关数据上的信息,这个将来也是大量数据的集聚。高速,4G的发展,国家已经在推进降费提速,未来随着速度提升,我们数据量会更大。所以我们价值在哪里?第一,如何做好这些多数据源的汇聚,能不能把数据汇集起来,不是简单建一个大的数据库,全部拿到一起,通过更多标签化的工作,把数据纳入到一起,这就是我理解挖金矿的过程。最后如何把用户隐私做好?大数据讲到最后,数据量很大,安全非常重要,有很多脱敏技术,看似很成熟了,美国可能有很多地方技术更先进的,脱敏数据出去了,还可以还原,怎样保护好用户的隐私,让用户防骚扰、防诈骗等等就是我们的价值。

15:05【钮钢】我们内部团队最近做的一项工作,只是一个展示,我们做了360精准画像,把多数据源数据进行分析,从一个社会属性来讲,基本上能判断你的年龄,你的身份证号就代表你的年龄,男女性别,我的数据非常直接,登记的身份证号、姓名、地址直接告诉我你的信息。职业和社交属性,判断你会不会经常漫游、出差,包括通话时间是上午还是下午、通话时间长度,以及社交范围,微信反映社交圈,但经常跟谁通话比较多,这些都很重要。通过这些提炼以后,通过这些我们试图做一些模型来判断你其他方面的一些信息,包括消费信息。现在从征信机构跟我们交流,非常看重的一个信息,你是否经常换号或换地址,特别是还有一个信息非常重要,一部手机的SIM号知道,这个机器是否经常在换卡,如果经常换卡,可以基本判断是有问题的,代表他是一个骗子,用了这个机器以后换张卡扔了,马上又换一张卡,我们通过这个信息的挖掘跟信用机构在合作。包括看你的周末社交圈、工作社交圈在哪里。通过这个给用户做360度画像,通过画像,我们试图用我们数据最后提炼出一些模型,通过模型画像以后,看能不能跟其他业务进行合作。我们结合自己一些号码商旅服务,看你的订票习惯,经常折扣,或看你经常订哪些方面的机票,包括看你订餐的偏好,包括看到你订房的偏好等等,我们现在已经建立这样的库,就是号百的标签生产和管理平台,通过这个平台把刚才那些数据、金矿能进行一些炼金的东西。

15:07【钮钢】我们这个平台有几个核心功能,数据的汇集管理,非常重要,能把多数据源进行汇集;标签的生成和管理。将来更多不是原数据或者裸数据的输送、输出,更多是标签的生成和管理,很多标签的生成来自于需求,来自于业务的迁移,哪些业务需要哪些标签,这方面非常有研究价值,不是数据越多越好,很多数据要少而精,判断一个人的行为做哪些业务,通过哪些标签可以去识别非常重要,在这方面我们在做标签的生成管理,包括我用标签数的方式在做。我们在构建360客户的视图。标签输出能力有两种形态,一种叫应用级的,360的画像就是应用级的,直接告诉你这个人可能是这样一个情况,我们通过所有的数据源判断出他是怎样一个人,他是怎样一个状态,通过这个数据看看是否可以给其他一些应用进行服务和输出。第二种叫原子级的,在库里面把所有的数据源汇集以后,更多面向数据汇集层做了很多原子的标签,这些标签作为一种数据能力可以输出,更好跟大家合作。

精准画像的背后有行为的图谱、有多维的统计,包括分布的模型,特别是分布的模型有一定的价值,我知道每个人的手机的精确位置,通过分布以后,可以判断密集度,有人说如果能早把这个数据做好的话,可能上海就没有踩踏事件。我去年在美国看到有一家公司,不光是这些点,点上还做了更多三维的,把时间维度加上去,可以看到时间点上人的分布情况。这是我们在精准背后的一些画像。

15:09【钮钢】我们做了哪些实践?智能营销。首先利用好自己电信数据能否做好自己的营销,我们通过自己客户数据的挖掘,做了会员管理,非常有价值。为什么现在做业务都要有一些数据思维,原来是帮你订个票,未必一定记录你很多信息,但现在我们会去记录,包括每次拨打电话询问过程都会记录,因为这是用户的触点,也许这次没有完成交易,但我知道你现在想要订什么票,或者想要做什么事情,我们通过这个应用场景,对会员做了管理,把会员做了分析,同时开始做一些智能机票推荐。我们最近还有一个团队做一件事情,我们在做语意和语音结合的分析,也就是说今天在这里问上海天气怎么样,可能有几种判断,一种是今天晚上要回上海,已经下午三点多了,给你推荐六点以后的飞机票;第二看到是一个金卡会员,看到你的偏好以后,包括你喜欢东航还是国航的,帮你做一些智能的推荐、预定,包括订票、订房的交叉推荐,这种场景是经常有的,用户可能是上海人,要到北京,一定要查酒店,我们根据他的情况推出相应的服务,包括还有很多商旅客户端的推荐。

15:11【钮钢】我们面向金融征信的实践。8月份会发八个面向个人征信牌照的公司,包括芝麻信用、中诚信用、还有我们天一的信用,我们电信有这些数据,你们到底有哪些需要?蚂蚁金服自己已经积累了很多数据,但希望更多能跟电信数据结合,因为他们原来积累的是在淘宝上买东西的一些数据,记录你的交易行为,电信数据如果能够有效跟它结合,把你个人身份信息、电信消费信息,特别是在网时长作为一种信用评价维度,这方面有很多需求。包括我们定了个人身份信息的核验,不会直接告诉蚂蚁金服这人是谁,但是会跟蚂蚁金服的信息进行匹配,在蚂蚁金服上你可能注册一个代码,但是跟我身份进行核实以后,我会告诉他这个人是不是这个人,通过核验以后,信息比对以后更加精准。比如你的入网时长,代表你电信的信用度,你的手机机型变更的时间、变更的频率,包括你使用手机的品牌,比如你是使用小米、华为还是苹果的,通过品牌价格也会提供不同服务,包括我们自己也在推这样的服务。信用达到一定地步以后,下一步就是零元购机,把手机送给你,将来通过套餐把费用全部收回来。下一步我们会面向他们输出我们的数据能力,通过数据能力的输出以后,希望对一个人的评价,就像蚂蚁金服的芝麻分一样能够更好的使用,数据是越用越活,越用越有价值,我们在这方面积极寻求合作。我们的思考是将来数据不仅可以了解你的人生,我了解你的基本信息,我们希望将来能洞察人心,我们可能更多去判断你的下一步的行为,下一步的想法或其他一些需求,这是我们下一步在思考的。数据一定是够精准、不骚扰,现在大家越来越能接受这个,如果盲目给你发短信,你会觉得是骚扰,如果我们在你正想需要的时候给你提供这种服务,而且根据你的行为判断出来你需要这个服务的时候,给你推送,让你觉得很惊讶。

15:13【钮钢】我们希望提供可信的号码,现在大家越来越多看到不可信或者骚扰电话,先把数据做到可信。希望结合企业、个人的行为做到诚信,比如你是一个经常提供好的服务,用户评价非常高,包括将来提供很多到店服务、到家服务,也是经过使用以后,用户点赞以后,诚信的服务,这是可信诚信,最后提供安全、便捷的服务。最后希望数据是更加丰富和精彩。

我们的探索——众筹大数据。数据一定要开放,我们在上海现代服务业联合会下搭建了一个平台,我们会提供数据的处理、标签和信息化,我们把新金融企业拉进来,P2P金融拉进来,把传统金融——招商银行、机构投资者、数据产品商拉进来,我们希望在上面字一些数据的众筹,然后我们做好安全和管理,最后我们输出很多会员的数据,包括360视图。我们希望通过这样一种合作能让它产品化、联盟化,数据输出以后,作为数据产品商可能会打造一个指数,这个指数可能给股权投资者用,企业所有的情况,从基本情况到互联网经营情况,到产品情况,用户情况全都有了,编出中小企业股权投资指数,最后提供给股权投资者。谢谢!

15:15【主持人】下面有请晶赞科技联合创始人兼首席科学家陈小光(音)先生,他为我们带来的题目是“受众管理新时代”。

15:16【陈小光】大家下午好,非常高兴有这个机会跟大家分享一下我们在大数据营销方面的一些实践和思考。我今天讲的题目是“受众管理新时代”。作为一个互联网从业者,我们发现互联网这个企业现在越来越跨界了,整个企业的边界会越来越模糊,大家在互相进入自己的领域、互相进入对方的领域,比如BAT互相进入对方的领域,比如腾讯曾经做过搜索,百度也曾经做过电子商务,阿里巴巴更是全面在进入各个领域。同时在传统垂直领域互联网的商家,比如携程最近购买了很多油轮,分别进入自己的上下游产业领域。今天这个公司可能是物流公司,说不定明天变成地产公司、变成电子商务公司。快速变化互联网的态势就让我们思考一个问题,什么才是这个公司最重要的资产?什么才是驱动这个公司产品不断前进的东西?从我们这个角度来看,人是促进整个企业持续变革的原因,因为只有人、只有受众持续在反映我在使用这个产品的情况,我需要什么样的服务,那么这个企业的产品才能够不断进展。

15:18【陈小光】现在互联网用户已经到了非常广泛的地步,我们在不停使用微信、使用社交工具、使用各种各样的电子商务的产品来满足我们的生活,同时我们也留下了很多足迹留给各种各样的公司去跟踪,根据这些跟踪可以不断优化我们的产品。既然需求已经提出来了,我们的技术有没有跟上?如图,中国的股市走势跟这个图比较相似,这张图是一个产品从初期到成熟整个走势图,一个技术一开始都是进入相对快速的成长期,大家都会觉得整个报纸、互联网都充斥着一些热词,大家对这些词期待都非常高,但是到了一定程度之后会慢慢衰减,大家觉得这个技术也不怎么样,也没有传说中那么夸张,然后慢慢这个技术就会沉淀下来。大家虽然对它寄予的期望不算高,但它自己在慢慢沉淀,然后再慢慢改变自己整个流程,慢慢会达到一个成熟的阶段,探底之后会有一个回升的过程,真的跟股市比较相似。作为互联网营销的一些具体技术,云计算已经到底底部的境界,云计算到目前来说是相对成熟的技术,无论是中国还是国外,国外是亚马逊,国内是阿里云、青云、U-Cloud等等,有了这些技术,很多大数据营销的工作可以慢慢展开。作为一个初创的企业,我们集中精力在做一个专业的事情,我们希望在这个平台之上能够作出很多满足第一方用户需求的产品,我们专注在大数据的数据分析领域。既然我们初创公司的资源有限,但是我们同时也想做这进事情,必须要跟大的平台进行合作,所以在这个背景之下,我们选择和微软Azure合作,提供大数据营销平台的产品。

15:20【陈小光】(播放视频)所有一些信息都是可以数字化,并且整合到一个平台去管理。基于以上的理念,我们推出了晶赞天机,这个平台这是我们跟微软战略合作的一个产品,在微软云上可以方便部署受众管理的平台,同时也可以在用户自己单独的集群上部署晶赞天机的产品。我们为什么选择和微软Azure合作,大家为了同一个目标,互相看对眼了,一起去做这件事情,微软看中我们的主要是我们在数字营销领域的口碑,以及在大数据技术方面的一些积累,我们看中微软在企业服务专业程度、云平台可扩展性和安全方面的口碑,所以我们共同推出晶赞天机这个产品。

15:22【陈小光】CRM确实是一个很好的产品,而且为之前所有的商家很好管理客户,但受众所有信息不停在扩张,大数据不停在扩张,针对这些大数据,CRM完全满足不了现在受众管理的需求,我们不仅有CRM的数据,有网站成交的数据,有移动的数据,有网站各种各样用户行为的数据,甚至包括这个公司在投放广告时产生流量的数据、电邮的数据等等,所有这些数据需要在一个平台上管理才能发挥出数据充分的价值。我以前在阿里云曾经工作过一段时间,深知道阿里云当时所做的所有工作是为了打通阿里巴巴数据的链路,大家花了非常多的时间才完成这件事情,但完成之后发现工作效率提升很多了,所以我们如果一开始就做了这件事情的话,对整个企业的发展是非常有益的。完成这些数据input之后,能产生人的基本的画像,人口属性、男女性别、教育程度,同时还有他的POI画像,关于人所有行为的信息等等,互联网已经掌握了用户线上很多数据,但是线下行为的数据其实非常重要,而且是非常有商业价值的数据。其次我们还会有各种各样ID信息,比如你是用微博、用微信,其实是同一个人,还有很多其他购买的信息、社交画像的信息、浏览画像、兴趣画像信息,这些都是要通过深度的机器学习和数据挖掘能够完成,打上各种各样的标签,并且能够被深度使用。这是我们的输出。基于这些输出我们何以做很多事情,第一可以洞察整个受众是怎么样的受众,作为一个企业非常想知道受众是怎么样的组成,可能会关心这些受众分布在全国哪些区域,如果具体在上海,是分布在黄浦区还是闸北区还是什么地方,甚至在某个区域里面小区的分布怎么样,这种信息对业务扩展可能有帮助,在某个城市发现我的受众很多,这个城市可开拓的前景非常大。我们还会知道受众人口属性统计的信息,在同行业、跨行业之间对比是怎么样的,如果知道我的行业和另外的行业是互补的行业,对于我的产品的拓展或对我的销售可能会有一些指引性的作用。其次还有一些用户的搜索关键词的信息,一些网站访问跳转的信息等等,最后是一些社交的信息,我们这个平台就是洞察人的意图,因为数据挖掘很多时候是需要人工介入,图形化的展示,可视化的工具非常重要,所以我们提供非常丰富的工具供人可以不停去探索。如果只是给你一个图表,其实对于很多数据挖掘是没有任何意义的,图表只是一张孤立的图表,如果根据图表可以做深入挖掘,可以不停地做查询的话,可以挖掘出很多深入、有意思的一些特征出来,比如在社交媒体上可以知道某个大V是非常有号召力的,对这个话题他的影响度是怎么样的,这个话题影响到哪些人,那些人又会影响到其他哪些人,对你的品牌传播如何,都可以通过我们晶赞天机进行实时反馈的查询。

15:25【陈小光】其次我们可以做智能推荐,因为我一直在从事数据挖掘和机器学习相关的事情,其实推荐大家非常推崇的是这个东西要让我很新奇,不像传统的广告和搜索大家关注用户点击的概率,智能推荐大家推崇的很多,要新奇,出其不意,不受干扰,这里面算法算到最后往往选择跟你比较相似的人,推荐一些他们经常会选择的东西,这个往往跟个性化有一些背离的东西。如何实现个性化?个性化需要更多人的标签去描述这个人,让这个人更独特、更唯一,然后才能够体现这个人的个性化,根据这些信息可以去推荐相应的东西给他,才会让他觉得不会干扰,才会让他的接受度强,不然他会觉得你只是推了一个大家都觉得热门的商品给我,对我来说也没有什么意义,我到哪都可以看得到这个东西。从智能推荐的角度,我们可以利用战略的参数、ID的参数等等完成推荐的工作。我们对于ID工作做了非常多,ID在整个数字营销领域是非常关键的一件事情,但是ID工作是非常底层的工作,我们需要知道这是同一个人,才会有意义,不然所有营销的工作都是分散、割裂的,对整体的营销效果并不会很好。

抓新客的需求商家都会有,这个商家做到一定程度,有了相对稳定的老客,新客从哪找?往往会求助一些营销公司、广告推广,新客从哪找?一开始先去关键词定向,做一些定向类的东西,其实这些工作可以省去,整个流程完全可以优化,可以给我一批你的一些种子用户,已经转化的一些用户,根据这些种子用户可以通过相似的推荐、相似的选择找到什么样的用户会发生转化,根据我们刚才提到很多的标签找到跟我转化的种子用户相似的用户,根据这些用户我们再去投放,不停优化整个投放的结果。

多触点的营销。多触点在几年前只是品牌广告主的一些需求,因为品牌广告主可能会关注曝光度如何,多触点现在真正变成了效果类广告都要保证的一个东西,我们在不同的时间、不同的地点、不同的场景可能会在手机上推这个广告给你,让接受程度更高,效果会更好。

15:30【陈小光】管理好我们的一亩三分地之后,我们会想这个世界还是很大,外面是怎么样的?如果我想对我的用户了解更多,该怎么去做呢?目前市场上的场景是BAT都有自己的DMP、数据管理产品,但是都是封闭的、独立的王国,可能会让你去用,但是必须在他们的平台上去使用,去做营销的产品,数据的流通其实是非常关键的事情,互联网做得所有的事情都是在做链接,把一个原先物理上不可能发生链接的物体连接在一起,希望发生化学反应,爆发出很强的生命力,有一个很好的产品出现。数据同样也是这样,数据必须流通才能产生价值,如果不来流通,大家都封闭在自己的独立王国,这个数据产生的效应根本没有全流通的效应大,在这个基础上我们做了各种各样的尝试,BDU就是我们的尝试,全称是“中国先进企业大数据联盟”,在这个联盟里面我们目前大概有60多家企业,包括中国电信、东方航空、携程、慧聪这些传统的中大型的国企,我们有丰富的线下数据,也有互联网用户,包括金融类、教育类、房地产类的等等,这些企业在一起希望能够互相交换数据,发生数据的分析。数据只有分享才有意义,因为所有数据都锁在BAT平台上,数据的意义就没有那么大。在这个平台里我们互相讨论数据应该怎么分享、数据应该怎么准入机制,才是好的数据,如果这个数据持续提供,怎么保证这个数据质量是好的,如果今天调用你的数据,明天你给我一个很烂的数据,这个事情怎么解决?所有关于数据交换的东西,我们都在BDU里面不断讨论,因为我们相信数据的明天应该是一个数据交易市场的明天,因为数据只有真正发生了交易,发生了流通,整个数据的价值才能体现出来。这是我们所奋斗的方向。BDU是中间里程碑的一个产品,我们希望通过这个产品能够不断为整个数据生态服务,让大家能够在这个数据全流通市场更大发挥自己的价值。

BDU目前已经60多家,我们非常欢迎新的企业、大的企业能够加入我们这个联盟,因为在我们这个联盟里的氛围非常好,所有的事情都可以不停讨论、不停研究。我们的微信公众号,在这里我们会时不时发布合作的案例,我们讨论的一些协议、规范等等,通过这个平台,我们可以很好交流数据,这是我们公司存在的愿景,我们希望做一个大数据的公司,而且是推动整个数据生态持续发展的公司。

今天我的报告就到这里,谢谢大家!

15:35【主持人】谢谢,我唯一不同意的就是你的BDU,现在BAT不参加,不是因为他们封闭,你不是歪曲他们就是故意的,是因为BDU的实力还不够,还难以吸引他们参加,真正的里程碑是BAT参加了你的BDU,你的那个东西才叫里程碑,多加努力。下面有请搜狗广告研发部总经理李刚,演讲题目是“大数据驱动市场决策变革”。

15:36【李刚】今天我代表搜狗分享一下搜狗对大数据深入的理解。搜狗是一家经营了很多年的公司,我们一直以技术和产品为理念,不断在大数据领域探索和经营,而我们数据量非常非常,我们有全中国第一输入法的客户端——搜狗输入法,市场占有率第二的搜索引擎——搜狗搜索引擎,还有广告联盟——搜狗的广告联盟,搜狗希望把这些数据,从输入法到搜索引擎到广告联盟综合到一起,为我们广告业主、客户提供更好的营销决策的方法。我主要演讲的是搜狗在商业、广告领域对大数据的分析和理解。

15:38【李刚】我们最近一直在谈大数据,大数据的“大”主要体现在哪?更多人说大体现在数据多,我个人觉得数据就像一张图,这是一个传统的广告,当地铁进站的时候,这位美女的头发会飘起来,我个人觉得大数据对广告领域最重要的是引入更多维度的信息,引入火车进站的信息,使整个广告更灵动。有更多维度的数据,有火车的数据进来,对广告产生一个更加个性化和奇妙的变化。这是我们认为数据的一个应用。

搜狗有很大量的数据储备,每天有上亿的网民通过搜狗搜索表达他们的意愿,比如他们想看汽车,他们想在电商里面搜索自己的产品,他们想找一些游戏,同时我们不仅有搜索的行为,还有每个人在互联网上的点击行为,点击更能说明他对这个事情的想法,比如他想买房、想装修,想做各种各样的事情。搜狗希望把这些数据形成一个完整的平台,最终在营销领域通过这些数据表达每个网民的兴趣和爱好,最终给我们客户解决在商业营销决策里面最重要的问题,谁是我们的对手?谁是我们的敌人?我们的占有率有多少?我们的品牌该怎么去售卖?这些通过精准、高效和有价值的数据把这个问题反映出来。最终我们会给每一个我们的客户形成一份大数据标准的报告,进而帮助他、辅助他在整个营销领域决策的模型。

比如大数据的人群画像,比如他访问了京东,我们会认为这个人是网络的购物达人,他在网上经常问北京的问题,可能家在北京,他还查了《来自星星的你》,对摄影感兴趣,经常用手机上网,所以我们推测这个人是一个本科以上、学历高富美在北京的女士,所以你给她推什么样的广告?如果你给她推一个网游的广告就不适合。但传统香水广告会打给每一个人,如果能在整个营销决策里把这个人的特征全部刻画出来,这个特征不是传统简单的男和女,而包含更广的维度,他到底是金秀贤的粉丝还是TFBoy的粉丝,你的广告就会更有目的、更准确达到。搜狗广告特征数量达到1个亿,这个数据量非常惊人,准确地说是1.2亿,这个特征不是传统的喜欢购物的特征,我们更多的特征是你是否是金秀贤的粉丝,还是喜欢TFBoy,这些会产生更强的决策性。大家每一次看搜狗广告内容都是不一样的,古希腊有一句话:“一个人不可能两次踏入从一条河流。”以前是抽象的话,现在我们讲不可能两次看到同一个广告。

15:40【李刚】我觉得大数据主要有三个最重要的特征,跨屏、覆盖率和技术。现在已经说得很多了,但是仔细思考这个问题,可能跟我们说得不太一样,什么是跨屏,不是你的数据既有PC的数据,又有移动的数据,又有手机的数据,这不叫跨屏。跨屏是你有能力通过PC和移动把两个打通,未来我们看大数据是否跨屏的时候,如果只是一个PC和一个移动,只是有了两份数据而已,并不具有举个人完整的跨屏能力。如果大数据具备跨屏能力,首先要有一套账号能力,把账号体系打通。覆盖率,特别是在商业领域,中国最大的一个电商跟我们合作,它网站的人群里面有20%的人一个月会有一次成单,但其中只有1.5%的人会有一个月六次或六次以上的成单,但就是这1.5%的人占了整个成交量的55%。所以不要说数据覆盖率大,关键能够覆盖1.5%的人。所以大数据的覆盖率,在于对这1.5%的人是不能已经完全覆盖。同样大数据整个技术体系不在于存储水平,可以说你存储了1个亿或2个亿,更多在于你的运算能力。我们经常跟业界朋友们聊这个事,说你们这个训练数据用多长时间了?有大公司说我们半年、一年、两年,为什么中国广告匹配结果就是没有谷歌的好,所以我们有时候也跟谷歌聊,我说我们训练数据一年两年,你们谷歌训练数据是多长时间的数据?他说叫有史以来。不是说这个数据量多大,而是这个数量量可以每天训练你的模型。所以我觉得大数据的技术体系要能完整存下来,刚才说的电商的案例98.5%的都是噪音。搜狗在整个大数据建设上建立一个非常完整分层的模型,把整个搜狗大数据组织起来,完成清洗工作、预测完成,一方面会在广告展示时选出最需要的广告,同时会给客户提供一份你该如何投放的指导,这是我们最新做的事情。

15:45【李刚】搜狗大数据商业平台,现在只对我们客户开放,我当然希望它未来可以开放给所有的人,但是我们还是希望把一个事情做得更深入、更精准和更精深,目前这个平台主要对我们的客户开放,我们会做一些市场格局的调研,会做一些消费者属性的分析,会做一个消费偏好的分析,最后形成完整的营销方案,甚至帮助评估他的方案投放怎么样,比如你在各个领域投放的效果如何,在各个网站投放的效果如何。举例,我们通过网民的需求,无论是搜索行为还是展示行为,到了大数据平台上,最终完成整个营销方案。

其实我们是一个多维度的数据分析,但是我们为了简化,投影到一个二维图上,可以看到奔驰的受众更关注于新闻资讯和家居地产,可是奥迪的人更关注于旅游,福特人群可能更关注于游戏和娱乐,如果我是福特汽车的话,建议投放广告时在游戏、娱乐板块多投放一些广告,同时希望广告投放本身注重游戏性和娱乐性。同样道理,每一个品牌的用户对汽车品牌一些诉求点也不同,比如奔驰汽车,是否更需要保养,最后我们甚至辅助客户进行代言人甄选,比如携程、途牛、艺龙尽量不要找刘德华先生来代言。会发现每一个受众真的不一样。我个人觉得数据体系本身是一个很复杂的事情,而大数据的存储过去更关心数据多上面,而不同的维度之间关系的挖掘以及整个特征的提取和整个数据的运算会让整个广告领域和营销领域有一个质的不同,这就是搜狗一直在做的事情。

15:50【李刚】我们还有一个公众号,刚才说的这些报告除了给客户提供以外,经过客户同意以后,还会把一些报告放出来,除了向第三季度汽车行业报告,这在公众号里大家都可以查看,春节期间我们做了一个春运方面的报告,同时也做了清明节、母亲节一些很有意思的报告。最终搜狗希望通过整个大数据的营销体系,把搜狗大数据的能量在商业领域去释放出来,给我们客户最好、最精准的服务,也让搜狗的品牌可以在整个大数据体系有更强大的发展。谢谢大家!

15:55【主持人】谢谢李总,明年请你去网络营销论坛讲一讲,今天上午没请到你是遗憾,讲得非常好。下面有请壁合科技创始人赵征先生,演讲的题目是“广告效果中的大数据应用”。

15:56【赵征】刚才晶赞的大哥和搜狗的大哥都跟我们讲了大数据很多很多的概念,我们是一个新公司,我们没有这么深厚的底蕴,所以我先从另外一个角度跟大家讲一讲我们作为一个新公司是怎么尽量的往大数据这个概念上靠的,同时我们怎么尽量的让我们能掌握到的一些小量的可以成为大数据的内容为我们广告效果去做服务。我会从五个点来讲,1、效果广告的定义;2、我是如何看广告效果相关的大数据;3、如何用;4、实际品牌案例向大家介绍一下这些大数据产生了什么样的广告效果的提升或产生最终什么样广告效果的回报;5、壁合简介。

15:58【赵征】我们所理解常规意义上的广告效果,广告的曝光、广告的点击、广告的到达、广告的转化,可以囊括现在80-90%广告KPI的要求,对于壁合来讲,这些数据只是广告的前半部分数据,以游戏行业举例,当一个游戏用户通过看到广告,注册了游戏之后,他是否创建了角色,是否玩到了一定等级,是否在第二天、第七天、第三十天持续在这个游戏里登陆,最后他是否在这个游戏里面做了充值,他充了多少钱?这些才是广告后续的数据,这是我们所理解的广告真正效果的部分。

壁合是一个很年轻的公司,但是我们只坚持一点,我们只做能监测到后续效果的广告。有了这个大前提我再去介绍一下我们是如何利用这些数据实现这个效果的优化的。我们把我们所能掌握的数据分为几个部分,第一部分是我们理解第三方的数据,也是我们所能掌握的数据规模当中最大的一个部分,我们每天接收上百亿的流量,这不是我们吹牛,是所有行业内的DSP都是这样讲的,上百亿的数据每一条数据都包括了很多东西,这些数据都包括了你的cookie、IP、设备信息、访问网站地址,有些甚至提供给我们网站的分类,甚至还会提供给我们这个用户是男是女,大概性别、人生阶段、收入规模水平,但是这些数据我们一般不用。这些数据是我们能够掌握到最大规模大数据其中一部分。第二部分是第一方数据,这个数据非常非常,甚至不能称其为大数据,只是具备大数据的形态,但绝对没有大数据的规模。第一方数据是我们广告主数据,比如我们跟一个电商合作,它的网站访问行为、它的访客是第一方数据,这部分数据虽然小,但这是真正可用的大数据,包括您在网站上看过什么产品,是否收藏了这个产品,是否购买了这个商品,为这个商品您是否提交了订单,是否完成了付款,是不是最后退货了,这些数据是跟广告效果真正有关的数据,也是为什么我们在对接客户时一定要通过很多种解决方案、很多套技术方案,一定要把你的后续数据跟我们系统关联起来,就是这个目的。这两方数据组成了一些同样在这个行业不可免俗的一些东西,但是我们不会去定义,最起码我们自己不会去推测你是男是女,不会当做核心的数据,我们推测出来就是大家能看到的这些东西,是权重,这个权重代表你的各种行为,都会在这个用户身上形成一个权重,每一个行为的组合都有它的权重值,这是纯数学的事,讲起来会让人很枯燥,我只是给大家尽量形象化的展示一下。

16:03【赵征】我们核心观点是消费者是复杂的,当一个转化产生的时候,说实话很难从理性角度上想清楚它是为什么,他是在新浪网上看到了一个超级品牌的汽车广告就产生了购买,比如兰博基尼,如果这么说我可能不会信,我不知道你们信不信。但是每一个消费者的转化行为我们都认为是多因异果,但是多因的规律又不是大家所想的一定有一、有二、有三就一定产生加成的结果,我们觉得所有的环境影响、个体差异,总结出来可以做权重的东西,包括媒体类型对它的影响,媒体内容对它的影响,他自己的兴趣、年龄、收入、时间等等都会产生影响,每一个因素的影响都会形成一个权重,他在这个影响当中权重是不一样的,每一个广告活动、每一个用户的权重都是不同的,这是真正的大数据计算复杂的地方。所以我们会去采集大量的原始数据,会采集第一方、第三方数据,同时加上我们有史以来的广告效果数据,然后去做计算,同样也会产生一个模型。但我们所有的模型都是动态的,针对每一个人是动态的,针对每一个活动是动态的,针对每一个素材全部都是动态的,有可能媒体的权重在用户A看到广告A的身上,媒体权重是4%,有可能他在广告用户A看到广告B的行为上权重占到50%,所以这是一个很复杂的数学过程,但是大家只要明白一点,即采集了在所有我能去接触到的数据当中最可信的部分,抛弃了推测的数据。基于这些数据,我去训练这个动态的模型,这是我们一直以来所做的一件事情,很难用形象化的语言解释清楚。

16:07【赵征】但是我们还是有我们自己特殊的一点,即我们除了对用户去做模型计算之外,还有一个计算的方法,是对用户进行质量打分,我们也是用了大量的数据进行,除了他在一个网站里的行为之外,我们还会分析很多细节的数据,比如他在这个网站里停留时间,回访率等等我们可以定义的行为,最终每一个用户都会有他对转化产生的比例,就是所谓的输出,这个比例值决定了我们对这个用户的重视程度。通过这些整体的计算,我们最终仍然会计算出来一批种子用户,这批种子用户我们也不是推测出来的种子用户,而是真实在这个网站上发生了转化,甚至后续的充值行为的用户,我们只把这部分很小量的用户作为种子用户去做扩散,而且扩散是依据质量分做扩散,而不是他的兴趣等等其他方面。

同时我们也做了跨平台的映射,我同意李刚所讲的,现在在国内能够根据账号去做跨平台映射的公司不到5家,我也同意现在通过账号去做跨平台的映射,比如您在搜狗上有和搜狐的账号,可以把您的移动端和PC端设备,甚至您的电视都关联起来,这是行得通的,而且是唯一的方法。所以我们现在只是应用少量的数据,并没有那么巨量的数据,但是要求有条件的客户全都配合我们完成这样的事情,我们现在同样在布局一个移动端大数据的产品,这个产品会在Q4发布。

通过这些数据的计算,我们最后的算法的产出,经过很复杂、很催眠一系列计算的讲解,我们算法产出没有大家所想的100%、200%、300%的提升,我们稳定的算法是35%,原来一个转化是100元,稳定能降到70元左右,这是现在我们公司立身于这个行业的根本。

16:12【赵征】实际案例—国美在线。我们在去年的时候是国美最大DSP的提供方,这是我们成就之一,也感谢国美对我们的信任和支持。我们针对国美实现的是完整的逻辑,在它的网站上采集数据,经过分析,给他推送动态的广告。第一步,我们会在国美网站上采集用户的行为层信息,即你在网站上浏览、收藏、加入购物车购买、付款、退货等等信息。直接信息,我们有一个爬虫系统,会把国美上您所访问的网页,我们只抓它的商品名称、图片、类别、价格和折扣,这些信息再往下会有一些延伸的信息,即商品关联,比如有些商品是买了之后就不会再买了,有些商品是买了之后会再买同类型商品,有些商品买了一段时间之内再重复购买,这些有很多人工工作在里面。我们通过互联网和移动互联网分别监测用户的行为,并且通过账号的方式尽量关联在一起,这些形成我们一个基础为国美服务的数据。我们会通过广告投放反复验证不同行为组合、不同标签组合和不同数据组合所产生的最终效果。如果在国美站内搜索相应的产品,你在国美搜索结果页。这次活动并不长,我们为国美带来1000万的销售额度,并且会有很高的客单价,以及很低的新客成本,这个数据是比较漂亮的。

16:15【赵征】壁合简介。我们公司只是成立了两年的公司,但是我现在绝对敢说我们在国内流量交易平台上消耗额度、预算额度能够排进第一梯队的,这跟我们一直在效果广告或真实的后续效果广告优化和投放上有关系的。公司主要收入80%来自于有后续效果要求的广告,主要涵盖四个行业:游戏、电商、教育和金融。其中教育和金融是我们今年新开的行业,我们之前做游戏电商和少量的品牌,不是我们不想做,而是我们觉得每一个行业都需要投入大量精力、时间做研究,你要懂这个行业才能投这个行业。

请大家花点时间关注一下我们的公众号,因为我们在今年的Q4会有两个重磅产品发布,还会有一个非常大的跟国内大型真正有大数据公司合作的一个项目,都会在第一时间通过我们的公众号发布出来,请感兴趣的朋友们都关注一下。

我今天的分享就到这里,谢谢大家!

16:17【主持人】非常有想法的一个老总,非常有实效的一个公司,不错。刚才我看了一下,刚刚结束演讲的几位嘉宾,我发现两个特点,第一都是结合自己的公司、自己的产品和自己的时间来讲他们对大数据、对营销、对应用的理解,兼而夹杂一些小广告,但是也很好;第二,前面五位都是男性IT狗。下一位决定调一下人,有请秒针系统媒体业务副总裁赵洁女士,她所演讲的题目是“打造以客户为中心的数据生态”。

16:18【赵洁】谢谢马老师的夸张,他至少承认我是女的。其实我不是学纯数学的人,我是理工的,但我实在觉得大数据挺烦人的,太干扰我的生活了,数据之大,无所不在,像电信运营商有所有的数据,像阿里、百度有点像数据怪物,特别霸道,把所有的东西做闭环,虽然马老师也说他们在做开环,但实际上从它的各种沟通上可以看到是在做闭环。然后跟我们同行一些DSP、Exchange和DMP的同事们都在再数据挖掘,做得很苦也很累。刚刚坐在我旁边的一个朋友说你们秒针跟前面几家公司有什么不同?我说当然不同,秒针是行业里面一个第三方,所以我们是紧紧跟客户站在一起,或者我们是行业的裁判,这就是为什么刚刚赵征先生有一个信息是错的,因为秒针是第三方,所以不做Exchange,我们过年之前已经把我们Exchange平台剥离出去了。秒针从2008年还开始到现在做的所有事都是以广告者需求的生态链。

16:20【赵洁】我们是一个数据农民,我们要挖数据,要监测数据的效果。当时邀请秒针参加的时候,我们市场部同事安排我去,我想了半天大数据到底意味着什么?到底对我们的含义是什么?对电信来讲是一个沉淀的数据资产,对阿里来讲是控制整个电商的平台,对我来说它一份工作。为了参加这个会,我也看了一点资料以后,我自己反思了,因为我的工作就是和大数据相关,虽然我一点都不懂大数据算法的东西。我看了很多文章,都是很技术相关的,我一点都不懂,我明白一个道理,大数据就是技术的革命,直白地讲基本让理工男翻身了,所以理工男现在特别吃香。我现在有一些观念,这种观念一定是一种思辨的行为,比如大数据有一些主张是全体不要抽样,前面看到也都说数据之大,并发之快,计算之快,全讲的是这些,没错,这都是大数据的好,但是大数据其实某种程度上要保持灵动性和数据的决策能力,实际上另外有一种思维,而且这种思维是在一些计算模型上和数据引擎上才应用的,是纯数学的东西,你会感觉到它是另外一个思路,它的思路就是数据要抽样,大数据不见得越大越好。实际上一定要考虑到数据效率的时候,这种思维就进去了。我认为大数据是一种思维的方式,是一种战略的高度,所以我们要会用数据去思维这件事情很重要,到底有多大?是一个T还是后面一个什么,其实并不重要。贵阳市市长也讲到,大数据推动的是整个社会的变革,对政府领导来讲,他看到的是智能的市场、智能社会的管理,Smart的概念,这种大家也体会到了。

16:23【赵洁】作为一个广告营销界的第三方,我们希望秒针能够帮助客户培育三种能力,1、整合数据的能力,我们要存、要算,这是数据的整合能力;2、我自己本身不是互联网公司出身的人,我是一家研究公司出身的人,我现在越来越感受到一点,数据本身存在,但数据背后是什么,它的决策是什么,真的需要有研究能力的人去思考的,靠我们理工男工程师其实也不能完全解答这些事情。因为数据工程师我们已经有了,算法工程师我们也有了,各种前台、后台我们都有,我们需要有的是架构师、咨询师,把这些数据用活,这些数据代表什么,这是我们必须要有的;3、最后还是要帮到企业有一个可以精准去实施行动能力的计算平台,这是大家都必须的,one data、one platform每一个做数据都是必须要走的一个方向和趋势。

16:25【赵洁】秒针最初的发展是以广告主需求带来整个公司整体产品的发展,有很多问题,但我们把几个问题归总一下,列出三个问题,第一,几乎所有跟我们在接触的企业或媒体(是指转型的传统的媒体)都会存在大量孤岛的数据,如何把这些数据打通是我们秒针要去面对的,我们要把消费者每一个触点全部连接起来,我们基本爬三种数据,广告投放的数据、监测的数据,同时站内的各种数据,social的数据。后面都是相对来说比较产品层面和技术层面了。第二,我的广告被浪费了50%,其实在互联网上,从秒针的视角来看,互联网上的广告也有被浪费,因为我们是第三方,有时候秒针会做一些特别讨人厌的事情,有两种浪费,效果怎么样,前面讲到转化率、跳转率,导到站内电商的购买,七十从我们数据库里可以完整监测到,这也是归功于秒针一直致力于和广告主站在一起,在整个中国保守地说大概是60%以上,自我夸张地说差不多70%的广告流量是过秒针的服务器,我们可以把这个收集起来,成为一个大数据库,然后孜孜不倦挖掘这些数据库。第三,在互联网上跟传统是不一样的困惑,互联网上很多的流量是非人类的流量,这件事对我们来讲作为一个第三方也是我们要去帮广告看如何让他的1分钱花在一个可靠的流量上,这是秒针要做的。

案例,PC和移动要打通,但凡做营销的,但凡做监测的,实际上都孜孜不倦在干一件打通的事,PC和移动打通,移动和数字电视打通,跨屏打通是大家必须做的,通过这些我们就可以前端的数据,比如这是4S店的情况,到最终施驾成功,以及移动端订车成功,其实转化率非常低,基本最后的转化率应该是小数点0以后的很多位。通过秒针的效果数据可以看到不同垂直类效果的转化情况,以及它的各种广告位的情况,对我们来说都非常清晰。秒针有一款产品叫SmartVerify,如果60%以上的流量都过秒针服务器的时候,无法甄别出屏幕前是人还是狗,但是知道这个流量是地球上来的还是非地球上来的。

16:30【赵洁】这段时间我们经常碰到的困惑,往往广告主会问到底是渠道更有效,还是内容更游戏?如果以内容营销典范的话,芒果TV内容做得好,不仅带动了传统收视率,稳固了传统的霸主地位,同时还把它的互联网整体都带动起来。芒果和优酷的区别在什么地方?这是常常被问到的问题。

在大数据下面,我们有自己的研究团队和咨询团队,会应用归因分析的模型看不同媒体,无论是付费媒体还是自有媒体,还是社会化的媒体,还是和最后行为相关的媒体,所有这些渠道当中谁的影响力最大,分别代表什么意义,它在整个品牌的建设当中的贡献是什么,这就是我们做的。

案例,这是我们一个真实的案例,是挺大品牌做的案例,我们用归因分析时,做了控制组合对比总,可以看到非常有意思的现象,转化率是0.038,但是video和social的时候就是0.318%,看到一个很有趣的现象,通过归因分析可以看到之间不同渠道的传播作用如何,大家有一个感触,在整个营销当中,social变得越来越重要,如果单单是一个视频也不行,单单是一个social也不行,一定是video和social在一起。

16:33【赵洁】我们做内容研究的时候,越来越多广告主问我们这个节目或这个平台可以给我带来多大的量,我的整合营销方案价值是什么?秒针就是要回答节目价值的三个方面,第一是整个内容的传播指数,第二是口碑越来越重要,第三是情感指数,因为类似都是代表着一种价值观和态度,这也是我们秒针要做的。看上去这三个里面其实包含就跟前面在座讲到的,用口碑的数据去挖掘他的互动,用口碑的数据去挖掘他的情感,其实一样,只不过我们今天不再讲数据,我们在数据上搭建的是产品的平台,这个平台服务的是我们的广告主。

我们在看节目时,往往说节目,但回到秒针体系来讲,现在不仅看的是节目,而且要看节目的组成元素,换句话说今天我可以把数据积累以后去做预测李冰冰的电影好,还是范冰冰的票房高,这就是我们要做的一件事。

前面都是讲到各种数据的维度、数据的4个V、数据的挖掘,秒针要做的事情就是数据的连接,我们认为所有的数据价值在于连接。第一,我们最基本的连接,我们还是一个第三方公司,所谓我们有线上很大的库,是验证DSP投放的效果,验证媒体投放的效果最主要的依据之一。第二,秒针从底层来讲,要做的一件事是把屏做连接,如果PC屏和移动屏的连接,到2015年这件事已经算过去了,现在大家在做的一件事,包括各大媒体在做的一件事,是把数字电视和智能电视和PC屏和移动屏加在一起的事,这也是秒针在做的事。秒针为什么被那么多广告主认可,归功于它把电视和互联网做了连接,我们有一个预算分配的体系。我们争取努力更多的去和一些电商数据合作,进行品牌和营销效果的连接。所有这一切我们只是想回答一件事,即回答以消费者为中心整个决策路径的数据全部收集到,从浏览行为、搜索行为到购买行为,到最终的沟通行为都是在秒针的数据收集和产品的搭建平台下面。

16:36【赵洁】前面也听到一些嘉宾提到数字资产和数据资产,我们现在不仅关注的是品牌消费者和品牌之间的数字资产,更关注的是消费者和品牌之间的数据资产,这就是说IT到DT的概念。我们帮助企业主整个构建数字资产的一个大平台,从数据收集到管理,到最终的应用,最上面一端都是秒针应用的产品,体现在广告主的产品应用上面。

我借助这个平台发布一下秒针最新的愿景TVC,也算是公司的介绍。(播放视频)最后一句话是“营销数据和技术公司秒针系统”,大家看完了以后是不是有一种数据给我们带来一种情怀的感动。谢谢大家!

16:37【主持人】谢谢赵总。下面有请世界邦旅行网董事长兼CEO张平合先生,为我们分享的内容是“大数据+达人众包开启规模化定制游时代”。

16:38【张平合】刚才赵总放了一个视频挺好,我们也先把视频放一放。前面嘉宾都是服务于广告主的,我是广告主,服务广告主的各位希望争取广告主,下面跟我聊一聊。从昨天开始,在北京所有写字楼的分众平台屏幕上都可以看到我们这个广告,如果觉得我们广告做得不好,可以跟我们聊聊,怎么样改进我们的广告。

16:40【张平合】可能大家会问做旅游的跟大数据有什么关系?这是稍微长一点的话题,八年前我们曾经做过一个个性化的推荐引擎,是做个性化音乐推荐,我们做了大概两年多,最后没有做成功。我们是怎么做的?完全基于机器的、大数据的分析、挖掘,以及针对广泛人群个性化的推送。我们没做成功,但是当时英国有一家公司,美国另外一家公司,做得都很成功,其中一家卖给一个很大的音乐集团,另外一家在纳斯达克上市了。这两家跟我们做得不一样,我们完全是基于机器,每一首歌曲是什么曲风,男生、女生,中文、英文,用什么样的配乐,是POP还是摇滚还是民谣,大概有400多项标签打进去,然后针对几百万首歌曲,根据不同人听的行为去分析、去推送。今天我看到有一个做得不错的是“今日头条”,是做新闻推送的,我们在八年前做音乐推送。另外两家公司为什么取得了比较好的成功?我发现它是基于机器+人,这也是今天我想主要跟大家分享的,大数据一定别忘了人。人工智能首先是人工,后面是智能。在座每一个脑袋都是一个小宇宙,人在整个大数据应用角色当中应该是扮演主流的角色,而不是机器。刚才看到很多都是用机器来分析,这也是想跟大家分享的一个方面。另外两家公司,其中一个叫潘多拉,潘多拉是用70多个音乐家分析六年,把各种各样的曲风数据用人的方式,而不是用机器的方式,做一个归类,然后加上机器分析做推送。现在新的宝马车上面全都用潘多拉做音乐系统推送。另一家公司是lastam(音)有点像social,比如大概八个人里面随便让两个人来看,A先生和B女士听前面100首歌曲或1000首歌曲其中990首他们听的是同一首歌曲,我认为当A先生在播第101首或1001首的时候,B女士可能也喜欢听,把1000个人听歌的行为做分享、做个性化推荐,这个精准度比机器推送的精准度大大提升,用人脑分析你心灵喜欢听什么歌曲,当然原理会比这个复杂,但基本上讲的事情是一件事,就是大数据的应用一定是机器+人共同的作用,才能真正产生可应用、可个性化,而且是规模个性化的产品出来。

16:45【张平合】我2012年创世界邦的时候,就想八年前那个故事,我要做个性化的出国旅行,要让上亿人次出国旅行的人不用跟团,不用上车睡觉、下车拍照,所有景点都是雷同的,如何做到这一点?就是要个性化。但是中国现在出境的人每年以1000万-1500万的速度在增加,我2012年想创建世界邦的时候,拿到2011年的数据是8400万人次出境,其中有6000万人是第一次出境,今天这个数据从8400万涨到1亿2600万,过去三年里已经增长了4000万,这么多人出国旅行,怎么能够按照自己的心情在几十、上百、上千个目的地几十万个景点和上百万个酒店里找到自己喜欢良好的体验,这是一个大的数据。大数据在旅游上的应用真正能够个性化定制,一定要把机器和人(旅游达人)在一起做个性化推送的精准。

趋势。2013和2014年的数据,GDP增长大概在7%,旅游的消费是20.8%,即3-4倍于GDP的增速在增长,总花销,2014年是1400亿,今年同比增长18%。出境旅游这一件事就是1万亿的市场,中国GDP去年是60万亿,相当于是1/60整个中国GDP的总值,所以是很大的一个数。其中70%的人要求自由行,而不是跟团游。70%的人想去自由行,这是挺良好的愿望,但现实并不是这样,有那么多的目的地、那么多的玩法,现在有那么多人第一次出境,跟团游不好玩,不跟团游不会玩,不操心的买不起,会玩的太操心,想自由行,花上百个小时研究目的地,这是现在人们比较痛苦的一点,能不能像跟团游一样去玩了,有人定好了这样的服务。要做到这一点,需要有大数据的观景台才能做到规模化的服务。如图,左边是全球现在比较热门的旅游目的地,大概是50-80个热门的目的地,比如塞舌尔岛,这个岛是处在印度洋靠近西非的一个地方,这个岛离马达加斯加非常近,靠近非洲的一个地方,这个地方原来没有中国人去,基本都是一些法属的人去度假,但现在整个岛上游客中有1/3是中国人,包括帕劳,中国人已经遍布其中了。有这么多的目的地,每一个目的地,就算有5-10各城市,每个城市就算100-200个景点,如果加在一起,还不够大,关键不同的目的地是先玩景山后玩北海,再去长城,还是先去长城再去798,再去后海,这中间的组合加在一起,我们算了一下,有意义旅行的线路信息数有54亿条,这个数还在增长。如图右边是每年新增1000万-2000万人次的旅行需求,每一个人实际上都是一个小宇宙,需求都是多样的,而且同一个人今年和明年需求又是不同的,所以加在一起会发现,如果我们想在这么多的旅游信息和目的地商品里面推送给其中一个家庭,是他喜欢要的,这是一个蛮复杂的事,也是一个大数据。

16:50【张平合】我们怎么做?我们现在做到一个用户要想出国玩,告诉我去哪里,我们现在有30个目的地,欧美澳新基本覆盖,想去哪里,我们通过结构化的数据,再加上遍布在全球的上千位达人,比如你要去法国南部,加上巴黎玩一下,就会有当地的一位留学生或者白领,在当地生活、学习或生活、学习过的人,利用他的业余时间从众多玩法里面,找到符合你是上亿人里面的一个家庭,你有什么需求,这么多的数据通过我们的工具,根据跟你的对话,针对那么复杂目的地的信息迅速的收窄成你这个家庭在法国15天旅行里面需要住什么样的酒店,是否喜欢毕加索,如果喜欢毕加索,法南有他的一个别墅,现在变成了毕加索的博物馆。不喜欢毕加索,喜欢博弈,法南还有一个非常小的袖珍国家,有3万人的摩纳哥,是欧洲最大的赌场。你说带着孩子想去嘎纳看看明星。我们用上百万条结构化的信息分成6-7层存储起来,然后用结构化的工具帮助我这个达人在法南生活三年,1000天不断体会这些信息收集到我的头脑里面去,在非常短的时间内根据你的需求给你做一个定制,如果在出行前两三个月定制了以后,你有一个朋友说其实法南还有一个更好玩的地方,我们还可以随时给你做修改。如果你还是不知道我要去哪里,达人可以给你推荐,根据这么多好玩的地方或者是我服务其他客户的需求给你推荐一个行程。

16:53【张平合】有的用户护照丢了,我们有非常好的定位,迅速追踪你在什么位置上,下一步要去哪儿。结构化的数据里面还有LBS信息,我们通过精准的定位做到精准到米的指南,也就是说没有导游的情况下,右边从巴黎的埃菲尔铁塔拍完了夕阳西下的美景之后怎么样到塞纳河上吃晚餐,我们把晚餐票订好以后,你怎么样走过去,其中可能要经过九段路程的条街,这些叫智能导航+精确到米的指南。

我们开了30个海外目的地有50万个可售卖的商品,在50个国家提供接机,80个国家提供达人网络,全球覆盖报信和700万辆可租的汽车,用户来自全球139个国家的华人每个月来使用我们的服务。

通过大数据,以及达人,经过过去三年的学习、生活积累的知识,有点像机器自学习,但实际上我们叫人自学习,这些学习的经验、知识放到他脑子里面,当要输出时,边际成本几乎接近于零,我们用这样一些达人的经验,加上数据的工具,再加上LBS一些信息和地理位置的互联互通,做到精确到米的行程和玩法。我经常跟朋友讲,你们的定制肯定很贵,因为我们用人+机器的方式。现在夏威夷三岛春节期间的定制架构在1.8万元到2.5万元,也就是说利用数据+达人的人工智能,把传统行业的价格成倍下降。最后我们和一个旅行团去的一个人的价格是相当的。如果你和你的先生或太太去德国宝马3系列,住星级酒店,把所有的门票、签证、WiFi、保险、租车全部费用加在一起,12天,大概多少钱?可能得2.5万、3万,实际上我们能做到1.6万元,其实比跟团游价格还要低廉。

刚才看到片子里面我们的一些愿望,在过去两年里,我们通过大数据的分析加上达人众包的模式,服务了全世界各国人自由旅行,这里分享一个案例,有一对聋哑夫妇去年去澳洲自驾了14天,过去基本上都要家人陪伴到一个岛上面去旅行,他们非常想自己能够自由完成旅行,去年通过我们的沟通做了这样一个旅行。他们自己开着车,拍了很多照片,写了很多优美的话。他们到了奥克兰中央公园,正好碰到当地开领袖会议,拍了一些政要的照片。

大数据和达人众包方式开启个性化的旅行,我这里没有二维码,我不喜欢二维码,因为我觉得二维码比较丑,如果大家希望做这种旅行,可以用微信公众号关注世界邦或者搜索世界邦。谢谢大家!

17:00【主持人】谢谢张总。下面有请平安金融科技业务发展中心总经理彭涛女士,为我们分享“一财通基于大数据用户经营”。

17:01【彭涛】我应该是在这个论坛里最不务正业的人,因为我们不是做Exchange,也不是做DSP,也不是做广告投放的,平安是一个金融集团,今天听了一下午大家讲的大数据,都是跟广告相关的。其实我们又和大数据紧密相关,在所有的行业里,其实金融是最早利用大数据进行业务的,比如信贷,信贷业务主要通过对用户的征信和持续收集用户各方面的数据和行为来进行信贷的定价。比如渠道,金融投放的渠道也是持续通过对各个渠道数据的反馈,对不同人群数据的反馈,经过大数据的方式去做风险的控制个产品的定价。我今天要讲的其实是另外一方面,下午大家可能听得比较多的是公司、机构怎么样用大数据的方式去提升投放的效率,去提升触达用户的效率。当然对于我们来讲是用大数据做用户的经验,但从另一个角度,对用户来讲,用户如何通过大数据的方式去管理自己的财富。所以我这个课题的名字本来叫“基于用户经营的财富管理”,主办方希望我能够跟大数据的论坛更贴切一些,所以把名字改作了“基于大数据的用户经营”。

17:03【彭涛】大家有没有注意到,特别是在中国,管理的资产相关机构非常多,各类财富管理机构,包括从银行到证券公司,到P2P,到时候理财公司,各种各样加起来有2万多家。健康的也非常多,各类医院健康管理公司有3万多家。生活就更多了,证件办理的部门,各类会员卡提供的部门有500多万家。这对我们个人来说是一个什么样的意义呢?在中国其实每一位个体的用户在一生当中其实可能会持有超过50张各种卡,包括不同银行卡,特别是年纪已经超过40岁的,换一家工作就会有一张新的银行卡,可能哪个地方有一个优惠,你就会有一张新的信用卡。我们每一个人的投资可能分布在不同的银行、不同的证券公司、不同的P2P公司、不同的第三方财富公司。我们还会有很多生活证件的卡,各种各样的证件卡,身份证、护照、港澳通行证,各种会员卡。我不知道大家如何管理这些卡,或者怎么样管理这些资产的?现在在中国兴起了一个行业,叫第三方财富管理领域,但在整个中国接近7亿网民当中,其实只有不到1%的用户是有专门针对于它的财富管理服务,但经过我们自己的调查发现,其实超过90%的用户都希望能够有专业的机构给它提供这样的服务。

这是我们每个人都在问的问题,我们自己到底有多少张银行卡?每个月的流水,流入、流出我们清楚吗?有多少投资分布在不同的地方?是不是有很多保险,可能我自己都不知道。更深一步,我不知道多少人有做自己财富管理和自己家庭的计划。如果有人做的话,做的方式是自己建一个表格,或者自己建一个很长的清单去记录自己每天的流进流出,其实这对每一个个体来说就是每个个体的大数据,每天有多少流入、多少流出,钱花在哪些地方,其实没有多少人能讲得清楚。

再往下一步,市场上有这么多琳琅满目的金融产品,这些是不是适合你的?因为对自己不了解,比如现在市场上有很多收益在15%-20%的一些金融产品是适合每一个人的吗?如果一个年收入在5万元刚毕业的大数据,其实不应该去买年收益在20%的产品,他自己的流水都没有办法去承担这个风险。换一句话说,一个家庭收入在100万以上的家庭的投资方式其实应该是不一样的。

17:08【彭涛】最后一个问题是你的私人顾问能够满足你自己家庭的财富管理的需求吗?整个私人财富管理顾问市场其实在中国也是刚刚兴起,比较高端的人士其实还没有开始很好地享受这个服务,更不要说普通家庭了。但是在中国真正兴起的往往是中产或向中产往前走的家庭和个人,这是我们认为对个人,特别是对个人财富来讲,是我们每个人应该做好的大数据的管理。

平安是个人综合金融集团,平安业务包括从保险到银行、到证券、到投资各块业务,为什么最早是在平安里面形成一账通呢?发现很多用户可能有多样金融产品,但是往往金融刚刚开始的时候,哪怕直到现在很多金融机构更多从卖产品的角度不停把这个产品去推送给客户,哪怕以我们认为最精准的方式推送给客户,很少看到有一家机构是站在用户的角度,以用户整个生命周期的角度去看这个用户可能在他的不同的阶段和在他不同已经持有的资产配置的情况下去整体的管理他个人的资产,这是当时一账通最早开始发起这个产品时的初衷。希望通过把用户不同资产打通,然后给用户提供全面财富管理的工具。开始的时候这项工作非常容易,但相信难度不亚于多屏之间的打通,保险账户和银行的账户安全等于完全不一样,要实现这个相互打通是非常困难的事情。对于一个用户来讲,其实在平安的资产是他资产里面很小的一部分,所以平安内部金融资产的打通和平安外部金融资产的打通又是一个艰巨的工作。金融资产也是一个人非常小的一部分,金融资产和非金融资产的打通又是一个非常大的工作。现在很多讲征信的部分,金融资产里面有财富的部分,有征信的部分,还加上用户的行为各方面的部分。所以我们做的是这样一件事情,即我们希望能够把这些信息汇聚在一起,基于把这些信息汇聚在一起以后,去给用户提供更好的服务。

17:11【彭涛】我们如何做这个事情?我们主要做两块的打通,一是在账户层面的打通,包括平安内部和平安外部金融资产、非金融资产的打通,同时我们是一个非常开放的门槛,让用户愿意把他的信息放上来,然后我们进行服务。把这些服务整合了以后,我们做的事情就是财富的服务,通过我们对用户资产和行为的分析,去给他提供适合于他的,不管是资产的透视、财富的扫描、智能的提醒,提供一个个性化的服务。

简单的事例,也是我们即将要推给用户的一个服务,如图,存款里面是6,把用户,包括平安和平安以外的6张银行卡都整合在这里,信用卡有2张,投资有4项,这个投资可能是通过银行走的,可能是通过第三方P2P,我有2辆车,1个房,有多少贷款,有多少积分,到用户是非常简单、完整的页面去看对于一个个体到底整体有多少财富。更仔细的是有多少企业年金,有多少不同类别里面的财富分布。到目前为止我们整合了包括19家平安内部以及150家平安外部的账户,生活类账户更广一些。

17:14【彭涛】整合这些资产以后我们会做什么?这部分和大数据非常相关,这是给用户的一个呈现,我们给用户整体的打分,分数里包括信用分数,结合整个平安征信体系,以及他的财富分数。用户再往下一步会想仔细了解在财富分布里,他的投资、保险、资产、负债、流动性健康情况到底是怎么样的。基于对这些健康情况的一些分析,比如这位用户是一个资产已经有500万的用户,但发现他完全没有做任何保障性的一些配置,我们就会告诉他,可能基于你现在财富整体情况,再保险这一块的配置其实是比较弱的。这是我们会为用户提供的一个整体的服务。再往下一步走,对于金融行业我们认为可能会有改变的,刚才讲了那么多的分析、那么多的整合,再往下一步走难免走到产品这一块,大家看到很多不管是第三方财富平台,还是其他产品的平台,大部分的平台都是用把产品推向用户的方式,其实很多平台并没有很仔细去看这个产品是不是适合这个用户,我们希望打造的一个方式是根据用户的情况,告诉他什么样的产品是适合他的。所以我们希望给出的口号是,第一希望金融是民主化的,并不是由金融机构告诉你来买这个东西,而是根据你的需求,当然背后你的需求的挖掘是基于大量数据的挖掘;第二希望投顾普惠化。我们发现未来80后、90后不愿意跟投顾打交道,希望自己拿主意,所以更希望是一个更开放的平台给他一个比较中立的建议;第三希望从产品的角度,根据用户个人情况进行定制化金融的服务。

很多平台逐步希望用户把他的信息放上来,然后做整合提供服务,但是这里有非常重要的一个因素就是安全。我们也看到市场上一些平台推出的服务,但是安全机制得不到保障,用户是不敢用这个服务的。作为老牌传统金融机构做这件事情里面考虑最大的一个因素,相信不只是金融,包括下午大家讲了那么多大数据,在座作为一个用户,考虑最多的就是安全,因为你的所有信息都暴露在所有商家的下面,作为个体,你的安全怎么样去保障,我信这是个体会有要求,但是作为企业来讲必须要守好的一道防线。

17:18【彭涛】最后一点跟前面一位嘉宾讲到的合作是相关的,在这里我们做了大量的探索,作为金融机构,我们希望打造一个全产品线的金融产品,但是我们发现在互联网各个垂直领域,其实需一个垂直领域大家都在做金融需求的衍生,其实这个合作点无外乎三条,1、不管对于垂直领域来讲,还是对于金融机构来讲,如何做用户全生命周期综合服务;2、用户在垂直领域积累了大量的信息和行为数据,在金融另议也积累了大量的信息和行为数据,这些信息和数据怎么样互融互通,起到更好的数据挖掘的效果;3、每一个垂直领域有非金融的信用体系,这个体系如何和金融现有的体系融合。

一账通是在8月13号会重新上线,马总一直讲整个平安集团有两朵云,一个是资产云,一个是健康云,资产云就是一账通,我们现在已经有5000多万用户,月活超过10%,非常希望不管是在座的个人更多用我们这个产品,我们8月中旬会上新的产品,还是在座各个互联网的垂直领域的合作伙伴,我们希望大家能够一起联手,把给基于大数据用户的服务做得更好。谢谢大家!

17:20【主持人】下面有请友盟CEO叶谦先生,主讲题目是“移动数据的下一站:挖掘海量数据价值”。

17:21【叶谦】大家好,今天能来这么多人,我非常高兴能在这里和大家聊一聊移动互联网相关数据的一些事情。我今天下午三点半左右到的现场,在我前面大概有六位演讲嘉宾,其中大概有四位展现了公众号、二维码,有三位在演讲里有视频,有两位是女性,还有四位的产品跟广告相关或者提到了广告。从这些数字可以得出一些结论,1、微信现在确实深入我们的生活,因为有大概66.7%的人提到了公众号;2、大数据这个事情跟广告相关。提议下次如果大家参加演讲或要去演讲的话,记得放一个视频。

17:23【叶谦】刚才我就是临时客串了一下互联网大数据分析师的工作,首先我采了一个样本,我对这些样本进行了一些数据统计分析,然后得出了几个结论,病人给出了建议,当然这个结论和建议可能比较扯,但这些事情是我们现在分析师每天都在做的,如果我的结论够新颖的话,我可能还得去36氪上投篇稿子。

今天我的题目是“移动数据下一站”。首先做一个现场调查,在座各位有多少听说过友盟这家公司?大概有1/5的人知道。友盟是一家致力于给移动互联网提供服务的公司,我们公司成立于2010年4月份,整个产品体系是以我们统计分析产品为起点,我们在2011年的时候推出了在线参数服务,2012年我们瞬时推出了社会化分享组件,2013年整个产品有比较大的升级,推出针对垂直行业的游戏统计分析服务,2014年打造了KTPlay,为手机游戏提供游戏类社区服务的产品,还有消息推送。今年推出微社区和用户评级服务。

友盟现在在三个方面为我们广大移动开发者提供价值:1、全国数据量最大的统计分析服务,目前我们平台每天可以采集来自于全世界各地6亿台不同移动设备的数据;2、集成APP最多的社会化分享服务,我们服务大概为10万款以上的APP设备提供社会化分享服务;3、功能最强大的消息推送服务,我们的精准数据以及稳定性在业内都是领先于竞争对手。我们在过去五年中一共服务了64万款APP并且为23万开发者提供价值,我可以非常自豪地说,在友盟这里有全中国体量最大的移动数据。很多同学可能就想问,你们有这么多数据或者数据对移动开发到底有什么作用?我之前一直在思考这个问题,我们的数据对于移动开发者到底有什么作用?有一次看了《一代宗师》电影,其中提到见自己、见天地,见众生。这跟我们这个有点像。

17:27【叶谦】什么是见自己?移动开发者处于早期,刚刚自己做了一个APP,最关心的是用户新增数据、用户活跃数据、留存率、错误分析、渠道推广效果数据。这些数据关系到这个APP能不能从0到1,如果你的APP刚刚上线,一定会关心今天到底累积多少用户,在360渠道上下载量到底怎么样等等。留存率,就是新增用户在一段时间之后有没有回访,如果他的回访次数越多,就是对我这个APP比较认可,我的APP确实满足了他的需求,如果用了一次不回访,就说明你这个APP做得太烂了。之前很多朋友问我能不能给我们提供一些参考数据,我想知道我这个留存率在业界是不是牛的留存率?移动互联网里垂直领域非常多,不同领域的回访率、留存率不一样,比如天气类应用可能每天会看,但像机票类应用,我觉得可能有需求,平均一个月看一次比较合理,这样留存率做一个横向对比意义并不是太大。

对一个新的APP来说,必须要实时关注的一个数据,就是用户对他的反馈。这个数据是比较真实反映了对你的APP又爱又恨一部分人的心理,我觉得你的APP太烂了,根本不需要给你反馈,如果你的APP很好,也不需要反馈,真正能给你反馈的用户都是你的核心用户,你需要好好看他们的一些反馈,然后来改进你们的产品。这两部分可能就是APP开发者在他们APP刚刚上线时候最关心的两个话题。

17:32【叶谦】当他对自身有了一些了解之后,下一步关心APP量长到一定程度之后,可能就会想见天地,想了解一下这个APP现在在行业内处于什么情况,或者这个行业怎么样的发展。有一句挺有名的话,是雷总说的,只要站在风口上,猪都飞起来。友盟提供了一个产品——友盟指数,包括设备指数、市场指数、应用指数和社交指数,从四个维度帮助大家来分析现在市场里哪些APP比较火,哪个很也比较火,以及每个行业的发展趋势。当然除了我们提供的一些数据之外,大家其实还可以通过其他很多媒体、很多其他渠道看到其他一些数据,这对你们了解行业,对你们了解以后应该如何改进产品都有非常大的帮助。

了解行业趋势。我们提供的一个数据报告的产品,这个报告每年、每个季度都会发,我们有季报和年报,这些报告都是我们基于对于我们采集到的每天6亿台不同的移动设备的数据进行采集、分析、整理出来的产物,这些报告都代表了最近这段时间互联网的发展趋势,如果有兴趣的话,大家可以参考,我想对大家的APP开发会有很大的帮助。

见天地之后,让APP真正发展到一定规模,比如日活达到几十万,下一步可能就更需要了解在这个生态里你的用户或其他用户的一些情况,首先你可能会更加有意愿去精细地了解你自己的用户到底是什么状况,首先你的日活可能现在已经达到每天几十万或几百万,但这些到底是怎么样的一个分布情况,全都是新用户,还是有一部分本周已经访问过,然后回流的用户,还是以前老用户一直在用你的产品?如果你发现你的用户里面大部分活跃用户都是新用户,其实对你来说应该说是一个警钟,因为你的日活必须依靠不断去推广、不断获得新用户去获得,但如果你的老用户非常忠诚,占的比例非常高,我非常高兴告诉你你的产品做得不错,可能你下一步只要想办法扩大你的核心用户群,你的日活、你的用户数还会不断往上涨。沉默用户也是我们做一个指标,可以帮你分析到底你的用户有没有只下载一次就走开。

17:36【叶谦】除了用户回访情况之外,可能会感兴趣你用户的一些兴趣、属性和质量。友盟今年推出一款新的产品——用户评分产品,这款产品是业内第一家帮助APP开发者分析他们用户质量的产品。利用我们之前累积的数据进行深度挖掘,何以帮助APP开发者分析我们用户各方面属性,如年龄、性别、购买能力、感兴趣的一些话题,或者感兴趣的一些东西。用户画像前面几位嘉宾也提到,可能我们数据源跟他们不太一样,我们完全依靠移动上的数据,依据你的APP活跃度、APP属性做这个分析,所以我们数据源应该是比较独特的。现在移动上有一个不太好的风气,有很多灰色地带,很多移动广告系统都受到了一些不正当分子的刷量,可能利用一些假的设备或利用一些虚拟机刷广告量,但我们现在提供的用户评分产品可以帮助大家识别这些质量较低的量,这对于我们的推广来说是比较有帮助的。

在精细化运营阶段,我们想知道用户的珍惜需求,这一点是刚才用户反馈并不能直接带给我们的,因为用户反馈系统能够在上面进行反馈的一定是对你的产品已经又爱又恨到一定程度的用户,但是有很多用户的一些需求或用户需求的改变是没有办法从用户反馈里得到。友盟提供一个微社区产品,可以帮助APP在应用内打造一个微社区,有点类似于微博的形态,可以帮助开发者聚集用户,在微社区内进行讨论、交流,并且发现他们新的兴趣点,我们开发者可以根据新的兴趣点对他们产品进行改进。

17:38【叶谦】刚才是从友盟发展历程中总结出来的规律,大家从一个小APP到中型APP,到大APP,需求可能发生不同的变化,但必须要说到一点是,刚才说的趋势变化只是在前几年的趋势变化,现在时代已经改变了。据统计,每个网民移动设备数至少在1.5部以上。与此同时,我们季度活跃设备总量增速在放缓,也就是说移动互联网的人口红利其实已经接近尾声了。在这种情况下,我们还发现另外一个有趣的现象,今年1月份和去年7月份我们做了统计,在这两个时间段内,大家使用频率比较高的活跃APP有超过1/3是半年内发布的,这说明两个问题,一是虽然我们现在APP市场存量比较大,已经达到上百万个APP但新的APP仍然有它的机会,另一方面由于新APP非常多,所以新APP面临的竞争也非常多。如果今天我再用刚才的思路,先见自己、见天地、见众生方式去使用数据,可能已经没有办法赶上这个时代了。举例,大家手机里可能都会安装一个或多个新闻类的APP,这些新闻类APP宣称自己的一个核心竞争力往往是可以给你做精准的新闻推送,可以在你打开新闻客户端的时候就预判到你是喜欢之前的优衣库的新闻,还是喜欢冥王星的新闻,如果想做一个新的客户端,新的新闻类APP只能依赖现在能够提供给它的第三方大数据平台的数据来做这件事情,就是说我作为一个新的新闻类APP,不是先累积数据再分析数据,而是需要在我的新客户第一次打开这个新闻客户端的时候就知道他想要看到什么样的东西,这样才能提高他的用户体验,才能把这个APP做好,把他留下来。在我看来,未来的明星APP需要三方面构成,第一方面需要依赖强大完善的云计算服务平台;第二方面合理的商业模式,完全不赚钱,先累积流量是一个玩法,但是这个玩法可能越来越难玩了;第三方面需要有力的大数据支持。以上就是我今天想分享给各位的一些东西。谢谢大家!

17:40【主持人】下面有请360数据中心副总经理傅志华上台,他来对话阿里巴巴数据委员会会长车品觉老师,大家热烈鼓掌。

傅志华:非常荣幸,我是这次对话的采访人,车老师也是我们整个大数据行业的前辈,我记得很早前我就关注了车老师在新浪微博、在微信公众号的各种言论,缔元信让我主持这个论坛,我也了解车老师关注什么,我今天提的问题基本上代表了整个行业,包括车老师最关注的话题,希望对大家有用。车老师先跟大家说几句。

车品觉:我是很担心的,我觉得我还不可以一个人去做这个访谈,但是既然这样安排了,就尽量把我自己的观点说出来,大数据行业根本就没有所谓专家,大家边跑边看。

傅志华:车老师非常谦虚。我们直接进入正题。大家都知道大数据非常大,而且大家感觉大数据是一个非常技术性的话题,做营销、产品运营,觉得大数据是非常先进的一个技术,但跟自己没关系,实际上我们要推动大数据的发展,肯定要解决这方面的问题,即如何让大数据更加平民化,有两个含义:中小企业如何把大数据用好;即使是一些中型或大型企业,也有很多数据,也不一定能把这个数据用好。所以我理解的平民化有这两个方面,也请车老师给大家指点。

车品觉:刚才叶谦讲他的PPT,今天如果再发展APP,企业优化具体的业务或产品来讲,不可能重新所有东西重建,所谓见天地、见自己,不可能,今天是竞争的环境,有一个好的云平台,有足够的计算能力、存储能力,最后要有一个支持大数据的东西,不可能从现在开始积累数据、使用数据,最重要的是中小企业当要使用大数据之前,如果没有一个很好的商业模式,前面这两者跟你都没关系。为什么会谈到产品经理,产品经理最厉害的点是选择你的擅长去做,因为不是所有的问题都是数据能解决的,一定要找到一个地方数据在这个地方去解决它是最好的、最有效的。什么问题、谁的问题、你能解决吗?以后是数据能解决吗?现在能解决吗?这是产品经理必须要面对的。如果当你把数据整合完以后是三年以后的事情了,基本上没你什么事了。因为建数据是最痛苦的。刚才中华说的是这需要花很多时间建好自己的数据之后,发现产品在上面跑的时候很爽,但如果数据层没建好的时候,在上面跑产品,会发现太困难了。

傅志华:但是有一个问题,这个过程很漫长,很多中型企业可能都受不了这个过程。

车品觉:所以不是所有问题都是数据能解决的,或者不是所有的问题今天都已经有数据能解决,如果要等到这个数据出现的时候才做,那你就等一下。你的资源不是一定要用在那种场景里,你的资源是用在今天的数据本来已经有点ready的。平安说有很多数据,我的数据是ready的,把数据散乱的地方整合在一起,然后标准化,先建自己内部的生态才管外部的生态,肯定比其他金融公司准备的好。换过来360做这个事情,可能要花很大力气做他们的事情。所以每个人本身的数据资源是不一样的,所解决的问题也不一样,隔行如隔山,在数据上也一样的。

傅志华:您之前提过有一些公司专门做数据预处理的,您觉得这种技术在中国应用中会不会提速?

车品觉:肯定的,看看今天美国的发展,连数据都变成服务了,所以谁都可以拿。最近有一家公司在美国,把爬数据作为一种服务,每个行业的人都要爬数据,他现在创了一个新的领域叫爬数据服务,如果已经足够大的时候,你干吗建一个爬虫机器,他已经是最好的爬数据的服务了。还是回到叶谦说的事情,在别人的肩膀上,他做得很好,所以我使用他的数据,不用什么都自己建。所以答案在中间层里面,包括数据的中间层、工具的中间层,以及算法的中间层,三个中间层在今天的中国来讲跟美国相比到底差多远。

傅志华:您觉得差多远?

车品觉:我不敢估计,中国产业链创业公司今天还不足够去支撑一个企业,比如阿里要不要把数据某个环节给某个公司去做,但是美国的产业链已经开始出现这个苗头,大量中间层的数据公司出现,大量投资者去支持。当然张思梦在中国做这个东西也是有人支持他,中国未来也会出现这样的东西。

傅志华:但我会估计比较麻烦、比较困难,我感觉最大的差异是在美国和中国环境的数据意识。

车品觉:我们在中国走访大部分大数据论坛,怎么样可以把ETL的东西智能化,类似东西不会再中国听到太多,大家其实都想做出彩的事情,这个事情做好了以后,老板说太好了,能帮我赚钱。应该有一个人真的能跟公司里面的高层沟通,你到底有多少个数据底层的东西要做,多少中间层要做,多少上面的层要干,今天能不能用一个故事的说法让管理层明白他要投这个东西,但是中小企业不一样,中小企业是必然要在今天的一些大个子里面给出方案,支持中小企业去长大。或者他也是中间层,让你们去使用。

傅志华:我感觉还是有点难,比如让中国企业老板花很多时间去做中间层的处理,可能得边做这个边提升30%、50%的车技出来。

车品觉:就是要聪明的做这个事情,要不然今天就不能坐在这里了,就是要用小的项目支持你还能坐在这个位置,才能跟老板说其实我要做一个中期的东西,再后面才可能跟他说有一个更遥远的东西必须要解决,否则你根本没有资格去谈这个事情。但是中国今天有一种人才必须要培养的,是商业与数据的中间物种一定要出现。

傅志华:刚才讲了数据处理流程,还有数据源的问题,没有数据,有很多企业是因为招了很牛的数据人员,比如数据处理、数决挖掘人员,但没有数据是最大的问题,未来很重要的趋势是也许一些大的公司会联合起来,形成一个公用的数据银行或不同行业、不同企业,甚至政府会推动,把一些有用的数据形成一个公共的方式,美国奥巴马推动了病例电子化,对全民健康医疗都会有帮助。数据银行是未来一个很重要的趋势,但是在未来两三年内,您觉得数据银行有没有可能发展到比较理想的状态?您对这个事情的预期怎么样?

车品觉:问题前面的部分很重要,如果有一家公司招了很多有算法的人,但是没有数据,这个老板肯定做错了决定,方向都错了。没有数据怎么培养到很好算法的人,今天中华在做所谓的one data,没有数据,找一堆玩算法的人过来,肯定也会走的,因为没有活。数据银行就是数据的共享、数据分享,首先要看到底我们分享的是死数据还是活数据,如果把半年前的数据给你,仅仅放数据在银行里面,你从银行里面把数据拿出来,我觉得一点都不会有用,因为这是死数据。当他放数据进来的时候,有没有把这个数据的数据告诉你,如果没有告诉你,你发现这个数据很困难。当我用这个数据很爽的时候,突然停掉不给我用,可能我的痛苦不亚于你不给我数据。数据的质量、数据的稳定性、数据是不是连贯性是考核银行数据到底有没有用,如果发现三者都没有的话,宁可不用银行的数据,因为有问题的话都不知道怎么办。

我今天看了一篇文章,有一句话让我想到,大数据里面有一个比较特别的东西,它去挖掘的是大部分跟你行业的人都不知道,这个数据实际上跟这个行业是很相关的,但是你能挖掘出来。大部分东西很小是从跨行业里面过来的。当这个东西让每个人都知道的时候,会发现变得做这个行业里谁都知道,更不能没有,如果没有的话,一点竞争力都没有了。会发现整个大数据里面都去挖掘一些别的数据跟你数据的关系,而产生一个很新的价值出来,在这个定义之下发现要获取别人的数据来改进我自己数据的东西很重要。但要解决的问题是数据质量、稳定性、一致性,这三者里面最简单两个字就是规范,没有规范怎么知道数据质量没有的,没有规范怎么知道是否稳定,是否一致性。数据规范没有出来之前,乱把一堆数据给我,也挺费劲。

今天中小企业为什么没有用大数据,甚至大企业使用大数据的成本不低,因为从底下到中间层,到时候使用,到数据循环,再回收数据,再把数据刷新,整个链条里面所发挥的力量到底有多大,所以我为什么很同意叶谦的说法,你不必闭门造车再做一次,不用重复做相同的事情。今天这一步还是差很远的。

傅志华:数据共享还有很多问题要解决,因为中国隐私保护法不是非常健全,包括有很多企业也不一定有意愿去共享自己的数据,或者对别人有用的数据,这些问题都挺难逾越的。

车品觉:这是另外一个技术上可以解决部分的问题,在不影响个人隐私之下,依然要把数据的价值体现出来,这对数据的成本又再抬高一个门槛,必然会出现有人只做中间层,我不跟你们竞争,这个成本分摊到每一个行业里面的时候,觉得很划算,做得很标准化、很稳定,让你们使用,这就是美国今天的生态,美国的生态已经到了这个程度。但是在数据中间层的公司,发现美国好几家这样的公司已经做了数据整合20年了,就是说有20年的背景去整合线下的人,现在发现有线上数据可以整合,所以在整合上是非常有经验的,所以在短时间里面能做到这个层面,美国拥有非常多的数据,反过来中国没有太多以前,所以这个地方会成为它的一个门槛。

傅志华:可以投资一些有价值的公司,比如京东也投了,这种方式会不会更快加速大数据的进程?

车品觉:看投什么,如果投底层数据的时候,会对这个东西有了解。

傅志华:车老师为什么要从数据管理转向数据治理?先请车老师给大家介绍一下这两个概念,什么叫做数据管理,什么叫做数据治理?

车品觉:数据管理就是从上而下的管理方法,数据治理是一个从下而上的管理方法。最不一样的东西是当里今天所管理的很多东西都是已经知道的,当然可以从上而下去做规矩,但今天所面对的东西根本就不知道它未来的发展怎么样的时候,很难使用从下而上的管理。阿里云没有给一个非常清楚数据安全怎么样,但是我们有一个委员会,会每一个案例审完以后,根据数据安全的精神,我们判定这个案例时这样判。当案例不断积累的时候,有一个案例进来的时候,当这个东西积累够多了,差不多有两年的时候,我们开始会做公司数据安全规范,基于这两年的积累才能做这个规范,只是规范而已,而不是法律一样的东西,从规范来讲我们知道怎么处理某一种数据分享时所应该要遵守的情况。

傅志华:利用大数据有哪些创业机会点?这是网友提问的,但是这位网友提问前加了一个背景,说在BAT的垄断下,大数据还有哪些创业点?我刚才跟车老师讨论好像这个背景不应该放在这儿。

车品觉:我觉得这个背景这样讲的话,证明你自己对大数据太没有信心了。

傅志华:叶谦他们也是在BAT夹缝中成长,变成很大的一个企业。

车品觉:友盟的数据就是自成体系的,看见了移动的APPs里面有这样一种机会,所以做这个事情,而且往往不是先奔着数据去想,先要解决用户的问题,后来数据再积累。所以创业的时候,今天在市场里面到底有没有一些数据别人没有注意,但这个数据收集相对比较容易、比较低门槛,收集完这数据之后,发现这个数据其实能解决大众的一些问题,用这个东西作为起点去把数据循环。旅游的网站就是讲类似的东西,如果没有人愿意在海外旅游时留下他们的一些感觉就没有这个数据,这是他们自己在出去旅游时愿意分享这个数据,所以出现这个数据。其实数据只要你想到,就有,只不过收集的成本有多大,以及收集完这数据之后能不能成为一个大众的解决方案,如果成为一个大众解决方案,其实这个商业的模式就成立了,你就能创业了。我刚才讲的东西跟第一个问题倒过来了,什么问题?谁的问题?这个问题你能解决吗?这个问题应该是现在解决最好吗?解决这个问题的数据现在出现了吗?从问题开始的,但是如果把这个问题从后面开始也可以,今天我发现有一个很有趣的数据,这个数据可以整合起来,现在刚好是时候用这个数据能解决一些人的问题,以及这个数据是可以产品化去解决它们的。

傅志华:可能更多人创业的时候都是后者,先看到自己的资源,然后再想它的价值。

车品觉:说明是数据人,如果是商业人不会这么想,商业人是现在有100万,能干什么,看见什么机会,不敢是不是数据,反正能赚钱就可以。当我看完这个问题以后,有些数据必须要引进以后才能解决这个问题,所以我要数据。

傅志华:如果做数据公司的话,您有100万,可能烧一两个月就没了。

车品觉:数据化运营和运营数据其实是两个不同的环节,大部分公司的启动最好是用数据化运营去做,不要用运营数据来做,因为运营数据所付出的代价会比数据化运营难很多。看你的资本,如果你一出生就有一个富爸爸,可以试一下,收集足够数据之后,成为这个垂直数据的王者,说你们都用我这个数据,有一块很好的地,你在这个地里面能种出很多东西出来,还要培养一帮人使用自己的数据,找几个亮点出来,这个地说真的能长这么多东西出来,这就属于生态了。不简简单单是一条线就能把鱼钓出来,要很多条线放下去才能钓出鱼来。数据运营肯定跟生态有关,但是如果要使用数据来解决某个问题的话,应该是哪一个中小企业都可以做的事情。

傅志华:我也想从车总本身自己的发展历程反过来给大家一些启发,如何推动企业的数据化运营?车总在您的人生整个发展过程中遇到过哪些比较大的坎,如何逾越过去的?数据化运营非常美好,但过程非常痛苦、非常曲折,能否分享一些您的经验?

车品觉:我的东西很难历史重演,做数据行业前期几年肯定会很委屈,因为大家都不知道这是怎么回事的时候,你做这个行业就必须要去接受这种委屈的感觉,然后逐步证明数据的能力,从小到中,从中到大,今天最关键的东西是你到底懂不懂把数据的东西翻译为商业语言,让做商业决策的老板明白。

傅志华:即怎么用语言能忽悠住老板?

车品觉:让老百明白数据到底是怎么回事,他要等多久,要做什么事情。从数据层面翻译数据的东西让管理层知道。同时翻译管理层的需要给技术的同学们,让他们感觉到很兴奋。做数据行业,如果不感觉到做数据很兴奋,其实很难做这件事。我本身很爱数据,所以不管中间有什么打击,其实我基本上很快就会觉得好,想想应该怎么办。我觉得比较能概括得就这么简单,每个行业都是这样,你们要找到爱的东西,坚持你做的事情,并且很好奇这个东西怎么样可以做得更好。这不是数据的行业,任何行业都要这样做,才有机会成功,特别是好奇这一点,就是不断好奇,想象力和好奇应该是不断去延伸的。

傅志华:看来成功的人有相同的做法,周鸿祎最近在企业内部一直提倡好奇心,要对一些新兴的事物有一个探索的欲望,这是非常重要的。

问:在数据分享过程中的隐私安全,还有数据的价值度量问题,这些年IT的度量有很多人在研究,比如MIT有很多度量的方法,但是数据价值的度量,因为一旦商业化以后,涉及到如何定价、如何使用,包括一系列的东西,就是度量怎么做的?

车品觉:今天大部分的人都没有完全有答案,我先把这个问题分解一下,这些数据给到一家公司里面可以分为几个环节,在决策上、在运营上、在产品的优化上,等于有一些数据是帮你找方向,在这种数据里面,你想衡量它的价值太难了,等于今天跟你说,其实你可以怎么样,结果你成功与不成功在这个闭环里面没有办法预测到底是否成功,闭环里面的数据回馈是没有办法让我知道到底这个东西跟你成功有多大关系。今天讨论有很多跟广告有关,其实不是广告的人特别爱数据,而是因为广告这个闭环数据的回路是特别紧密的,很容易证明大数据的价值,所以才会广告先用。不是所有东西都能衡量价值的,但是在广告这个行业里面特别容易,所以大数据进了广告这个行业里面。它的闭环不是这么清楚,只是决策里面的一部分,我告诉你三个相关数据,你用这个数据做决定,这个决定依然是人做的时候,很难衡量这个数据的价值。我在阿里首先解决的一个问题是,当要做一个算法、当要做一个产品的时候,要追溯回来全公司里面每一个产品、每一个出口到底怎么样使用今天哪一个数据,这个地方必须要有一个很良好的方法帮我硬性知道数据今天怎么在用的,后面才讲价值,因为后面的价值是有难度的,但每天用了多少数据,这个算法到底每天怎么使用的,必须要让提供数据给我的人知道他必须这样使用数据。当我们选择场景的时候,最好选一些场景找回路的时候是非常直接的回路回来的产品必然是比较容易快的先走出去的,一些数据产品如果回路相对比较远一点,会发现价值已经难让使用者对它感觉到有信心或觉得有用,这个时候它的价值相对减低。

问:引申一点,您也提到在美国有做20年数据的公司,MS等等,他们如何度量?

车品觉:如果一个投资人问一家有数据的公司,可能会问两个问题,有了数据之后能怎么样?没有了数据也不会死人。我只问两个,如果有数据给你,你会飞吗?你跟我说一下怎么来的数据会飞?下一个是如果明天没有数据了,在哪一个环节在你们公司里面会死人的?其实已经证明你的公司有多大程度今天使用数据作为你的原材料,这个问题是比较快速能找到价值点的。但单独每一个点去看价值点,我们必然有一个闭环,科学化的告诉你,有了和没有了有什么分别。广告最好的东西是ABtext,就是有了算法和没有算法,有两个算法,一个算法是有用这个数据,一个是没用这个数据,两个一出去PK几天之后,基本上价值就是两个的差别。我如果要付钱的话会付钱给赢了的算法。简单来说是这样的。这个闭环就清楚了,很容易衡量。

傅志华:简单总结一下车老师给我们的一些启发,如何让大数据平民化,中间层如何通过技术、产品手段更有效去提升,这是非常重要的。

车品觉:我想补充一下,这个东西还不会停掉,今天的数据价值是来自关联性,数据关联越多数据价值越高,但是数据关联越多数据的复杂性也越高,所以成本也会越高。我们追求数据关联性的同时成本越高,如果没有人能把成本分摊,或者没有用新的方法来处理这个东西把成本压低的话,其实会发现数据越来越难用、越来越贵。这一点想补充的,肯定会走到这个方向,关联、关联、关联,拼命关联,关联越多的人越厉害,同时关联时候的复杂性变得越来越复杂,在那个时候使用成本也会变得越来越高,如果中间里面不出现产业链把成本分摊或者没有新的方法来把它成本减低的话,永远都会这样。所以业内里面有一个讨论的说法,是到底应该把数据做得更薄、把算法做得更厚好一点,还是把数据做得更厚、算法做得更薄,哪一个好一点?明显我们是数据尽量薄、算法用深度学习来探索数据之间的关系,用深度学习,三层、五层的神经网络,我们试图在中间挖掘价值出来,而不至于要先把数据做厚。数据做厚的成本是很高的,但是算法做厚可以复用性很高,这也是业内讨论两者之间的关系。今天我感觉到深度学习应该还没到能把数据做得更薄的地步,所以暂时数据还是要关联的时候,还是会出现非常大的成本。

傅志华:所以成本和效益还是要比较好的合理权衡投入产出比。还谈到数据银行是未来的趋势,但过程中有非常多挑战,包括数据在驱动企业数据化运营过程中也非常多的机会,但是坑也非常多,车老师给我们的建议是唯一一点有兴趣、有信仰。

车品觉:就是坚持,爱这个东西就坚持。

傅志华:就像我经常坚持长跑一样。今天都在跑马拉松,有的跑5公里,有的刚起步,就跑了1、2公里,所以大家还需要继续努力。


作者:杨丹 翟文静  来源:数据观


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞1 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-3 23:31

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表