最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
开启左侧

【BiMBA论坛】大数据:一场新的技术革命

[复制链接]
发表于 2014-8-17 22:07:46 | 显示全部楼层 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

题记:当你在网络上搜寻“大数据”这个关键词,在谷歌里面有4.8亿条结果,在百度里面有1亿条结果。如果你搜寻“互联网金融”,谷歌有9.9亿条,在百度有接近1亿条。由此可见这两个词语在当下的火热程度。但是你真的了解这两个词语背后的含义么?大数据与互联网金融论坛对此进行深度解读。

4月19日下午,北京大学国家发展研究院二十周年院庆“企业高峰论坛”分论坛“大数据与互联网金融”举行。本次分论坛分成题为“大数据”和“互联网金融”的上下两个半场。论坛上半场发表致辞和演讲的嘉宾有:北大国家发展研究院副院长、BiMBA院长张黎、阿里巴巴集团副总裁、数据委员会会长车品觉、微软亚洲研究院主管研究员郑宇。上半场“大数据”论坛的精彩发言。




张黎:细分客户需求 大数据追踪消费者行为


我们经常能看见社会上对于“大数据”的各种赞美,但是大数据究竟为我们的生活带来了什么?张黎认为“大数据是一种新的技术革命的发生”。营销最重要的是对客户的需求进行细分,然而想准确做到这一点并不容易。传统的方法是对总体进行抽样,根据调查对象的选择来了解他们的行为,把不同的行为选择变成相应的变量,然后基于变量刻画不同的群组特征。这种方法确实能够说明一些不同群组所具有的需求特征,但是却有一个巨大的问题:你的被访者说的很有可能和做的并不一样。为了改进这种缺点,我们又开始模仿一些真实的购物环境,让受访者去选择。通过建立联合实验法去了解不同群组的消费者行为特点。但是这种方法的准确度依然值得商榷。

张黎院长认为我们要感谢大数据——“大数据让我们知道一个人的行为,大数据使得一切变成了现实”。人们在网页的浏览、通过网络购买的东西、交通的路线,银行卡记录甚至在网络上的发言,都会被大数据记录下来。“这些参数成为了人们在雪地里走的每一个脚印,通过这些脚印我会清楚地知道你是谁”。这正是大数据给我们这个社会带来的巨大的改变。但是张黎随后提出了一个问题:大数据到底是什么?在商业和城市规划、医疗保险里有什么样的应用?这成为了整个上半场演讲和讨论的焦点。


在中国只要提到大数据的例子,就必然会提及淘宝“双十一”活动。而对于阿里巴巴集团副总裁、数据委员会会长车品觉而言,知道“双十一”促销中前5分钟进来的人到底是谁,他们是怎样的情况,却是一个更加重要的问题。因为这5分钟可以解释的东西要远远大于整个活动的其他时间。

作为数据专家,他认为大数据一定要有四个特点,即4个V:Volume(体积), Velocity(速率),Variety(种类), Veracity(准确性)。这4个V要求的就是数据的可解释性。“我们不再只需要一个数据模型,我们更加需要的是数据可以解释给我们的东西。同时我们还要知道数据是从哪里来的,只有这样我们才能够知道数据是否有用”,车品觉说到。大数据在这一点起着至关重要的作用,它使得对数据的解释变得更加容易。

但是大数据不是万能的,大数据也有自身的困境。“今天早上我看见一件衣服,我在电脑里搜索,而我搜索衣服时候看见了一个手表,但这个时候我被老板找去开会。开会的时候我用手机买下了那块手表,这是整个的购买过程。但在数据库里面,我们只关注这个人买了一块手表,不会关注他之前早上的时候看见的那个衣服,也没有人知道其实这个人之所以没有点搜索的结果,是因为他要开会,更没有人知道这个拿着手机淘宝的人,和用电脑上网的人是同一个人。当然你也不能识别在PC里面的人是老公还是老婆,有时候他们是用同一个ID的。”

同时即便在大数据中我们有时也要放弃一些数据。以前当我们提到大数据的时候,引以为傲的就是数据规模极大,我们保留有所有的数据。但是现实中有些数据是有可能过时的。“比如淘宝两年前的用户数据,我们现在就必须放弃”车品觉介绍说,“因为网站已经变了,数据的场景也变了,所以数据的生命周期也变了”。

所以并不是大数据就一定是好的,企业更加需要的是实效数据。你要理解业务的场景,你要有应用数据的能力,你要回答有没有解决这个问题,以及下次怎么改进。现在企业最大的问题是用的人不知道有什么数据可用,但同时做数据的人也不知道别人怎么用他的数据。当使用数据的人更改了数据的一个基本维度,那么对于做数据和整个公司而言都可能是一场灾难。因此企业最困难的是数据文化和数据管理。存什么数据、开放什么数据是数据管理层必须要考虑的问题,“这也是我最近一直思考的问题”。




郑宇:城市计算——大数据中的大城市的“大挑战”


现在的城市越来越大,问题也越来越多。如何能够有效的处理是城市管理的核心内容。但是这些问题非常复杂,城市相互关联的方面太多,这就使得“牵一发而动全身”,我们并不知道为了解决这个问题会带来什么其他后果。然而大数据的出现为我们提供了一种解决城市问题的途径,那就是基于大数据的城市计算。在美国,这种方法已经开始使用。而在我国,郑宇博士正是研究这一领域的佼佼者。

城市计算是一个十分复杂的事情,它包括四个环节:城市感知,城市管理,城市数据的分析和挖掘、服务提供。它是一种多数据的方法,包含的数据种类非常多,可以是城市的路网图、城市的兴趣点数据、空气质量指数数据、气象数据、社交位置的服务数据,甚至还有出租车的轨迹数据。当多种数据相互融合对比之后,它就可以解决很多问题。比如可以改进城市规划,缓解交通拥堵,了解城市商业模式的变化,也可以解决打车难,实时监控城市油耗。

同时,城市计算还能解决另一个非常重要的问题:空气污染。在现实中,我们不可能在所有的地方都建立空气检测点。原因是站点非常贵,不仅要花巨资买设备,还要占地。但是由于空气质量的影响因素非常复杂,一个城市里面空气质量是不均匀的。以北京为例,同一时刻北京的22个检测站点对空气质量的检测数据会差得非常多。因此空气质量并不能用一个平均读数,也不能通过简单的差值计算来代表其他地方。这造成的一个结果是在没有检测站点的地方,我们根本就不知道它的空气质量是多少。而如果我们无法获知这个关键数据,我们就无法对我们的健康状况提供可能的必要保护。

为了解决这个问题,郑宇团队利用了两方面的大数据,来做实时的细密度的空气质量更新。第一是基于历史和时时的空气质量数据来进行。另外一个是其他数据,包括气象数据、交通流量数据、兴趣点数据,和道路结构数据。在计算这些数据后他们可以测算出城市里每个角落的空气质量。而政府可以利用这些数据去寻找降低空气污染的最主要的措施。而更重要的是,通过这种大数据的对照方法,他们的准确率比传统的动力空气学模型计算提高了20%,达到了80%的高准确度。




城市计算另一个功能可以用来校验城市规划。城市一直处于变化当中,之前我们的规划可能因为多种因素变得不再那么合理。所以我们的城市规划也应该是一个动态的变化过程。但是城市的居民需要什么?规划应该如何变化?传统上政府很难了解这些问题,而城市计算通过对比城市的兴趣点和人口流动图,则能给出一个准确的答案。

如果你很讨厌去加油站加油的时候要排队,也可以找“城市计算”帮忙。它能告诉我们什么时间去加油站加油排队时间最少。郑宇博士通过计算得知,在早上8点钟早高峰的时候,平均等候是12分钟,而到晚上8点钟,平均时间是6分钟左右。“所以我都不在早上的时候给车加油”,郑宇博士说。然而在这种加油的排队时间背后却反映了加油站的人员设施是否优化,布局是否合理。排队人多的区域说明加油站不够,要考虑建新的加油站。而有的区域加油站过度建设,就没人去加油,结果造成大量的浪费。而这里所需要的仅仅是所有出租车司机在不同加油站加油的时间对比图,“大数据正是通过这种小的弱相关的区域里面解决城市规划和能耗问题”,对于城市管理,郑宇博士认为只有做好大城市大挑战中的大数据,做好数据管理、数据挖掘和数据分析,我们才能做到居民、城市和环境的三赢。而他将这一程式称为“3BMW”。


102984906.jpg

(信息来源:北大国家发展研究院BiMBA)


楼主热帖
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-3-29 01:32

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表