马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
各位嘉宾欢迎来到阿里巴巴,我是数据平台的负责人,我叫卜鹰,今天非常高兴能跟大家进行开场的交流,也非常高兴品觉给我这个机会。在座的各位都是搞数据的,或者是被数据搞的人,对不对?我想谈一下搞数据,我对搞数据以及对被数据搞这件事情怎么看。搞数据第一个要回答搞什么数据?今天大家提的比较多的,尤其这两年已经被讲烂的词叫大数据,我现在越来越发现这个事情不是那么靠谱,什么叫大数据?多大才是大数据?今天有一些想法正好借这个机会跟大家交流。 阿里巴巴集团数据平台事业部副总裁 邱昌恒(卜鹰)
第一个,真正的大数据不在于你有多大,而在于你有多活,活的数据、流动的数据、实时的数据远远比数据有多大更重要。最简单的道理,如果我们知道一个人的性别,这个基本上一辈子不会变的东西,基本上,这个价值有多大。我们知道你短期的兴趣,现在正在浏览什么、关心什么,这个价值就会非常大。这是第一个。 第二个,更重要的是数据能不能被交叉,你自己的数据再大也是有限的,今天阿里集团有很多的数据,但是我们真正跟未来,未来来看的话,我们真正的数据还是比较小的,更关键的是我们能不能让数据交叉起来。最简单的道理,未来几天天气的变化,今天天气变凉了,如果天气的数据如果能跟我们淘宝的数据结合起来,我们可以对未来一段时间的冬装的销售进行预测,这对很多商家是非常重要的。很多的服装销售是靠天吃饭,如果能够把这两部分看起来没有多大相关性的数据结合起来,将会产生巨大的价值。所以搞什么数据这是大家需要思考的问题,光大不是关键。 第二怎么搞?我们过去的搞法,要搞数据你先买一套小机或者是IBM机器,各种解决方案,上面布一套很成熟的数据仓库,然后招一批数据专家来搞数据,但是我觉得这个事情如果这么搞下去,这个世界上真正能搞数据的公司没几家公司有这个数据和能力和资源,未来搞数据怎么搞?我觉得很有意思。我自己的判断,未来数据一定是跟云计算绑在一起。所以今天我要搞大数据了,准备投资投资多少钱,买多少机器、软件,这个事情在我看来特别不靠谱。因为你还不知道数据产生多少价值,你已经产生了巨大的沉淀成本,而且将来数据如何跟其它交换,如何让数据流动起来成为巨大的问题。大数据还是未来的数据时代,一定天然的是基于云计算的,基于底下的资源的共享,基于共同的平台,这样数据才有可能是活的。所以先让数据上云,是我认为未来搞数据的第一步。如果今天数据还没有上云,我觉得我们就来搞大数据,在我看来这个事情也特别的不靠谱! 第三个搞数据谁来搞?这个事情我纠结的比较多,我们可以想象一下,以阿里巴巴今天的人力资源的储备,我发现我们都搞不动!我们能搞的事情非常非常的有限,我们即使把今天集团我们数据人才扩大十倍,我们今天很难讲能够把我们的数据能用得好。所以搞数据的人我自己的判断,或者我相信未来一定是基于社会化的方式来搞的。也就是说,我们可以把数据更多的开放出来,让更多的商家、其它专业的机构来基于这样的平台,基于云平台上面来搞数据,来把它建模型,变成数据产品,然后再服务于第三方。在这个地方我有一个美好的想象,未来我们很多真正做数据的人、数据专家、算法、数据科学家,我们希望你就和今天的设计师一样,这是非常专业的人才,你可以把你的智力在一个平台上产出变成一个模型、数据产品,让很多人用,这个故事今天已经发生在淘宝上,淘宝有很多设计师专门设计店铺和商品展示,我相信我们未来的数据人才也有可能这样,在一个平台上工作。 这是我对未来所谓的大数据时代也好,从搞数据角度的一个想象。回过头来,今天我们的话题是叫生态圈的丰富的数据想象,我觉得非常有意思,基于这样的判断,允许我自己做一点广告,我们的数据平台希望做什么事情呢?我们数据平台就希望I我们的数据生态圈可以起来,I我们的丰富的数据可以在这地方关联和交换。为此我们希望做几件事情: 第一件事情我们希望搭建一个云计算的平台,这一块我们跟阿里云密切的绑定在一起,我们希望让底下的计算能力,无论是什么计算,成为一种公共设施,你今天要用计算的能力不意味着你要建很大的集群,因为这部分网上像水龙头一样,只要一打开用多少取多少,计算能力变成一种输出,而且可以弹性的使用。这是我们需要干的第一件事情; 第二件事情我们希望构建一个在计算能力上面的一个数据加工的工厂。我们希望从数据的同步、任务的调度、算法的实现,最后变成一个在线的服务,所有的一整套的东西可以在一个平台里面完成。我们做数据的人可以拎包入主,我们希望能够做到这一步。更进一步我们希望在这个平台上有更多的合作伙伴,更多的第三方可以进来,你可以我有上据希望跟别人交换获取商业利益,这也可以做一个非常好的DP。你说我有很好的商业场景,我需要数据支撑我的商业场景,那你可以作为一个数据的消费者。我有数据的能力、建模的能力,有数据的能力,可以做一个专业的服务商,基于这个平台做你的服务和产品。而为此我们特别也希望推动一件事情,推动阿里集团的数据可以跟外部的数据进行交换,让更多的人能够安全的、方便的用起阿里的数据。这是一个美好的希望,我们在这上面也尝试了一段时间,发现任何事情总是想起来很美好,做起来很困难!我们磕磕碰碰摸索了很多,我们今天跟广告,我们今天在商家的数据的应用,智能交通方面都做了尝试,大家有兴趣下午有一个专场可以分享一下这个。但是很幸运的是,尽管很难,但是今天我觉得我们看到了这样的机会,我们今天在座的人,能够有机会创造这样一个未来,这是我非常希望能够发生的事情。我也非常非常希望阿里巴巴集团今天能够在这个过程当中发挥一点点作用。 最后也非常希望所有在座的各位能够今天渡过一个非常愉快的一天,找到自己非常好的未来的合作的伙伴。谢谢大家! 摘自阿里数据开放日 现场演讲
来自群组: Hadoop中国 |