最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

【重磅干货】韩亦舜:大数据、大挑战、大责任

[复制链接]
跳转到指定楼层
楼主
发表于 2015-12-18 23:03:52 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本讲座清华大学数据科学研究院执行副院长韩亦舜于2015年12月13日在 RONG 系列论坛——大数据大责任论坛暨清华数据创新基地揭牌仪式上所做的题为《大数据、大挑战、大责任》的演讲。


韩亦舜:在座的嘉宾都比我更专业。我是因为职责所在,又是我们自己的事,就借此机会和大家分享自己的一些肤浅思考吧。

大数据时代已经无法回避地到来了。很多人会问大数据和我们自己有什么关系?这个关系挺大的,大数据时代带来的变化非常之大,影响和改变着我们工作和生活的方方面面。我们也遇到了很多新挑战,这就意味着很多新责任。


我们先来看看大数据与大挑战。

在座的有谁11.11的时候参加过“剁手党”,买过东西?双十一让我们爱恨交加。我们来看这两张图,一张是春运,一张是十一黄金周。

黄金周和春运带来的问题大家都有了解。

再来看看这张图。

为什么这个时候拿出这样一张图来看?一个是时尚的网上采购,一个是那么拥堵的线下行为,有联系吗?有!我们应该想一想,这两个线上线下看似无关的事件,背后是资源的不均衡利用和商户的不当得利。春运的时候大家都希望用最短的时间回到家,但是最后导致社会资源的不均衡。十一黄金周集中出行有这个问题,其实到大数据时代也有同样的问题。11.11狂欢购物节上网抢购的人多,服务器和带宽的需求量大,物流需求量大,那几天商家忙得不得了,给社会造成压力。11.11之后,明显退货比例高,普遍购买欲望下降,最后连服务器和带宽的需求量都会下降。把本可以相对均衡的供给与消费人为搞成波动性,会导致资源运用的不均衡。需求供给的不均衡,更容易引发商家的不当得利,价格明降暗升的事情频频发生。早期推动网上销售还可以理解,长期这样并不一定合理。我觉得我们这些从事大数据的人有责任来思考。搞大数据的人却沿用了一个传统的思维方式,做的依然跟传统的事情一样,资源不均衡利用,是一个很可怕的事情。


第二个挑战是现在做大数据的产生了大量的冗余数据。我之前跟很多人聊过,过去“愚公移山”说的是愚公每天挖山不止,挖一点就会少一点。大数据时代可以改写“愚公移山”这个成语,可以写成新“愚公移山”。因为数据山不一样,你从这边可以刨出金子,那边可以出银子,再从另外一边可以刨出其它有价值的东西。而且山还在,还可能会越长越高。今天我想提出另外一个思考的角度,在座的各位手上是不是都有跟别人几乎一样的数据?每个人都从网上扒一大堆数据,每个人都存了一大堆别人那里也有的数据,这个其实是在拷问我们自己。用着方便固然是个理由,但是大量数据冗余造成社会资源浪费?有些时候我们觉得我们花了钱了就有理由浪费,或者别人没出钱,不能管我。浪费就是浪费,没有任何意义。所以我们有没有可能把大家共用的数据放在一个地方,让大家随时可以用。如果遇到智叟忽悠愚公每天堆山不止的话,那是坑你呢。数据在于“挖山不止”,在于利用。包括现在很多政府的数据没有充分利用,都是一种浪费。


数据中心怎么建?左边这张图够高大上、够代表高科技了吧?它会幻化出什么呢?各地都希望它幻化出高科技地产,但究竟有多大的意义?目前中国各地都在争着要盖数据中心,但普遍的实际装机量不足设计装机量的10%。一方面本身设计装机量和实际装机量差别这么大,这里面就有资源配置不合理的问题。中国制定的绿色数据中心的标准PUE是1.5。大家知道,这个数值直接影响到每天数据中心运营的能耗指标进而是经济指标。我知道在一些发达国家的一流大公司,像Facebook、Google的数据中心的PUE指标能够控制在1.1以下。这意味着和我们传统钢铁产业石化产业一样,在数据中心这个新兴的产业中我们的单位产量能耗指标又落后于他人了。



今天我们建立的数据中心都面临着怎么样才能不沦为新的能耗大户,不沦为新的“鸡肋”的问题。因为一个数据中心对能源的需求,甚至对水资源的需求、对周边其他的环境的影响都是巨大的。



政府开放数据是政府重塑公信力的机会,但也面临挑战。这张表的指数体系是英国做的。他列出了作为政府开放数据,应该包含哪些标志性的指标(政府预算,政府支出,等等)。这里面名列第一的是英国政府。我在英国伦敦市政厅的网站上发现,他们把单笔超过250英磅的政府开支全部向公民开放。我们国家现在有一些地方把政府预算能够公布出来,但是支出公布还做不到。这方面的政府数据开放其实是考验我们的执政自信力,我们要告诉老百姓钱花在哪儿了,让老百姓监督。



很不幸,到了2014年,中国排名从2013年的36降到了57,中国一直在进步,这个没有错。但是可能在这个维度,我们中国落后了,我们走得比别人走得慢。



在大挑战话题里,最后想讲一讲生产力释放的前提是生产关系的变革。前不久我们请清华的校友李竹讲过一次中美创新生态的比较,其中他讲到一个很关键的话题是,中国比较多的是所谓商业模式创新,美国比较多的是技术创新。说明技术创新不容易,需要很多的积累。在中国更多的技术创新都被生产关系所束缚,所以我们可能更多的需要去关注打破生产关系对生产力的束缚,才能释放出新的能量。但是不要以为这件事只是政府的事,我更多愿意让大家思考,是不是我们每一个人都有可能在我们不经意中就把某些生产力给束缚了?如果有,大家回去检讨、改变,争取把所有能够释放出来的生产力都释放出来。

我们要注意,不要以为做大数据就必然代表先进的生产关系,必然思想意识是超前的。如果不时时检查和接受监督,一样成为落后生产关系的代表,一样造成新的浪费。这是我们要面临的大挑战。

下面讲下一个话题,大数据与大责任。

我的数据,你的责任。

这里说的“我”不是“个人”,而是数据的拥有者,你指的是采集人。前不久有学生和我探讨数据的权属怎么定,我今天仅仅是做一个引领性的思考。我觉得数据可以比较简单地划分为跟人无关的数据和跟人有关的数据。比如说自然界的,天气、海啸、地震、石油等,这些跟人没有太多直接关系的数据,谁采集谁就可以拥有。但是跟人有关的数据,谁采集的时候就要注意了,这个数据是我的——数据拥有者的。



我们每天都会遇到各种各样被迫要点“同意”“接受”的应用,大多数情况下我们也都接受了。如果你是苹果手机,你可能还有一些做其它选择的权利;如果是安卓系统,也许你只有不用或接受全部条款。这个背后,应当隐含着我和数据采集者之间建立的一种契约关系。我的数据给你是因为你可以向我提供特定的个性化的服务。如果你不加说明、不加处理就把我的数据转让给别人,谋求利益,这应该是不合法的。即便是不牟利,也是不合理的。这个我们大家都记在心上,采集别人的数据时你要想好,你要对别人的数据负责任。

大家都关注数据安全数据隐私,有相当的公民数据,我的身份证信息,我的出行信息,我在公共区域的摄像数据,谁来负责?那么我想告诉大家应该政府负责。



公民数据,政府责任。我选了这几个图,典型的公民信息公民数据。这是2014年底的外滩发生踩踏事件当天的人流变化及前一天的人流变化。这类涉及公共安全的公民信息政府应该合理加以利用。现在政府一些大公司更多地是强调要保障数据安全,但是实际上这个背后又蕴藏着很大的、对社会的一种新的不负责任。就是说这些数据不加利用,对我们社会也是有害的。所以怎么样把公民的数据安全地用好是政府的责任。



什么是个人隐私,我们每一个人应该有私密的空间,在这个空间里有属于你自己的个人隐私。但是当你走到街上的时候,你还说那个数据你要拥有、有权删掉这些数据,就不一定合理甚至不合法了。还有讲到个人的健康数据,我们应该换位思考,每个病历是医生的知识、技能叠加在病人的情况下,得到成功或者失败的病例,这是人类的财富,我们不应该以个人的隐私为由拒绝加以利用,应该依法脱敏后加以利用。合理开放私人的数据,对社会做贡献,是我们的社会责任,不应该加以拒绝。


编造数据,法律责任。我们应该严格立法,让编造数据、数据造假的行为负法律责任。今天我们在很多地方都有类似的情况,政府干部都知道我们的部分统计数据中有假。我认为数据带给我们的价值是让我们把这个世界看得更真。如果有人造假,就是严重干扰我们认识这个世界,影响决策。所以不应该允许数据造假,数据造假要负法律责任。哪怕真实数据不是那么漂亮,只要真实的数据都是最有价值的。相反,漂亮的假数据一钱不值。我在这里也提倡每一个人在自己填写数据时一定要真实才有意义,才有经济意义和社会意义。


最后谈谈造谣的责任。其实传谣造谣将来是不是需要负法律责任我说不好,所以我这里只说了是道德责任。大数据时代,由于环境发生变化,由于互联网的发展,我们会不经意中伤害一个千里之外无辜的人,我希望大家在微信上传东西的时候,最好多一点思考,千万不要轻易地就把一个不靠谱的东西大肆宣传。当然并不是说每个人要对信息的真实性负责,但是将来有一天,一定能够认定你是造谣还是传谣。如果你在传播的过程中还添枝加叶,这就要负更大的责任。


大数据今天是件比较“高大上”的事情,但是并不代表我们可以任意发展,随意地滥用数据。大数据意味着大挑战大责任。所以我希望今天在座的大数据从业人员。认真想想自己的责任,真的管好用好自己手上的数据。有人问我,我们公司采集的客户数据被黑客攻击而流失,谁的责任?我觉得既然数据是资产,我把我的资产寄放在你那里,就相当于美国有存货的地方。我把东西交给你,你应该为我保存好。你如果没有保存好,你的保安不够格,最好别揽这个活。因为数据被盗,你也许不负法律责任,但也要负民事赔偿责任。


这是我想和大家分享的几点思考。谢谢大家!


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-6 04:26

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表