最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

大数据不实用?看看数据化带来的惊喜

[复制链接]
跳转到指定楼层
楼主
发表于 2016-10-12 18:01:26 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
近年来,被「大数据」这一新词所包围,但是说来说去,由冷到热又趋冷,耳朵都听出茧子来了,除了沃尔玛超市「啤酒与尿布」的老例子,似乎并没有什么新的应用让人切身感受到大数据带来的惊喜,其实这是因为「大数据」被过度神化甚至妖魔化、故意把概念搅浑、搞的云山雾罩所造成的。

其实,大数据带来的便捷和惊喜早已深入我们的生活,下面,我将从数据化的角度给大家展示一下大数据的实用及数据化给我们带来的惊喜。

这里我要讲到的是十九世纪的一位美国人,他叫做马修·方丹·莫里(Matthew Fontaine Maury,1806~1873),这哥们曾经是一位前途无量的海军军官,但是一次意外事故让他变成了一位跛足军官,不再能胜任海上工作,于是他就被调任到后方,负责图表和仪器厂。

十九世纪时候,海上行船毫无章法,基本全靠船长的经验,这就导致很多航线明明可以直线到达的却要绕很大的弯儿,费时费力,作为一位年轻的航海家,莫里对此曾请教过很多有经验的船长,而船长们给出的答案是:走熟悉的远路比冒险走不熟悉的近路要保险的多。他们认为海洋是一个不可预知的世界,人随时都可能被意向不到的风浪困死在汪洋大海中。

但是同样有着丰富航行经验的莫里并不完全认同这一说法,因为即使是在同一片海域,不同的时间段也会有残酷的风暴和平静的微风,如果能够根据潮汐、季风和洋流的知识,把沿用拜年的陈旧图表做下更新,一定能找出很多更短更安全的航线。

这一想法在他脑中盘算良久,但苦于没有足以支撑他想法的数据。这一难题却被莫里意外解决了,在他清点库房的时候,发现了一些装满航海日志的发霉木箱,里面装的都是以前海军上尉写的航海日志,当莫里将这些海水浸泡过的书籍上的灰尘擦净,凝视着里面的内容的时候,这些被搁置已久的「垃圾」在莫里手中熠熠闪光。

这里有他所需要的所有的信息:特定日期、特定地点、特定季风、特定水域、特定天气下的航海状况,这些正是莫里梦寐以求的,但同时莫里也面临着巨大的困难,这些日志杂乱无章,页面边上还尽是奇怪的打油诗和乱七八糟的吐槽涂鸦,莫里为了提取其中的有用信息,和他的20位助手一起将这些破损的航海日志记录的信息进行了数据整理及处理,并记录在一张表格中。

根据整理的数据,莫里将整个大西洋按经纬度划分为五个板块,并且按照月份标出海洋的温度、风向、风速等信息,根据时间的不同,这些数据都会发生相应的有规律的变化,据此,莫里整理出一份全新的基于千百万船长航海日志的粗略航海路线图,这张图带来的最大的好处是给出了一些确定时间段内安全的航线,极大的减少了船队海上航行的冤枉路,能够帮助商人们节省很大一笔费用。

为了获取更多的数据,莫里制作了标准的航海日志表格,发放给美国海军,要求他们在海上记录,并在返航后交回表格,这些数据采集还包括数量众多的商船,莫里让他们用自己的航海日志来交换新的航海路线图,参加莫里行动的船只还会悬挂特殊的旗帜,恐怕这就是病毒营销的原型了。

在数据不断更新完善之下,莫里的新航海路线图不再需要年轻的海员们去摸索、总结经验,能够在图表上轻松获得来自成千上万经验丰富的航海家的指导,平均让船队的航行路程减少了三分之一左右。

这就是大数据很早的一次尝试,没有提「4个V」,也没有提「hadoop」,只是简单的数据化,将现象描述转化为可制表分析的量化形式,然后数据就给我们带来了明显的实用价值和无限的惊喜。

其实,这是一个经验数据化、经验可视化的过程,就像我们的中医,传承千年,只是知道这种草药能治疗这种病症;那种草药能只能那种病症,这就是经验,但是这种经验没有数据化,没有进一步发展,我们需要的是经验可视化的过程,就像屠呦呦从传统古籍中得知青蒿对治疗疟疾有一定的效果,并在此基础上不断探索,让经验数据化、可视化,提炼出能够治疗疟疾的青蒿素,挽救了数百万人的生命。从经验的传承中找到精华,并不断发扬,这才是传统古籍通过经验数据化、可视化带给人们的大数据的实用及惊喜!

再进一步,经验数据化在现代医学中还有什么更加惊喜的应用吗?有的。

比如说现在我们知道一些已经确定的疾病和基因的关系,如果突发一种疾病,我们并不清楚这种疾病是什么引起的,但是我们可以通过病症的临床表现,比如发烧、腹泻等症状来确定一些可能的基因,圈定了一些可能相关的基因,然后再通过富集分析、查找拓扑模块,确定疾病致病蛋白,然后再针对致病蛋白查找现有的能够靶向治疗的药物,比如某一疾病爆发,临床表现就是发烧、腹泻,那么就针对引起发烧和腹泻的致病蛋白寻找靶向治疗药物,找到了能够治疗发烧和腹泻致病蛋白的靶向药物,然后将药物进行技术性重混,进行临床实验,看是否对该疾病有效。如果有效,则作为实验性药物再进一步研究,通过不断的尝试药物配比或者增改新药物来到达治疗未知疾病的目的。

这岂不就和莫里通过以往的航海日志数据化来形成新的航海图帮助改进航线有异曲同工之妙吗?

如果我们脑洞再开大一点,想想我们生活中的算命先生,每当有客户找到他们请求算命的时候,算命先生都是仰头掐指、念念有词,那么他们是不是也会是某种经验数据化呢?

很有可能,比如一个人出身贫寒、努力奋斗、机遇好,可能成为达官显贵、富甲一方;比如一个人出身高贵、努力奋斗,能够守家业并且可能还会开辟新天地;比如一个人出身贫寒、好吃懒做、怨天尤人,可能就潦倒一生……

这些都是有规律的,把所有这些不同的人的性格和最终归宿进行汇总,是不是就能够得到一个从古至今所有人的性格和最终成就的表格?如果再进一步进行聚类、协同过滤等算法处理,再来一个人算命,你针对他的性格特征在数据表格中搜索类似的人,是不是就可以对他的人生有一个预测?

恍然大悟啊,原来算命还有这么大的学问!

千万不要小看算命,算命公司是可以上市的,新加坡有一家叫做「新天地集团」的公司于2012年6月在伦敦证券交易所AIM板块挂牌上市,公司主营列赫然写着:算命、算卦、看相、看风水……

再想想你们公司,又是科技,又是互联网+,又是共享经济的……什么都是最牛的,但是到头来融资都苦难,更别说上市了。

人家一家搞算命的公司都能上市,是不是感觉很心塞?

读到这里,你是不是有一个疑惑:如果算命真的是靠从古至今积累的大数据检索来做预测的话,算命先生是怎么做到检索速度这么快的呢?

其实,这里面还有一个技术要点,算命先生在算命时候一般轮换着掐手指、45度角仰望天空。

你以为他们那是在干嘛?

掐手指那是使用感应键盘输入指令!

至于看天空,自然是在请求云计算资源嘛!

既有大数据,又有云计算,算命公司上市,好像也是理所当然的了。

计量和记录一起促成了数据的诞生,他们是数据化最早的根基,所以我们目前的要点不仅是要做将文字转化为数据、将方位转化为数据、将聊天转化为数据、等等世间万物的数字化,我们更应该重视数据化。

毕竟我们存一堆数是没有意义的,就像你收藏书是没有意义的,只有读了才能发挥作用,正如现在面临困局的滴滴公司,搜集了一堆的用户数据,从家到公司的、从娱乐到休闲场所的、从学校到实习公司的……这么多数据如果单纯的存着是没有价值的,将这些数据化,才造就了现在的滴滴线路智能推荐系统,帮助我们挑选最合适的道路,如果现在滴滴公司能够将这些数据与政府共享,协助政府缓解城市拥堵问题、为解决城市拥堵提出有效建议,估计还能缓和下局面。

有了数据化大数据的帮助,我们不会再将世界看作是一连串我们认为或是自然或是社会现象的时间,我们会意识到本质上世界是由信息构成的,我们更看重的数据所产生的价值,而不是存储一堆数据抱残守缺得给大家画饼,告诉我这大堆的数据将会产生什么价值。

现在很多公司包括一些政府都买了一大堆的硬盘,存了一大堆不知所谓的数据,给投资人、民众鼓吹大数据的价值,你又不是演员,别设计那些情节,简单点,做事的方式简单点,有个做事的样子,不管手里有多少数据,首先发挥出价值来,不要让数据仅仅是到数字化的阶段,比谁家硬盘存的数多有什么意思?

多想想数据化的事,这才是正事!

来源:景辰公众号

楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-3 00:53

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表