168大数据

标题: BigData非万能!揭秘大数据四大弊端 [打印本页]

作者: 乔帮主    时间: 2014-10-30 15:43
标题: BigData非万能!揭秘大数据四大弊端

    阿里巴巴创始人马云说:“用户没搞清PC时代的时候,移动互联网来了;没搞清移动互联网的时候,大数据时代来了。”他的话很好地佐证了2013年以来“大数据”一词在业界的热度。

  不可否认的是,一直被宣扬的大数据时代似乎真的到来了。在众星捧月的光环下,“大数据”如同一个香饽饽,人人都想分一杯羹。那么,大数据真如我们想象的那么美好?

  笔者以为,在信息时代的今天,对浩瀚繁杂的数据进行整理判断是有必要的,数据中也确实存在大量的宝藏。但是,这就好比在垃圾场拾宝贝一样,垃圾永远都比宝贝多。

  很多时候,我们无法判断数据的真实有效性,这对最终的判断是一种莫大的伤害。当数据来源不当时,这又是对用户隐私的一种伤害。企业需要在利用数据盈利的同时注意不窥探用户隐私,很多时候,很难掌握那样一个平衡点

  在生活中,“脏数据”无处不在,举一个例子,网络水军的存在就极大影响了互联网信息的真实。一款产品,他的价值和品质是成型的,就摆放在那里,但是对它的评价却可以千差万别。按照统计学原理来讲,评论的基数越大,最终得到的结果就越接近于真实,但是它的前提必须是用户真实客观的反馈。但是在网络水军存在的情况下,这个条件是不被允许的。

  比如,一部低品质的电影被推上市场,因为营销手段的成功,上座率也很高,在电影网站的评分也很高。但是这并不是真实的数据,大量的水军淹没了信息的真实性。如果对数据不加分析评判而直接使用,无论计算精度多么高,结果都是无意义的,因为数据本身就存在问题。

  类似的例子还有,淘宝卖家刷钻,微博僵尸粉丝,贴吧论坛营销贴等等。脏数据在网络中无处不在,在大数据还不成气候的今天,其实还没有十分有效的方法对“脏数据”加以鉴别。








欢迎光临 168大数据 (http://www.bi168.cn/) Powered by Discuz! X3.2