最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

BigData非万能!揭秘大数据四大弊端

[复制链接]
跳转到指定楼层
楼主
发表于 2014-10-30 15:43:17 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

    阿里巴巴创始人马云说:“用户没搞清PC时代的时候,移动互联网来了;没搞清移动互联网的时候,大数据时代来了。”他的话很好地佐证了2013年以来“大数据”一词在业界的热度。

  不可否认的是,一直被宣扬的大数据时代似乎真的到来了。在众星捧月的光环下,“大数据”如同一个香饽饽,人人都想分一杯羹。那么,大数据真如我们想象的那么美好?

  笔者以为,在信息时代的今天,对浩瀚繁杂的数据进行整理判断是有必要的,数据中也确实存在大量的宝藏。但是,这就好比在垃圾场拾宝贝一样,垃圾永远都比宝贝多。

  很多时候,我们无法判断数据的真实有效性,这对最终的判断是一种莫大的伤害。当数据来源不当时,这又是对用户隐私的一种伤害。企业需要在利用数据盈利的同时注意不窥探用户隐私,很多时候,很难掌握那样一个平衡点

  在生活中,“脏数据”无处不在,举一个例子,网络水军的存在就极大影响了互联网信息的真实。一款产品,他的价值和品质是成型的,就摆放在那里,但是对它的评价却可以千差万别。按照统计学原理来讲,评论的基数越大,最终得到的结果就越接近于真实,但是它的前提必须是用户真实客观的反馈。但是在网络水军存在的情况下,这个条件是不被允许的。

  比如,一部低品质的电影被推上市场,因为营销手段的成功,上座率也很高,在电影网站的评分也很高。但是这并不是真实的数据,大量的水军淹没了信息的真实性。如果对数据不加分析评判而直接使用,无论计算精度多么高,结果都是无意义的,因为数据本身就存在问题。

  类似的例子还有,淘宝卖家刷钻,微博僵尸粉丝,贴吧论坛营销贴等等。脏数据在网络中无处不在,在大数据还不成气候的今天,其实还没有十分有效的方法对“脏数据”加以鉴别。



楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-9 17:25

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表