168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

1 2 3 4 5 6
开启左侧

现阶段我为什么不看好纯粹的数据交易?

[复制链接]
发表于 2016-12-28 22:26:51 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 168主编 于 2017-1-11 18:45 编辑

【导言】普通人发现,自己的隐私在不断被暴露,不是房屋中介就是股票推荐;一般企业会说,“大数据就是骚扰电话和短信”、“能不能帮我找到客户发短信、打电话”;业内人都清楚,现阶段大量的数据交易实际上就是客户隐私数据和敏感数据的出卖,并且已然催生了庞大的地下产业链;现阶段的 “数据交易”,多限于个人身份、企业基础信息的核实验真,而更多的是客户隐私数据的黑市交易。
尽管大数据交易平台建设正值爆发期,数据交易号称的市场规模也在不断壮大,同时也有国家大力的政策支持。但是短期内,我仍然不看好数据交易,因为现阶段的数据交易缺乏了必要的基础构建。
普遍缺乏大数据认知,不知道大数据能做什么
在大数据产业中最重要的因素是人,而在数据交易中,交易双方必须对数据有清晰的认知、理解。但在现阶段,大数据刚刚起步,绝大多数的行业、企业对于本身数据、数据如何使用并不清晰。所谓认知理解基础,指的是知道“我能用数据做什么”、“别人的数据对我有什么作用”、“我的数据对别人有什么作用”等等。
理想的数据交易是数据提供方与需求方能够进行对接,解决企业之间的数据缺失问题,完善数据价值。但大数据的能力和价值是抽象的,大部分是非直接的,这就导致很多人对数据价值的认识不到位,甚至不同位置的人之间也存在着严重的断层。
很多时候做搜集数据工作的人不知道拿数据做什么用,作数据分析的掌握不了数据质量,营销策划人员不知道数据能够帮助他们做什么,管理者会发现大数据的应用没有达到预期的效果。
再者,对于数据交易这个前所未有的领域,作为数据提供方、数据需求方或交易平台管理者,不同的角色该怎么发挥自己的作用,大家能够促成什么事情,其实很多人在思想上都是没有做好准备的。
缺乏数据交易基础,高质量数据拿不出来
口径不一致,有数据却用不了
数据口径必须要极为明显、确保一致,才能保证后续高效利用。在建模分析中,对于所研究的变量,必须搜集、整理其时序的或某个时点的横断面数据资料,它们是建模的物质基础。这些数据资料的质量,直接关系到模型的质量,影响我们对数据的应用。
然而,大数据对于大部分行业都还是新鲜事物,部门、行业间存在严重的数据壁垒和孤岛现象,很多数据口径不明晰,别人读不懂你的数据;又或者同类数据口径不一致,没有办法合并同类项。
就拿大数据征信举例,不同部门的信用评级标准不一样,很可能对于同一个的评估结果就有天差地别。这时候该相信谁,该采用谁的标准?大数据本应是告诉你答案的,而不是让你陷入新的难题。但如果没有明晰、一致的口径,数据就不能帮助我们解决问题,数据交易又有什么意义呢?
数据拿不出来,躺着睡大觉
数据交易要发挥作用,必须要有高质量数据集的参与。但众所周知,越是高质量的、具有核心竞争力的数据,就越是容易涉及信息安全、信息敏感等问题,因此越是被高度保护、无法获取。
几乎每天新闻都会曝光非法的数据交易,利用各种社交工具售卖学生个人信息、银行卡卡号密码等等。明明是非法的勾当,却还是有那么多人以身试法,正说明了目前正规交易市场的数据其实远未能满足商业需求。
数据交易不应该触碰到用户个人隐私信息、敏感信息这条红线,那如何在不触碰红线的前提下,输出数据的能力,跟其他数据进行拼接,这是我们需要长时间不断探讨的问题。而现阶段的数据交易并没有办法释放这部分的数据能量。
可读性不足,数据形同虚设
我们有个客户,手头上掌握的数据能够帮助同行业的一些企业来做精准营销,但他的数据既有文本、又有数字,且规范性差,可读性非常的弱。有些政府数据也是如此,虽美其名开放数据,但数据孤岛、数据结构性差等问题大量存在,没有办法被机器读取。
像这样的非结构化数据其实不在少数,而且大都蕴藏着巨大的价值,但需要大量的时间、人力物力去做清洗、处理。这些基础工作在现阶段并没有做好,所以数据也就难以实现拼接和大规模流通。
缺乏制度基础,交易环境不明朗
数据交易下,隐私和安全问题是社会最关注、最敏感的问题。随着大数据时代的到来,过往的法律法规并不能简单地套用到数据交易的场景中,需要制定特定的制度、法规。否则数据交易将会长期处于一个尴尬的境地,进退两难。
此外,行业与行业之间、企业与企业之间目前仍然没有数据互通的意识或共识,大家对于自己所拥有的数据还是持十分谨慎保守的态度。但未来这种态度必须要转变,因为跨界数据的整合才能够带来大数据应用的爆发。
数据交易要蓬勃发展,把数据“拿出来”是关键
我认为数据交易是趋势、是未来,但由于不具备上述基础,现阶段还很难发展。在这些基础之上,最本质、最核心需要解决的是高质量数据“拿不出来”的问题。所谓“拿不出来”,意思是数据变现必须运用间接的方法,而不可能通过纯粹的原材料买卖来变现。
要怎么把数据“拿出来”,第一,必须要形成一套口径统一的标签体系。通过长期摸索,当标签极其规范时,我们就能够以标签化输出代替原始数据输出,信息孤岛才能够被打通。
第二,是要形成行业与行业、企业与企业良好的信息共享机制、保密机制,完善的法律法规,数据交易才能够顺利地进行,健康发展。
同时,像我们做大数据的公司,其实还肩负大数据普及教育的使命——提升大数据意识,培训大数据能力,激活企业大数据资产。要告诉企业大数据是什么,能帮你做什么;然后深入探讨交流,分析你所具备的能力,有什么需求;还要给企业做大数据培训,做能力建设等。
【结语】我曾经提出“技术不是大数据第一生产力,数据交易才能带来应用的爆发(链接)”,但数据交易绝对不是纯粹的数据原材料买卖,否自在未来将会丧失核心竞争力,借助大数据做一些现在做不到的事情,才是大数据交易蓬勃发展的未来!
本文作者简介
江颖,帷策智能、原力大数据创始人兼CEO,大数据应用实施领域资深专家,中国大数据商业实践先行者。自2003年起,一直致力于大数据领域的研究及应用实践,深度涉入通信运营商、移动互联网、零售、服装、教育等多个行业,拥有大量的行业经验和研究成果。
原力大数据(广州帷策智能科技有限公司)
广州帷策智能科技有限公司致力于大数据研究及应用项目,积累了丰富且深入的大数据实践经验与成果。尤其擅长基于大数据的分析建模、能力固化和产品研发,力求帮助客户透视业务全景,实现量化决策、精准决策和科学决策,高效提升市场营销及运营管理能力。

楼主热帖
168大数据(www.bi168.cn)是国内首家学习型大数据社群媒体、大数据深度交流社区!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

 
 
帮主在线
在线客服
商务合作
招聘服务
Hadoop交流群:
大数据技术精英会①
大数据课堂群:
大数据技术精英会②
大数据求职群:
大数据人才库
 

QQ|关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2017-2-21 15:31 , Processed in 0.520075 second(s), 28 queries .

Powered by BI168社区

© 2012-2014 海鸥科技

快速回复 返回顶部 返回列表