最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

[理论框架] 大数据确权、流转、定价的创新范式解析

[复制链接]
跳转到指定楼层
楼主
发表于 2019-11-1 09:58:54 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 168主编 于 2019-11-1 10:04 编辑

作者:李立中 来源:科技最前延

近年来,全球大数据产业发展迅速,行业应用得到快速推广,市场规模增速明显,大数据对于人们生活方式、国家经济发展以及社会治理方式都带来了巨大的影响。利用大数据对个人数据的挖掘和分析,能够帮助企业更好的理解用户需求,提供个性化定制服务,实现减少经营成本,提高服务效率和提升用户体验的目的。2017年1月,我国工信部发布了《大数据产业发展规划2016-2020年》,进一步明确了促进我国大数据产业发展的主要任务和保障措施。党的十九大也明确提出要构建以数据为关键要素的数字经济,推动大数据与实体经济的深度融合,并且切实保障国家数据安全。

根据有关公开数据显示,全球大数据行业市场规模呈爆发性增长,全球数据总量将从2016年的16.1ZB增长到2025年的163ZB(约合180万亿GB),十年10倍的增长,复合增长率为26%。数据量的快速增长已经远远超越单个计算机存储和处理能力,数据中心处理能力变得日益重要,同时也驱动着数据中心网络不断向大带宽低时延方向演进。
数据来源:中国产业信息网,图表1 2016—2025年全球数据总量预测图
2017年超大规模数据中心新增90个,总量从2016年的300家增加到390家。绝大多数超大规模数据中心仍位于美国,占比44%;中国位居第二,占8%;其次是日本和英国,分别占6%;澳大利亚、德国紧随其后,占比5%。2017年底在建的项目有69个,按照目前的速度,到2019年底前全球超大规模数据中心的数量有望突破500个,2020年有望突破600个,市场规模也将从2016年的202.4亿美元增长到2020年的490亿美元,复合增长率为24.7%。
数据来源:中国产业信息网,图表2 2016—2025年全球数据总量预测图

数字经济时代,数据已成为特殊的资产,能够在被使用和流转中不断创造新的价值。然而,数据造假问题泛滥,大量用户数据被泄露等问题使得大数据产业的发展备受质疑。投资人在选择和评估一个产品或企业时,主要通过用户量、活跃用户量、使用时长、点评量数据判断产品的是否值得投资,而众多互联网平台为了获得利益,采用了数据造假的手段。社交媒体“制造用户”、电商平台“刷单”、点评类网站“刷好评”等数据造假例子屡见不鲜,随着新媒体产品更新迭代,还出现了给直播、短视频等刷赞的业务。

近期大型互联网平台数据泄露事件也频频出现,雅虎、谷歌及万豪等著名企业下大量用户的隐私数据被盗取。

Verizon 公司《2018 年数据泄露调查报告》显示,48%的数据泄露与黑客攻击有关,但是内部操作错误及特权滥用等内部攻击方式也是数据泄露的主要原因。
数据来源:中国信息通信研究院官网,图表3 2018年全球数据泄露中主要攻击手段

随着大数据行业的增长,大数据的可信性和隐私安全性已成为现阶段技术所需解决的重点,不仅要降低外部攻击的风险,还要从技术上实现内部防范与管理。

大数据合法收集、市场计量、脱敏流转、开放应用的痛点问题亟待标准化解决方案,目前新加坡WOLOT基金会的TOOL数金链生态解决方案有效的解决了上述难点问题,其运用大数据合法收集即用户主动授权参加行为数据挖矿确权机制,通过数据的信息广度、数量、质量等衡量参数对用户的数据价值公允计量定义出企业衡量规范,通过标准化数据彻底脱敏创新方案有效进行数据隐私保护,最终把用户授权收集、流转、应用的数据价值标记进行市场化衡量。初期会先形成联盟企业规范,逐步完善上升到行业标准,努力成为未来数字经济的数据衡量流转运用的国际标准。

据了解新加坡WOLOT基金会已经完成了下列的能力建设:

(一)实时行为数据的记录规范
行为数据分类:过往履历数据、日常消费数据、行为动作数据、金融资产数据、社交人脉数据,用户通过客户端上传数据或实时产生数据可以获得贡献权益确认,平台通过贡献的权证进行标记把价值权益返还给生态贡献者,使得用户通过数据贡献获得额外的平台回报及在平台超值消费的权益,这样可以刺激需求端的消费能力进而做到供给侧变革。

(二)确保数据的真实性及不可篡改性
数据造假主要是通过无效的“用户”进行刷量及篡改数据等方式使得数据失去其真实性,变成了具有误导性的信息。通过定制化部署的北斗区块链(https://bdqkl-inc.com/)天玑存证系统可以利用区块链存证的方式,将交易记录等账目信息打包成一个个的区块并进行加密,同时盖上时间戳,所有区块按时间戳顺序连接成一个总账本。并运用协议规定的密码机制进行了认证,保证不会被篡改和伪造,因此任何交易双方之间的价值交换活动都是可以被追踪和查询到的。但是如果想要在区块链中修改“账本记录”,需要把整个链条上的加密数据进行破解和修改,这几乎是不可能做到的。

此外,另一个安全的因素是天玑系统利用了区块链的分布式存储的方式。即使黑客破解和修改了一个节点上的信息,数据指纹就会发生变化,篡改者需要同时修改网络上超过半数的系统节点数据才能真正的篡改数据。

(三)保护数据的隐私性
传统的数据脱敏是在保留数据原始特征的条件下,对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在不违反系统规则条件下,对真实数据进行改造并提供使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。而在数金链上,通过天玑系统会对数据进行标准化封装,所有包含身份证号、手机号以及卡号等隐私信息全部做真正的脱敏处理(直接删除不是转化),企业对用户进行分析时,使得企业可以分析用户的行为偏好和特征等数据,但无法知道用户身份等隐私信息。想要触达客户需要通过定制的行为数据挖矿任务推送给客户。

用户注册时授权平台可以在接入的生态合作伙伴APP上搜集个人的行为数据,自主参与行为数据挖矿的区块链生态,平台通过前端的埋点技术及对应的任务记录系统进行跨平台的个人行为数据收集,数据的内容涵盖用户实时产生和用户主动提交两大来源,数据的分类有过往履历数据、日常消费数据、行为动作数据、金融资产数据、社交人脉数据以及未来在平台相关生态场景的履约数据。每天数据进行脱敏处理后导出数据文本文件获得各个接入平台文件的hash值和文件大小记录后压缩打包再次文件的hash值和文件大小相关信息记录到区块链,这样就为每天获得的行为基础数据打上数据质保标签,确保当时记录的数据可信有序无法篡改。未来基于这些原始的可信数据进行整理再加工,进而服务建设数字经济新生态,为数字进程中的全球各国贡献数金链的解决方案。

对于数据而言如何确保数据真实性不可篡改性;有效保障隐私数据安全;标准化数据指标;客户授权数据采集和使用显得尤为重要,新加坡WOLOT基金会的创新性技术解决方案创新细节如下:

确保数据真实性不可篡改性
利用天玑系统的功能,通过区块链技术记录每天的系统数据导出的指纹(哈希值),若对应的数据包有一个字节被修改,数据指纹就会发生变化。

加密哈希函数的一个重要特质是任何输入端的细微变化都会对哈希函数的输出结果产生剧烈影响。假设在上面的图表中,有人尝试篡改1号区块中的数据。那么,即便有人尝试对1号区块里的数据进行细微的改写,也会使得存储在2号区块里的1号区块的哈希值产生巨大的变化。接下来,这将导致2号区块的哈希值发生变化,进而影响存储在下一个区块的哈希值。以此类推,最终整条链上的数据都会发生变化。这种通过冻结整条链条来修改数据的方式几乎是不可能做到的。


有效保障隐私数据安全
通过天玑系统会对数据进行标准化封装,所有包含身份证号、手机号以及卡号等隐私信息全部不做记录和显示,只有一个UID和开放平台的用户对应,所有流转的数据不包括任何隐私信息。此外,只有把UID透过接入的应用系统或授权的管理员,在必须知晓的业务场景下,才可通过特定应用程序与工具访问数据的真实值,从而避免隐私数据在共享、移动时带来的信息泄露风险。

标准化数据指标通过数据涵盖场景范围、时间跨度、行为数据数量、数据价值转换频次、数据可分析个体数量等信息来衡量数据包的价值。每天哈希存证记录的数据包可以通过可信程序化自动重组。
客户授权数据采集和使用
符合国际惯例实现数据的个体主权、企业主权、国家主权,客户接入生态就要求授权平台采集和使用,平台作为数据载体必须将数据存储在对应数据贡献人所在的国境内。

目前数金链的生态体系已经接入了国民蛋巢、掌肥猫、斑鸠职业、币航、U萌店、i生活等DAPP,整个生态的用户数量和接入商家迅猛增长,随着用户的数据沉淀生态的整体价值在不断推升,但任何事物的价值认知都需要一个再平衡的过程,因为早期的预挖释放与生态商家接入生态转换存在时间差,数据价值标记对应的市场价值衡量会存在偏差。

就如同比特币的披萨日一样,用2万的比特币买了一份披萨的行为在生态早期一定存在,但是随着数据价值的再分配和生态的快速发展,价格和价值一定会慢慢的重新匹配。数据挖矿的本身就是把浪费的数据资源收集起来,相当于用户通过生态无偿额外获得的增值收获,所以参与生态的用户应该心态平和,对于用户自己更应该清楚每天辛苦点击、购买与浏览背后的价值。有效用户的时间就是价值,在互联网上一次有效浏览或点击就是价值,百度的单位点击成本(ACP)要3-4元,背后的数据价值更不可计量,用户自己可以测算获得一个数据价值标记背后实际映射的公允价值。当然在市场供需的再平衡期间,愿意低价出售数据价值标记的用户也一定会存在,这就看个人的判断了。

最后祝愿那些相信未来的用户可以通过自己的行为数据挖矿搭上数字经济的高速列车,让我们一起期待未来。

注:以上学术分析不构成任何投资建议

楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-4-26 22:42

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表