最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

2015中国大数据产业发展大会在京召开 业内专家发表主题演讲

[复制链接]
跳转到指定楼层
楼主
发表于 2015-12-3 21:49:59 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
  12月2日,2015(第二届)中国大数据产业发展大会在北京国宾酒店召开,大会主题为“落实国家大数据发展战略,提升我国大数据产业发展水平”。
  当前中国经济发展正在步入“新常态”,随着信息化普及程度和应用水平的提升,金融、交通、电信等重点行业和医保、社保、海关等重要领域已经实现或逐步实现了大量、海量业务数据的集中,中国已经成为全球最重要的大数据市场之一,成为名副其实的“世界数据中心”。
  自去年8月27日第一届中国大数据产业发展大会召开以来,一年多时间过去了。在这一年中,我国的政务大数据开放程度如何?大数据惠民又取得了那些经验和成绩?公共医疗关系国计民生,未来医疗将会如何应用大数据?关于大数据技术本身,又有那些最新发展?在本届大会上,也许你能找到一些答案。
  出席本次大会的嘉宾有中国信息协会会长卢时彻、国家信息中心副主任兼中国信息协会大数据分会会长李凯、中国工程院院士邬贺铨、中国工程院院士沈昌祥等诸多专家学者,阿里巴巴、京东、中国电信云计算公司、用友、浪潮、亚信、IBM知名企业,以及地方省市政府代表参会。让我们跟随专家的脚步,聆听最前沿的声音,感受和体验中国大数据产业发展的最强音!
  以下为出席此次大会的嘉宾在开幕式上发表的主题演讲内容。
  中国信息协会会长卢时彻:
  大数据的广泛应用 引领社会逐步走向世界经济时代
  各位来宾,各位朋友,大家上午好!
  由中国信息协会大数据分会主办的以“落实国家大数据发展战略,提升我国大数据产业发展水平”为主题的第二届中国大数据产业发展大会今天在这里召开了。我代表中国信息协会对大家在百忙中抽出时间来参会,表示热烈的欢迎!对长期以来对协会的支持表示衷心的感谢!
  近年来信息技术与经济社会各领域的深度融合,引发了数据量的爆发式增长,日益对全球生产、流通、分配、消费活动以及经济运行机制、社会生活方式和国家治理能力产生了重要的影响,大数据的广泛应用,是引领社会逐步走向世界经济时代。据统计,全球所掌握的数据每两年就会翻番。到2020年,全球数据量将达到60ZB,其中我国所掌握的数据是在20%。根据有关机构预测,2016年全球大数据相关产业规模将达到2320亿美元。大数据所具有的巨大的资源禀赋、市场价值以及产业高速发展,也同样引起我国政府的高度重视。今年9月5日,国务院正式发布促进大数据发展行动纲要,在全社会引起广泛的反响,这是目前为止我国第一份促进大数据发展的国家文件,从促进大数据发展的高度,提出了我国大数据的顶层设计,是指引我国大数据未来发展的纲领性文件。纲要要引导大数据发展,以企业为主体,以市场为导向,加大支持力度,建立市场化应用机制,深化大数据在各行业创新应用催生新业态、新模式,需求与供给紧密相结合的开放式体系。使大数据成为创业创新的新动力。
  我国发展大数据产业,不仅因为有丰富的数据资源,还有巨大的应用市场优势。近年来,经过各方面共同努力,我国大数据得到快速发展,产业规模不断扩大。在部分关键性技术上实现突破,涌现出一批骨干企业,在各行业当中的应用也得到了深入应用。形成了一大批典型的示范案例,大数据日益成为了推动经济增长加速产业转型的重要力量。
  要想实现我国大数据产业的快速健康发展,需要产学研用等方面不懈努力。在此总结去年第一届中国大数据产业大会以来的发展情况,以及党的十八大五中全会的精神,我想提出以下几点思路,跟大家一起共同参考。我相信今天的会经过大家的努力,一定会开好,并且达到预期效果。
  在总体思路上,要进一步明确我国大数据发展的战略目标和战略证据,统筹谋划大数据应用,关键技术研发与产业培育开放以促进保护,市场监管法律法规等关键布局,引导国内大数据发展方向,避免一哄而上的盲目发展。大数据应用上,政务和公共服务领域的应用要重点面向改善民生服务和城市治理方面。积极推动环保、医疗、教育、交通等关键领域的大数据整合以及应用。进一步提高政务和公共服务效率。
  在市场化应用方面,重点在跨行业大数据应用方面出台推动政策,促进互联网、电信、金融等企业与其他行业开展大数据融合与金融创新,带动全社会大数据应用不断深化。
  在技术创新上,一是要加强大数据技术研发方向的前瞻性和系统性,重点支持深度学习,以员工智能支持大数据处理,海量数据存储管理,交付式数据可示范和应用相关的技术;二是积极产学研用力量形成合力,在大数据平台和软件上实现突破,以此为核心发展开源生态;三是创新科研项目支持方式,将开源和开放标准作为考核指标,通过补助或后补助方式促进企业、科研机构参与大数据开源发展。
  在政府数据开放上,推动政府和公用事业领域数据资源开发开放工作,并按照相关法规制订政府和公共数据开放中的安全和隐私保护目录。对可能涉及国家安全和公民隐私的风险点进行严格控制。在此基础上,按敏感性和对政府、公共数据进行分类,确定开放优先级,制订分步骤的数据开放路线图。同时政府也积极规划和引导大数据交易活动,为数据资源的流通创造有利条件。
  各位来宾,各位朋友,未来随着我国经济发展进入新常态,大数据正在稳增长、促改革、调结构过程中承担起越来越重要的角色,在经济社会发展中的基础性、战略性、先导性地位也将越来越突出,同时大数据重构信息技术体系和产业结构,为我国信息技术产业的发展提供巨大的机遇。
  中国信息协会作为国家发改委主管以推进国民经济和社会信息化为己任的全国性社会团体,愿意和社会各界一道抓住机遇,携手共进,为推动我国大数据的发展作出积极的贡献。
  最后,预祝大会取得圆满成功,谢谢大家。
  国家信息中心副主任、中国信息协会大数据分会会长李凯:
  中国大数据产业发展大会为从业主体创造经验交流平台
  尊敬的卢时彻会长,沈昌祥院士,各位领导,各位嘉宾,大家早上好!
  借今天2015(第二届)中国大数据产业发展大会隆重召开的时候,代表中国信息协会大数据分会对各位来宾的到来表示热烈的欢迎和衷心的感谢。
  为了推动新一代信息技术的广泛应用,落实党的十八大关于促进新四化同步发展的有关精神,协助国内产学研各界把握大数据发展的有利时机,充分发挥大数据资源的巨大潜力,推动我国社会转型升级,发改委和民政部主管部门同意,中国信息协会于去年8月27号组建了中国信息协会和大数据分会,中国信息协会举办了第一届大数据产业发展大会,转眼间第二届大数据产业发展大会在全体会员单位的热情支持下,今天又在这里召开。这标志着大数据分会已经初创成功,并在不断成长壮大。
  近年来党中央和政府特别重视大数据在政府职能转换和产业升级当中的作用,推动大数据产业发展陆续出台了一系列战略规划和扶持政策,刚才卢会长已经给大家一一列举了。这些方针政策的出台,为我国大数据产业未来发展指明了方向,规划了路径,配套了有力的措施保障。
  在当今信息技术和传统产业日益深度融合的时代,大数据产业链和生态圈正在不断的扩展和延伸,伴随着云计算、互联网、移动互联网、产业互联网等等广泛应用,支撑数据爆炸式增长,大数据形成新的产业。保证大数据产业健康发展,就要从大数据规划、技术、应用、标准等各个方面到大数据采集、传输、存储、交易等各个环节规范协调,需要政府、企业、研发机构充分沟通,密切协作,这是行业发展必然要求,也是大数据分会存在的价值。
  回顾这一年来大数据分会参与和主办了多次大数据领域的学术和技术交流活动,具体包括今年初大数据分会在北京隆重举办了题为“启动正午体验之旅、引领数据开放潮流”中国大数据首届开放论坛。今年3月大数据分会和信息惠民分会联合举办了以“信息化带动民生,务实推进信息惠民工程健康发展”为题的首届信息惠民大会。今年5月份数据分会作为2015年全球大数据时代峰会贵阳的大数据博览会协办单位,协助组织和推进了,该次大会的召开,数博会会议期间,分会举办了以“大数据和政府职能转变”为主体的分论坛。还有和承德等有关方面举办了论坛。最近几天我们准备联合廊坊市政府共同举办中国廊坊大数据产业周。这一年中围绕着医疗、金融、教育、电子商务、营销、数据中心等行业领域以及大数据可视化、大规模数据等特定相关技术方向,分会在上海、北京、成都分别举办了“中国大数据论坛”系列公益沙龙活动。每次沙龙都得到了会员成员热烈响应和积极评价。截至目前,中国大数据论坛已经举办了11期。
  作为分会一年一度最重要的盛会,2015(第二届)中国大数据产业发展大会再次起到了沟通交流桥梁作用,为我国大数据从业主体创造了一个当面交流经验的平台。一年工作中,分会能取得这些初步的成果,离不开大家共同支持。未来日常工作中,中国信息协会大数据分会愿意一如既往与政产学研各界人士携手进一步扩大活动范围,丰富活动内容,争取更大的作为,与产业界的同仁们,一起共同促进我们国家大数据产业的日益繁荣。
  今天下午交流政府数据开放和大数据惠民,以及探讨大数据核心技术与行业应用创新,是本届产业大会的两个分论坛。希望大家能够积极参与。
  最后,我中心的希望第二届中国大数据产业发展大会能够取得圆满成功,同时再次感谢大家的光临。谢谢大家。
  中国工程院院士、中国信息协会大数据专家委员会主任委员沈昌祥:
  用可信计算构筑网络安全
  各位领导,各位嘉宾,今天跟大家交流一下大数据安全的问题。
  今天讲一下可信计算保障大数据安全,国务院发布的促进大数据发展行动纲要明确指出要重视大数据的安全,要研究大数据安全技术,落实等级保护制度,要建设大数据信息安全。今天围绕三个问题讲一下。一是大时代的安全需求,二是等级保护怎么落实,三是怎么把大数据技术、安全保障按照保障体系建设。
  我们知道大数据很多,但是我们大数据不是数据库,大数据是指无法用现有的软件工具提取、存储、搜索、共享、分析和处理得海量的、复杂的数据集合。
  大数据跟以前的海量数据有什么区别呢?它有四个特征来概括。一是海量数据,数据量比较大;二是数据类型繁多,这是最主要的特点,学术上讲结构化,以前的数据是关系数据,是严格结构化的,大数据甚至没有结构化的背景,这是主要的结构特点;三是价值密度低,数据汇集起来价值不是很高的,丢了一两兆没有什么大的影响,不像以前丢了一个P不行,把1改为0,以前就没有了,这是不一样的;四是现在我们不能把这些数据堆积起来,要实时的处理,成本越低,价值越大。围绕大数据做了很庞大的数据中心,我在贵阳跟有关领导说了,你搞那么大数据中心,把垃圾堆了那么多怎么办呢?没必要,处理完了以后就过去。
  这是和以前数据安全处理的情况不一样。当时跟贵阳开会的时候,跟省领导、市领导、发改委领导说,大数据对于一个单位来说不重要,可以扔掉,对于单位来说是垃圾,处理过的。把以前各单位处理过的一些没用的数据汇集起来再处理,好象是数据垃圾处理工厂,很形象。尽管垃圾数据量特别大,但是价值确实不高。但是这里面有金子的,银子的,还有木头的。单看起来没有价值的数据,可以梳理它的规律性,发掘它的知识,统筹高层次的指挥政策。
  大数据是各单位弄出来的东西,对单位也不重要。但是这些垃圾能反映出这个单位是干什么的,收集情报很重要。以前不是信息化时代,以前保密单位的垃圾一定要处理好,一定要扫的干干净净的。情报机构禁止你有垃圾。大数据网络普及之后,大数据处理过程更要重,现在网络犯罪特别多。系统安全,作为大数据会记得主要载体,云计算平台等系统安全将直接影响大数据安全。个人设备安全,个人设备成为大数据的外延,最容易构成信息安全问题。供应链安全,尽管是低价值的,辛辛苦苦挖掘出来的一些东西丢了,被人家偷走了,不是白搞了吗?如果我们利用大数据,信息安全就成为非常严重的激烈斗争。金子弄出来了,被人家拿走了,我们好不容易做了规律,很有价值,知道我们行业发展,供国家决策,被人家拿走了以后,不就丧失价值了吗?还有大数据生产、存储和分析过程中,尽管丢掉一些不重要,但是系统性破坏是相反的,数据安全是非常重要的,要保持原来源头数据不被破坏,原来数据梳理以后、外延以后,规律不走样。我们要重视大数据信息安全工作。
  做好大数据时代信息安全等级保护工作,有人说大数据以后信息安全等级保护模糊了,做不了,我说不是,我们要依托大数据网络技术,采用数据挖掘、关联分析等技术手段对分布式存储异构海量数据进行处理。这是处理的方式。这样的处理过程、处理方式,无论是网络环境、计算平台,还是存储的载体,都分属不同的信息系统。因此按等级保护制度来做是解决大数据安全的抓手。
  我们立足信息安全等级保护,全过程增强信息安全保障能力。信息安全等级保护是按照两维来说的,一是处理系统的计算资源,就是处理设备系统,二是处理不同的数据信息,这两类也是按网络空间的两维,网络空间也是全球可以互联的物理信息,还有就是处理这些信息的基础设施、固件。等级保护一开始就是两维的,因此我们也应该围绕着大数据处理过程数据本身,以及处理过程中的设备设施系统的安全去做。
  等级保护是非常明确的,第一等级是用户自主保护级,自己说了三,第二等级是为安全审计保护级,相当于办公室办公,一开始自己弄还行,多个办公室就不行了,需要审计,第三等级是为安全标识保护级,保密信息不能自己说了算,由上级单位专门机构说了算,叫强制性访问标记保护,有了保密信息以后,这个人是什么级别的,他能看什么,有规定的制度。第四等级是结构化保护级,保密室有了,但是门窗柜稀稀松松的,也不行,保密室门窗一定要严严密密的。第四等级就是静态保护,动态建设,叫访问验证保护级。
  信息安全等级保护对大数据安全实行全过程保障,要求安全产品研发和系统安全建设者,按照标准设计、开发安全产品,建设管理信息系统。要求专业测评者,按标准并运用专门的测评工具检测安全产品,评估系统,把住信息系统及产品安全保护等级的实现结果关。要求建设、管理、评估及监督检查者全过程的安全关。要求各兼管部门使用登记的标准和监测工具开展检查,对重要的领域进行严格的管理。
  积极规范构建基于等级保护的大数据纵深防御防护体系架构。
  1、应加快构建多层次、高质量的大数据纵深防御体系结构。
  任何一个数据体系结构非常重要的,但是我们现在做的都不是太理想,都是封堵查杀,防火墙等等,我们要构建大数据纵深防御体系,一是要加强大数据资源、环境、系统整体防护,建设多重防护、多级互联体系结构,确保大数据处理环境可信。二是要加强处理流程控制,防止内部攻击,提高计算节点自我免疫能力,不是外面封堵。三是要加强全局层面安全机制,制订数据控制策略,梳理数据处理流程,建立安全的数据处理新模式。四是加强技术平台支持下的安全管理,基于安全策略,与业务处理、监控及日常管理制度有机结合。技术平台和安全制度是两码事。我们可以认为可信、可控、可管。
  2、保障大数据安全,要做到以下几点。
  1)攻击者进不去。
  2)非授权者重要信息拿不到。
  3)窃取保密信息看不懂。
  4)系统和信息改不了。
  5)系统工作瘫不成。
  6)攻击行为赖不掉。
  以前震网、火焰、心脏滴血等不查杀自灭。
  具体怎么做呢?怎么构建可信免疫、主动防护体系呢?可信免疫、主动防护确保大数据可信、可控、可管。
  大数据时代,原有的信息资源处理手段已经不适应迅速增大的数据量级,原有的计算环境也在随之数据挖掘、关联分析等大数据技术的发展而变化。传统的封堵查杀就不好用了。
  最近《求是》杂志约我的文章,我发表了一篇“用可信计算构筑网络安全。可信可用方能安全交互,主动免疫方能有效防护,自主创新方能安全可控。
  可信免疫计算模式,可信计算是指计算运算的同时进行安全防护,使计算结果总是于预期一样,计算全程可测可控,不备干扰。就像人体的免疫系统一样,一边工作一边防护并存。免疫系统也识别身份,有没有破坏机体现状改变了,还有生物信息,比如说基因,原来基因排序出不来,后来把某个基因破了,排序就出来了。我们要及时识别“自己”和非己”的成份,从而破坏与排斥进入机体的有害物质。
  这是可信计算的大型结构,现在PC机联网以后,主要问题是可信。
  这是运算和防御并行的双体系结构,计算体系架构下面的基因全不全,左边是大量无形PC机结构,主机、主办、操作系统、网络接口、管理接口,就这么简单,右边加一些访问措施。
  安全可信系统框架,我们整个体系架构,整个系统的行为,体系结构、操作行为、资源配置、数据存储、策略管理都可信。我们现在提出的可信计算作为免疫系统一样动态循环发挥作用才有效。
  这样我们构建了国家标准,信息安全和大数据安全和日常安全不一样的。计算机环境,人进去了以后,有信息对立了,以前办公室有人的安全,现在办公室管好机器的安全,什么人做什么事儿,什么机器能干什么活儿,什么程序能做什么,不应该做什么。每个单位都有门卫,都有保安,现在保安太不讲道理了,进来以后防火墙男男女女、老老少少都有,没有防火墙一样的。10分钟防火墙的指令就反馈到网站了。网络通信有可能被别人看了,安全很重要。一个单位必须能保障单位环境的安全,我们在计算机大数据梳理以后,一定有系统管理,保证计算资源的安全。我们有安全管理中心,什么样的人能干什么事儿,能看什么软件,能定级、标清,和保密室一样。我们还要审计,需要审计平台,出现异常及时处理。我们信息安全按照科学的框架跟日常的安全是完全对应的。我们以访问控制为核心,实行主体按策略规则,访问不同等级数据,确保全程处理可控。
  推行最小权限管理,尤其是高等级系统实行三权分离管理体制,信息安全和日常安全一样,如果权力太大必然腐败,我们有三权分离,没有腐败条件。
  我就讲这些,谢谢大家。
  中国电信云计算公司副总经理吴章先:
  中国电信大数据实践
  尊敬的各位领导,各位嘉宾,非常高兴今天有这个机会在大数据产业发展大会上,就中国电信在大数据上的一些实践给大家做分享。
  今年年初运营商大会上有朋友讲了,运营商在分布的象限里面划在一个土豪的小圈圈,运营商有很好的能力,在大数据时代下,发现这是一个很好的基础。今天我们还是想把中国电信在大数据方面的情况,以及在应用服务的实践,还有在开放平台上的实践,给大家做一个汇报。
  国家总理在国务院纲要发布以后,整个大数据非常热,中国电信和客户沟通过程中发现不仅仅是在传统大数据应用非常成熟的互联网业界,在其他的包括政府目前都纷纷在大数据尝试和应用。这主要是什么趋势呢?首先是数据的发展,运营商数据有,但是现在在行业里面由于新技术的体现,数据基本上属于一个大爆炸的时代。在移动互联网领域,中国电信今年也进行了4G+,大家在移动终端上网速度速率带宽比2G时代有飞跃的发展,这也是带来了用户不断在无线、运营商网络里面、应用厂商平台上产生大量的数据。我们看到业界有很大的趋势,就是物联网、可穿戴设备、智能设备方面的发展。这些的发展对于企业、政府带来了一个很重要的改变挑战,这么海量的数据,传统企业运营模式,包括整个政府决策机制,依托在这个数据上会有一些变化。这些变化离不开数据的支撑,包括云计算,大数据和云计算就是相辅相成的关系。我们依托于这些数据的改变上面,我们在空间性和数据上面也有一些新的进展。
  从中国电信的数据情况来看,目前中国电信有制度四门八类,云、端等等八大类的数据,这些数据基本上覆盖了海量用户,包括将近2亿移动用户,1.5亿宽带用户,1.3亿古话用户,IPTV用户也达到了4000万。同时公共WIFI覆盖有102万,家庭WIFI超过3000万。我们本身就汇集了上千节点的数据处理能力,每天汇聚数量非常大。中国电信每天清洗完的数字还有200T以上。这么海量的数据,我们在技术上的挑战和业务上挑战是非常大的。
  运营商的数据和BAT的数据可能不太一样,我们是分布在全世界、全国不同的结点上,不同的业务系统、不同网络系统汇集起来的数据,这些汇聚本身就是数据有结构化的,也有非结构化的,也有一些视频的数据。通过一年的实践,我们从底下的省分公司标准口的平台上,通过清单和标签级的做了前端处理以后,再汇聚到中国内蒙的云资源池里面。这个会聚把整个中国电信业务口数据和经营口数据都汇集上来,通过一点汇聚、集约管理、多点服务。通过汇聚形式我们也理解到多元数据融合挑战还是非常大。中国电信内部也会有涉及到一些数据处理的问题。
  举例,我们在做某一个群体价格分析的时候,我们发现某一个省某一个县市的用户价值特别高,用户收入都是500块钱,5000,上万非常多,这个情况不是很对,因为这个区域收入水平没有那么高,不可能每天交那么多的话费。经过调研发现,分公司字段定义有按元,有按分,按照原始字段处理就肯定有误。这也是我们在大数据方面小的感受。
  接下来跟大家分享一下中国电信大数据应用服务的一些实践。运营商的数据源比较广,它的深度比较广。我们做产品的时候,还是依托于我们对行业的了解,主要是聚焦在4+1的产品结构。我们4+1产品结构主要是星图系列、鲲鹏系列和飞龙系列。星图系列目标客户是P2P、金融保险、小贷、支付、众筹、第三方征信,提供敏感信息核验、风险分值评估,风险变化探针。精准营销就是针对电商、门户提供分别不同的精准拂晓。再就是我们咨询报告,我们依托电信终端汇聚平台数据,依托我们对互联网抓下来的数据,对不同领域进行舆情控制,我们针对精细运营提供咨询报告。区域洞察主要是针对政府、交通、商业客户、车载厂商,提供人流热图、实时交通,商业选址等等。我们下面还有一个飞龙大数据PaaS,我们在资源托管和处理分析、产品孵化方面产生一系列安全整合方案。大数据云可以依据客户的规划,不管是私有云,还是公有云,我们可以在传输层、物理层、应用层分别采用不同安全级别的手段,保障用户数据安全。同时在平台里面提供一系列大数据基础处理单元。待会儿我会专门介绍。
  在讲风险防控的时候,星图风险防控遇到一个细节,整个运营商数据伪造成本还是非常高的。银行贷款的时候,传统要做房贷,以前都是企业开一个工资证明,你挣多少钱,银行一看1万块钱,你买我这个房子可以,银行那边给你发贷款,你就可以买房。实际上随着现在金融业务的发展,不光是我们的银行,还有P2P公司,个人信息仿造可能性比较大。如果采用了运营商的数据,包括用户实名制验证、证监、家庭地址、生活圈、工作圈、个人收入评估,同化交叉验证等等非常准确。
  大家都知道最近打车软件非常火,有一个著名的打车软件也在跟我们探讨合作的可能性。他们碰到一个问题,打车软件促销的时候,大概有20%的营销成本都被欺诈用户骗取了。欺诈用户有几类,一是用一些身份证号分别注册,骗取首次司机补贴;二是利用苹果越狱软件装完以后,一个人可以模仿司机和乘客,通过软件进行司机和乘客位置模拟,然后模拟路线,获取费用;三是小团体作战,小的团体分别模糊司机和乘客。本身这些打车软件在平台侧确确实实从原来业务处理逻辑很难对这些进行规避的,但是经过跟运营商风控反欺诈服务结合以后,通过手机电子识别号、手机号、身份证号,加上整个在位置网位移变化情况就可以计算出来。这是运营商数据实现非常好的一个案例。
  基于通信数据我们进行了一些特征分析,特别是金融普惠政策下,我们建立了一个五维一高风险评估模型。这个模型是通过用户在运营商网络里面的消费能力,身份特征,行为偏好,履约意愿和人脉关系,还包括一些高危行为,主要是体现在它有没有出没在一些相对不是人多的场所,有没有在通信里面突然出现异常情况。突然工作圈有一个很大的改变,突然更换手机号。通过这个我们进行一个风险评估模型的构建,最终输出一个分值,通过这个评分进行风险控制。
  前两天我看一个头条,华中地区最大的一家P2P平台跑路了,这是现在金融领域风控环节怎么做,真正决定了一个金融公司的生死存亡。这通过运营商的数据也可以做的。
  精准营销里面,我不想更多讲了。我们主要是依托爬虫系统和DPI数据,找到这个用户是谁,他做了什么,他的画像是什么样的,他经常出现在什么地方。通过这个对用户整个兴趣点进行刻划。通过他的需求,我们把用户需要的服务精准的触达到用户,我们在产品里面也会提供一些相对安全、客户能够接受的触点,保证服务的提供。
  区域洞察,讲的直白一点,实际上我们通过线上线下的数据通过分析地域和个人,整个在现实世界里面位移的情况,帮助零售、金融各种业态的客户,解决在区域里面选址的问题,区域里面价值评估的问题,包括区域里面城市规划等等一系列的问题。
  我们在整个产品系列里面比较有我们的一些心得,主要是依托移动运营商特有的蜂窝网络,我们构建了一个Hive网络模型,通过最小蜂窝的力度和所有PI、各个地理信息进行分析,找到地域特点和地域上人流的特点。这上面我们已经做了一些相对不同的区域指标展现。包括区域的常驻信息、区域人流的情况,区域富裕程度,区域不同层次包括银行网点,包括交通的分析,包括区域各种不同业界形态,帮助客户找到他们所必要的商业区域。
  在区域洞察里面,我们还提供了人流热图,大家都记得年初上海踩踏事件,因为中国经济发展迅速,节假日或者任何一个有活动的区域,人类集中的状况非常凸显,这也会给我们相应的政府、支撑部门带来很大的安全保护方面风险。依托整个运营商移动用户,在不同地域、人流汇聚的情况,实际上我们可以通过大数据分析的方式,在人流变化,对密集区域人流实施监控。
  这是我们在今年东盟博览会上帮助广西省厅公安局实现了东盟博览会人群安全的平台,我们实时把展厅人流变化情况展现出来,还有把人流从哪儿来的,做了什么事情,这可以帮助客户做事前、事中、事后服务上面的提升。
  4+1里面,还有一个飞龙大数据的Paas平台,它是电信级安全的数据开放能力基础。本身我们在依托用户的需求,在这个平台里面,实现了数据的分析能力,我们构建了以hadoop为核心的数据组件,这套系统可以帮助客户降低大数据分析的安排,在我们门户上面可以安全的对自己的数据进行综合分析。同时我们也在上面业提供了一整套数据支撑管理系统。运营商在数据管理上面规划了有27个数据处理路径,数据处理的方法,这些方法在整个平台里面都可以帮我们拥有数据的合作者,一起提供基础数据。同时在这个网络体系里面,我们提供了一个安全手段,大家都知道中国电信是最老的一个运营商,在我们安全上面也得到了国家安保等级相应的认证,我们可以提供安全、高效的服务,帮助合作伙伴、客户更好的挖掘和分析他们的数据。
  刚才讲的是我们在产品服务商的一些实践。
  下面我讲一下在大数据开放平台下面的情况。刚才我们讲了电信的产品,但是不是电信依托我们的产品去做全行业、全产品,其实我们非常聚焦,我们更强化的就是开放平台促进数据合作,通过平台的开放,我们也跟航信等等企业建立了大数据产业联盟,通过产业联盟,通过我们安全的平台,可以把各个联盟的企业进行数据的开放合作,通过开放合作,来实现对客户的服务。
  在征信领域,刚才讲到在风控方面,电信运营商有很好的数据可以帮助客户降低风险。但是如果再结合行业内其他企业的数据,我们在整个风险评估上面,整个精准度上面,或者用户覆盖上都会很大。我们这次和天政理财合作也是利用这种模式,我们和其他企业的数据一起构建这样一个合作。
  在开放平台上,我们现在还做产品的合作,今天到会的不仅仅是做数据产品的,也有做大数据领域非常强大的基础,这样我们在产品构建上面,底层处理技术、算法模型、可视化等等都可以进行合作。前一段我们正在合作的一个例子,最近雾霾很厉害,雾霾主要原因可能还是能源是采用煤的方式,对大气的污染比较严重。现在风电是一个很重要的新能源方式。我们最近在谈的是风电企业运营过程的有很多的问题,因为风速、风向等等原因会造成风机损害不可测。风电企业有自己的数据分析团队,但是在底层缺乏IT支撑。电信PaaS平台就是构建这样的合作,产品上面底层分析平台可以是电信提供的,上面算法可以是企业合作伙伴或者企业自己,上面的数据是自己的,我们可以结合起来提供更资深、更全面、更好的产品体系,增强产品的能力。
  同时开放平台里面也提供解决方案的合作,我们给客户提供一站式解决方案,在东盟博览会里面,中国电信承接了从宽带接入、场内的WIFI、监控还有大数据安保,这些都是当地大数据解决方案提供商支撑的。我们在行业解决方案里面,结合我们合作伙伴,相对在各个领域里面,我们把它汇聚,采用更强的支撑。
  最后在平台实践里面,产品覆盖是10个行业,在上周中国电信正式启动了行业大数据成长技术开放平台的模式,通过这种模式,我们也欢迎在座的各位企业家、各位专家通力合作在大数据产业里面做大做强。
  祝大会圆满成功,谢谢大家。
  贵阳市大数据交易所总裁王叁寿:
  大数据改变世界的力量
  感谢协会给这样一个交流的机会,其实我们协会开这个大会之前是用大数据算过天气,今天的天气真是太棒了。大数据对雾霾来讲,不如风管用。
  我是贵阳市大数据交易所总裁,贵阳市大数据交易所可能大家这半年听了很多。我给大家介绍一下贵阳市大数据交易所以及半年来取得的成绩,今天来的大多数都是交易所潜在的合作伙伴。交易所是今年5月8号克强总理亲自批示的,当时这个批示也是抄送给马凯、张高丽、苗圩、徐绍史等等。贵阳市大数据交易所到现在已经有225家会员单位,不知道在座也有很多是不是我们的会员单位,中国人寿、余额宝、天弘基金等等。
  我们今年12月31号整个交易量大概会突破5000万人民币,离预期还是有点距离,但是贵阳就是这样一个地方,首先领导对我们大数据交易所没有设一个特别硬性的盈利要求和目标,因为贵阳市大数据交易所自从克强总理给了批示之后,我们现在做的很多事情也是做标准。200多家会员里面,中国人寿、泰康人寿正在协助我们做保险大数据的交易标准,还有神州数码、华为、软程动力等协助我们做智慧城市的大数据标准。
  现在贵阳市大数据交易所交易系统开发过程中也费了一些周折,保证我们交易系统是原汁原味的,是我们自己开发团队开发的,我们开发团队大概40人,贵阳市大数据交易所整个团队是120多人,同时形成了一个总部、三个中心,我们还是以贵阳为总部,有一个北京运营中心,有一个上海运营中心。北京运营中心就在清华大学东门的同方科技广场,上海有一个运营中心,在中国金融信息中心那个楼,也在陆家嘴。还有深圳运营中心。
  目前交易所的一些交易规则,我们也做了一些调整。交易所目前收入来源是三部分,一是会员收入,会员是每年10万到30万不等,会员收入也是解决了今年交易所研发过程中一笔很重要的收入,随着交易系统的研发,逐渐成型之后,我们也会降低会员费的门槛;二是交易佣金收入,目前我们是分成制,和股票不一样,我们不是佣金制,是分成制;三是数据清洗,贵阳市做了一个大数据清洗基地,主要是企业驻地方政府协助一些公司提供数据清洗服务,包括简单的建模服务。
  贵阳市大数据交易所目前电子化交易系统在申请成为国家大数据领域的重大工程,现在我们报告已经写完了。
  贵阳市大数据交易所以贵州市政府的名义,给国务院、证监会写报告,希望能纳入证监会和相关部委的监管。
  这是目前交易所取得的成绩。我们市场上出现了很多大数据交易中心,很多人都说这个交易中心会不会跟你产生竞争关系?我想不会,因为这相当于水池或者蓄水池的关系。像中国发展新三板的时候,有上海东江、武汉洪湖、天津滨海等等,现在新三板归集到北京,这些市场也没有消失,反而成为了中关村的新三板的蓄水池。
  贵阳市大数据交易所有政治优势,很多政府的数据是我们敢接的,没有克强总理批示这样一个高度,很多政府的数据接不进来。
  借着今天,我阐述一个观点,对于政府最有价值的有两个,一是土地,经过多年土地价值释放的差不多了,二是释放数据价值。我们交易所5月8号开业到现在为止,已经有110多个国家部委和啊地方政府的领导来我们交易所进行交流、参观。马凯副总理到我们交易所考察是5月25号,5月27号后续领导都来交流,另外还有各个省市的一些领事,宁夏自治区刘晖,广东省副省长刘志庚,很多政府也在我们交易所开了帐户,这是交易所非常重要的一个地位,也是有它的高度所在。
  现在国家大数据实验特区只有贵阳是,今年9月5号发的大数据发展纲要里面唯一提到的城市就是贵阳,这也给贵阳市大数据交易所提供了非常好的生存土壤。
  从我们下一步规划来讲,今天很多朋友都是大数据行业的,你可以把数据经过清洗、建模分析完以后,给贵阳市大数据交易所一个接口。很多人说如果购买中国电信的数据为什么不直接找中国电信。这是错的,经过半年探索,我们有一些经验,很多买方买的数据都不是一家公司,往往是好几家数据公司聚合在一起的结果。这是我第一个经验。第二个经验,数据目前这种交易的连续性问题,很多人觉得连续交易才是交易所,这也不对。北京所和北交所很多产品也不是连续交易,有的时候甚至通过拍卖交易、竞价交易,交易所今年总结的第二个经验,就是一个买方买的数据是对着10个卖方,现在交易所发挥一个撮合的作用,我们把10个卖方的数据汇总在一起,撮合成一个成果,才能较给对手。天融基金买我们的数据,不是一家公司,可能是十家公司数据汇集在一起。我们也在跟京东云沟通,他们购买的数据是不是只有一家公司供应的?肯定不是这样的,是有很多数据供应商供应的。
  还有定价的问题,现在贵阳市大数据交易所定价模式是什么样的呢?一个愿打,一个愿挨,撮合。我不在乎是不是有一个非常标准的价格,我要的是交易量,我们就是撮合。今天是周三,我周一撮合成了一笔通关数据,总额是1000万,一年完成,这是按条结算的,一条8块钱,主要是通过通关数据分析到底从深圳海关走出的产品是往哪个国家最多,哪个城市走出来的,以此支撑贸易上的业务。我们周一签了合同,一年之内把数据做完,第一笔交易就是4500万块钱,我说如果你一年达到1000万的量,我就按照3块钱结算,低于这个量就是5块钱、8块钱。没有那么多的条条框框,这就是贵阳另外一个好处。陈刚书记一直反复说我们要容错,但是我们不愿意犯错。我们价格随时可以调整,灵活,包括会员入会过程中,有些会员说会员费后置行不行,有交易之后从交易费扣除,我说没问题。我们还不是一个国企,虽然我们是贵阳市政府指导、控股,但是完全是市场化的。这是关于价格的总结。
  国家最后到底允许多少家大数据交易所生存下来,很难讲,我看到的现实情况,大数据交易所经过合法上升到国家层面批示的交易所只有我们。这种业态早年新三板的市场遍地都是,这个怎么管。国家的态度是什么?一个数据从一个口出来,很容易监管,但是社会上流动很多数据,从很多口出来的,不太利于国家监管。中国网信办召集一个会,他很关心这个问题。就像北京的自来水管道,这个人要喝出问题,这个问题就是北京自来水公司的问题。比如说北京自来水有十个管道,喝死了也不知道谁家的水有问题。这个道理和大数据目前交易平台是一样的。
  这是我们对大数据交易所总结的几点。
  大数据交易所从5月8号开业,也做了很多工作,欢迎大数据行业很多人下来跟我们沟通交流。大数据交易所也参与了工信十三五规划,贵阳市大数据交易所也在联合业内很多大数据公司,一起开展大数据交易标准的制订。我们联合了中国人寿、泰康人寿做保险数据标准,很多人说你侧重于交通大数据,他侧重于能源大数据,欢迎和我们交易所沟通,我们愿意制订各个领域的大数据标准,这些标准制订出来以后会形成手册,会报给领导审阅,形成我们国家大数据的标准。
  这是我们眼前做的事情。
  贵阳市大数据交易所还在做一件事情,我们在贵阳市政府数据公开上面也充当了很重要的角色,因为我知道很多大数据公司都会基于政府大数据平台,来进行二次开发、创业,我们也非常欢迎。贵阳市工商数据、交通数据等都接到我们交易所了。我们把这些数据进行清洗、建模、分析、可视化,就像我们做自来水的,贵阳市大数据交易所出来水龙头的自来水,我们提供给各个政府和公司做可口可乐、苏打水,大众创业、万众创新,贵阳市大数据交易所出来的水是自来水,所有大数据公司都可以到我们交易所提取自来水进行二次开发、二次加工,这也是我们今年响应国家的创意推的一个政策。贵阳市大数据交易所在贵阳市政府数据公开上面也充当了一个协调的角色。
  这就是我今年的总结。很多领导都在关心数据交易安全的问题,我强调一点,贵阳市大数据交易所目前交易的都不是底层数据,我们不做底层数据交易,目前所有数据都是经过清洗和脱敏的。像贵阳农商行贵阳银行都是我们的客户,我们给他们提供数据的时候尽可能保证原汁原味,同时不侵犯隐私,把一些数据做清洗工作,贵阳市政府支持我们做了一个大数据清洗基地,主要是做数据清洗,还成立了一个块数据公司,主要是做贵州市政府数据整合,非常欢迎台下很多大数据同行企业参股入股。我们贵阳所有大数据公司都是这样的,这也是我们贵阳市政府在大数据产业方面推动的经验。
  贵阳市大数据交易所未来的宗旨就是贡献中国数据智慧,释放全球数据价值。感谢协会给我们这样一个交流的机会,谢谢。
  明略数据副总裁兼金融事业部总经理周卫天:
  中美大数据图谱,透视中美大数据产业发展差异
  感谢主持人,感谢协会。
  今天的题目是中美大数据的图谱,尤其是对中国大数据产业能够给我们带来什么样的启示,不会涉及到很多大数据细节性的东西。
  大数据图谱是一个国家大数据产业布局的表现形式,也是一个说缩影,可以说是一个重要的特征。我们在讲大数据产业图谱的时候,免不了要从美国大数据谈起。目前来说已经很热了,王总也谈到了贵阳市大数据交易所,整个大数据产业如火如荼,但是整个大数据产业的当量其实还是有差距的。
  先讲讲美国大数据图谱,这张图看起来有点唬人,里面东西太多,简单来讲我会提一些大家耳熟能详的公司。美国大数据图谱是按照大数据生命管理周期产业链来看的。从数据的数据源、数据获取、存储、分析到数据的使用,最后是数据共享、展现,这是一条它的脉络。当然我们在讲到数据源的时候,往往还有一种简单的分类方法,就是把它分成基础设施到中间的平台,再到上层的应用。这当中大数据耳熟能详的公司,比如说传统的叫做事务性处理公司,比如说Oracle、IBM,也有一些分析性的公司,包括SAP、IBM、特萨(音),我们也有大数据的基础平台公司,一年前也进了中国,就是叫做克劳待若(音)。美国大数据图谱分的很细,分析类的公司还会分机器学习、上层应用、BI分析等等。一些大的公司,值得一提的公司像比较火的也进入到中国,像开普路(音),大概70亿美金的估值,还有一系列的公司。林林总总,有一个公司还是值得一提,叫凯姆替尔(音),这是美国大数据比较有特色的公司,还没有上市,但是估值已经从两年前40亿美金左右到10月、11月资本的冬天估值200亿美金,它的客户就是美国的中情局、国防局、TMT等。
  美国大数据产业分的非常细,大家至少一开始起步的时候,都是专注于某一个领域,甚至是某一个领域的子领域,不论是说从底下数据处理做存储,还是分析,还是有的专注做内层分析,有的做应用分析。大家的起步很专注。
  我们看到在中国的大数据公司当中,就会完全不是这么一个现象。一开始就包罗万象,什么都要做。我们回过头来再看看中国大数据的产业布局。
  中国的大数据产业布局把企业分为几大类,这是几个月前最新的,明略数据和易才联合调研了中国几百家大数据公司,首批把大数据公司按照数据生命周期管理分类。既然谈到一个产业的问题,尤其是大数据产业,大家不要专注于首先这上面具体的某一个公司,或者这个公司在哪个位置,其实真的不重要。我们讲到大数据产业,一定是涉及到国家、企业、社会、多方共同的责任。回过头来,我们看大数据中国图谱的时候,口头看到有一类公司叫数据源公司,出于对同行的尊重,对产业严肃的态度,我不提任何具体的公司,因为大家已经看到了,我们自己公司也在里面,不大好。首先是数据源的公司,由于种种原因,现优势,相对垄断资源的优势,这些企业由于拥有了数据,比如说国家工商部门的数据,很多企业的数据,甚至税务的数据,我们讲的三表的数据,水表、电表、煤气表等等数据,短期内这些公司爆发力很强,因为大家都要做大数据的项目,你没有数据没法玩儿,巧妇难为无米之炊。刚才王总也讲到了自来水的问题,贵阳市大数据交易所出来的应该是纯净水了,他们有清洗等等。也有相对垄断资源的公司,国家相应法律法规也在跟进。纯净水出来,有的是3块钱一瓶,有的13块钱一瓶,有的要包装,有的是我从阿尔卑斯山来的,有的是天山五千米以下来的,价值就不一样了。
  还有就是大家的数据技术是不一样的。尤其是大数据,一般大数据到10TB、10PB的时候,你要有数据处理成本,这类公司来做数据处理。数据平台当中就会涉及到大家大家耳熟能详的技术,包括Hadoop。
  数据最重要体现价值,尤其是企业,如果没有价值,企业没有带来业务上的提升,运营效率的优化,或者是说营销额的急剧增加,这个大数据项目上的是没有意义。所以各种解决方案的公司也应运而生。
  还有一个趋势,国内现在也在跟上,前面讲到美国大数据图谱的时候提到了一个公司叫开普路德。
  大数据的展现,什么样的数据以什么形式,通过一种人机互动的形式展现给用户。在我用这个数据的时候,数据对我来说不是死的,是活的,是一种双向互动的沟通,其实产生了一系列新型大数据BI展现公司。国内已经有了几家,华东有、华北有。
  大家可以看到,我们大数据产业图谱是按照数据源、数据清洗,把它成为一个商品,到数据平台,整个围绕大数据提供一个整体解决方案以及大数据的展现。这上面列举了一些公司。
  我们看看中美图谱对比,我们看到美国还是以底层技术和应用为主,反观我们更多是以数据和技术为主。而且数据Data要更大。前面讲了,因为有了天然的先发优势,相对垄断的资源或者和政府先知先觉的快速合作,这类数据型的公司增长快,爆发力也很强。如果做技术性的公司和应用性的公司,软件化、平台化的水平,投入就会比较慢,产出也会相对比较慢。当然我们这里也是因为产业的大会,自然也对各界政府提出了这样一个问题,我们如何去引导,如何去分流。是不是在相关国家、科技的政策、上市制度方面可以对一些核心的涉及到大数据、平台、底层ICT通讯安全,以及光缆数据保密、解密等等涉及到国家安全的,大数据通常在军事方面的应用不常讲。我们都知道大数据对飞机机械故障收集数据,对隐型战机大数据收集已经非常厉害了。试想一下,我们今天发展大飞机事业,对大数据涉及到底层信息交易、网络技术,如果不引导,大家都去做一些相对快速爆发的事情。
  很多传统型企业、一些传统集成商,甚至很多上市公司,原来因为这个行业中耕耘很深了,随着大数据出现了,就出现了。比如说东方国信,原来做运营商了,现在也做大数据,通过收购大数据上市公司,还有软件做传统外包的牧和等等,都在介入大数据领域。这些IT运营商、巨头们因为看到了这块火热的领域,大家自然而然从商业角度进入了。当然也有一些大数据的初创企业,现在也比较多。
  总体来说,其实大数据已经到了一个爆发的前沿。个人来看,大数据产业技术、应用,除了电商领域之外,其他相比美国还是落后两年左右,可以说是22个月到28个月。后面你会看到大数据的市场规模。电商领域由于BAT的发展,尤其是淘宝、天猫对客户的了解,其实在这方面大数据的应用是完全可以跟美国比肩的。
  我前面讲到有一类数据型的企业,也是对我们国家的发展,由于数据量相对不那么开放,政府6、7、8、9月份出台了一系列密集政策,包括互联网+指导若干规则和意见,还是9月份初国务院印发促进大数据发展纲要,包括最近工信部具体对大数据的政策,方案密集。但是我们启动还是相对滞后西方一些国家,尤其是这里列举了一些发达国家大数据的开放。当然我们对一些公共数据,无论是交通,还是人口,还是婚姻,以及气象等等,以往对这些要数据的积累、管理、整理方面也是在迎头赶上。
  我们还观察到了一点,复制与创新的问题,很有意思的一个问题。大家可以讲复制本身就是一个创新,复制做的很成功的,我也很同意复制本身就是一种创新。携程四君子做的如家酒店、汉庭等等,他就是复制美国的连锁酒店。我们也看到各种各样的娱乐节目,快乐大冲关等等,我们娱乐节目也是很快拷贝复制美国的娱乐节目,这些节目复制给大家带来了快乐,给电视带来了营收,对社会如果产生正能量,这也是一种创新。但是我们复制式的创新和颠覆式创新,涉及到我们根本大数据的技术,那是不一样的。首先我们要在这个复制式创新和颠覆式创新上面不能一面倒,我们也要看到特斯拉这种颠覆式创新的技术,已经有企业走在前面了,像百度,它在人工智能引进了不少人,引进了人工智能专家吴宏等等。但是相关政府、政府研究机构甚至是初创企业,是不是也能大胆的引进一些人,在一些根本性的技术方面敢于创新、敢于创造,而不是简单的复制。至少我们希望看到复制和创新是能够平衡发展的。
  下面我们看到大数据产业环境,国家顶层的大力支持我一带而过,大家讲的非常多了。当然大数据市场机制快速发展。
  涉及到大数据人才的培养,刚才讲到复制、创新的时候,也提到了一个。作为高等院校、职业学校以及高科技企业,尤其是高校,现在是设了一些大数据课,我们从国家层面是不是能支持一些创新型的。我们经常看到机器人大赛,大数据都是一些分析模型,在学校开始甚至毕业设计的时候就有一些和产业、行业结合的大项目让学生做,从学校开始培养他大数据的思维,对大数据的理解,可以在学校搞一些大数据活动,哪个老师最受欢迎,为什么最受欢迎,从舆情开始抓取,给产业提供大数据人才。
  大家看一下这个数字,我刚才讲到了整体除了电商领域还落后于美国大概两年左右的时间。我们看一下美国大数据市场,15年是380亿美金的规模,中国大数据市场根据CCW的统计,也有赛迪顾问的数据,差的不多,到15、16年也就是100亿人民币的规模。我们今年的GDP和美国差距已经不远了,我们产生的数据量绝对不会比美国少。大家交通出行看看马路上的探头,我估计本身就是美国的10倍、20倍,产生的数据量就是10倍、20倍。我们移动互联上网的人数,点击流已经超过了美国。无论从GDP当量,还是大数据数据源的当量,以及无论是政府、民众对大数据各种应用的呼唤,我们大数据市场规模完全不应该小于美国。但是今天我略放大一下,把今天的再提高下,姑且认为是20亿美金对380亿美金,今天是2015年,如果我们用5年的时间,每年翻一倍可以赶上美国,因为美国大数据平均每年增长50%,发展到一定时间就缓下来了。如果是20亿美金,2020年是240亿美金,按照目前18%的发展,到2020年就差不多了,这对于我们产业、大数据的企业是多大的一个机会。机会无比巨大,到2020年是1200亿人民币市场规模的空间,空间很大。如果大家觉得我是在讲大跃进,每年翻倍不难,其实前两年不难。我们每年就60%的成长,从20亿到2020年应该能超过200亿,如果每年60%的程度,就是1.6,5次方一下,到2020年也能达到200亿美金的规模,而且每年60%的成长完全不在话下。刚才贵阳市大数据交易所王总给了我们很多的信心,光数据量和政府联营,别说每年60%的成长,每年100%完全有可能。连续5年,我们也就达到了几百亿的规模。这对大数据产业来讲,是一个机遇,但是挑战非常多。
  我们首先一定要合理开放数据,从一个企业的实践者来看到,我们看到江苏某银行,由于省政府的支持,拿到了国税、地税的数据,很快的推出了一个税易龙(音),结合数据对小企业客户进行评价,3个月的时候就贷出16个亿,我们合理开除这样数据,是整个社会跨行业生产力大幅度提升。我们碰到西部一个银行跟北京福田汽车合作作供应链金融,如果有这些企业的税务数据开放、企业进销存的数据开放,岂不是美事一桩,我们把上游的企业和下游的企业都联系起来了。现在银行是想尽办法去获取原本可以合理开放的数据。从产业角度呼唤政府相关部门,要去养技术。
  中国人讲“养”,大数据技术算法如果没有数据,本身这个技术算法是不能有长进的,不能前进的。阿里巴巴有200多人的工程师,百度有300人的,阿里巴巴号称上网的客户有2300万人,一家五口的人不同的帐户进来,阿里巴巴就知道是爸爸进来了,还是小孩进来了。如果没有大量的数据,阿里的算法不会越来越精进、成熟,我们也是呼吁亲爱的马云同志能够真正开放他的电商数据。马总其实真正开放的数据虽然不断讲BT时代,分享数据,其实分享数据力度是有限的。我们看到其实1号店、阿里,甚至京东,各自都有各种各样的数据,但是我们没有看到这个数据层面的合作,数据层面的分享,我作为一个从业者,讲的个人观点。如果政府促进企业更开放一点,能把这些数据跨界、跨行业的来分享,一定能够发挥更大的作用,使我们的数据二次价值提升,甚至级数级的把价值提升。
  我们还看到一个问题,大数据基础数据投入当中有一个问题,就是大家对大数据知识产权重视程度不够,大家希望模仿,因为模仿的成本最小,要做第一个吃螃蟹的人很难,生怕吃不好就被噎着了。这个也涉及到基础核心技术知识产权的保护,如果没有这个知识产权的保护是很难的,企业都不愿意进行大力投入。
  从我们来看,讲到产业链,我代表明略数据数据公司,讲讲我们公司做什么。我们公司是要帮助企业,尤其是政府、银行以及其他各也各业的企业做数据互联,首先从内部数据切入,然后根据业务需要,把外部数据引入。同时我们的目标是我们服务银行、服务税务过程中,希望把税务的数据能够给到银行用。当然也要把银行的数据一样给税务用。因为小微企业贷款的时候,到税务交税的时候往往说我现在经营状况每况愈下,很难,一把鼻涕一把泪,去银行贷款就是产销两旺,每年成长30%,只要把两部分数据关联,交叉一下,就可以一目了然看到这些东西。我们把企业生态圈的数据能够有机关联起来,用技术、安全合理的让他们放心的去使用,从而产生价值
  我们讲中美大数据图谱对比,产业分析,我们看到首先是一个很大的机遇,整个市场目前是20亿美金,5年以后就以每年60%的成长,我们看到的是200亿美金的规模。所以我们身处大数据的企业、合作伙伴都是看到这样一个巨大的机会,当然我们挑战也很多,大数据整个产业链从提供数据源的数据处理公司、到数据平台数据运营公司,大家是不是都均衡的发展,国家相关的技术专利保护以及科技新三板上市公司的引导,对技术的投入,都是国家、产业、企业、社会一同努力。如果我们要实现弯道超车,就是每年以100%的成长,2020年就能达到640亿的市场规模。企业千万到敢于创新、敢于尝试。滴滴打车也不容易,经常被认为是非法运营,但是滴滴打车照样在不断前行,以至于上海市政府也颁发了证照。企业创新过程中肯定有一定的容错精神,肯定也会付出一些代价,只要大数据企业齐心起来,敢于创新、勇于创新,才能把大数据的产业一起做强做大。
  谢谢大家。
  文思海辉高级副总裁、大数据首席科学家贾丕星:
  大数据—金融和实体经济的连接纽带
  非常感谢,特别感谢有机会参加这样一个交流,和各位领导、专家分享文思海辉在大数据领域的一些探索。
  刚才明略数据周总讲的时候,我快速查了一些数据,周总一直在算数据,2020年大数据产业的规模。我有几个值,中国15年6月份沪深两市总市值是70万亿,14年年底中国GDP是60万亿,已上市公司总市值也就超过GDP一点点。大数据2020年产值是几百亿,我跟各家大企业沟通过程中,他们告诉我们,他们的估值远远超过这个值,每个企业都值5亿美金、10亿美金,不过加起来,二三十个企业就到了整个市场的规模。
  国家鼓励整个大数据产业的发展,大数据产业随着政府的鼓励,快速发展的时候,中国人也有个不太好的习惯,就是炒作概念,把这个概念炒的非常大,认为我们在做很多高大上的事情,这个领域里面有很多可被挖掘的发财机会。我们在数据领域里面耕耘了很多年,其实数据是一个特别需要静下心来踏踏实实做的事情。大家鼓励大数据的发展,让大家重视数据,重视数据产业是对得,但是我们应该认真的对待它,任何企业初期都有一个快速膨胀、增长泡沫的过程,挤压泡沫之后就会走向正规。
  文思海辉在大数据领域做了什么?我们作为IT服务型企业也在进入大数据行业,我们一直在这个行业耕耘。今天讲的题目是大数据是连接金融和实体产业之间的纽带,其实这句话也不为过。因为金融是虚拟经济分配的方式,它最终投向有发展潜力的企业,最终能够解决社会资源合理配置的问题,这是一个纽带作用。文思海辉做什么呢?
  我从文思海辉以往发展历程和未来怎么做大数据这个市场跟大家分享。
  文思海辉做的事情很扎实,我们目前为止,主要以金融服务数据为主,基本上我们和数据服务类不厂商都有合作。我们守着国家30多家金融机构的大数据服务平台,我们提供营销决策、经营分析、平台建设,我们连接了产品方、工具、展示方,我们着力连接数据提供商,无论你的数据来自哪个渠道,是原始的,还是分析模型加工处理的,最终如果要迈向金融机构,到底解决哪些问题,是风控的问题,还是营销引流的过程。这个过程中只有原来踏实在这个行业里面,懂这个行业行为,了解这个行业已有特征的才能上下联合,左右打通,这就是文思海辉做的工作。我们有1600名员工为大家做这样的服务。
  现在看起来大家都可以创业,爆富,国外大量的数据类公司虽然做得不错,大家大部分还是谋求市场扩充,人员增长,靠服务盈利的模式。跟电商一样,摆在那儿的几个电商仅仅那么几个而已,但是支撑大电商是什么,如果没有快速构建的快递网络,快递能到你们家吗?
  这就是文思海辉的定位,我们在这个定位里面走的不太低端,国内面向整个金融机构的数据领域的规划,数据架构规划,到数据管控治理体系构建,包括营销风控整个领域的风险应用实施,这些方面是我们擅长的。
  这是文思海辉现有的客户基础,我们在整个行业里面市场地位还是不错的。举例,10年的时候,我开始介入人民银行,参与人民银行整个金融标准化的工程制订,整个金融体系内,金融体系信息化水平比其他行业高一些,对监管要求很高。监管实现跨行业的时候,首先制订的是标准,没有标准行业没有办法做数据互换和交流。我们要参与人民银行这个体系,清晰人民银行做金融标准化的思路。我们又借鉴到证监会,13年我们开始证监会的标准制订工作。从今年股灾来讲,大家对证监会的行为可能不是那么认可,但是它确实在监管层面对行业经营实体监管分析比人民银行银监会差了一些,行业也在改革。
  除了证监会,像国家外汇管理局外汇管理平台,打通海关、金融、实体整合是我们做的。通过这些数据可以了解到,一个好的企业,IT数据服务企业,最重要就是人才培养,不仅要懂各种各样的数据技术,还要懂每个行业给每个行业提供知识的服务。
  我们目前在银行、证券、保险里面都有自己的位置。我们越来越关注泛金融领域的合作,随着国家金融体系的改革,大家越来越谈更多的大集团下面混业经营的机制,平安比招商走的更进一步,大家更愿意参考它。我们也做了整个的布局,我们有金融类企业的客户,有租赁类企业的客户,保险、基金、信托谈的都是泛资管的概念,用各种各样金融基础工具支持项目融资。你提前做布局,打通对整个金融领域各行业的理解,这是我们在做的事情。
  目前基于我们对金融全牌照的授权,我们已经拿到了国内几个新型的金融数据平台一体化构建的项目。
  接下来讲一下文思海辉在未来的定位,金融在信息化水平比较高的行业,随着国家大数据战略的颁布,我们希望我们在金融领域的经验复制出去,无论是实体经济还是区域经济,做数据业务和传统金融有很多可借鉴的思路。针对我们在金融领域的数据服务能力对外复制和延伸,我们提了三个观点。
  一是复制,我们最近也在跟进一些航空业、医疗业数据类服务市场,在这个里面,我们通过沟通指导发现,这些领域懂行业知识,又能做数据整合的供应商非常少,应该属于一个空白状态。很多行业都是空白的,他们可能借鉴其他行业,做一些小型数据类的项目,解决了领导要报表和驾驶舱的问题。但是用数据提升价值的水平上,和传统金融和电信业还有差距。我们如何在规划上的方法,架构上的理论,开放上的策略,运维管理机制,以及不同领域的决策模型,通过跨行业的复制,复制出去。这里面除了技术类的专家以外,我们也开始引入跨行业的业务专家。只有这个行业的业务专家,才能真正懂这个行业真实的数据产生逻辑,以及如何应用,以及决策管理。
  二是协同,如何把实体经济和虚拟经济做协同。大家都知道车联网,这几年特别火,很多企业都号称我们做车联网。车联网都号称能做车险定价,谁做到了吗?汽车制造商和车联网布局,大家炒的很火的,但是这个得和保险公司做衔接,保险公司还是根据你出险概率给折扣,可能按车种,这种车是不是容易出险定价。走到人的驾驶行为定价,我认为还有几年要走。
  航空险定价,我聊了一个企业就是民航总局,他们要做大数据平台,每个航空飞机里面装一个黑盒子,每个飞机落地之后,把飞行过程中的参数和驾驶员习惯记录下来,到民航总局,建立一个Q2数据库。他们说找这个数据怎么应用出去?我说你们怎么想的?他们模仿了车联网,是不是能够支持航空险定价?我直接否定了,保险公司航空险定价里面成本因子是怎么决定的呢?最大的成本因子是销售渠道,这个航班出险不出险概率非常低,所以主要成本根本不是,因为Q2数据分析,让它觉得这个飞机容易出事故,还是不容易出事故,一个飞机飞1万年到飞7000年出险,对航空险20块钱没有影响。他们就不懂行业,既然车联网能这么做,飞机为什么不能这么做呢?其实不是一个概念,无论是产业大数据服务于金融,还是金融服务产业大数据,这种纽带非常重要。
  除了这个,还有业务模式,国家主力所谓双创和四众,你会发现很多金融机构愿意把自己的钱放在安全的口袋里面,投在国有企业,有政府背书的地方。即使国家提高银行给中小企业贷款,但是银行还是很谨慎。国家政府、银行的钱、资产公司的钱、基金的钱能不能支持这些企业的发展呢?不是不想做,是没有数据支撑。如果能够分析到这些所谓创新、创业企业到底是符合第四代工业革命的发展,还是自主可控的技术,还是什么,未来这个企业能够短期知道三到五年内跟踪整个盈利水平和现金流的变化。这些数据有吗?大量都没有。文思海辉大量做IT服务,中软国际等等国内很多,因为中国客户不好的行为就是付款周期很长,中软国际做了一款产品就是解放,通过云平台给这些企业提供整个项目的管理,如果这个项目管理能跟商业银行基于应收帐款的抵质押做衔接,这就是打通了这个关系。这里面真正什么东西是纽带,一定是数据,而不是点。
  三是反哺,当你学会这个行业的分析,那个行业的分析,你能够给银行找到更好的客户群,中行今年发布年报的时候,马上有了第一个反馈,中行开始出现利润副增长,四大行里面第一家,它也面临第一个挑战。银行关注的是业务创新、风险防控和区域协同,我们能够给他们以反哺。
  文思海辉随着政府大数据战略颁布,有一个小的定位,我们希望做整个中国大数据产业里面仍然坚守这个服务领域的供应商,有可能大家做产品,各种各样的创新业务,没关系,最终你的东西还是要通过服务转化为企业可被接受的东西,这是企业坚持做的事情。
  我们提出了311布局,沿着传统金融对泛金融领域、产业经济扩充,而且做区域政府大数据、企业大数据的支撑。针对这个大的布局我们做三件事情,一是大数据生态圈的打造,首先模式创新是基础,国家主导的PPP模式不是一种坏的机制,只是把政府一次性投入变成政府和企业联合,变成分期付款的模式,解决项目建设中融资的问题,从项目开发和数据运营,也是我们探索的一条路子。二是数据走到最后面,最重要还是分析型的人才,我们要构建自己的大数据人才学院,无论是跟政府合作,还是协会合作,这是我们自己的路。我们过去已经培养了400多名专业服务人员,解决自身供给的问题,我们想把在大数据领域课程体系发布出来,和外面更多的教育机构合作。我们培养的服务人员比较贴合实际,不是和传统教育理论相关。三是生态圈的打造,服务是黏合剂,所有厂商选择三家服务型企业一定有我们在,我们在金融领域的布局和位置给了我们这样一个先机。
  在座所有的企业无论是硬件生产,软件制造、工具开发,还是基于数据产品的流动,打造更好的合作关系,共同把这个生态圈建得更好,谢谢大家。
  京东商城大数据部大数据创新部总监星图:
  大数据开启智慧商圈
  首先非常感谢主办方能够提供这样一个机会,非常有幸能够在这里和业界朋友做一个分享。
  我刚才听了几位专家的讲解,我个人有一个观点,想先来谈谈。大家都在想一个问题,有了大数据能够做很多事情。我一直在台下想这个问题,大数据是怎么来的。是不是因为我们为用户带来了很多价值,因此我们获得了用户的数据或者其他领域的数据,我觉得数据的核心应该是为我们的用户带来价值,因为给用户带来价值,自然就可以获得数据。很多公司都在谈我们没有数据,我觉得我们需要去想一个问题,到底可以给用户带来怎样的价值,你就去获得数据。
  今天我分享的主题就是是京东商城刚刚上线的一个产品。京东大数据做了这么多年,今天依然希望以谦卑的心态和大家探讨,我们方法论和做的东西不一定是对的,但是我们愿意和业界的朋友一起看看这个领域是不是可以做更多的东西。
  今天我的主题是围绕O2O领域和线下零售谈的,分四块内容。
  首先我们看一下目前中国实体经济都在面临着非常大的挑战,我这里引入艾瑞的数据。截止到2013年传统线下百货销售额增幅连续两年低于社零增幅。艾瑞总结的观点里面,它认为很多线下企业没有或者无法有效整合商品的信息、库存信息、顾客消费偏好等精细化的数据,无法实现精准营销,可能是线下零售朋友们面临的一个挑战。同时线上零售,像阿里、京东电商飞速发展,进一步挤占线下百货的市场空间。
  我们内部一直希望京东大数据不仅能够为我们自己、伙伴带来价值,也希望能够为行业,通过我们一些开放的手段带来价值,因此我们在内部有一个京东智圈的产品,刚刚在近期发布。这个产品的域名是ZQ.JD.COM这个产品的愿景就是通过打通消费者线上、线下数据,为线下和线上商家提供大数据服务,打通O2O信息闭环,促进整个O2O快速发展。
  我们看一下内部对京东的分析,京东有几块业务,包括到家服务,自营供应商,POP商家平台模式,他们商家覆盖的数量都是非常有限的。这个有限是相比于线下3000万实体商家。即使是线下的商家,我们自己的商家在内部因为有京东大平台,他们数据之间有联系,其实可以发现线下几千万的商家线下数据是没有联系。京东智圈就希望能够将用户线上线下的数据打通,打造O2O生态闭环。
  首先京东始终认为,一个模式是否能够持续的发展,必须依赖于同时创造三种价值。一是为伙伴、用户带来价值,这里面就是对线下实体商家以及京东线上商家带来价值,我们会帮助有实体店的商家,进行线下运营的大数据决策支持。结合地理位置,让京东庞大的线上数据产生线下运营价值,并且整合线下数据支撑京东线上商家。同时输出京东在大数据挖掘方面积累技术,能够让线下商家快速进行自我变革以及模式转型。二是对行业,O2O行业一直都在充斥着补贴、资本的泡沫,京东希望通过大数据米两的注入,能够让行业更加理性的发展。三是对京东,我们希望这样的模式能够打造京东真正的技术影响力,帮助我们自身O2O业务更好的发展。
  京东智圈目前刚刚发布了PC版,未来我们会在大数据挖掘、数据可视化、互联网技术开放方面,来进行进一步的完善,最终能够通过PC版以及移动版服务于零售业态。
  11月19号京东智圈Alpha版上线,这个版本可以通过手机体验差一点,通过电脑好一点,12月10号京东智圈1.0版正式发布。
  智慧商圈和线下零售业态核心是三个方面,一是商业环境,一个线下的店周边商业环境的构成决定了这个店的竞争策略以及营销策略;二是商圈所在的行业特点,运营独特性,同时商圈人群兴趣、爱好、购买能力、信用,包括对促销是否敏感,是否关注用户的评价等等,这些同时会对线下零售商家指导运营产生根本的作用。
  我用一个很小的案例看看这样一种尝试或者探索,前面明略数据周总也说到创新,京东也希望通过创新激发大数据的力量。
  一个超市经理可能有三个困惑,一是准备在知春路在附近开个分店,不知道用户购买力怎么样,附近竞争状况如何。二是知春路店和苏州街店同时运营,但业绩差异很大,很想知道原因。三是不知道用户购物趋势发生怎样的变化,如何进行优化运营策略。
  京东智圈产品通过大数据的分析,这里面也是跟腾讯地图进行紧密合作。首先会有一个商业环境的分析,我们会发现可能知春路这个店附近超市行业竞争度适中,购物属于大型购物社区,住宅属于中型住宅区,是大概这样一个竞争环境。
  在这个商圈里面,用户里面的购买力指数、信用指数,通过量化的方式呈现给线下店主,包括这个区域的女性和男性用户的比例。
  同时我们用户画像实验模型会发现这个商圈周围更多是白领、一般职员比例比较高,学生和老师也比较高,23岁到46岁人群集中度达到了57%。
  这是一个超市经理开店,可以看看这些数据。
  他知春路和苏州街店业绩差异很大,想知道原因,通过京东智圈分析,苏州街店周围1里,白领比例一半,学生教师不到8%,但是知春路周围1公里,白领比例比较高,学生和教师比例是26%。相比于苏州街店,知春路的老板是不是更应该考虑学生和教师的需求。
  环境对比,苏州街店周围3公里,超市行业竞争度比较低,知春路周围3公里,超市行业竞争度。好在苏州路店是种型美食区、娱乐区,而知春路周围是大型美食区、娱乐区。京东智圈可以提供大数据支撑。
  我们不知道购物趋势发生怎样的变化,以及怎么做店铺实际运营。我们也做了探索,我们可以通过京东自身庞大的线上消费数据,观测出结合地理位置的这个商圈周围消费者消费习惯的变迁,这个商圈附近用户在第44周的时候,随着天气的转冷,羽绒服、棉服、毛呢大衣等品类销售占比逐渐上升,商家可以通过这些线上数据关注周围用户需求的变化,从而优化和改善运营。
  通过几个有趣的数字可以看看京东智圈能给线下零售的朋友带来哪些便利性。
  我们可以分析,大屯是人均消费能力最高的商圈,慈云寺是人均信用指数最高的商圈,定福庄是人均需求指数最高的商圈。东直门是白领占比最高的商圈。798艺术区是女性占比最高的商圈。超市行业竞争最激烈的商圈在北京站。母婴行业竞争最激烈的商圈是沙子口。促销敏感度最高商圈是灯市口。对商品评价他人评价关注度最高的商圈是中关村,可能互联网从业人比较多的地方都会比较关注这个东西。
  刚刚我们通过一组数据看到了这样一个产品能够帮到线下零售伙伴们的事情。同时我们商圈数据会进行到天、到周,包括月度更新,登录我们产品首页就可以看到以天、以周为周期得出的商圈动态列表。目前我们对北京市331个商圈都进行了深度分析。同时我们对每个商圈里面的用户购买需求指数、购买力指数、信用指数、商圈人群特征、商圈商业特征等,都进行了全面刻划。这个产品不仅在北京市实验,未来希望扩大地域范围,快速覆盖全国一线城市,后面也会逐步扩充到二三线城市。能够帮助商家全面了解基于地理位置的线下人群因为他们有了线上消费行为数据,了解到他们的购物趋势。
  京东自身有到家业务,我们的产品如果已经成为我们京东到家的商家,我们也会有专门的定制功能模块,目前这个模块是面向我们成为京东到家的商家开放的,它会提供基于经营状况、销售分析、门店分析三个基本的分析功能。
  接下来谈一下京东智圈技术创新,首先京东智圈既有京东庞大用户消费数据,又有腾讯地图独特的地理位置数据,所以它融汇了京东与腾讯自身技术特点和数据优势。同时经过调研我们发现线下很多零售朋友们并不是不想使用数据,包括利用大数据做智能决策,往往觉得技术门槛比较高,包括自己组建技术团队、获得数据非常困难。基于这一点,我们在数据可视化方面,包括数据建模、输出我们技术成果方面都做了非常大的用户体验优化,帮助商家快速上手这款产品,而且这款产品免费,帮助商家指导线下业务的运营。
  这是我们的产品,它目前基于我们需求热力指数、信用热力指数,购买力热力指数的演示图,我们网站上,大家可以体验一下。
  我们在理解线下零售的时候,发恢复发现所谓商圈概念是动态,基于一个中心,500米、1000米、2000米也是商圈,我们的产品可以支持自定义商圈,你以一个圆为中心,500米是半径,2000米也是半径,我们基于这个范围分析你的商业环境、用户习惯,以及这个商圈里面的品类特点,帮助你构建你自己线下自身的营销体系。
  同时京东智圈也在探索大数据的一些挖掘技术,我们积累的技术能力,怎么服务整个O2O行业。我们首先使用了文本挖掘技术,把京东评论的数据、走所的数据,以及用户咨询评价的数据都进行了整合。通过这些文本挖掘的分析,大大补充了线下传统行业,没有非结构化数据,只有自己销售量的数据的短板,把京东积累大数据的成果用于线下商家决策支撑。
  我们技术特色是基于深度学习,提炼出电商的知识,以及基于用户的观点,商品的评论,提取了观点提取模型,都可以很好的帮助线下企业们更好的利用大数据。同时因为我们到家业务当中,目前正在业界尝试众包配送,基于众保配送,我们内部也有这样一个信用建模体系,希望这个体系能向行业开放,帮助线下零售朋友一起通过信用的判别了解这个商圈用户支持信用卡刷卡等等商业可能性。
  我今天的分享就到这里,谢谢大家。
   (数据观记者)


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-4-30 20:21

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表