最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
开启左侧

亚洲大数据可视分析峰会现场直播(下午)

[复制链接]
发表于 2017-3-29 16:20:40 | 显示全部楼层 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
亚洲大数据可视分析峰会(下午)
时间:2017年3月29日
地点:天来大酒店
    主持人:尊敬各位的各位领导各位来宾,大家下午好!那么吃过午饭我们的论坛继续,目前大数据的发展已经获得政府投资人各级社会各界的广泛关注。今天下午的大会以大数据助力平安城市为主题,让大家更好的探讨大数据的落地路径。下面请允许我先为大家介绍今天下午的演讲嘉宾,他们是中国城市发展研究会理事,美国硅谷大数据协会副主席,海云数据高级合伙人高伟凯先生。中国刑事警察学院教研室主任刘硕,以及悉尼科技大学教授的梁婕女士,大家掌声欢迎。本次大会的承办方海云数据,多年来一直专注于大数据落地领域。下面首先就有请海云数据的高级合伙人高伟凯为大家介绍。
    高伟凯:感谢大会主办方,感谢主持人,各位先生女士们,原来想讲城市大数据,后来想智慧城市和平安城市、智慧政府实际上关键是政府如何利用大数据。如果没有政府把数据利用和推动,智慧城市这个概念是不存在的,这是一个。那么大数据的热门主要是有十年吧,大数据应该从2006年英国推出来叫数据全的一个运动,当时在伦敦开始。真正的推广应该是从2011年,韩国搞了一个首尔的数据广场运动,当时叫开放数据广场。后来在2012年的时候日本提出了以大数据为核心的IT国家战略,当年的美国也出了一个报告,叫大数据的研究和发展计划。同年联合国也出了一个数据脉动(音)的倡议,中国是从2016年大数据从政府全面推动,智慧城市还是界于城市之间的硬件和软件的需要,还谈不上对数据的整理和运用环节。
    去年国家发改委、公信部、科技部围绕大数据做了一些重大的课题,现在有一些成果正在推进中。另外一个就是谈到数据,实际上大数据自身的竞争,现在不是某一个城市的竞争,已经上升到国家战略层面的竞争,常规的这种国家的治理结构,从国家战略上来说,海陆空最后加上天,现在又加上数据。现在存在一个数据主权问题,我们在数据谈论过程中,会谈到数据的主权分三个层次,一个属于个人的主权,鉴于一个法律的界定。第二鉴于机构的数据权,存在着谁有权用数据,谁有权出让数据和谁有权公开数据?第三个就是国家的数据主权问题。国家数据主权的问题,包括现在对数据安全的保护,我们也经常接触到信息安全,包括数据平台自身的保障机制,未来国家战争和电网瘫痪,金融瘫痪,交融瘫痪,可能都是上升到国家安全的程度。应该说数据主权的问题,已经上升到军事、国防以及外交的层面。
    大数据作为一个战略,为什么是国家战略?它就和道路、空气、水一样,不能由某个城市,某一个企业,某一个社团,某一个个人解决,个人作为原点的支撑,是整个数据构成的基础。我个人认为,数据作为国家战略,基础数据必须由国家建设,这是我的一个理由。就像道路一样,如果国家不建,某一个人建,这人建的是断头路,如果长江的流域不靠国家治理,某一个省也很难治理,这还是一个国家性的战略。在数据国家战略成型过程中,我认为有几个方面,这是我昨天下午从北京来的时候发的几张照片,现在首先是要找到数据,知道数据在什么地方,如果不能明确找到数据,就建不了数据仓库,很多的数据组成才能汇成数据海洋,数据的仓库能不能建成?取决于数据平台。大家了解包括腾讯平台,阿里巴巴的平台,做的都非常好,更多的平台应该由国家来建设。国家的建设才能真正成为共享经济,才能成为一个有利于公共事业发展的一个渠道。包括前段时间打车说,他有数据上下班高峰,下雨天让你加钱,实际就是国家没有这种数据,未来应该是国家去建立公共的服务平台的数据。
    在数据处理的过程中,数据处理大家现在都认为是数据处理商很时髦很高尚的一个职业,但数据处理中存在三个问题。第一有多少数据可供你处理?它全不全?就是全不全部,有没有结合?第二个就是现在数据量很大,不仅仅是打电话、发微信的数据可以删掉,有系统的也可以删掉,但是在历史轨迹中,有的数据是不好删的。比如说我们要用于刑事侦查中如果大家都把数据删了,或者视频数据都删了,把两个月的都删了,如果两年以后要用这个数据就找不到了,处理过的数据是可以留下的,哪些数据可以真正最后作为垃圾清理掉?这是第二个不好确定,第三个就是数据既使经过处理了,质量到底如何?谁来验证?这个可能也是一个关键问题,另外一个就是到下一个层级,为了做得更好,就要进行数据分析。在所有的数据处理的过程中,真正分析出有用的数据,至少在某一个课题,某一件行业性的研究。数据的可视化也是现在海云做的,可视化主要是一个展现的问题,数据还是为了利用。数据并不是每个人都能去读懂,如果有冲击力的视觉,冲击力是一部分,而且科学的表达,给人目标感更强,判断性更强,这是一个问题。最终的数据还必须有产品,如果没有一个产品的数据是没法推广的。我们也可以搞很多模块化的产品,但是产品真正有没有竞争力,就取决于在座的能不能成功比尔盖茨、马化腾等等人物。
    在商业中也会有数据推广,烧钱的建立数据平台一样,数据主要还是一个推广问题,就跟广告一样,有一个市场推广,也有一个专业性推广,有些数据是针对专业人士,行业细分市场。在数据应用过程中,更多的会是引导社会积极正面的运用!有没有犯罪分子也在运用数据呢,也有,包括非法集资,上网的时候经常跳出来一个连接让你点击。另外数据最终在于评估,数据的评估在政府的层面,主要是绩效问题,对任何一个企业和产品,对它的评估它的数据真正有没有竞争力,就是它产品竞争力的问题。
    我演讲的题目“商业社会的大数据政府管理价值”。我主要是想讲一下这块,政府更需要大数据在平安城市的建设中。今天我们的演讲题目是平安城市,平安城市的建设中,政府要起的作用,对数据的运用和开放和共享。是建立智慧城市和平安城市的一个要点。更多的政府的数据还是见于这种公益性,数据对政府管理的重要性,主要是它要量化,现在政府有很多数据,我们做的数据属于社会、国家的,最后也是属于政府的。因为只有政府有权利,有能力,有渠道来收集所有的证据,有很多数据是不能量化的,不能量化的数据,就不能成为数据。不能量化的数据也无法带来管理的效益,所以在量化数据的过程中,数据的重要性首先要量化,量化的状态,为什么要提出它量化的状态,数据我们也知道多样、动态、海量等等的特点,包括结构化、非结构化,对它的量化首先是关键,这个需要行业人士。可能需要政府去引导投资建设。另外一个就是理解数据,大家对数据的理解是不一样的,因为政府认为有用的,可能对市民来说不一定全管用,对市民管用的,政府不一定是优先的。因为处于不同的需要,政府为了管理的需要。我们为了服务的需要,所以这块理解上面会有出入。
    另外一个技术控制,所有的量化数据的清晰、归集,包括对数据的理解,最重要有技术解决它,就是我们说的技术方案,没有一个好的技术方案,我们无法控制数据。无法控制数据,就不能进行后面认识事件和改造人事,首先要靠认识数据,有可能靠感官,有可能靠照片,有可能高以讹传讹,但是它不是事件本身。包括最近韩国的问题,山东有一个持警问题,你在网上看到的数据量很大,但这个事件的认识不是靠我们去网上看,背后会相信政府,相信媒体,也会相信自媒体网络,会有更多的元素,让我们判断这个事件。
    另外一个改变的方法,改变的方法存在两个层次,一个就是政府对数据的管理这种互动性的过程中,是会改变状态的,因为有数据,政府的管理会改变。因为政府有需求,它对数据的理解和使用方式也是改变。另外就是创新管理,大数据之所以能够使得世界带来变更,不仅仅涉及我们每个人,每个社会的每一部分,那么对智慧城市平安城市来讲,最主要是要让政府去改变它的管理方式。实际上大数据对政府和我们个人,提出来的挑战主要是大数据带来的这种不确定性。叫做社会本来就是动态发展的,企业的管理也会随着领导人,或者企业的制度改变而改变,而政府也会随着法律和社会结构的改变而改变。那么这块首先它的适应性会受到挑战和质疑,原来大家觉得政府共产党朝九晚五,处理日常的业务,现在他会受到质疑,包括现在的执法过程中,为什么有质疑,因为数据给大家带来的比较性和便捷性,对现有和原有行政体制管理方式会带来质疑。第二就是它的科学性会带来冲击,政府管理在大数据时代,科学性到底多大?就像山东的两个警察走了一样,这是一个小事,有多少个警察会离开这种场合,在法律的状态中是不是允许的?多少个法条对应?它会对执政的科学力造成冲击。另外一个就是会对他的有效性挑战,政府说你已经做得最好了,他举出了很多的例子,让你无法反驳,他认为你是做得还不够。在有效性上,会面临一个挑战。不仅仅是政府机构,也包括公务人员,另外一个就是我们会形成大数据的推动,会对政府使用大数据进行科学管理,他寻找中间的规律。这个规律也是变动的。变动的会是小数,你掌握了规律以后,规律有它自身的延续性。它主要寻找的规律的必然性。
    在大数据推动现代化政府治理过程中,一个是治理模式问题,为什么是治理模式的问题?原来的模式可能是一维的,或者是传统的,现在要寻找一些技术路径,从二维三维的角度去实现这种治理模式。还存在一个思维的问题,就是想变和不想变的问题,和认识到位不到位的问题,这也是一个从治理模式转变上,是一个问题。另外一个就是在治理能力上,因为治理能力的提升,是要通过现代的事件去解决。执政的理念智慧城市和平安城市的建设,是提升政府的治理能力,这个治理能力到底提升多少?他要在大数据的运用中进行实践的检验。另外一个管理革命,从刚才我讲的国家治理存在一个变革,政府的治理也会存在一个变革,这个变革自身服务模式的创新,比如说我们早期到政府去办事,可能到行政集中的大厅,现在可能到网上,这就是模式的创新。另外一个就是决策科学的工作方式是什么?大数据对政府能力的提提升,不能说政府用了就是科学决策了,一个智慧城市的城市规划,一个城市的交通的优化。它也可以通过大数据去征求民众的意见。民众它就会互动,这块就会是工作方式上也会走向改变。另外一个工作方式的改变,不仅仅是民众,园林规划部门搞一个规划,现在是要结合各个行业的规划来总体做。实际上每一个人做规划,每一个行业做规划,有自己的局限性。部门之间的工作和融合方式怎么解决,这也是面临的一个难题。现在讲数据惠民互联共享,这是分两个层次,一个互联共享是在什么状态?如果互联共享仅仅在政府部门状态,跟老百姓有多大关系?它有利于社会的进步,有利于政府效率的提升,但是对民众的互利没有得到最优化,所以数据惠民,最重要的是能给社会带来什么?公共利益得到了什么提升?数据必须开放,所以上面可能是共享数据,鉴于部门之间和许可,下面是开放数据,是我们人人都应该享受的。比如说我点击一下,你不能说交通数据,交管局可以跟交通局互相看,那不行,现在需要我们看,我现在要去某某酒店,这班的公交车几分钟能到,我现在需要解决这个问题。互联共享如何能实现数据惠民,这还有一个过程,这还需要很多的投入。另外一个大数据对政府管理最关键就是组织文化,面临跟会计一样,政府的岗位也会重新调整,组织文化也会改变。但是对政府领导的好处是什么?现在提倡要容错机制,是把领导和政府机构能达到免责和容错,因为它有数据做支撑,他不是拍脑袋。早期我们见过很多领导拍脑袋,都是有魄力的人,后来出事了就是顶雷的人。如果经过大数据对政府管理进行一个系统性的方案设计,达到政府自身的免责,也让组织给他有一个容错的机会。
    拍脑袋决策的就是早期在解放战争的时候,很多大的很胜利的战役中也有的拍脑袋,拍准了就准了,拍不准也是受伤很重。事前拍脑袋,中国的组织架构正在提倡集体负责制。大家讨论要集体决定,事中便于拍脑袋基本上是会派生,他认为没问题,还有办法解决,真正解决不了事后就跑了拍屁股走了。有的时候到退休年龄了,我退吧,有的没到退休年龄我提前退,现在恨一点,有的从直接省长到科长的都有,这个都是不用大数据,早期有一些战争也是拍脑袋,他是集中不同的信息。因为领导善于抓住信息全面判断这个形式,才能拍准,那个也叫科学决策,在当时的情况下,利用收集最多的数据,来支撑他的决策体系。还有一个就是现在数据共享和开放的问题,现在最大的问题就是信息孤岛如何打破,大家都认为信息孤岛是存在的,是致命的。是智慧城市推动是很难前进的一步,就应用上无法突破。包括国务院前两年也做了一个13个部委数据共享机制,总理办公会也讨论过,就是数据的可用性到什么程度?这块还是有待进一步推动。也有些地方政府已经做出有效的尝试,最早是浙江一个地级市,有用的数据基本上都是在有权的部门,所以有的还是调快的,地方管的干部基本上数据开放都能协调,垂直的还要跟上一级单位协调。所以就以市委市政府出了一个问,因为属地化的管理机制,党委是地方任命,行政领导是上面派,去年开始成立了好几个大数据管理局。包括沈阳、武汉、贵州、贵阳都成立大数据局。我们没法判断一个是数据提供是不是全面?不全面有两个方面的原因,一个就是自身数据,有的局的信息化程度低,他可能需要人工填报,他就不愿意做这个事情,另外还取决于部门的权限,这个权限可能有个人,可能有行业管理的规范。假如说你要做征信,中国的征信为什么做不起来,不仅仅靠银行,靠工商、税务、公安等等,有的可能公安说我不一定给你数据,税务说我是征税的,我不贷款,我也不提供数据。部门之间的信息孤立是一个状态。
    另外一个业务流程信息也会是孤立的,我刚才讲的征信的例子,无论什么业务,要集中更多的数据才能做出有意的判断。但是很难有那么多数据去做出判断,这样在业务流程与信息之间分离。另外就是数据的评估,评估这个数据是否能用?与实际应用也会脱节的,比如说你提供一个数据给另外一个部门用,举一个例子跟大家切身利益相关的比如医疗大数据,包括春雨医生在医疗平台上,有时候在判断,他能看出90%的片子上面的病因,但是这个数据在中国就没有医生会去采纳它,为什么呢?医生只有开处方才是合法的,机器开处方是不合法的,所以医生现在也很难,包括像医疗宝前段时间都关了,数据的评估和应用也有脱节的成分。
    另外就是数据质量问题,现在数据是有噪音的。噪音而且很多,而且中国预测房地产的专家都是外国人,因为中国很多经济数据,他看到的数据是假的。所以数据的真实性很关键,如果不合格的数据失真的数据,还不如没有数据,它比较可怕,你没有数据的时候你会凭经验做,有假数据的时候,比拍脑袋还可怕。数据的质量主要是两个方面,一个是真实性,第二是准确性,真实不代表准确。就跟电影院想去看评分一样,它不准确,有的是真票,准确性是有问题的。另外一个就是在政府管理中,数据的应用主要是靠价值,价值的体现有一个机制性的问题。如果要没有机制性,这种数据价值很难延续,它没有机制性做保证,另外一个就是技术性。就是这个技术性是要去挖掘出数据的价值。说海洋、石油的也多,你说钻石有什么用?你说黄金也没有用,因为它是什么样的洗选工艺洗出来的?既要考虑到开采工艺的选择,也要考虑到洗选工艺的选择,如果是钻石你还得考虑它打成多少面?欧洲的打的面好,就带到英国女王的皇冠上去了。多打一面增加5%,它的附加值就会出来。另外就是讲究有效性,在政府数据应用中,它主要是针对一个是提高政府管理效率,第二是提高民生质量。这个是它有效性的一个方面。如果没有这两点做支撑,光是一点,它只能得40分,所以有效性的评估很关键。
    数据价值有时候靠创新性,大家都炒一盘菜,为什么同样的菜有人卖80,冰淇淋有卖50,有卖10块的,这个就取决于创新性。我们海云也在做大数据可视化,做两亿的量可能挣一千万流水。也许现在做五千万的业务,能挣两千万,这叫附加值高。数据的价值是靠挖掘,创新性的使用中,新的方法会不断出现,只有世界的不断前进,包括上午说的人工智能,如果人工智能跟大数据结合那就改变世界。这个路很漫长,因为现在这种创新,首先取决于平台和系统的能力,其次才是应用开发能力。像我们这样的小公司,现在还是属于创新开发能力,还不能算是一个带有很大创新的平台性的公司。这块也是一个方面。这张图是一个图腾文化,历史很悠久,历史上也是有大数据,所以人家画了很多的羊,狩猎者,讲的是大数据的社会化和商业化。目前的大数据大家更多的看中是商业化,能有多少流量,卖多少钱,政府关心的是社会化。它要提升这个社会的进步,要提供便民服务,要解决社会整体文明的前进。所以在社会化中,它讲究的需要政府去承担的,政府是数据社会化的主要推动者。而公司是侧重商业化,挣了钱以后也可以像比尔盖茨一样做基金会,那是另外一种追求。在数据的两化中,政府管理更要做的是社会化的部分。如何决定狩猎人狩更多的羊,实际上是如何让提高提高效率,市民就有更好的这种幸福感和便捷化。
   
    大数据政府管理价值,一个就是公共利益。公共利益是政府首先要考虑的,政府不能考虑政府的利益。如果政府花很多钱,也是纳税人的钱,包括现在PPP也是下一代的钱。你建一个很大的数据平台,最后用于磨砺,那跟我们没有关系,所以政府利益和公共利益之间,数据的价值,政府必须去做公共利益的事情。不能做政府利益的事情,政府利益在实现公共利益的时候,它自动的实现。另外一个就是在政府利益下面,它会形成透明政府,因为数据是开放的,而不是仅仅是部委之间共享,所以它会是个透明政府,透明政府就有利于政府效率的提升,有利于舆论和民众的监督,也包括跨部门之间的沟通,科学联动的沟通,这是政府利益中考虑的两点。在公共利益的维护中,政府主要考虑第一是要兼顾,兼顾更多就是市民的利益,群体的利益社会利益,同时还要兼顾自己效率的提升。另外一个就是交互,数据不能是单项的,你说什么是什么,所以这是交互的,交互就是说,政府的数据开放是有利于民众积极参与到智慧城市、平安城市共同建设中去,包括现在已经在做了,有些提前公司,在国外很多年了,政府必须公告,所有案例,既使他盖一条房子,修一条也征求民众意见,还要集中答疑,要开辩论会,有一个交互的过程。这个可能是大数据政府管理价值的一个方面。
    另外就是说,一般讲到大数据的分析,刚才我们讲过的价值属性,在政府的价值属性中,它首先要服务,服务是它的第一个观点,如果没有服务,大数据没有意义了。第二个就是公平,通过大数据实现社会的公平,当然这个公平也有侧重点,因为政府的公平更多是照顾弱者,而不是照顾强者。强者是要多征税的,弱者是要扶贫的。政府要通过这个数据去判断,比如说我们研究这种交通拥堵,我们不是为了有车的人上高速可以跑得快一点。你还得要考虑住在老城区的人,他没有停车位,住在郊区的人买经济适用房的人如何解决交通问题,这就是大数据要解决的公平问题。另外一个就是效率问题,大数据可以解决它的效率,我觉得和平有几个方面,一个是提高办事的效率,就电子政务。大数据跟电子政务相结合,可以提供办事效率。大家以前去排队要排很长时间,天天去排,包括买房子过户,很早就要去排队,有时候还找别人代排,大数据需要解决的是效率问题。中间可能还有导号的人,拿着腐败的成本。价值属性四个方面,我认为是数据分析,在政府管理中需要考虑的。政府的管理价值也会有关联性的分析,比如说在警情监控上,公安中也有。通过关联分析,有利于我们提高破案效率,我们可以判断哪些相关联的人,从事一些类似的活动,这可能有违法的也有违规的,也有可以作为客户画像的。数据的属性中还一个,不能盲从看着网络上的数据,因为政府在数据分析中,容易陷入“打土豪、分田地”这种事情很多,包括前几年河南的事件新闻一炒判得就严,事后大家理性考虑,不一定是那样,或者没有到那个程度。政府的数据和技术架构中造成去除,可能是一个学问,尤其在政府决策过程中。
    算法是它的依据,所有的数据分析,都是靠算法。做算法的人很多,真正有算法的人很少。大家多人认为自己有算法,可能本科生、教授都在算,不代表教授比本科生算的就好。这是一门学问,不是每个人都可以做,或者是有点水平的人能做,这可能是一个方面。
    大家都说技术革命是一波又一波,互联网革命之后,可能就大数据和人工智能化、物联网的这种革命。这种革命现在已经开始,未来真正能取得翻天覆地的革命,还是取决于最终大数据能不能成型,最终大数据能不能成型,取决于互联网能不能成型,物联网能不能成型,我们现在4G了,马上要5G了。中国最有希望在下一轮革命中领先世界。现在讲政府管理的这些理解,大家都能理解,但真正解决问题的是思维方式,大数据改变的是思维方式。第一领导改不改,领导跟不上就没法推动,第二所有的员工改不改,每一个个体,你不仅要用大数据思维,还要用大数据的思维去工作,还要用大数据的思维去处理实物。都可以通过大数据解决,在解决过程中,当前可能会有三个问题,还是法律的问题规矩的问题。大数据现在没有形成一个国家层面的立法层面的规则。可能是下一步从国家层面需要做的。另外一个就是监管层面的问题。大数据很多部门都在监管不同的数据,大家对数据的理解不一样,管理方式不一样,现有的基础不一样,就会导致监管的方式也会不同,第三是平衡层面,大数据监管方式,包括制度的建设,需要一个平衡。既要平衡数据的拥有方,也要平衡数据的使用方。不仅仅本国使用,地区使用,你的指数有没有影响到周边的省,也影响周边的国家。可能还有一个平衡问题,这可能是下一步大数据中立法层面的。
    另一个就是大数据在整个储存上面,因为海云也要建数据银行,大家都在建数据仓库,真正数据的储存也是一个问题。虽然压缩式的储存也有一些算法的革命,平安城市中国建了这么多探头,照的图象视频,这个量也很大,是不是也要灾备。而且要异地,但是异地到什么程度?比如四川可以到甘肃,宁夏的可以到成都,但是永川到万州还是到哪里?如果为重庆市的大数据在其他地方选两个为中心,而不是选在重庆,对重庆的数据保存度是最安全的。现在讲数据基础,主要是平台的建设问题,因为平台建设,原来都是大家不同的单位,在不同的时期投入不同的资金,首先买硬件,其次买软件,最后买硬件,最后自己系统内可能都对不上。我曾经去过一个省的国税系统,他告诉我有39个系统,光省局还不包括下面,各个市局。实际上就是说,数据的归集虽然讲了,但是真正弄到高效率的归一是有难度的,但是这个建设还需要大力的资金。现在还有很多数据平台建设不太好的,前期欠了很多投资,他就加大投资,加大投资是政府出钱还是PPP?PPP如果是一个开放性的数据,没有商业的价值,那么政府购买服务,政府有多少的财政能支撑多少智慧城市的投入?这可能也是一个问题。
主要是想讲什么呢?大数据在政府管理中很重要,但是大数据对智慧城市的推动作用,也取决于跟行业的应用相结合。现在搞数据的公司,基本上有一部分搞业务的人,跟业务接触多深,就垂直度多大多深,这是很关键。我们海云现在也就做3—4个行业还行,公安、军事也做一些,现在智慧城市也在做一些,我们更多的还是民航这些做得更多一点。平安城市我们也做一些,也不是量巨大,跟行业知识的结合,跟政府部门的结合上,需要大家共同去组建一个团队,进行前期不仅仅是调研包括方案的设计。光靠自己画图是盖不起房子的,你得给业主说,业主想在这里盖后花园,还是在后面盖后花园,因为你不光是画图,你光是画得好看没用,大数据一样,大数据公司更多是需要跟行业知识的结合,我的演讲时间差不多了,非常感谢大家。
   主持人:感谢高总的精彩演讲,真的是深入浅出,从各种纬度给我们讲解了大数据很多信息和知识。下面有请中国刑事警察学院情报系研究室主任刘硕为我们带来精彩的演讲,有请刘老师。
   
    刘硕:非常荣幸接受海云的邀请来参加这次盛会,也是一个我学习的机会。冯总给我一个命题作文,可视化技术在公安行业的应用前景。说老实话,我对可视化是门外汉,这两天我快速补课,学习能力还行,天天看,我就把我的学习笔记跟大家分享一下,也是我的体会。
    但是在讲之前,由于情报不准,一开始我以为是跟公安同行交流,但是在座好象多数都不是我们行业,所以刚才就改课件,有些不便交流的就删减了一些,不当之处请大家批评。
    首先介绍一下我是什么来头,可能同志们都听说过刑事学院,我到这个单位之前也没有听说过,但是在公安领域其是小也名气的,是公安部第一所本科院校,一般是有警察的地方都有情报学院。我们80年代开设了全国第一门情报课,编了全国第一本情报教材,2018年招收了首届情报方向本科生,到2009年成立了情报局系,下设三个专业,一个研究生点。同时我这块还和香港警务处合作成立了十情报研究培训中心,这些年给全国培养了2000多位情报人员。
    我看在座好多都是学生,所以我简单介绍一下,不然可能后面交流上会有一些不对称。在情报上我们使用的一些概念跟数据行业很相近的概念。大家经常看到行为、数据、信息、知识和情报,这些也是我们经常用的一些概念,这里简单看一下。数据就是事实的编码化,通过测量方式得到一些结果,比如这个屏幕是一个16:9的,是什么颜色的,这就是数据。信息表达的是完整的意思,比如说这是一张屏幕,或者我拿的是一只话筒。知识是系统化的信息,比如看到课本上的东西都是系统化的信息。我们人生经验当中包括警察职业生涯当中取得的一些经验也是感性信息。如果信息遇到了一定的环境,产生了对警务人员起到辅助决策的作用,这就是情报,就是知识被激活,原来知识是静态的。   
    我们看PPT上面有四条,大家觉得哪个是情报呢?实际上这是警察采用的数据。第一个是“阳光酒店2060房间,君悦酒店1318房间,20岁的郭小美。这些是数据。第二个是什么时间什么酒店,谁在某酒店有开房记录。这是信息,表达的完整的意思。第三个是某情报分析师通过分析,得出了郭小美可能是一个失足妇女的结论。这就是一条情报。第四个,用一个算法,“频繁和不同年龄段开房的女性有可能是卖淫女”,这就是数据的算法。
    我们说大数据时代来临了,我们在用数据。实际上警察的对手也在使用数据,我们是用数据用情报,他们是反数据、反情报,我们对手的能力是越来越提升。我记得我在2006年参加过一个美国的情报培训,当时教官叫约翰,他在课程就讲美国的情报。课间我问他一个问题,你们美国这么厉害,为什么没有抓住本拉登呢?但是在2010年的时候,美国情报组织找到了拉登,然后就把他消灭了。但是在2006年的时候还没有找到拉登,教官听到这个问题就苦笑了一下,这么跟我解释,情报不外乎两条线,一条线是技术情报,一条线是人力情报。技术情报就是我们常说的大数据,比如说互联网信息、高空视频的侦拍。拉登在这个领域是反情报的高手,从来不上互联网,也从来不用手机,交通基本靠走,通讯基本靠吼。其实我们警察最不愿意遇到这种人,因为他的行为和事实很难产生关联,这为我们下一步的分析造成很大的难度。在人力情报,比如说外线跟踪,还有像我们看电影的一些线人的手段,但是拉登在这方面也是反情报的高手。
    一、警务工作中使用情报的可视化历史
    警务工作中使用情报的可视化历史是远远流程的,最早是使用萌芽图钉红旗在地图上标注,其实也是一种可视化的手段。有个著名的公司叫安那卡帕,开发了一套著名的情报分析课程,其实就是很多可视化手段在分析当中应用。这些课程大概需要两周左右的时间,现在我们刑警学院在培训学生的时候还在沿用这套课程,包括世界各地警务人员做情报分析的时候都用手绘的方式,当然现在有很多信息技术手段。近些年来,可视化对情报分析提高了很大的推动力,以及产生了一些情报分析的软件,像有I2  coplink  visuallink  rigel  predator  crimestat  dragnet。未来可视化分析工具都是跟人工智能、VR这些技术相结合,我们也很期待这个时代的到来。
    在做可视化的时候我们最主要的还是思维。我们在这PPT上做了一些可视化的分析。关系分析是分析团伙用的,这个图实际是画得有问题,版面配置上缺乏重心,没有关系的人还放在了一起,比如这是两伙,这种放在一个版面上在分析的时候是不会出现的。连线也有交叉,但是我们做分析的时候连线尽量避免交叉,同时颜色、图例也会影响对案情的分析。在警察的案情分析当中尽量强调简洁度,不是越复杂越好。
    二、可视化对公安工作的价值
    我想可视化对公安工作至少有三个方面价值。
    第一,发现关系。关系分析是情报分析当中最重要模式,包括人和人的、人和车的、人和物的、人和组织的、人和房间的各种类型关系,还包括真实的关系、虚拟的关系、因果关系、相关关系等。在关系分析当中我们发现团伙的存在以及关系的性质。这张图是美国情报部门对拉登911事件做的可视化分析,这里面有一个重要的分析点,刚才我们讲了,说拉登是一个反情报高手,要找到他很难。但是情报人员发现一个问题,拉登虽然很难找到,但是他的信息仍然能够在世界各地传播。于是情报人员就得出一个假设性结论,既然他的信息能够传播出去,应该有那么一个环节为他传递信息,这个关系我们是一开始看不到的,但是我们把它虚拟出来这样一个关系。这个环节可能是一个人,也可能是一个组织,最后我们去围绕虚拟的关系把这个人重建出来。在美国有个监狱叫塔那摩,在那里关押的都是一些恐怖分子,美国情报部门对他们采取了很严厉的审讯手段,大家看网上新闻就知道它里面有水刑,其中有一个基地组织3号任务叫做末罕默德,他是一个疯狂的原教型主义者,挺住了183次水型,到第184次的时候挺不住了,就说出了一个人名。后来基地组织又一个3号任务,叫利比,也被关进了监狱,美国情报部门对他进行了审讯,他也说出了一个人名,科威特。说这个人是跟拉登关系非常亲密,但是很多人没有见过他。这个人身份出来以后,对他所有关系进行布控,布控长达五年,这里面包括电话识别、电话侦控、视频侦控。最后监控发现一个电话从英国打出去,最后地勤马上就到接电话的对手,真就发现了接电话的人,这个城市是巴基斯坦第二大城市,这样进去找到了拉登的住址,这里面用了很多关系分析手段,还有图表技术。现在很多公司在争,不敢是哪个公司做的,可视化的手段都是非常有用的。
    包括天安门1028的金水桥事件,实际也是通过关系分析来发现真实身份的,公安部动作非常快,出事之后20分钟之内就研判出了嫌疑人的所有关系。在警察实践当中,这种关系发现挖掘是我们在可视化中最主要的工具,看一个工具好不好,它的关系展现实际是最基础的要求。如果关系库或者是图表展现中没有挖掘到相关关系,比如展现的是四层的或者五层的关系,实际最好的关系可以展到无限层,当然取决于服务器速度,现在服务器速度也不是问题,基本上展现得越多越好。但是这个能力已经不是可视化工具本身的问题,就是我们数据库资源的问题。
    第二,发现规律。也就是发现犯罪的模式。我们看到网上或者新闻上有人做出中国犯罪之乡,对警察来说这是高危人员分析,这不是传说,是大量存在的,但是不便于在公开场合说,但是警察在研判的时候是在用这些成果,对警察来说有非常重要的意义。
    在美国把模式分析分成七类。实际上中国警方没有把它总结成相关的有多少种模式,我们在各地警方都用不同的模式来总结规律。但是我认为是应该像美国学习一下,编制一个统一犯罪手册,美国每年通过统一犯罪报告UCR,几百页。最近中国警方也在做这个事,我们和公安部刑侦局合作,对全国刑侦的犯罪数据做深入挖掘。公安部五局在做,二十三局也在做,二十三局做从人到案件的挖掘,五局做从人到案件的挖掘,用的手段不一样,但是思维是一致的。
    这里给大家举一个例子说明怎么发现模式。这是苏州市公安局做的数据挖掘的例子。发现模式最主要是在于多发性侵财案件,现在命案基本95%有的地方100%破获。对公安困扰是多发性侵财案件,自己体会丢了钱包或者发生一些更严重的犯罪,你会希望警察去破案吗?我自己都不寄予希望,因为没有那么多警力,警察就会把这些案件串联起来,这样提高效率,这对数据分析挖掘对会有很重要的作用。苏州市公安局对数据库侵财类犯罪嫌疑人做了数据挖掘。但是侵财占到整个犯罪案件80%甚至更高,对这类犯罪案分析有非常重要的价值。分析是用的旅店业的住宿信息,要研究违法犯罪人员住宿活动的规律,就是说坏人的生活习惯是怎么样的。最后得出一个结论,如果大家学过统计学,统计学老师会告诉你,图表更为简洁。你不要用三维的,其实有两维的图够说明问题就可以了,三维的除非你能透视出更多东西。这里面是很简单的折线图,按照24小时时间分布规律来看,住宿高峰是晚上十点钟,住宿的谷值是早上6点。这个对我们警察来讲价值不大,好人、坏人住宿习惯都差不多,也没有什么太多的价值。就是把违法犯罪嫌疑人的住宿轨迹做了一个分析,早上6点是谷值,晚上10点是峰值。把所有旅客入住宾馆时间做了一个24小时分时段分析,发现好人住宿的时间峰值是晚上9点钟,早上6点钟是谷值,这就看出好人和坏人住宿时间规律没有显著差异,坏人比好人晚上晚开房一个小时,其实这也没有什么价值。那我们怎么发现价值?就是可视化手段,其实这里面核心还是算法,就是在一个时间段内,用坏人住宿的数量占好人住宿数量的比值作为指标在24小时时间段做一个分析。24小时之内坏人、好人住宿的比例这个图就不一样了,凌晨3点钟,坏人住宿的比例是最高的,也就是凌晨1点到凌晨6点是高峰时段,凌晨3点是最高的峰值,这个数据就有用了。还有7点钟是一个峰值,这个跟犯罪行为规律相吻合了。坏人一般午夜作案就两三点回去,后半夜作案的就7点开房,这是入室盗窃案的住宿规律,这对警察巡防和侦破来说就非常有用。再做了一个分析,就是入住时间年龄段,结果发现是19到23岁的喜欢在这个时间段开房。同时发现犯罪前科人员住宿的宾馆都是大部分以中低档宾馆为主。对原籍进行分析,发现安徽籍、贵州籍的人最多。这时候就总结出规律模式,一是1点到7点是违法犯罪嫌疑人入住高峰时段。二是19到23岁有盗窃前科犯罪嫌疑人的年龄阶段,三是开房一般以中低档旅馆为主,四是安徽籍、贵州汇占多数。这时候警察就会关注这个时间段来开房的人,都是年轻的开中低档旅馆的安徽和贵州籍的,就为我们巡防勤务提供了很好的数据参考价值。
    第三,发现异常。一个身份证同时在辽宁沈阳和广州都有开房信息,这个就是一个异常数据,一个人能同时在两个地方开房是做不到的,这就是可视化数据给我们提供预警。我们在做调研的时候,可视化平台一定要具有实时预警功能,马上发现异常马上得有报警,这是对可视化平台的基本要求。美国有一个实时犯罪监测中心,也是可视化的平台。再比如,一个人能够跟一家的奶奶、母亲三代同时有开房记录,实际上就是逃犯本人,利用一家三代的身份证去开房。
    北京警方公交卡大数据抓小偷,把智能一卡通的数据做了分析,首先也是梳理规律,从规律当中看问题。梳理出来四种规律,一种是正常人出行模式,第二种是旅游的人,第三种就是购物者,还有一种人跟这三都不一样,他去的地方就是哪儿人多就去哪儿,比如地铁换乘站。正常人的路径,比如说A点到B点,一般我们先经过A再到B,但是不正常的路径是从A出来到C,然后再到D再到B,如果这个人常年出现,那他可能就是扒手,当然也可能是流浪乞讨的,但是这需要我们进一步的甄别。据说效果还不错,实际上公交的数据有非常大的分析价值,可以给警方建立非常多的模型,比如说地铁扒窃往往都是团伙作案,什么样的人同时进、同时出,现在盗窃一般都是团伙作案。
    这是我们国家刑事案件破案图,横坐标是年份,纵坐标是发案数。纵坐标每个刻度是50万起,最高是500万。大家只看蓝柱就可以,是每年的发案数。看这张图可以明显看出,在2000年的时候,刑事案件出现一个异常峰值,为什么在2000年突然刑事案件上升呢?这里面有很多背景,最主要的是公安在那年搞了一个专项行动,但是要把它分析出来,作为公安部门要向中央政法委报告打击犯罪成果,写这个报告那年我正好在公安部借调,当时要写报告,就是为什么搞专项行动犯罪率不降反升。
    在经济生活中,我们国家2014年GDP是7.4%,2013年是7.66%,这个我们看不出大的问题,但是这两年的用电数量相差一半,这说明GDP有可能是造假的。因为长期观测的话,用电量、银行贷款放款数量和GDP增长是正相关的。如果GDP往上走,但是这种参照指标却突然下降,就说明GDP有可能是假的。
    两室一厅的出租屋登记一百多人,就说明在信息更新采集没有到位,说明换人了但是没有更新数据。再比如说一年有50次以上的驾驶员扣分,人死了还能扣分,这说明什么呀?说明交通处理有内线,这为我们公安督察工作提供了基础。实际上公安大数据项目非常多,但是真正成功的也没有几项,其中用来督察的算一项。
    三、公安情报业务可视化的理论基础
    最重要就是犯罪分析理论和可视化理论,这里我们就简略的过一下。日常活动、理性选择、破窗理论、犯罪地理等这样的理论。作为同学们,我建议大家看一看环境犯罪方面的书,这对于我们建设平安城市非常有价值,对空间分析也是非常有用的。
    四、公安业务对信息可视化的需求分析
    这里面有几项希望,一是能够通过可视化平台迅速的把关键信息传递给决策人员。二是平台尽量的集成不同类型的数据资源,现在可视化平台上下都有,最重要观测点就是集成了什么样的数据资源;三是能够实现总体统计功能,帮助决策者集中精力分清主次,因为领导有时候精力也不一定永远关注在业务上,有的时候他可能是公安外行,这时候可能领导在领导班子当中排名靠前,比如说有的人当某地方厅长,然后提出一个口号,春节到了,打倒强盗保平安,让全省的民警行动起来,这是领导提出的要求和希望,各业务处拿意见,情报处就拿出一个报告,发现春节期间案件其实是少的,违法犯罪人员有钱没钱也要回家过年,这时候我们警力的集中和工作对象其实是不匹配,就浪费警力,情报处就根据这个分析给领导提出建议,鉴于春节期间案件较少,我们建议春节期间不搞专项行动,我们要搞另一个工作,比如说培训、维稳,领导觉得有道理,就采纳了情报人员的意见。四是要求界面友好,跨平台动态研究功能也要有,越好的可视化平台就越简单易学,减少警务人员的学习成本,谁有工夫去学那么多的工具呢,我们说ITO实际上是世界上最情报分析工具,但是为什么推广效果不好,就是因为它非常专业,一个好的ITO分析师,第一要求有非常深厚的警务经验,再有要有非常多的时间去使用它,所以普通人很难把它运用得很好,好的可视化工具应该是傻瓜式的,有些算法可以集成在里面。
    五、五局联查平台分析项目
    前几年,我们公安部刑侦局把全国刑侦的数据做了一个项目,做一个深度挖掘,他们领导为此到我们刑警学院去,跟我们聊了一次,怎么做不知道,领导意识很好,说我们数据肯定是一个宝贝,有东西可以抓,但是怎么弄不知道,就请老师给弄一弄。数据绝对是海量的,但是数据比较单一,工具也比较欠缺,当时也没有什么好的工具,就是用常规的数据挖掘工具,。公安部要求把这个数据拿出来之后对全国的案件做分类,结合人工分析研判,最后要得出公安五局关注刑事案的归类特点,局领导关注的作案人员的黑名单,尤其是重大节点的时候,这些要上布控。没有形成两类报告,战略情报产品和战术情报产品。
    我们做的预测,红色的是实际发生,蓝色是预测的,初步看还不错,至少从数据看基本吻合。但是也有不吻合的地方,预测的时候刑事犯罪是在下降,实际发案是高发。有的时候预测应该是上升,但是实际下降很多,因为那时候都有重大事件。比如那年是奥运会,那期间刑事案件全国都普遍下降,这种值用数据是没法预测的。我们也反思了一下为什么还是有很大不准确的地方?就是因为我们数据不多,当时我们用了四年的数据预测第五年的,从时序分析角度来讲,如果有十年的数据积累,预测率是准确的,但是我们找到数据只有四年,再往前数据都不能看,随着公安信息化推进,我们数据会越来越多,我们预测也就会越来越准。
    我们做了全国所有省份车盗保险柜案件,竖项是12个月,每个月刑事案件发案的标准分,标准分指标就是为了方便公安部对全国各个不同省份之间的犯罪进行评估,大家知道,不同省份、不同区域发案数没有办法横向比较,比如重庆,刑事案件上升10%,和拉萨上升10%,这两者是一样吗?肯定不一样,我们上升10%可能日子没法过了,但是拉萨可能全市才10万人,上升10%也没有什么影响,所以这肯定没办法比,我们就换了一个指标,可以进行横向比较。这两天我也委托海云数据做了一下可视化,做得很漂亮,但是今天发邮件的时候我电脑没有打开可视化现场效果,很抱歉,将来有时间有机会我们可以把可视化的信息给大家看一看,实际做得还是非常好的。
    各种省份的人不同的手段做了一下聚类,贵州人作案手段很独特,其他我们分了几个区域,这跟我们正常经验是有关系的。
    六、国内可视化技术及产品存在的问题
    这些是我个人的理解,不一定对。
    第一,观念层面,对可视化的意义认识不足。很多的专业人员、领导认为可视化不是分析,在我们平台当中不重要。去年3月份我参加了公安部二十二局开的全国反恐会,领导最后总结的时候,有一个专家讲了可视化,有启发的,领导说原来认为可视化不是分析,看来可视化还是有用,可见我们理念还没有达到这种层次。再有过渡以来。这里面关键取决于数据资源。
    第二,应用层面,距离实际基层应用比较遥远。我们经常去看的一些都是市局、省厅,看到可视化的平台都觉得好漂亮,但是实际上民警他们都不知道,更谈不上用,只有给领导汇报的时候说这个很好。我为什么这样说?前两年,我们学校在沈阳,有大队长找到我们说帮他们做一个分析,就是学校组织的电话话站服务机,一百多个人,打电话打了一年,话单是很多的,这个大队长我觉得是很敬业的,他用手工来可视化,我不知道是圆规还是怎么画的,特别圆,直尺连线,画了很厚一本,说实在画不动了,你们弄可视化弄一弄,结果我们弄了四个小时,展现非常清楚,并且没有错,手工记录毕竟还有一些小错,所以他们感到很有用,这就看出我们基层根本不知道ITO是干什么用的。再比如我们去新疆调研,新疆在反恐第一线,国家投入的信息化资源在其他省份是很难比的,建了很多的云系统。但是在我们调研的时候,基层民警跟我们讲的时候,全是手工去做,国家花那么多钱建那么多工具,他们在一线打仗流血牺牲的民警根本有不上,可见可视化的平台跟我们想象的完全不一样,任重而道远。
    第三,理论层面,犯罪分析与犯罪信息可视化存在理论和实际脱节现象。我们现在做可视化这块,交流一下然后做一个模型,实际没有深厚理论基础做支撑,没有犯罪学、犯罪心理学的基础,就很难开发出专业算法,我们看到国外好的分析软件都有很多理论研究,然后在理论研究基础上开发相关可视化工具,这是目前我们所欠缺的。
    第四,产品层面,信息可视化表达研究比较少,远远不能适应针对多源、异构、非结构化犯罪数据的分析需求,特别是缺少用于犯罪相关复杂社会经济因素的高维数据分析的可视化形式。谈到可视化分析我们往往画一个地图就行了,完全达不到业务要求,很多多维数据展现不出来。
    第五,技术层面开发的数量没有海量犯罪数据验证,很难完善最优的算法,保证实战应用。海云跟我们学院合作对一些数据做分析,但是我给海云建议,最后还要去验证,在实战中去验证,实验室里是做不出好模型的。
    七、公安情报领域可视化发展趋势
    第一,情报产品可视化工具会越来越易用,并且能够实时接入数据,多平台展现。当然,这种在很多地方已经实现了,像广东、江浙一带等,民警通过移动端可以看到好多可视化产品,当然这是有区别的,包括我跟我们领导建议,学校的校勤可以做大数据分析,可以给领导手机配一个可以实时推送的分析结果。
    第二,可视化技术助力信息采集,可以提高信息采集的效率。当前信息采集的时候经常面临许多问题,采集的时候临时性任务,比如说派出所经常收集一些自己要采集的信息,但是采完之后束之高阁,以后就用不上了,采的时候又不能实时纳入系统,因为系统结构不支持他采集的数据,这是采集给我们带来的挑战。这里面我们有个设想,举个例子,对带回派出所的人我们要对他采集随身身份证信息、信用卡、手机相关信息,有的信息库里面没有,我们就可以建一个可视化信息采集的平台,然后我们可以在采集的时候建模,考虑用的时候怎么做。比如我们可以在采集的时候建一个模型,比如说需要采信用卡、电话、名片、随身物品,看到一个新的东西,现实生活当中没有的,那就加一个数据项,这个采集的数据就有用了,便于提高信息的采集效率。
    第三,可视化技术会与犯罪分析理论逐步融合。我想再要提升一定需要理论的支持,其实可视化本身理论需要提升,但是在跟业务结合的时候,业务本身理论也非常重要的。因为公安机关有时候自己的培训工作也不讲理论,公安最讲实际的,但是真正搞公安工作经验久的就知道,没有理论支撑实践是搞不好的。
    第四,可视化技术与犯罪预测技术逐渐融合。犯罪预测也是大数据的本质,国外对犯罪预测研究目前已经走在了前沿,比如说他们提到预测的类型包括四种,一种是对案件的预测,第二种是对嫌疑人的风险度预测,就是重新犯罪的预测,我们内部话叫重点人员动态管控,或者重点人口的管理。第三种是预测犯罪嫌疑人,就是我们找到这个案子是谁干的。第四种就是对被害人的预测,看谁有可能成为犯罪被害人,人一生当中有三次成为被害人的机会的,所以大家还是要小心。我们警方实际就是研究这些规律,把这些信息支持的产品精确投送到潜在被害人手里。当然,我们现在警察用的老办法,比如说前段时间东莞市局在春节后做一个工作,春节之后企业的人包括会计都回来了,警察就进企业,挨家挨户讲电信诈骗这种犯罪预防的教育。实际我们结合信息化手段,会更加提高效率,因为除了企业之外还有很多老百姓。
    第五,可视化将深刻影响情报理念,可视化分析和决策实战一体化。
    第六,对公安工作的专业队伍建设和情报人才培养模式也会产生重大的影响。去年公安部给我们刑警学院签定协议,委托我们做一个工作,就是情报分析师职业资格标准,我们的规划是三年做完,这不是一个课题,但是是以课题的形式,是公安部的一项工作。实际对于公安情报工作来说有两点是非常重要的,一个是情报信息,一个就是人才。而对人这块,实际上将来的设想,通过与海云接触,包括对信息化、可视化的理解,我们会对专业人员在可视化能力方面做一些明确要求,就是说在可视化能力方面如果没有一定的职业水准,就不能进入这个行业,这是我对可视化可能会做出的一点贡献,正式纳入职业资格标准,包括情报人才培养的课程规划也会有所推动。昨天看一个新闻,全国35个学校批了大数据专业。
    最后给大家放一个小片子,好的分析产品是更容易接受的,其中一个重要途径就是可视化,以上的内容跟大家交流,我今天汇报就到这里,谢谢大家。
    圆桌讨论环节
   
    主持人:非常感谢刘主任,下面进入到今天下午最后的圆桌论坛环节,首先有请圆桌论坛嘉宾台,我们掌声有请:
    海云数据高级合伙人  高伟凯先生
    刑事警察学院情报系主任  刘硕老师
    有请中关村大数据联盟常务副秘书长  张涛先生
    各位的背景大家也都比较了解了,我们下面直接进入圆桌论坛环节。首先我想问一下高总,刚才我们了解到,可视分析在警务工作中有很多可以结合的地方,您作为可视分析的从业者,您觉得它和传统的警务可视化方式相比最大的异同在哪里?对于警务工作来说,您觉得海云数据所做的可视分析能起到多大作用呢?
    高伟凯:现有的和传统的区别我觉得有几个方面,简单的说,第一,现代的可视化分析系统视觉效果更有冲击力,不然为什么叫可视化呢,原来可视化可能是简单的柱状图、波浪线,现在可能既有图也有数字。第二,可能融合性更强,原来可视化是基于一张图做简单示例,现在的融合性可能更多跟地图结合、数据抓取的结合,而且是实时的。第三,现在可视化应用很多新的平台、软件包括开发的应用,它计算可能更科学,这样使得它的速度就会更快,对现有决策工作就会更好起到实时决策的作用。第四,为什么现代的大数据可视化应用市场会更广泛,是因为现在数据海量、动态而且异构数据比较多,用原有的可视化技术和方法很难解决现在的问题,所以通过现有的可视展现、可视分析,可能起到效果更好。
    主持人:谢谢高总,也就是说其实现在包括可视分析在内公安已经在逐渐的去使用很多高科技的手段,能够让我们整个城市更安全,让民众生活更安全。我接下来想问一下刘主任,科技强警可能是警务工作者的不懈追求,目前咱们国家在警务建设上尤其是信息化建设上主要面对的挑战是什么呢?以及大数据现在是否已经满足了当前的需求,和先进国家相比,我们的大数据建设尤其是在警务方面还有相关产品的使用上是不是有一些差异?怎么样能够达到发达国家的先进水平呢?
    刘硕:还是说明一下,我回答不专业,在我们学校老师的专业领域特别狭窄,刑事技术,就研究枪弹,就研究足迹的,提这么大一个题目,只能坐井观天,谈一下我个人的看法。最大挑战有这么几个方面,根据我自己的一些实际的感受。一个就是数据思维,整合我们天天在说,但是真正能做到很少见。包括我举个例子沈阳做的一个数据平台,大家知道尤其整合社会资源这块非常难,怎么办?有这么几种途径,第一种就是通过行政的途径,第二通过私人的途径,行政途径怎么做?副书记牵头,各位业务局都参加,把数据集成在平台上。市委副书记要给面子,我们把平台数据导过去,市委副书记他是一个流动的活,他做两年之后,就到别的地方高升了,换领导了,这个领导不提了以后,数据资源整合有很困难,但是不实时更新的话,它就是死数据库,所以后来就不用那个平台了。再有私人关系,建很多群,包括很多好的情报就是建很多个人的情报网络。我个人最喜欢是什么?通过法律途径,国家出台大数据相关法律,现在反恐法出台对这方面有改善,在民用层次,还目前还做不到,包括理论支撑不够。领导意识也不够,就领导意识的问题,观念的问题。去年年底我去新加坡访问,新加坡警察就给我看一个PPT,说是你手机都可以下载,下载以后可以看到,手机功能可以定位,可以看附近的刑事犯罪发案的情况,帮助老百姓干什么?对你居住的地方,经过地方安全指数做评估。晚上我找不到这条道,我不敢一人过,所以这种情报服务,情报分几种类型,一种战略情报战术情报,行动情报,这是给警方自己用,还有一种情报给老百姓用的,叫管理性情报,我们国内是没有这种概念,但是国外是有,把这种情报推送给老百姓,我把这种经验聊天的时候跟外地的局长介绍。那个局长说什么?你们可能想不到,局长这么说,哎呀那可不能说啊,犯罪行为让老百姓知道,那会引起社会恐慌,这个局长还是国内信息化搞得最好地方的局长,全国第一个通过案件破案的局长,这样的局长都说这样的话,可见我们这个观念,信息化的观念更西方的差别。新加坡把犯罪情况都公布出去,也没见新加坡乱了,这种数据是有选择的不是无限度的。第三层面就是人才,我感觉到公安讲实际,你拿出来的东西能破案,能不能破案取决于什么?不光取决于数字,还取决于人才,我们建情报队,建情报中心,人员素质跟不上,研判成果也很难出得来。我想这三个方面也是挑战,也是差距吧。
   
    主持人:谢谢刘主任,刘主任太谦虚了,刚才说自己答的不专业,内容里面有这么多精彩的干货,精彩的内容,也让我对新加坡的管理模式充满了向往,回头再去新加坡的时候一定要下一个APP试一下。说到平安城市,像警用公安当然是保障平安城市非常重要的结点,大数据要真的想助力平安城市,其实可以在各行各业一些广泛的应用,我也想问一下张秘书长,我们如果孤立看待大数据,它可能只是一排排计算机代码,或者是存在在报表里各种点装图……。那么对于大数据的落地应用,您觉得关键的结点和重点有哪些呢?
    张涛:你问题一个比一个大,我从产业角度跟大家分享一下,我们的一些基本观点。先说大数据再说可视分析。现在大数据落地无论是结合平安城市,智慧城市还是结合其他垂直领域的应用,有几个摆在面前的关键点需要突破,第一个关键点大家经常说的数据开放。实际上数据开放是一个现象,它也是一个待解决的问题,它不是造成问题的本身。数据开放怎么能够跑出来?应该有三点的要点,可能是必须要突破的。刚才刘主任提到在政府应用市场的观念升级上要持久的做下去,现在对于大数据到底是一个IT时代的概念,还是大信息化中的一个阶段等等,我觉得各行各业都说法不一,实质上大数据带来的是整个治理结构甚至是产业结构的优化和调整。是一个触及根本的东西,这个事在很多地方,在很多基层,甚至不仅是基层,在很多相当级别的领导心目当中,还把它视为很简单的一个信息化的一个组成部分。这个事情要不断去做,这个会直接制约数据开放这件事是不是可行。第二要想打破数据开放,在整个大数据产业,包括海云为代表的可视分析层面,有一个问题是一定要被解决的就是安全。关于数据以及数据运算安全问题,安全问题不解决,数据开放是不可能发生的。第三表现形式是人才问题,人才会影响大数据甚至可视化的落地,根本是到底这个产业未来缺什么人才?基于大数据平台,基于纯粹的数学为基础的人才是一项更缺乏是传统产业,来自于公安、海关、传统产业当中应用场景专家,他们与大数据的密切,是大数据产业的命门所在。业务场景的植入我们的数据,我们的模型,模型背后的操盘人,就是大数据科学家,是不是足够懂一个基层公安干警的工作场景和工作习惯,是不是懂一个养殖户养猪的他每天的生活和困难。这个决定了界面可用的简洁程度,在我看来主要是在这个方面吧,基于数据开放,有这么一个层次。
    第二需要科技力量的推动,实质上大数据打破的不是原有的工作方式,工作方式,大数据实际是打破部门设置功能设置,甚至是所有行业的设立。数据只有跨行业,跨部门,各种跨才能构成意义上的大,它才能够有魅力,才能产生化学反应,这种跨突破了很多现行的组织壁垒。什么是推动力,是具有迭代意义,具有足够前瞻性的意义。我每次出席海云的活动,都会提到海云,是大数据圈子里面,在算法上走的很深的,并且是走的很实的不是仅做实验室里的东西,他们能够把科学的技术和精神带到非大数据圈子里,其他行业当中应用场景里面去,我们需要这样的精神和技术来推动,才可以有所突破。
    主持人:下面问题是针对三位嘉宾的,吸取刚才的建议,下面是一个很具体的问题,我们现在都在说智慧城市,都在说平安城市,针对平安城市的建设请各位嘉宾,各自提一个建议。就是无论这个建议是针对企业、政府、科研机构、行业的也罢。
   
    高伟凯:平安城市主要是给民众幸福感,幸福感是平安城市建设的重中之重。
    张涛:我是产业联盟的,我就对我们产业联盟的这些企业提一个建议,平安城市最大的本质是要被民众所用,包括海云在内的优秀大数据企业,既坚持科学锐性的气质,把洋气凸现一点,各个不同的管理部门实际结合得更紧密。语言变成他们的语言,操作习惯变成他们的操作习惯,可能仅仅做这种转变,他们的幸福感就会好很多。
    刘硕:还是从警方的角度来讲,数据的整合还是关键,没有资源一切的研判应用都谈不上,这个不是公安一家说了算。第二有些前沿的问题,前沿的工作,犯罪预测那种工作,政府和企业都应该做,不要说马上就能起作用,很多前沿性的工作代表了未来的发展趋势,我觉得像海云这样的企业,应该引领这个潮流。
    主持人:谢谢三位嘉宾,时间关系呢,我们今天的峰会就到此结束,下面请各位嘉宾按顺序退场,感谢大家。   
   

楼主热帖
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-3-29 19:14

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表