168大数据

标题: 乌镇智库张晓东:目前大数据主要应用在征信和风控上 [打印本页]

作者: 168主编    时间: 2016-9-26 11:00
标题: 乌镇智库张晓东:目前大数据主要应用在征信和风控上
9月23日,由《博鳌观察》主办的2016博鳌观察金融创新峰会在京召开。国家千人计划专家、乌镇智库理事长张晓东参与主题论坛讨论。
  以下为部分发言实录:
  张晓东:其实你要是看最早的比方说五六十年代,在金融领域里一直在用科技的手段,过去我们总说那个时候的科技手段模型做得很深,但是它数据也很少,因为各种各样的原因,新的互联网公司出来之后,像谷歌、FACEBOOK,它们模型也许是浅的,也许是深的,但是它的数据量很大,就是很多东西一旦数据量大了之后,它会让你很多东西变得很有意思。
  比方说数量大了之后,有一些数据你甚至可以负担得起,你说我不要,但是你在传统的六七十年代建立一个非常精准的数据模型的时候,这种你是不可能做到这一点的,这是一个。现在我们看到的所谓互联网金融就是浅模型,就是大数据加上浅模型,和浅数据加上大数据的这么一个整合,这种整合我们从技术领域看到一些新的技术出来,最近说深度学习,我都不想再提了,因为现在所有新的科技公司找融资的,要么是深度学习公司,要么是机器人(23.470,-0.16, -0.68%)公司,就是什么东西都往这边靠。
  从技术领域里面我想提两个,除了深度学习以外,一个是自然语言理解技术,一个是知识图谱的应用。在应用行业里面,我看到现在大家用到很多的,一个是征信,另一个是风控,几乎在互联网金融的任何领域里面都可能会涉及到风控的问题。
  我想举一两个例子来说,比方说最近征信公司拿到了所有的法院数据,比如说有两三千万法院的判例,它用自然语言理解技术来了解这些判例是对谁更有利,从而能够得出说跟这个人也好,这个公司也好,谁的信用度更可靠,另一个比如知识图谱的技术,现在很多企业在做知识图谱。过去我们讲数据都是结构化数据,现在比方说最极端的非结构化数据,比如说自然语言理解的,法院的文本,这都是非结构化的数据,我们有些手段通过知识图谱可以把人和人,公司和公司,公司和人关联起来,最近有一家公司,大家也提到P2P,去年年底到今年国内有很多波动,这个公司做了一些技术,这些技术给国内的监管部门,它就是用知识图谱的技术,把P2P公司之间、人和人之间的关系挖掘出来,这个挖掘出来它一个很好的方式呈现,你就很容易知道哪些公司是有潜在问题的,所以我就先讲这么多。






欢迎光临 168大数据 (http://www.bi168.cn/) Powered by Discuz! X3.2