最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

2015数据分析师峰会之 王吉培:中国征信格局与征信应用

[复制链接]
跳转到指定楼层
楼主
发表于 2015-9-13 14:58:14 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
王吉培

中国人民银行征信中心专家


        各位上午好!我是中国人民大学博士,我是关于征信方面想法和一些思考在这里跟大家分享一下,前面几位分享技术方面,有点偏术语。我给大家介绍四部分两个方面,主要通过介绍想达到一个目的,让大家知道什么是征信?什么是征信业务?我们国家有哪些征信机构?我们国家发展什么样子、未来发展什么样?第二部分主要分享一下,在我们征信体系下,我们一些应用和案例,主要想达到这个目的。
        一、征信概论
        03年的外经贸协会有调查数据,对10万家企业,其中有好多出现问题占了绝大部分是因为欠银行贷款、拖欠贷款,其实03年之前,尤其90年代末欠账不还非常严重,严重影响经济社会发展,因为我们没有建立征信机制,这里头就是信息不对称的问题。因为我不了解你,我把款贷给你,最后你违约。
        我要了解他,了解有几种方式:一个看提供资料,再有去网站看,更多去公司调查,或者有专业的相关机构出具报告,表明你征信什么样子?这种可靠度大部分通过银行或者提供报告,对于我们判断风险机制更容易建立起来,这是征信机制在里边起到作用。
        什么是征信?征信里边有很重要的词就是信,我们平常说的信用必须通过两个方面理解,一个社会层面的信用,还有经济层面的信用,经济信用指银行贷款当中记录你的信用。征信就是征集信用。征信是我的信用由专业第三方进行信息采集、整理、汇总,提供另外其他机构的过程。信用来源于第三方,提供也是第三方。
        很多朋友说做的征信,其实不是征信。两个关键词,信息一定来源于第三方,不是平台自身,用的也不是自己用。征什么、信什么?人民银行收集的个人信息,首先我知道你是谁基础信息,基本照类信息,再一个信贷信息,包括这个企业贷款效率、信贷业务,还有一类非银行信息,这一类主要来自于工商、税务,个人来说有没有贷款?
        当然信息有正面、也有负面,有的国家只采正面信息,有的国家只采负面信息,咱们国家都采,但是银行更多看的你负面信息,假定你有问题才用你负面信息,主要中国之前征信机制缺失,导致银行坏账太多,大家怕了,大部分关注负面信息。各个国家关注不太一样。
        什么是征信业务?好多人说你们是征信公司的,我知道你们,你们是做评级的。我们征信业务分三类:第一类信用登记,比如像中信和上海咨信,客观记录这个信息不搞黑名单,只是客观记录,政府运用过程当中,有可能把这类企业归为黑名单企业,但是对于我们征信机构来说,提供你是什么信息就是什么信息。这类是信息登记;第二信用调查,通过现场走访,大部分在信用调查工作,像华夏邓百氏;第三信用评级,这个大家比较了解,比如去银行贷款或者私人市场发债,有信用评级。像中诚信就是这个业务的代表。
        这个分类比较狭义的分类,还有广义分类,还有社会信用调查、还有信用评分,都可以算到征信业务里边去。我们征信机构有哪些?人民银行个人和企业信息库,通过银行非银行获取数据,汇总数据库,除此之外还有企业做信用登记、评级的信息。
        我们常说建立国家的社会信用体系,社会信用体系包括几个方面:第一法规,第二管理机构,农村法律和机构实现信用体系。对我们国家2013年底征信业务管理条例出台有上位法的支撑,对我们机构有征信机构包括公共数据平台,最后通过不良信息处罚机制构建监控机制。
        二、现在看一下征信格局
        征信三个层次:
        1、金融领域。
        2、服务经济领域的,比如一些商品的买卖、促销,这行业的信息。
        3、社会管理领域,就是政府行业信息。
        和我们国家体制有关系,像美国他们数据是大家自愿,欧洲要求强制报送,我们国家采用强制报送机制,强制商业银行发生信贷业务,到征信中心报数据,所以这一块数据发展比较快。我们看一下我们系统,金融机构和其他社会机构报数据报到征信中心,个人也好、企业也好,最后汇总到征信中心来,形成这样报告,通过这个报告其他机构在了解你的时候看报告就行了,因为我只能了解行业信息,我了解你这个人在其他行业信息,通过察看信用报告就可以了。提供政府部门、金融机构、个人也在用。
        我们采集数据形式,像银监会批准的信用机构,非盈有一些机构,比如网站、政府、法院信息也是协议方式,大家签协议才去报送,不是强制。所以信息采集并不是特别多,这个给市场带来很大的空间。
        我们看目前形成的格局,刚才大部分说的传统征信这一块,主要服务金融领域,还有政府的征信,刚才说了,比如法院、税务也有自己不良信息库,还有像民间调查机构。现在互联网来了,大数据来了,社交平台也都在做大数据。还有一些我们用大数据加评分的方式做,还有行业内,他们因为信息不共享,我带这个平台违约,再跑到别的平台贷都不知道。现在上海征信建立不良B2B数据,圈内相互信息共享。
        目前格局是这样子?从我们收入主体来说,人民银行收入自然人到企业8亿多,能够提供信用报告发生贷款有3亿多,还有10亿多人没有信用报告,企业有2万多家,实际发生贷款1000多家,这是目前现状。大数据征信就是互联网征信,服务就是另外10亿人,另外1000多万企业。
        刚才说传统征信和互联网征信,传统征信有上位法做保障,让商业银行、征信机构,采集以信贷征信为主,互联网没有法律支撑,没有要求强制报送,但是这一块信息市场空间很大,好多企业、好多征信机构没有自己信息,怎么办?大部分利用网络爬虫技术,把他基本信息,舆情信息到好多网站爬,政府信息也是在网上公布可以从网上爬,公共事业单位和地方政府去谈,纳入水电煤气形成大数据。我不要求你报,我利用数据爬虫的技术,拼接我们上面去。
        应用简单说一下,我们国家利用深度比较偏低,中国是4,美国是6,大部分征信集中金融信贷,但是金融信贷10亿人没有征信记录,1000多万户企业没有,但是美国大概85%,覆盖程度不一样。像国外征信1830年英国有第一家征信机构,美国1850年,发展不到两百年的历史,咱们国家真正起步04年开始。
        从服务对象来说,发债、上市对它有信用评级,这一类评级机构正在做这一块,还有商业市场,包括企业信用的调查,还有消费市场,未来做大数据征信很重要的一块。大部分消费信贷,它是信贷信息同时也属于经济层面信用、包括社交都在这里,这一块数据没有采集到,消费信贷是很大的市场。
        商业银行用这个主要贷后管理,有的胸卡,包括商业银行在信贷管理中核对你的信息,你是不是你?还是别人代替你,更重要判断你还款能力,还有些人在审查当中也需要信用报告,政府招标也需要信用报告,这也是我们征信应用的市场。
        现在出国签证评先评优也是有打信用报告,二手房、民间接待都需要,在国外包括租房都需要。我以前老师从国外回来,为什么不在国外发展?在国外有两次闯红灯,进入不良记录了。国外信用机制深入生活方方面面,会影响你找工作。在国外世界银行高管从欧洲调到美国,因为没有信用记录,人们不信任你。所以在国外应用非常广。
        还有反欺诈,这方面也是有应用,反欺诈我们有收入变量,有违约变量,欺诈不欺诈有这样的分类。通过这个诊断你是不是涉嫌欺诈。还有异常值模型,我用关联的方式给一定规则,判断正常数据大概在这样范围,比如有人地址经常变,可能涉及反欺诈。
        刚才说了大数据也是带来巨大的商业价值,所有互联网公司都可以说他是大数据公司,沉淀大量的数据资产,形成很饱满的行业。刚才说大数据,我们征信收录数据以信贷为主,对于大数据公司收集数据方方面面,除了金融数据,大部分拿不到,有些跟商业银行合作可能有一部分数据,或者不太重要的数据给到你。更多是消费记录,我在哪里买东西包括一些网络行为,或者我点击这个网站停留时间,行为特征分析你信用水平。数据类型不一样,更多通过网络360纬度客户画像,全网络信息拼接,实现精准定价。
        三、案例
        简单谈两个案例,国外有一个公司,他的客户服务财富500强前10名九家,三分之二世界100强银行服务,美国前100家最大金融机构中的90家,这就是FICO评分,把风险、特征变量集中起来、揭示出来,这是征信里边重要的应用。在美国发源于40年代,一开始大家用传统的回归找几个变量回归回归得出数值。到发展后来,像引用实名网络对参数方法,56年FICO成立,主要做评分各方面的事情,他评分在美国网上有,大部分分布在620—680分,超过680分给里贷款,低于620分需要提供更多的工具。
        FICO评分关注什么?偿还历史、信用账户数、使用信用的年限等,只要采集都关注,有些信息也关注不是的像种族、肤色、宗教不会关注,在我们国内也不允许采集的,包括指纹、个人收入不能采集的。对他们也不采集这方面的信息,婚姻状况国内关注,他们也不关注,包括年龄他们也不怎么关注。
        根据标准的样子,根据客户不同进行调整,他服务客户金融领域很多。在中国不能简单移植,美国报送机制,商业银行全部用FICO评分,报送机制很发达,有些数据更新比较及时,我们采集数据都是静态的数据,并且我们国家FICO主要针对个人,用在企业身上不合适
        还有一压公司准备挑战FICO,新创的公司10年才创立,虽然发展不长,但是已经融到1.2亿融资。FICO是美国最大的信用评级公司,美国三大信用局都用它的数据。这个创始人想法来自于小姨子,他小姨子想买汽车轮胎,钱不够,贷不了款,只能向他借。后来想这个群体有一些,美国85%出报告,15%没有,他标准这个市场。在美国很少钱不多,发工资之前到市场贷款,违约率特别高。针对这类群体,没有信用记录或者次贷人群,做他们信用方面的评估,这就是大数据征信的想法。刚才FICO大部分基于信贷内数据,对于他们是全网数据。
        他用的第三方数据,只要网上来的,不管哪里的都用。他与传统逻辑相比有一些好处,一般FICO评分数据量比较多,真正模型用到十几项,这是传统征信评估报告。Zestfinace信用数据采用变量非常多,7万多变量,大部分重合,比如年龄和婚姻组合变量非常多,大概七万多。FICO是做减法,Zestfinace做延伸。这是他们比较,这也是国外大数据征信Zestfinace的拓展,没有数据没有关系,可以搜集各种数据,这是他们想法。
        还款率不错,他们创始人说大数据跟和人类艺术结合不才是的潜力。Zestfinace对社交数据虽然进入采集,但是这一块采用并不是特别高。时间原因我就讲到这里,谢谢!


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-7 13:35

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表