最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

大数据风控产品设计@百融金服副总裁段莹

[复制链接]
跳转到指定楼层
楼主
发表于 2016-2-6 12:39:41 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
来源:数据观

段莹:各位下午好!很高兴见到不少新老朋友,刚才边听三位介绍内容,也发现一个很有趣的一个事情,刚才边听边想,我们接下来分享大数据风控产品,换一个角度来分享。


什么意思?刚才戴总讲,戴总做了10、20年的金融行业,误打误撞进入大数据,开始做大数据征信。我本人经历跟戴总正好相反,我之前一直做数据,从民用航空到互联网、电商、广告,然后是金融数据,大概在2013年误打误撞开始做了金融,数据跟金融最直接结合点是基于征信的风控。刚才听戴总边讲我就边想,戴总从一个维度往另外一个维度,我尝试一下从另外一个思路,从数据思路角度往金融风控延伸,看能不能跟戴总刚才讲的东西有交叉或者是碰撞的地方,包括戴总讲的思路和观点,我想一块来探讨一下。我想就这个观点,把如何做大数据风控这个东西跟大家一块做一个分享。


说到大数据风控,用20秒介绍百融金服。我们原来一直是数据公司,之前是百分点,做互联网数据、电商数据,在2013年,也是因为有大数据风控和互联网金融才开始转型做大数据风控方面工作的,从2013年开始为银行包括消费金融机构、P2P提供服务,整个过程也是这个样子。我们现在做了两三年大数据风控,中间也有很多经验或是教训。


这块到底觉得有哪些事可做呢?刚才戴总讲的一点我非常认可,大数据风控本身目的是风控,要把金融信贷的过程做好,大数据是个技术,它所做的事情是把一个技术手段变成风控流程手段,能够把成本变低、效率变高、效果变好,这是一个本质的点。


我们说大数据风控产品设计的时候,一定要搞清楚风控流程包括哪些点,对于风控或者信贷包含哪些内容?第一个环节,我要找到有信贷需求的人,我能够找这个人;第二步画像,我要挑这个人。把里面的好人挑出来,坏人也挑出来,简单来讲,其实大家经常说,好人里面挑坏人,坏人里面挑好人,我才能够说风险定价或是受信能用;第三步,把钱放出去还要收回来。放得出去,我得有一个放款手段,同时,不管是证券化还是其他方式,我要拿到足够便宜的资金把钱放进去,否则如果你的资金成本是15%,放出去银行信贷一般不会超过10%,根本放不出去,那就没意义,放出去能不能收得回来,考虑是你催收能力。这三个环节在整个信贷流程过程当中是最重要三个点。


这里重点分享探讨第二个环节,如何从好人里面挑坏人,坏人里面挑好人,另外两个点一会有时间可以探讨一下。


所有信贷机构没有大数据的时候,过去一二十年的金融行业里面没有大数据,我仍然做同样的事,好人里面挑坏人。如何挑坏人,最简单,央行有一个征信系统,逾期出现过不良,我们认为他可能是坏人,因为我们有一个基本假设,如果原来不还钱,那未来不还钱的概率会更大,最典型的一个理论。然后,我除了看央行征信还要看什么呢?法院判决不执行,我们相信这个人不太好,有可能借了钱也不还,不管有没有大数据,我们原来都在做这个事。我申请贷款的时候,一定要把里面不还钱的人挑出来,不管原来不还钱还是通过现在的行为不还钱,把这些人挑出来。我们一直甚至几十年时间范围内零售信贷,做的第一步把坏人挑出来。大数据风控到底干了什么事?有什么区别?用大数据做风控,到底有什么特点?这种产品怎么设计?刚才提到这些,几十年金融在做。


最简单有几个出发点,第一点,比如说大家原来都查央行征信,这个人原来他有不还钱,我们知道,拿身份证姓名录进去,看下有没有不还钱,但是有一点,这次借款人手机号扔到央行查查,用这个手机号的人原来是不是也出现过借钱不还?央行能满足大家这个需求吗?满足不了。央行没有这个数据吗?其实不是,我们跟央行两年前探讨过这个问题,有手机号,我不允许判断这个手机号原来有没有信贷不还的记录,为什么?因为它具有不准确性。手机标志一个人,但是我手机号,因为有可能回收等等原因导致我可能有1%、2%的情况下,这个手机不是本人,所以央行不敢干这个事情,有不确定性,它要承担责任。假如说,我刚刚换一个手机信贷,这个手机前一任出现逾期不还,银行拿这个说事,那肯定咱们是不服,我们要申诉。但是在98%、99%的情况下这个信息有价值的,很多强调大数据相关性等等,我们这个不是理论,真的用的时候是什么样子?对很多互联网金融公司而言我们也会关心,这个手机是不是曾经也出现过借钱不还,有可能,有1%、2%不准确性。我能够通过额外的一些手段,通过手机来判断这个手机是不是出现过逾期,原来拿这个手机号申请借款人是不是出现不良,这是传统征信的补充,降低了一点点不准确性,但是提高了98%、99%的使用效果。


再一方面,现在央行里面没有互联网机构的这么一些不确定性信息、不良信息。当然,现在允许了一部分金融机构进入央行,但是因为种种原因,像小贷机构,线下有8、9千小贷机构能进央行,但是现在只有一千家,这些小贷机构不良信息进了央行,这种情况下,如何去打造一个互联网的平台,能够把大家信息集合起来,不光是说我能够有跨行业的数据,不光我按照手机的情况去查询去集合起来,这都可以用另外手段去验证这个是不是有负面信息的过程。




除了这些还有很多,我们现在做互联网消费金融,很多时候不通过线下渠道不通过门店,我们微信APP实现这种功能,这种情况下是无法实现这个见面、整个过程。咱们做互联网金融发现,最近两三个月出现了一个新的刷机的程序,它把最近市面上经常做APP受信的APP全部集成到这个程序上,只要你买这个手机,市面上能够经常见到10、20款信用借款APP已经自动装上,大家可能觉得这是很恐怖的事情,我是想。欺诈的人原来想各种办法,下一个APP,现在只要把程序一刷,手机上自动把市面上目前可以信贷贷款这些APP全都在里面,只要一个一个填,我已经有一些预知的信息在里面。


很多时候大家发现,欺诈的这些人永远处于一个道高一尺魔高一丈的,这么一个过程,我有一些手段去屏蔽去拒绝掉欺诈人的时候,他们一定会有很多新的手段,像现在出现这个公司,有些低端三流手机出厂就装这个APP,四五线城市的农民工买了这个手机,就自带10、20个信用贷款的APP,这些人是风险很大的人,传统的风控如何避免这种情况?避免不了,这种情况我们只能通过一些设备信息,这个设备出厂预装了,刷了某个程序,预装10个、20个APP,我们这块如果要做一些大数据的负面信息,去把坏人挑出来。我们刚才提到跨行业,还提到一些技术手段,也提到通过设备反欺诈的信息,这一块,我们通过各种各样的技术手段,通过互联网技术手段,通过大数据降低准确度提高效果的手段,我能够去把这些人里面的坏人摘取出来,这块可能有别于传统金融风控我们能够做的一些事情。




所以在这个行业里面发现非常有意思,大家经常会加入一些,比如说像信用卡套现QQ群,包括加入一些教你如何去办消费信贷的QQ群,你会发现这些群里面各种各样活跃思路,民间智慧是无穷的,确实你会发现,举个例子,上个礼拜跟国内最大消费金融公司,每天有3、4万的消费金融公司,我们看了长三角三个省份,填邮箱,邮箱一大堆是QQ号,我们看QQ号,我们找到了一百个QQ,相对量级不大,这一百个QQ就是在一些专门针对消费金融公司欺诈的QQ群里面,他们在QQ群里面去问,如何从消费金融公司去申请下来3C的借款,你说同样一百个人,当然这一百个人对消费金融公司来讲原来是受信通过,之前没有手段,一百多个人没有什么负面信息,完全OK,但是它的QQ,填的邮箱,在一个月之内专门进入套现的QQ群,大家知道这些信息,把这些人列为关注或者人工复查这些信息,如果没有技术手段,我们抓不到这样的信息,那OK,没办法!我们做不了这个判断。所以说,我们用这个数据去判断,从好人抓坏人的思路一直是不变的,只不过大数据风控这个产品,我们有更多的数据、更多的维度和更低准确度等,实现我能够把这些坏人抓得更多一些,哪些是坏人,哪些是值得关注的。


我们这种大数据的抓坏人的思路跟传统风控抓坏人的思路有一点点区别的地方,这是跟大家分享的一个点。


第二块,我们最关心还是坏人里面挑好人,最终的目的也不是非要把坏人抓出来,我们是信贷机构,我们最终目的把这个钱安全放出去,安全收回来,我们最关心人群里面到底哪些是好人?我要从坏人里面把好人择出来,这是做信贷最核心的点。


原来风控里面我们也是抓坏人,审计通过率最关键是什么?我能够有足够的方法、足够信息、足够数据判断出申请人里面到底有多少是好人,信用卡做得比较高,70%、80%的审计通过率,效率会非常高,互联网金融存在的问题,没有办法把足够多比例里面的好人挑出来。现在现金贷款,他们能够从一百个人里面挑选好人的比例5个人不到,一百个人里面看两三个人看上去是好人,把钱放出去,即使这样,发生不良也会有10%,把好人挑出来是我们最关心的问题。





传统风控一直做的是这件事情,信用卡要查央行征信,另外一方面,历史上有三张信用卡,两到三年还的很正常,说明这是一个好人。为什么有时候会有车贷、房贷、消费贷,我买房子,还款能力是没有问题。


为什么信用卡会发一些航空公司联名卡,为什么会发商场联名卡,通过各种各样的手段把这些人群里面好人挑出来,本质原因也在于说中国整个征信行业的数据库的缺失,在中国整个央行征信库里面只有3亿多人,其中有半年以上信贷记录只有2.6亿,意味着只要做个人信贷的时候,其实一方面口很小,我们不够用,再有根本没法用,这种情况下必须通过数据来使得我把这些人里面好人挑出来。





传统金融,我们刚才说的是各种各样的方法,其实刚才戴总提到,有一点,数据维度,本质上维度数据说明还款意愿好就够了,有两个维度数据足以说明你有很好还款能力和意愿,比如说你是国航常旅客,所以一两个维度给你放贷款,但是对于很多人没有一两个维度相对还款能力比较好这件事情择出来,我们得不得放大维度,来判断这个人还款能力、意愿OK,这种情况下,一定要先看这个人,我所有维度里面最强的维度,有车有房是会员VIP,这些都没有,我看其它行为,比如说最简单的消费行为,消费类型等等这些信息,这种情况下,我们维度就会从一个变到十个可能变到一百个,我们一直做数据的人一直有一个观点,是什么呢?我们有时候会建模,为什么建模?本质上是什么呢?


当单维度的数据不足以得出一个结论,我们要用更多的维度,上百个维度人脑分析不过来,这时候必须建模型去分析,当我数据不足够强的时候,我通过一种算法来把不同客群做划分,这边一百个人,我想10个受信,90个不受信,100个人有资产信息,不需要建模,只要给有资产的人,还款能力没有问题。100个人要给30个人受信,100个人,不知道信贷历史,不知道资产数据,也不知道车房等等信息,这种时候知道他的一些行为,比如消费行为,比如说浏览行为,这种情况必须要建模,建模维度要放大,单一十个二十个维度可能不足以产生效果,我要看类型是什么类型,什么时间消费,到底买这个东西干什么事,过去时间变化趋势是什么样,这时候维度变得非常大,这种情况下就不得不把很多机器学习的算法进入引来,但是目的都是一个,在我数据不足以单维度直接去区分业务的前提下,我通过更多的数据更多维度、更加智能化的算法去把一些好的挑出来,但本质上就一个事情,那就是说要把这些用户里面或者坏用户里面把好用户挑出来。


回到主题大数据风控产品设计,本质就两个点,我通过一些技术手段,通过一些数据手段,通过一些模型手段把人群好的挑出来,坏的挑出来。


刚才讲了很多理念的东西,回到做的一件事情,为什么要大数据征信、大数据风控?本质上就是提到的传统风控很多的局限性,所以这时候我们做了很多额外的事情,保证整个互联网金融生态里面有一些手段,有一些服务能够起到这样的一个作用。





刚才提到,大数据风控本质上两件事,挑坏人和挑好人,挑坏人通过反欺诈的手段,还有一个挑好人,看信用评估、还款能力意愿稳定性,很多时候为了更加综合去应用这些还款能力、意愿和稳定性会有一个评分,这个评分跟违约概率相关的评分,而不是很多我们市面上见的像会员分、积分,更多跟违约概率相关的分,信用评分,大数据风控产品起到的作用两个,第一个挑坏人,第二个挑好人,做传统风控做不到的两个目的而已。





简单描述一下百融做的信息核实,在座很多是百融的客户,也不少在用我们的服务,大概一个理念,就是我提到那些内容,具体产品内容这边就不细细过多介绍。信用评估,像刚才提到收入、阅读、阅览等等。


百融评分需要数据维度,本质上评分也是降维的过程,把几个百上千个维度降到一维上,让你的信贷员或者机器更好理解,本身我们干的就是降维的事情。


百融评分的细节就不多看了,就讲讲为什么要干这件事情,以及对百融服务而言,可能哪些类型金融机构会适合用哪些类型的服务,行业应用等等。





百融做大数据风控,主要负责机构银行、信用卡、P2P等客户内容,一些产品细节不讲了。




主要跟大家分享探讨这些,跟戴总从两个不同的维度把大数据风控串到一起,差不多是这个样子,谢谢大家!



楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-6 01:11

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表