最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

优分数据戴星:风控大数据应用的发展方向(PPT全文)

[复制链接]
跳转到指定楼层
楼主
发表于 2016-2-2 21:22:11 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
 导读:1月29日,数据观思享会第二期沙龙——大数据风控与应用在京成功举办。数据观思享会是在贵阳数博会组委会指导下的一个品牌沙龙。优分数据首席风控师戴星在活动中给大家分享了主题为《风控大数据应用的发展方向》演讲。

  戴星:感谢数据观给了我这个机会,能在这里和大家分享我们在金融风控领域大数据应用的一些心得。

  传统金融应用数据和征信信息做信贷风险控制,在中国至少有30年的历史了,成形的做法是后台数据复核+前台人工实地认证,这对于以经营贷款为主的传统金融业是成熟而有效的,但到了个人小额贷和消费贷这里,这种方式就显得成本太高,而且效率极低,发个信用卡审核要一个月,贷笔分期要审两周,但好在这类个人为核心的业务,在整个信贷市场上占比不超过10%,利少还操作麻烦,所以在这种业务上,传统金融就不愿意干了,大量外包给社会企业。   但这种骨头里找肉的生意,恰恰迎合了互联网金融发展的思路,国家也看到这点,给予互联网金融在消费金融和个人金融这侧发展充分的支持,所以今天各个互联网金融大佬都在进军个人金融市场。   互联网金融进军个人市场,依赖的就是征信和大数据,有了这些数据的支持,就有了将个人信贷变成标准化产品的机会,接着我们有了机器算法,于是有了替代人工,达到高效和低成本的机会。所以,风控领域的大数据应用首先要感谢民间消费金融的崛起和大数据技术。   大数据在消费金融中的应用,买卖的商业模式简单和清晰,所以风投们也迎风而来,推动了整体大数据行业的发展。据说,2015年下半年,平均3天就能诞生一家数据公司,2016年估计平均一周就有一家了,这个发展速度,让我们都成了飞翔的猪了。   金融风控大数据行业的产业生态中,现在是由征信牵引发展的,国家已经要搞多部委数据打通,建立公民信用体系,征信在未来金融中的地位不言而喻,所以人人都想要征信牌照。   征信热之外,我们看到的另一个现象是,无论征信公司还是数据公司、云风控企业,几乎都在干着同质化的工作,不管包装成什么形式,核心依然是以交易数据源产品为主,为了向更高层面进军,大家也在努力搞算法,马云说从IT到DT时代了,被他一忽悠,最受益的其实还不是卖数据的,而是我们几十年来一直被忽视的统计师们。   现在的消费金融算法,都是以统计回归为基础的,所以今天我们看到的算法都在拼谁的数据量大,谁有的结果数据越多,谁家的统计结果就可能更准。在谁家也拿不到更多的结果数据时,就只好拼谁家的因素数据多了,这样一来,每家搞风控的都在说自己多了几个维度的数据,好像数据维度越多就风控越好,这就好像intel吹CPU主频一样,好像电脑的速度就由主频决定一样。

  其实我们干风控大数据的,也就想电脑的386时代一样,目前还处在很原始的状态中。反映在数据模型上的能力更是如此,我们还有很多基础性的验证工作没有完成,现在谈成为中国的FICO和experia还都太早。   比如,五个准确的数据维度就能画出人的画像,你变成50个反而花了,因为数据质量你不能保证;统计学的基础是历史数据规律能反映未来,这在欧美日那种变化很慢的成熟商业社会可能成立,在中国成立吗?需要验证。   还有像数据源的准确性如何保证?数据清洗和结构化如何做?数据脱敏后的人物精准画像如何做?谁来承担数据失当导致的信贷损失?这些问题都需要时间来积累。

  另一方面,信贷市场的90%以上,仍然是传统金融在按照传统的风控措施在做,他们在互联网金融冲击之下,都有着强烈地服务提升愿望,但大数据行业对这些传统风控模式的支持远远不够。互联网时代都喜欢马云说的颠覆,但从互联网金融发展的这几年来看,金融的本质不因为互联网就改变了,风险也不是一上网就变低了,我们必须尊重传统金融几百年的经验积淀。传统金融需要的是提高效率、缩短人员培训难度,而不是数据用量的大幅度提升,很多时候,数据维度多用量大,只会让传统金融风控的效率更加低下。

  从模型算法上看,搞风控只谈统计回归是远远不够的,信贷逻辑验证模型才是传统金融多年来低风险的核心技术,在这方面的核心重要性还未被大数据行业认知。

  这是一张我们风控大数据应用的现状图,红色的是大家都在扎堆做的,黄色的是大家现在关注的,其他的则是进入较少的。但那些领域其实才是信贷的核心主市场。

  在金融风控数据应用领域,存在着两种不同的模型路径,一种是我们大数据行业现在最汹涌的统计归纳,强调数据关联的统计规律,从机器算法上说就是只问结果不用问原因;另一种是传统金融使用的逻辑演绎法,强调的从为什么上找结果。这两种模式必须同时开展,互相印证,才有可能形成完整的风控服务模式。在这方面,尤其是逻辑演绎方面,我认为大数据行业目前的研究是不够的。这也是现在我们不能在信贷最主要的市场上发挥大作用的原因。   我个人认为,未来风控大数据应用首先是两种算法模型的匹配建立,其次是对精准数据维度的挖掘使用。从行业发展角度来说,把数据做深比做宽可能对信贷行业更有意义。

  最后简单介绍一下优分数据,优分数据主做的是风控逻辑建模和定制风控服务。   
■提供基于精准数据源的逻辑分析模型   
为风控提供高效的工具,减少因大数据带来的效率下降问题。   
将跨行业数据用起来,刻画人性指数,让对人的风控更轻松   
■为大数据行业提供风控应用的基础模型参数辅助,帮助统计模型的基础建模

  优分数据的主要数据服务类型有:   
■银联消费详单   
■运营商的金融账户绑定认证服务   
■综合征信数据   
■黑名单及反欺诈   
正在做的:   
■基于凭证的中小企业财务信息   
■基于行为心理分析的借款人动机分析


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-8 00:45

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表