最具影响力的数字化技术在线社区

乔帮主 发表于 2015-1-8 17:58:29

宜信大数据实时授信平台技术、架构、模型解析(PPT)

本帖最后由 乔帮主 于 2015-1-21 14:17 编辑

   宜信大数据实时授信平台包含姨搜、知识图谱、授信和反欺诈引擎等模块。平台结合了用户授权数据、第三方数据、互联网海量数据等不同数据源,最大限度地获取 用户信息。授信和反欺诈引擎结合了专家知识和机器学习算法,分析客户的信用状况和欺诈风险,实时估计授信额度、检测欺诈风险。http://mmbiz.qpic.cn/mmbiz/AhRa04slytruGEJwicNEEhAa5jRfVNU713QLoKH5Pb7aUUBicbSmn52icic9RIJiavMcOdpUeV4kks5XUJ1ZsUnTpLA/0http://mmbiz.qpic.cn/mmbiz/AhRa04slytruGEJwicNEEhAa5jRfVNU71XgFaFWcvKQXYMlLKsMia1VbxrUmK2PtDHIvEJoOMd2ay2JHICgJdXSA/0http://mmbiz.qpic.cn/mmbiz/AhRa04slytruGEJwicNEEhAa5jRfVNU71bhJOpQuhAZx9qXmkcN6CyXcYiakP9Zkqjlv5yET6G4picc8IwqagNyVg/0http://mmbiz.qpic.cn/mmbiz/AhRa04slytruGEJwicNEEhAa5jRfVNU71VUtsnXCIIMvRebWzIibhLREnZUxLFUMDjXgNKNPPFddT4xLQSTzn0uA/0http://mmbiz.qpic.cn/mmbiz/AhRa04slytruGEJwicNEEhAa5jRfVNU71SQZOXVcBziaus2DmOFFgwrASOSsXX6xjuV3ttwLbPUyxw3X3SGNh5IA/0http://mmbiz.qpic.cn/mmbiz/AhRa04slytruGEJwicNEEhAa5jRfVNU71cwQuibricz4ibJEkJr74eNvJSKU13ziaG9AfbBUanAnetzeuvTdODSqyuQ/0http://mmbiz.qpic.cn/mmbiz/AhRa04slytruGEJwicNEEhAa5jRfVNU71crSBZ6a01vcnD03LGfy6zAOb2ibgSjtTibuGQHRxFCTBIWa8ZIL2Bwsg/0http://mmbiz.qpic.cn/mmbiz/AhRa04slytruGEJwicNEEhAa5jRfVNU71Jh3T4yHZUVNjEMYMLwKG95egicXM5JVJLvFrkZ5NSvxNtBQf7cXWQWw/0http://mmbiz.qpic.cn/mmbiz/AhRa04slytruGEJwicNEEhAa5jRfVNU719XLfMzzWRv0RBErhoOTVHbckbQcgHShffYGaUzpLKmBCBgul2UiclSg/0http://mmbiz.qpic.cn/mmbiz/AhRa04slytruGEJwicNEEhAa5jRfVNU71QLrMfUWFlzEBicKslPSYEqUHHq8UcYo7FJlF4175QmTdEsvyB2Lkmgg/0http://mmbiz.qpic.cn/mmbiz/AhRa04slytruGEJwicNEEhAa5jRfVNU71WkcqK0BqUrCwJRHOtor20fxpDOf5XxM8b8xGUTzHmVjiajMDF0bYiabw/0http://mmbiz.qpic.cn/mmbiz/AhRa04slytruGEJwicNEEhAa5jRfVNU71sUbSva6hcBBeZibl5htA7ibycSvja7emrdRTHCIZ7Mb5v944fL2jj1Lg/0http://mmbiz.qpic.cn/mmbiz/AhRa04slytruGEJwicNEEhAa5jRfVNU71YaEkWnkCf58wuWsiagSiavOaWkRukPlo15U8u9IhSKsVaMttanVedCQg/0http://mmbiz.qpic.cn/mmbiz/AhRa04slytruGEJwicNEEhAa5jRfVNU71ick7Ejfd1v1U8aedbeiapH7CbcC47tHsPy91qGpEGKKickLY5ZMCeqJ8A/0http://mmbiz.qpic.cn/mmbiz/AhRa04slytruGEJwicNEEhAa5jRfVNU71wYTVa2q92StQd9OfuP0E4Q3Eszu0WACDFKcEjynicZrOic1BAwqGNfSw/0http://mmbiz.qpic.cn/mmbiz/AhRa04slytruGEJwicNEEhAa5jRfVNU71I84M7IhylCZicny6cCZQeFeHRdBDJJw8oNNyzY7srlmkPQwW891VW4A/0
这个平台到底是做什么事情的?通过对各种各样不同的数据员的接入,包括自己的数据。通过对它的接入分析,梳理,挖掘,关联和理解。做了一堆的事情,但是三样最重要的事情是说,第一个分析客户的信用状况。二我们会检查欺诈的风险,我们这个行业欺诈是非常非常重要核心的东西要去做。第三个所有做完这些东西,我还是想做什么?我是想做希望实时能够估计信用额度。这不是我今天站在这个地方纸上谈兵的一个事情,我们上面已经有垂直的,已经在市场上在做。大家都知道宜信有一个非常棒的一个互联网产品叫宜人贷,有不同的模式,其中有一个是极速模式,我们这个平台做的第一件事情,我们支持宜人贷。你要上去去投标。如果非常幸运,可能10分钟就能买标。我能不能做到通过数据让宜人贷一分钟之内可以授信呢我们当时做了这样一件事情,我请来申请贷款的这些人给我一些数据。什么样的数据比如你信用卡的流失数据,比如你在淘宝,天猫京东的购买数据,或者你在运营商的通话记录,加上其他我们已经爬下来的,我们做了搜索引擎,大量的网上的数据,加上宜信自己的数据,还有我们很多生态伙伴第三方的数据。所有的数据加起来,我能够做出来,在实时一分钟其实是几毫秒之内,能够做到给你授信,你给我这些数据,我能说不能贷给你,还是能贷给你两三万,我眼看着向10亿在迈进,我们这是我们做的第一个产品。当然我们也有很多的合作伙伴,不同的方式在做这件事情,后面的原理是类似的,同一个平台在驱动。我们在9月份跟易贝做了战略合作,中国有一大堆在华南华东的外贸电商,不在天猫,不在淘宝卖东西,在易贝卖到外国,到我的网站,这个网站上去,把它的易贝帐户提交给我,绑给我,把分钟之内,你这个帐号值多少钱,还是对不起,你这个帐号没有足够的数据,是不值钱的,请你以后再来。这个产品,是我们做的第一个尝试,拿商家的流水拿来做这个依据。加上我们其他的各种各样不同的数据源来的数据,所有的数据做一个理解,做到现在做了大概几千万的级别。可能很多人会问我说,因为时间关系,没有办法我只能说做一个非常非常简单的展示,传统的金融机构,大家也做模型,做算法很多诸如此类的数据挖掘,传统的数据模型,比如说,他可能会放几十个变量,或者撑死了放几百个变量,我们的方法不一样,我的有几十万个或者更多的变量,传统的模型里头,非常强调说所有的这些特征,要是可以解释的。所以他需要非常非常强的特征。在我的这个模型里头,在我们这个平台的模型里头,对于我来讲,所有的数据,都是信用数据。当中交易数据,流水数据这些数据大家可以想象到,其他很多的数据,比如你的搜搜数据,网上的很多其他点击数据也是特征。如果这些特征被吸收的话,可能非常弱的特征没有关系,最后我能做出不管是信用,还是反欺诈,我后面有一堆模型在这边,我做的手段跟传统机构不一样的。今天我其实是想说的是,今天在座很多人,你们做O2O,你们也会积累数据,大量的各种各样的数据。我站在这个地方是希望跟你说有另外一种新的变现手段,数据变现的手段,你提供金融服务,可以是C端的流量,也可以是B端的流量,我们作为第三方,我的这个平台可以跟你合作,提供一个金融变现这样一个能力。作者:魏旋 宜信公司
Hadoop中国
页: [1]
查看完整版本: 宜信大数据实时授信平台技术、架构、模型解析(PPT)