马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
主讲嘉宾:张良贵 主持人:中关村大数据产业联盟金融大数据专业委员会 副主任 李灵隐 承 办:中关村大数据产业联盟、金融大数据专业委员会 整 理:王维
嘉宾介绍:
张良贵,积木盒子大数据应用中心副总裁。吉林大学数量经济学博士,中国人民大学经济学博士后,中央财经大学数量经济研究中心研究员。10年金融从业经验,先后服务于投资公司、私募基金、期货公司、信用评级公司等,主要领域涉及固定收益、商品期货、有色金属、金融衍生品套利套保、结构化产品设计等量化模型的研究与开发;在目标数据挖掘、定量模型研究与设计方面拥有丰富经验。曾在穆迪-中诚信国际任总经理助理、高级分析师,负责信用评级、资产证券化、非标业务评级等业务开展;参与多项国家级、省部级课题研究,兼任GLG等国际公司的咨询顾问。
以下为分享实景全文:
大家晚上好!很高兴向各位业界朋友汇报下积木盒子在大数据应用方面的进展。同时,也感谢陈新河秘书长、李灵隐主任提供这样的平台,让业界人士深度交流。
积木盒子作为互联网金融成员,自2013年8月正式运营以来,一直秉承“真诚透明”。
下图是积木盒子2013年8月-2015年3月的成交数据。
下图是积木盒子发展中的大事件,很感谢投资人和融资人对积木盒子的信任和支持,取得了一定成绩:
下图是积木盒子保障方式、产品、融资期限和融资主体的分布情况:
下图是积木盒子融资金额的区域分布图:
下图是P2P行业发展趋势:
从图中可以看到,P2P行业发展迅速,被业界认为是对传统金融服务模式的有效补充。这种补充主要来自对金融效率的提高。
这张图可以看到,互联网金融火爆的内在机理,互联网金融本质是将体验、效率融入了金融业务,是“互联网+”的典型应用。
在对互联网金融发展规模、发展内在机理简单分析之后,回归到积木盒子的运作模式,如下图所示:
积木盒子的价值在于为融资人和投资人提供更好的服务,将体验达到极致。服务好这两大群体,产品设计、风险控制、渠道准入等方面需要做的工作很多,基于此,形成的内生数据和外生数据积累,也为大数据分析与应用提供了必备的基础。
如图所示,大数据的应用一定是与业务生态紧密绑定的,这样才能实现闭环的数据链,得到的分析模型与结论才能更好的指导业务实践。在后面的应用案例中,会看到大数据在运营监测中的具体应用。
大数据可以提高决策支持,要实现大数据的高效应用,需要构建基础设施平台,即大数据平台,积木盒子为构建高效的大数据平台一直在努力。
大数据平台应当有三大功能,即数据模块、工具模块和可视化模块。
如下图给出了积木盒子大数据平台基本架构。
在对大数据平台做了基本分析之后,回归大数据应用场景,应用场景是数据的灵魂,可以让数据更有生命感。
对互联网金融而言,场景的关键要素就是“互联网+金融”,互联网的本质就是极致体验,金融的本质就是风险控制。如上图所示。
在这一过程中,积木盒子积累了两大数据,即内生数据和外生数据,内生数据主要是交易场景数据,如投资记录、信审积累等。为了极致体验与服务提供了大量的数据样本。
对外生数据而言,主要是如何从过载的互联网信息中甄别出对传统数据的有效补充。大的思路就是要建立欺诈规则、违约预警和运营的监测。
组件库和规则库是未来大数据应用的主要产品。
在上图中,可以看到数据仓库和API应用接口能够保证积木盒子的数据应用更具有便利移植性、拓展性。
形成闭环的数据生态链是关键。
上图给出了大数据的基本思路。
在明确下大数据的基本思路,即“数据+工具+场景”,数据大集中,形成API可以规范调用的数据仓库,场景就是业务模式,是数据应用逻辑所在,工具就是为实现数据和场景的有效对接而存在,包括调度、展示与预警等。
下面将是大数据在积木盒子业务场景中的应用。
构建筹资能力指数、融资压力指数和痛苦指数的初衷就是能够迅速找到资源的平衡点,互联网金融在投资人收益、融资人成本之间做着平衡,所以痛苦指数是心情的表达。
投资端运营监测,主要监测投资人结构(价值型、投机型)、投资人粘度、投资人偏好,基于实证结果为激励政策、产品服务提供决策支持。
项目端运营监测,主要监测项目满标时间、项目还款行为、项目分布等,满标时间可以直接引导项目定价、上线时间、上线额度及项目上线计划。 下图给出项目满标时间
下图给出了计划项目上线与实际项目上线趋势图。
下图给出了项目满标的热度。
风险端运营监测,是重中之重,对系统风险和个体风险要有更精准的研判,为实现这一目标,数据层、工具层和逻辑层要达到高度配合。
分散度是风险管理的重要指标,我们构建了时间、项目、融资人、渠道等不同层级下的分散度指数,可以对风险决策提供直观支持。如下图所示。
最后给出了积木盒子风控总体结构,基于这样的结构,去建模,去分析,为决策支持提供实时指导,如下图:
我的汇报到此结束,谢谢各位在百忙中不断的触摸屏幕,看着内容,再次感谢~
以下为交流问答环节:
韩笑:感谢@积木盒子张良贵的精彩分享关于外生数据中提到了三类,网购,浏览和社交。是否验证过这三类数据的有效性,相比传统数据和内生数据,这类数据的使用效果如何呢?此外,这三类的有效性从高到低是什么样的呢?
张良贵:@韩笑网购等行为数据我们更多倾向是对欺诈和违约成本分析,数据清洗程度对结果影响很大
豫章文:就昨天话题普级一个知识点,劝告大家表以企业评级高于所在国主权评级而去笑话大公,希腊还被三大公认为垃圾级呢?岂不是希腊企业信用全垃圾级?有评级牌的超码对企业信用评级是有两把刷子的,技能要尊敬,动机另议。
戴星:从运营角度谈风控,很有意义。@积木盒子张良贵担保公司在积木盒子有风险保证金吗?
张良贵:@戴老我们会根据不同的风险特征,会要求渠道在授信敞口期缴纳担保金。
张良贵:国有担保没有,需要出具保函。
梁军成:@豫章文豫总是实战派的,传统的经验再加上技术和大数据分析的预判,或许会有不一样的模式出现。
王恺:@积木盒子张良贵谢谢分享,数据脱敏ppt有提到,具体如何实现?
张良贵:@耐特,数据脱敏是个重要课题,既不能影响数据深度挖掘又不能牺牲隐私安全,积木盒子还在摸索中
高莉:@积木盒子张良贵谢谢;非常精彩;全面翔实;请教对投资和项目两端单独做信用评估及与征信有关内容吗?
张良贵:@高莉,项目端是有信用评级的。
豫章文:保证金仅是加大点违约成本和为平台支撑点时间催收,在次级债中风控意义不大,实际在于推高利率。
戴星:@豫章文在依赖担保公司的风控放款下,代偿及时性就依赖保证金额度了。
豫章文:平台变相蓄了点资金池贝,但那是純负债。
王恺:@积木盒子张良贵谢谢,共同关注,请问自有,线下数据之外,第三方和互联网获取的数据主要指?如何获取?互联网数据是指网购、浏览和社交网络信息吗?
张良贵:@耐特现在各类数据公司很多,大家都在为数据大集中做着贡献,满足特定场景的数据获取还是有方法的。
戴星:@积木盒子张良贵对担保公司的评级,有几家都做了,但现在结果也不算很理想,特别是被国资坑了的情况下,有苦只能自己咽,你们风控在这时有何好招?
张良贵:@戴老风控是艺术也是科学,细节可以咨询积木盒子的首席风险官
陈锋:@积木盒子张良贵,言简意赅,逻辑封闭。谢谢分享。请教两个问题:1、从图上看,指标的分布时间间隔单位是天?这是积木系统内最低的还是中位数的还是标准的数据时间刻度?2、采集系统面向需要脱敏的数据源和公开数据源,它们的最小采集间隔一样吗?分别常规是多少?
张良贵:@陈峰,问题很专业,第一个问题,时间刻度根据运营监管需求来定,对P2P而言,天的粒度可以满足需要了,毕竟不是高频交易。第二个问题,采集要根据资源限制和需求密度,最高频到天的粒度。在大数据上我们一直在追求对欺诈和违约成本上的研判。
吴昊:@积木盒子张良贵积木盒子如何利用大数据判别违约成本?
张良贵:@吴昊违约成本将是大数据下最有价值的突破口,积木还在摸索。
李灵隐:非常感谢良贵的精彩分享!金融大数据专题月精彩更多,敬请期待!
您只需在中关村大数据产业联盟500人微信群中分享一次大数据思想、案例,即可进入500人微信群,与众多大数据朋友沟通、交流、合作!(入500人微信群,点击下方“阅读原文”链接,填写报名表,并把代表您能力和水平的PPT及姓名、单位、职务、联系方式发至bigdata@adyolo.com)
|