老王带你搞定社交网络分析II——多维宇宙行动

编辑时间: 2017-01-09 13:58:30    关键字:

 摘要:上一篇《老王带你搞定社交网络分析》走红之后,不少读者津津有味的同时还有些许意犹未尽,处座当然要趁热打铁啦!在本文中,处座将进一步与大家探讨关于社交网络(SNA)在互联网金融行业中的一些应用。(下称关系网络)

神州十一号飞船成功发射,为我国空间站的搭建做准备。而前不久,墨子号量子通信卫星成功发射,人类正式进入量子时代。

看到航天科学家都这么给力,同样身为技术精英的征信大数据工程师们怎么能甘于人后,现在我们自豪地宣布——我们已经成功地将老王发射到了宇宙。

为什么发射老王到宇宙呢?

仅仅是因为没人愿意和他做邻居吗?

NO、NO、NO

我们要做的是研究多维宇宙中老王的状态(反欺诈信息验证)和宇宙中异常现象的解析(集团欺诈侦测)以及如何在茫茫宇宙中对老王进行定位(失联修复),还有最重要的——如何避开宇宙中的危险(反欺诈)。

 

起初

 

神创造天地

地是空虚混沌

渊面黑暗

神的灵运行在水面上

神说

来个老王

于是就有了老王

按照我们这个宇宙对老王的设定,他现在是互联网金融的一位潜在客户。

在互金行业最有市场的借贷产品非“现金贷”莫属。由于其无场景、低门槛、快放款等因素吸引了众多客群,另一方面也成为欺诈分子的众矢之的,贷前身份冒用、集团欺诈,贷后信用诈骗、欠款失联,都成为目前机构风控的难题与重点,关系网络作为大数据时代下的产物能够很直观有效地帮助我们分析相关风险点,解决风控难题。

下面让我们以“宇宙中的老王”为研究对象,深入探讨以下课题。

1 多维宇宙中老王的状态——反欺诈信息验证

在贷前做好信息验证,不仅能解决身份冒用的问题,还能增加贷后失联修复点。基于大数据的信息验证的难点在于如何把不同来源的数据整合在一起,提高可验证关系人的数据范围。关系网络在一度关系上能做一个很直观的验证,但往往只基于一度关系的数据范围较小,这里我们可以利用关系网络做进一步的深度挖掘。

(1)低维宇宙——关系人验证

就老王个人来讲,我们可以把他想象成零维生物——他没有经过验证的个人信息,联系方式,人际关系,什么都没有。我们无法验证他的身份。这时,就需要引入新的维度——一个他可能认识的人小明。

二度关系及以上信息验证

从人出发回归到人,中间路径需要整合人的网络行为(设备号、IP)、金融行为(银行卡)、社交行为(手机、LBS)等等。比如网络行为中我们建立关系图谱,可以发现老王通过设备A上网,小明也通过设备A上过网,那老王和小明可能存在一定关系。

 

 

图1

通过网络行为,老王成功上升到一维宇宙。

又如社交行为中我们建立关系图谱,手机A属于老王,手机B属于小明,手机A经常与手机B通话,那老王和小明存在明显的关系。

 

 

图2

通过社交行为,老王成功上升到二维宇宙。

再比如金融行为与社交行为相结合建立关系图谱,老王通过手机A办理了车险业务,小明通过手机B办理了银行业务,后续老王又通过手机B拨打电话进行理赔报案,那老王和小明是否存在一定关系?

 

 

图3

通过金融行为,老王成功上升到三维宇宙。

关系推导

从关系出发进行推导,我们可以从已知关系链中推导出新的关系链。比如小明是老王的子女,小红也是老王的子女,那我们可以推导出小明与小红是兄妹关系。

 

 

图4

正如我们所在的三维宇宙中,生物大量繁衍……好吧这不是重点。

(2)高维宇宙——工作单位验证、家庭住址验证

除了上述关系的验证,基于二度关系及以上信息验证也能对申请表其他信息验证做一个很好的数据补充,比如老王就职于公司A,已知小刚是老王的同事,那我们可以用公司A对小刚做工作单位验证。

 

 

图5

同理,小玉是老王的配偶,已知经验证老王的家庭地址是B,那我们可以用家庭地址B对小玉做地址验证。

 

 

图6

就这样,老王通过社交网络成功上升到高维宇宙。

我们成功论证了多维宇宙中老王的状态,顺便帮老王找到了失散多年的儿子和女儿。

2 宇宙中异常现象的解析——集团欺诈侦测

茫茫宇宙中既有恒星,也有黑洞。充满了机遇,也暗藏着危险。随着传统规则引擎与风险评分的建立,在反欺诈领域个体行为模式的防范上已做到了一定的成熟度,然而道高一尺魔高一丈,金融欺诈呈现形式已从个人过渡到集团,呈现有团伙有组织的形式。关系网络能基于历史数据呈现整个诈骗团伙的关联形式,从而支持我们做进一步的团伙特征分析、建立分团模型,通过分团模型能在贷前有效识别并侦测集团欺诈与中介代办的行为。

为了让老王在宇宙中成功存活并顺利完成我们的科研项目,我们对宇宙中存在的异常现象进行了解析。

(1)星图对比——申请表逻辑检测

在失重的宇宙中遨游想要不迷失方向,当然要有星图啦。但星图也有行货和水货,要通过多张图多角度对比找出错误的星区才不会迷路。通过对N张申请表建立关系网络,可以识别一些申请表之间的信息逻辑错误。比如单位电话相同单位名称不同,如图所示小明、小刚、小强等人预留了相同的单位电话,但所填写的单位名称却大相径庭。

 

 

图7

再比如直系亲属手机号相同家庭地址不同,如图所示小明、小刚、小强等人预留了相同的直系亲属手机号,但家庭地址却不完全相同。

 

 

图8

存在这些逻辑错误的申请表构成了集团欺诈的特征,具备较高的欺诈风险,审核人员也需要格外的关注。

(2)引力探测——灰名单扩展

大质量天体之间有明显的引力作用,通过提早发现引力异常可以躲过黑洞呦。利用客群交叉进行黑名单筛选能起到风险客户过滤的作用,对很多初创平台来说是最直接最有效的方式。与信用逾期类的名单(仅依赖身份名单就可识别多次历史逾期的风险客户)不同,欺诈名单往往本身并非是个坏客户,仅从身份名单很难真正定位到纯黑的风险(可能只是因为信息泄露被骗子所利用冒用办理的业务)。所以反欺诈往往需要结合身份灰名单的同时,定位一些其他维度的名单,如IP、手机与银行账户等。通过关系网络的推导,不仅能扩充同维度的欺诈名单,更能建立出不同维度的欺诈名单。

比如通过自身业务的发展,已积累了一批高发的电信诈骗银行账户与手机号的欺诈名单,通过对已有名单建立关系网络,一度关系中与该银行账户发生来往转账的银行账户同样有涉嫌电信诈骗、洗钱的嫌疑,且这些银行账户开户申请人属于伪冒办理概率较大。二度关系中,使用该手机号办理其他业务的申请人同样存在伪冒办理的可能,这些都可作为欺诈名单的数据补充。

 

 

图9

就这样,老王在技术团队的支持下,利用火星引力加速,成功穿过了小行星带,进入木星轨道。

3 如何在茫茫宇宙中对老王进行定位——失联修复

在木星轨道运行了一段时间后,没吃晚饭的老王由于能源耗尽与地面控制中心失去了联系。好在此次实验的绝大部分设定项目已经成功进行,老王已经完成了他的历史使命——中的一部分。出于人道主义,我们还是要回收老王以便未来进行更加尖(can)端(wu)前(ren)沿(dao)的科学实验。那么如何在茫茫宇宙中对失联的老王进行准确的定位并回收呢?这就涉及到反欺诈的贷后应用。

在贷后催收的场景中,早期逾期一般采用线上催收的方式。如何提高线上催收的成功率?结合内外部数据建立关系网络及分析对应节点的触达率成了关键。失联客户本人联系不上,那是否可以尝试对关系网络进行二度关系及以上关系人的分析?手机节点的自由度越高,代表持有该号码的人的社交圈子越大,那是否也可以认为自由度越高的手机节点触达率就越高?

如下图说明,可以回答上述我们遗留的问题:关系层级越低对应节点的触达率越高,即本人持有的号码触达到本人概率最高,其联系人的号码触达到本人概率相对低。同一关系层级中,并非节点的自由度越高触达率越高,而是呈现先上升后下降的趋势,可以解释高自由度的节点可能是某个中介号码。

 

 

图10

总结

关系网络作为大数据时代下的产物,已成为当今风控技术中的一个重要组成部分。除了上述提到的在零售风控中反欺诈及贷后的应用,还有在非零售风控中的一些应用,如企业族谱、关联路径分析与供应链关系等,我们会在后续的文章中会继续讨论,敬请期待!

推荐热图

合作推荐

2010-2018 可思数据版权所有 About SYKV | ICP备案:京ICP备14056871号