龙空技术网

反欺诈手段简述

AI算法程序媛 331

前言:

现在我们对“fast greedy 算法”大体比较注意,兄弟们都想要了解一些“fast greedy 算法”的相关知识。那么小编在网上搜集了一些对于“fast greedy 算法””的相关知识,希望大家能喜欢,朋友们快快来学习一下吧!

最近在做风控 评分卡相关,关于反欺诈这块,先分享个内容,链接如下:

反欺诈手段简述

1.申请人真实性验证

常用的特征模块有面部识别、身份证二要素、银行卡三要素等。这一步基本上是一切互联网信贷行为的基础,只有确认了“你”是“你”,才会开展后续的业务。

2.黑白名单

黑白名单是最原始的反欺诈手段。黑名单的优缺点十分明显,优点就是简单方便,各行各业各产品的反欺诈都可以用黑名单,缺点就是无法发现新骗子。

3.规则引擎

黑名单的升级版本就是规则引擎。如:

1. 连续退货5次的用户,拒绝其购买退货险;

2. 退货比例超过80%,拒绝其再次购买退货险。

这相比于黑名单,可以检测到新的欺诈者,算是进了一大步。但是,规则引擎却无法检测到新的欺诈模式。

规则引擎的规则是如何生成的?答案是:经验!正因为经验的不确定性,规则通常需要投入大量的精力维护,不断更新、修改、删除等等,否则就会造成大量的误杀和漏报。

随着技术手段的增加,以及三方数据尤其是电商数据的丰富,以前很难使用的地址信息也可以放进规则引擎中,如下:

4.有监督学习

有监督学习是应用最为广泛的反欺诈方法。有监督学习通常需要大量的有标签数据来训练模型,以此来预测还未被标注的数据。

有监督学习的好处十分明显,它可以帮我们分析隐层关系。我们可以不必知道到底有监督是如何做分析的,每一个子项被赋予了多少权重,我们只需要知道符合某种规则的就是坏人。此外,有监督还有助于处理多维数据。由于规则是人凭经验产生了,而如果老板丢给你一组数据,每一条数据都有多达500个字段,让你凭肉眼看出其中的关系,你恐怕要抓狂了。此时,有监督就可以解决你的问题了。

但有监督也有一个明显的弊端,每一个模型都需要大量的训练数据,训练一个模型也需要较长的时间。现在的骗子是何其聪明啊,到处打游击战。在你发现有入侵者后,你立马开始训练模型,然而,再你还没有训练好,骗子们可能就已经离开,开始找下一个目标了。如此,有监督便无法应对复杂多变,诡计多端的欺诈者了。

5.无监督学习

近年来,无监督为反欺诈打开了新大门,主要原理为异常值检测。无监督无需任何训练数据和标签,通过标记正常用户的共性行为,用来发现异常用户。

无监督算法应用于反欺诈检测,通常还有一个优势,那就是提前预警。现在聪明的骗子都知道要潜伏一段时间再发起攻击,以免太容易被发现。而由于其在潜伏期的行为依然符合某种规律,具有某些一致性,所以同样还是会无监督算法捕捉到。在攻击发生前就指认骗子,这一点,其他三种方法恐怕是望尘莫及!这也是无监督之所以在反欺诈检测大放光彩的重要原因之一。

6.网络图谱

一种思路是通过识别紧密关联的社群结构找出潜在的欺诈客群,常用的社群挖掘方法有Walktrap, InfoMap, FastGreedy 等。

上面的左图是正常用户的行为网络图谱:不同设备的行为是分散的,不一致的。而右边是欺诈团伙的行为网络图谱。在网络图谱上,欺诈团伙的设备行为会呈现出高度的一致性和集中性。

一般来说,识别欺诈团伙需要用到设备指纹,比如:设备关联多少个手机号,设备关联多少个身份证,手机关联多少个设备,IP是否是异常IP,登陆IP数等;

另一种思路是通过好坏用户的网络关系进行传播,可以使用标签传播算法(Label Propagation),传染病学模型(SIR Model), 以及概率图模型(MRF, CRF等)。比如团伙中有多少个逾期,一度联系人里面有多少个预期,二度联系人有多少预期,一度联系人里面黑名单数量,二度联系人黑名单数,团伙中是否命中黑中介。

后续把自己在实际场景业务中的反欺诈体会 发布上来

标签: #fast greedy 算法