反欺诈手段简述

AI算法程序媛 07-07 333

前言：

现在我们对“fast greedy 算法”大体比较注意，兄弟们都想要了解一些“fast greedy 算法”的相关知识。那么小编在网上搜集了一些对于“fast greedy 算法””的相关知识，希望大家能喜欢，朋友们快快来学习一下吧！

最近在做风控评分卡相关，关于反欺诈这块，先分享个内容，链接如下：

反欺诈手段简述

1．申请人真实性验证

常用的特征模块有面部识别、身份证二要素、银行卡三要素等。这一步基本上是一切互联网信贷行为的基础，只有确认了“你”是“你”，才会开展后续的业务。

2．黑白名单

黑白名单是最原始的反欺诈手段。黑名单的优缺点十分明显，优点就是简单方便，各行各业各产品的反欺诈都可以用黑名单，缺点就是无法发现新骗子。

3．规则引擎

黑名单的升级版本就是规则引擎。如：

1. 连续退货5次的用户，拒绝其购买退货险；

2. 退货比例超过80%，拒绝其再次购买退货险。

这相比于黑名单，可以检测到新的欺诈者，算是进了一大步。但是，规则引擎却无法检测到新的欺诈模式。

规则引擎的规则是如何生成的？答案是：经验！正因为经验的不确定性，规则通常需要投入大量的精力维护，不断更新、修改、删除等等，否则就会造成大量的误杀和漏报。

随着技术手段的增加，以及三方数据尤其是电商数据的丰富，以前很难使用的地址信息也可以放进规则引擎中，如下：

4．有监督学习

有监督学习是应用最为广泛的反欺诈方法。有监督学习通常需要大量的有标签数据来训练模型，以此来预测还未被标注的数据。

有监督学习的好处十分明显，它可以帮我们分析隐层关系。我们可以不必知道到底有监督是如何做分析的，每一个子项被赋予了多少权重，我们只需要知道符合某种规则的就是坏人。此外，有监督还有助于处理多维数据。由于规则是人凭经验产生了，而如果老板丢给你一组数据，每一条数据都有多达500个字段，让你凭肉眼看出其中的关系，你恐怕要抓狂了。此时，有监督就可以解决你的问题了。

但有监督也有一个明显的弊端，每一个模型都需要大量的训练数据，训练一个模型也需要较长的时间。现在的骗子是何其聪明啊，到处打游击战。在你发现有入侵者后，你立马开始训练模型，然而，再你还没有训练好，骗子们可能就已经离开，开始找下一个目标了。如此，有监督便无法应对复杂多变，诡计多端的欺诈者了。

5．无监督学习

近年来，无监督为反欺诈打开了新大门，主要原理为异常值检测。无监督无需任何训练数据和标签，通过标记正常用户的共性行为，用来发现异常用户。

无监督算法应用于反欺诈检测，通常还有一个优势，那就是提前预警。现在聪明的骗子都知道要潜伏一段时间再发起攻击，以免太容易被发现。而由于其在潜伏期的行为依然符合某种规律，具有某些一致性，所以同样还是会无监督算法捕捉到。在攻击发生前就指认骗子，这一点，其他三种方法恐怕是望尘莫及！这也是无监督之所以在反欺诈检测大放光彩的重要原因之一。

6．网络图谱

一种思路是通过识别紧密关联的社群结构找出潜在的欺诈客群，常用的社群挖掘方法有Walktrap, InfoMap, FastGreedy 等。

上面的左图是正常用户的行为网络图谱：不同设备的行为是分散的，不一致的。而右边是欺诈团伙的行为网络图谱。在网络图谱上，欺诈团伙的设备行为会呈现出高度的一致性和集中性。

一般来说，识别欺诈团伙需要用到设备指纹，比如：设备关联多少个手机号，设备关联多少个身份证，手机关联多少个设备，IP是否是异常IP，登陆IP数等；

另一种思路是通过好坏用户的网络关系进行传播，可以使用标签传播算法(Label Propagation)，传染病学模型(SIR Model), 以及概率图模型(MRF, CRF等)。比如团伙中有多少个逾期，一度联系人里面有多少个预期，二度联系人有多少预期，一度联系人里面黑名单数量，二度联系人黑名单数，团伙中是否命中黑中介。

后续把自己在实际场景业务中的反欺诈体会发布上来

本文地址：http://www.longkongtuishu.com/ca4c1BA1sBFAGAFFX.html

标签： #fast greedy 算法

反欺诈手段简述

跨域推荐技术在58部落内容社区的实践

反欺诈手段简述