当前位置:首页>财经

sna-“有人的地方就有江湖,有江湖的地方就可用SNA”

日期:2024-01-14

来源:玫瑰财经网

浏览:

    “有人的地方就有江湖,有江湖的地方就可用SNA”

    A6工作室魏然

    一起研究理赔科技

    上一篇文章限于篇幅和成文仓促,对SNA的操作应用没有展开讨论。文章发出以后,收到了很多朋友的咨询,也有朋友在留言里表达了进一步了解具体应用的想法。在此,我就朋友们集中关心的几个问题写一篇文章,欢迎朋友们留言或是私信我(微信:singlelensjourney,邮箱:2412801654@qq.com),展开进一步交流研讨。

    “有人的地方就有江湖,有江湖的地方就可用SNA”

    Q:SNA可以用于哪些类型案件的排查

    A:目前已经应用在车险已、未决案件的排查中,包括单、双方、多方交通事故,人伤、物损案件,均可应用SNA排查是否存在团伙作案。“有人的地方就有江湖,有江湖的地方就可用SNA”

    Q:在实际的理赔反欺诈工作中,如何应用SNA

    A:首先明确一点,SNA针对的是团伙作案,“独狼”型诈保分子不在我们研究的范畴。其次要明确的是,保险欺诈团伙与微博、Twitter等社交网络构成不同。后者仅由人构成,而前者除了人以外,至少还包括车。也就是说,我们面对的是一个多维度的社交网络。明确了这两点,我们来看如何应用SNA来梳理并分析这个网络。要解决如何应用SNA的这个问题,我们先来建立一个保险欺诈团伙模型,分析研究一下诈保团伙的业务模式。从诈保团伙的角度看,如何实施保险诈骗,一个诈保团伙(一个群体)需要哪些组成因子(节点),在剔除掉所有不关键因素后,还能剩下的必然是诈保团伙运转的必要条件,既是诈保团伙的“核心竞争力”。我的模型中,一个诈保团伙,必备的因子有以下几种:

    1、人

    毋庸置疑的,人,是一个诈保团伙的基础因子,是构成诈保团伙的充分必要条件,也是车险理赔反欺诈场景中必备的第一个因子。报案电话需要人来拨打,事故车辆需要人去驾驶,索赔申请书需要人去签字,骗到手的赔款也需要人去银行领取。不同的人在团伙中扮演了不同的角色,而这些人在团伙中具备相同的属性——一旦参与了保险欺诈,这个人就是团伙(群体)中的一个节点。既然是团伙作案,成员之间存在分工协作的关系,这个人(节点)必然会与其他节点发生联系(节点之间的关系)。通过人的聚集,和不同人之间的联系,我们现在得到了SNA的两个基础组成部分:节点(团伙成员)和边(成员之间的关系)。一个理想化网络模型如下图所示。我们的目的是从这些人当中分析,哪些人构成了一个团伙。

    “有人的地方就有江湖,有江湖的地方就可用SNA”

    2、车

    作为车险理赔反欺诈场景中,必不可少的第二个因子,车在保险公司角度是作为保险标的存在,而在欺诈分子角度,是作为必备的作案工具存在。我们把车辆加入的网络模型中去:

    “有人的地方就有江湖,有江湖的地方就可用SNA”

    3、电话

    当今社会,人的种种社会行为都已经离不开手机,社交、工作、休闲、三餐都要依靠手机来传递信息、获取信息。基于手机与人的这种高度绑定,手机号也成为了几乎等同于身份证号的存在。在保险索赔行为中,报案、联络、身份认证均依靠手机/号开展,故而我们要在模型中加入手机,如下图所示。

    “有人的地方就有江湖,有江湖的地方就可用SNA”

    我们为每个因子编号,得到下表。

    “有人的地方就有江湖,有江湖的地方就可用SNA”

    现在,我们来假设每个人在报案清单中均出现过5次,甲4驾驶A8、甲6驾驶A8、甲8驾驶A4各出过一次险,其余均为本人驾驶本车出险,共50笔报案,形成如下报案清单。

    “有人的地方就有江湖,有江湖的地方就可用SNA”

    之所以如此假设报案清单,基于这样的考虑:1.每人5次出险,各车出险次数差异不大,消除掉出险次数对结论的影响;2.模拟实际中出现的情况,既从表面来看各人、各车风险程度差异不大。此为理想环境,实际中的报案清单不会如此规律、完美,还需要经过数据清洗、数据回填,下文会单独介绍。下面来用我们的SNA引擎跑一下数据,看看会出现何种结论,见下图。

    “有人的地方就有江湖,有江湖的地方就可用SNA”

    注意第三列介数集中度(BetweennessCentrality)这个指标,在前文中我们介绍过,这个指标表示有多少个节点通过本节点实现最短互联,在本例中的意义是表示有多少人、车通过本人(车)实现最短互联,既是作为团伙核心节点出现。介数集中度最高的点是A8,节点甲6、甲8、甲4均通过A8实现最短互联,这四个节点构成一个团伙。至此,我们运用SNA成功找到了报案清单中的团伙。

    团伙构成如下图所示。

    “有人的地方就有江湖,有江湖的地方就可用SNA”“有人的地方就有江湖,有江湖的地方就可用SNA”

    Q:已决清单中的数据准确度不高,会在多大程度上影响SNA的应用

    A:还是借用上面的例子来分析这个问题。不难看出,除了团伙成员甲8、A8、甲6、甲4、A4以外的其他数据,介数集中度均为0,那么这些数据的准确与否对我们排查团伙的影响不大。对排查团伙准确性影响较大的是团伙成员本身的数据准确性。首先,在实际操作中,我们通过数据清洗、数据回填,可以有效地提高数据准确度。其次,当团伙中少数成员数据错误时,整个团伙的集中度会有所改变,但未必会被拆散,仍会表现为一个不那么紧凑的团伙。当模型中缺少关键数据后,会得到何种结论呢模型中的案件21包含了两个团伙成员,甲4、A8,我们在模型中删掉关键数据案件21,重新运行SNA算法,如下图所示。

    “有人的地方就有江湖,有江湖的地方就可用SNA”

    可见,部分关键数据的缺失,对我们排查团伙造成的影响并不大,也就是说,SNA具备相当的容错率,在部分数据录入错误时仍能精准定位团伙成员。

    第三,若团伙中大多数成员数据错误时,这个团伙大概率会被拆散成数个小团伙,扔能够具备团伙的特征,从而被发现。除非当全部关键成员或绝大多数成员数据错误,从而导致无法形成一个松散团伙时,一般情况下少部分数据错误对最终排查结果影响不大,仍有较大可能通过数据处理发掘全部团伙成员。我们在模型中继续删除部分关键数据。这次,我们删除案件31,包含了甲6、A8两个关键数据,重新运行SNA,得到如下结论。

    “有人的地方就有江湖,有江湖的地方就可用SNA”

    要知道,此时我们已经删除了3个关键数据中的两个。在缺失了大半的关键数据后,我们仍能定位该团伙核心成员。

相关文章阅读

Copyright (c) 2022 玫瑰财经网 版权所有

备案号:冀ICP备17019481号

玫瑰财经网发布此信息的目的在于传播更多信息,与本站立场无关。玫瑰财经网不保证该信息(包含但不限于文字、视频、音频、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。
相关信息并未经过本网站证实,不对您构成任何投资建议,据此操作,风险自担。