问题背景
不法分子建立所谓“数字货币 DCEP 学习群” , 在群里宣传数字货币由“商业银行和私人机构同时进行推广” , 私人机构“有多层推广收益” , 使用其提供的“e-CNY”收款码就可以参与推广, 只要向朋友和其他商家推广成功, 即可获得“两层收益” 。此外, 不法分子还盗用数字人民币试点活动中的官方素材甚至编造新闻稿、 虚拟“与央行签署合作协议” 会议场景混淆视听, 骗取消费者的资金后跑路。
案例 2:
2022 年 8 月 28 日, 厦门报道, 市民郑女士报警称自己受到假警察诈骗, 利用数字人民币先后转账 8 次, 共计 4 万元。 诈骗者正是利用市民现在对于数字人民币概念的不清晰钻空子, 而且不再让受骗者直接转账到“安全账户” , 而是要求使用数字人民币。 正如郑女士一样, 很多人以为数字人民币只是虚拟交易, 不会对自己的存款造成什么影响, 另外在整个过程中, 诈骗团伙要求受害人关闭短信和定位提醒, 受害人无法在第一时间就受到金融部门的短信提醒, 并不会发觉自己的钱款已经转出。随着数字人民币普及程度逐渐提升, 以及数字人民币知识普及率的不断提升, 在数字人民币交易进入新的阶段后。 参考国外例如比特币等数字货币在交易过程中面临的各类欺诈问题, 一些新的影响范围更大、 欺诈数额更高、 更加涉及底层技术的新型欺诈形式会随之出现。
从上述图表可以看出, 当前在数字货币欺诈方面, 漏洞攻击和 Rug Pull 类型的欺诈比例较高,但是从安全事件的资金分布来看, 虚拟币案件占据绝对主导的地位。随着商业银行运用新科技开展创新转型的加速, 数字货币等线上数字金融业务在给银行带来更大创新空间, 为客户带来更加高效、 优质的金融服务的同时, 也给反欺诈带来了严峻挑战。
1.“空投糖果” 欺诈风险
“空投糖果” 行为, 原本的含义是按一定规则免费发放数字货币, 泛指在一段时间内, 大量数字货币持有者的账户中无故(或因为前期简单操作, 如注册等)多出一部分数字资产的现象。 这些数字资产的金额可能非常小, 也可能价值非常相近。本文定义的“空投糖果” 欺诈行为, 指的是部分欺诈分子, 利用数字货币账户或者虚假的欺诈 APP, 通过向将小额的优惠资金转入其他账户, 这些转账交易发起源于一个或一组数字货币账户的交易行为, 这种转账行为表现出具有一定的发散性, 随后部分贪婪的数字货币用户希望通过诸如投资数字货币等方式, 获得财富增长。 一般而言, 在取得对方账户信任后, “空投糖果” 行为的发起者可能会在用户追加投入后, 卷款跑路。
2.“贪婪注资” 欺诈风险
“贪婪注资” 行为——通常是在一定时间段内存在某个或者某几个数字货币账户收到大量转账交易的行为。 [2]这里的“贪婪”具体指代两种不同角度的“贪婪”。 一种是恶意用户通过非法的方式, 贪婪地向普通用户索取加密数字货币资产。 另一种是贪婪用户希望通过注资这种行为(如, 投资加密数字货币)来获得财富增长。
3.应用程序欺诈风险
应用程序欺骗攻击是一种常见的黑客攻击方式, 其目的是通过向目标发送伪装成可信赖应用的虚假 App , 来诱导目标下载和使用该 App 。 这种攻击常见于移动设备,通常会出现在应用商店或其他下载渠道中。 一旦目标下载和使用了虚假 App , 攻击者就可以利用虚假 App 中的漏洞或后门, 访问目标设备并执行未经授权的操作。
4.代码漏洞风险
区块链技术本身并不存在代码风险, 但因区块链技术在金融等领域的广泛应用,因此在使用区块链技术时需要特别注意代码的安全性和可靠性。 这意味着在使用区块链技术时, 应该对代码进行严格的审查和测试, 以确保其安全可靠。
作品整体思路
首先是监测前准备阶段, 我们将历史有欺诈标签的数据集进行预处理并输入到我们的有监督集成模型中进行训练, 并通过可解释性的模型评估指标对接业务人员, 从而确认初步的模型并进行部署。在监测中检测阶段, 实时的高频交易流水数据集将不断进入我们的数据库中, 对于这些大体量的无标签数据, 我们采用了孤立森林和自编码器的算法结合进行无监督学习来初步过滤, 输出高诈骗置信度的样本, 从而将大数据集转为轻量级手机输入到有监督模型中进行二次核对。在监测后模型更新阶段, 我们将对过滤出的明显异常账户进行持续监控, 确认异常后进行标签标注, 并定期更新原数据集来更新有监督模型, 从而动态适应新场景风控, 使模型具有自我迭代能力, 为反欺诈风险防御中的动态对抗问题提供了解决方案。
算法介绍
( 一) 数据介绍
采用 NuerlPS 顶刊提供 6 个不同的银行账户欺诈数据集, [10]该数据集具有 6 个 csv表格, 其中一个是基准数据表格, 其他五个是对标基准表格的在生成过程中的数据,共由 600 万条数据构成。 数据集包括欺诈检测用例中使用的 32 个真实特征; 一列“月度” , 提供有关数据集的时间信息, 一列布尔值表示是否为异常账户; 受保护的特征为年龄组、 就业状况和收入百分比; 我们的数据集是基于真实世界的匿名数据集, 且每个数据集都体现了不同的欺诈反追踪技术, 这也对我们模型的性能和稳健性提出挑战。
发表回复