说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210472746.7 (22)申请日 2022.04.29 (71)申请人 中银金融科技有限公司 地址 200120 上海市浦东 新区中国(上海) 自由贸易试验区银城中路200号4层 408室 (72)发明人 金鼎立 范文琦 戴准宇 章媛媛 陆玥全 (74)专利代理 机构 上海科盛知识产权代理有限 公司 312 25 专利代理师 蔡彭君 (51)Int.Cl. G06Q 40/02(2012.01) G06Q 40/04(2012.01) G06K 9/62(2022.01)G06N 5/00(2006.01) G06N 20/20(2019.01) (54)发明名称 一种基于 XGBoost算法的洗钱交易识别方法 及系统 (57)摘要 本发明涉及一种基于XGBoost算法的洗钱交 易识别方法及系统, 获取客户的交易数据, 将客 户交易数据送入训练好的机器学习模 型中, 机器 学习模型给出洗钱可疑度得分, 根据洗钱可疑度 得分筛选出可疑案例, 对可疑案例进行甄别; 采 用XGBoost算法构建机器学习模型, 构建包括多 组交易数据的数据集, 将数据集划分为训练集和 测试集, 训练得到机器学习模型。 与现有技术相 比, 本发明提供了一种评估客户洗钱风险的方 案, 将反洗钱与机器学习中的XGBoost算法结合 起来, 根据客户的交易数据能够给出客户的洗钱 可疑度得分, 给甄别人员提供直观的参考依据, 节省了人力, 提供了效率。 权利要求书2页 说明书6页 附图1页 CN 115222506 A 2022.10.21 CN 115222506 A 1.一种基于XGBo ost算法的洗钱交易识别方法, 其特 征在于, 包括: 获取客户的交易数据, 将客户交易数据送入训练好的机器学习模型中, 机器学习模型 给出洗钱可疑度得分, 根据洗钱可疑度得分筛 选出可疑案例, 对可疑案例进行甄别; 所述机器学习模型的建立和训练过程如下: 构建数据集, 所述数据集包括多组交易数据, 所述交易数据的标签为洗钱和非洗钱, 所 述交易数据包括多个维度的特 征; 提取与洗钱操作存在关联的可疑特征, 对可疑特征所对应的值进行数据清洗、 空缺值 填充以及标准 化处理, 对可疑特 征进行降维处 理; 将数据集划分为训练集和测试集, 采用XGBoost算法构 建机器学习模型, 并使用训练集 对机器学习模型进行训练, 使用测试集测试机器学习模型 的预测准确率, 若预测准确 率大 于预设精度阈值, 则得到训练好的机器学习模型, 否则, 利用测试集更新训练集, 对机器学 习模型进行迭代优化, 得到训练好的机器学习模型。 2.根据权利要求1所述的一种基于XGBoost算法的洗钱交易识别方法, 其特征在于, 所 述洗钱可疑度得分的取值越大, 说明该交易数据的洗钱可疑度越高, 根据洗钱可疑度得分 筛选出可疑案例具体为: 设定第一得分阈值F, 将洗钱可疑度得分大于F的交易数据作为 候选案例; 设定第一数量阈值K, 若候选案例的数量大于K, 则按洗钱可疑度 得分自高至低选择K个 候选案例作为可疑案例, 否则, 将所有的候选 案例作为可疑案例。 3.根据权利要求2所述的一种基于XGBoost算法的洗钱交易识别方法, 其特征在于, 对 可疑案例进行甄别具体为: 确定方法甄别人员的经验度, 将甄别人员划分为M个不同的等级, 确定各个等级的甄别 人员的工作量; 将可疑案例按照洗钱可疑度得分的高低 排序, 按照各个等级的甄别人员的工作量将可 疑案例划分为M个不同的案例集, 分别由对应等级的甄别人员进行甄别。 4.根据权利要求1所述的一种基于XGBoost算法的洗钱交易识别方法, 其特征在于, 构 建数据集具体为: 获取被报送的交易数据和未被报送的交易数据, 采用最邻 近重采样法对所述被报送的 交易数据进行重采样, 并加上随机扰动, 得到数据集。 5.根据权利要求1所述的一种基于XGBoost算法的洗钱交易识别方法, 其特征在于, 所 述数据标准 化处理具体为: 对可疑特征中的离散型特征对应的数据, 采用One ‑Hot重新编码; 对可疑特征中的连续 型特征对应的数据, 用L2 ‑范数标准化方法将数据按比例缩放, 去除量纲。 6.根据权利要求1所述的一种基于XGBoost算法的洗钱交易识别方法, 其特征在于, 对 可疑特征进行降维处 理具体为: 利用主成分 分析法PCA将可疑特 征进行降维。 7.一种基于XGBo ost算法的洗钱交易识别系统, 其特 征在于, 包括: 洗钱交易识别模块, 被配置为: 获取客户的交易数据, 将客户交易数据送入训练好的机 器学习模 型中, 机器学习模型给出洗钱 可疑度得分, 根据洗钱 可疑度得分筛选出可疑案例, 对可疑案例进行甄别; 模型训练模块, 被配置为: 构建数据集, 所述数据集包括多组交易数据, 所述交易数据权 利 要 求 书 1/2 页 2 CN 115222506 A 2的标签为洗钱和非洗钱, 所述交易数据包括多个维度的特 征; 提取与洗钱操作存在关联的可疑特征, 对可疑特征所对应的值进行数据清洗、 空缺值 填充以及标准 化处理, 对可疑特 征进行降维处 理; 将数据集划分为训练集和测试集, 采用XGBoost算法构 建机器学习模型, 并使用训练集 对机器学习模型进行训练, 使用测试集测试机器学习模型 的预测准确率, 若预测准确 率大 于预设精度阈值, 则得到训练好的机器学习模型, 否则, 利用测试集更新训练集, 对机器学 习模型进行迭代优化, 得到训练好的机器学习模型。 8.根据权利要求7所述的一种基于XGBoost算法的洗钱交易识别系 统, 其特征在于, 构 建数据集具体为: 获取被报送的交易数据和未被报送的交易数据, 采用最邻 近重采样法对所述被报送的 交易数据进行重采样, 并加上随机扰动, 得到数据集。 9.根据权利要求7所述的一种基于XGBoost算法的洗钱交易识别系 统, 其特征在于, 所 述数据标准 化处理具体为: 对可疑特征中的离散型特征对应的数据, 采用One ‑Hot重新编码; 对可疑特征中的连续 型特征对应的数据, 用L2 ‑范数标准化方法将数据按比例缩放, 去除量纲。 10.根据权利 要求7所述的一种基于XGBoost算法的洗钱交易识别系统, 其特征在于, 对 可疑特征进行降维处 理具体为: 利用主成分 分析法PCA将可疑特 征进行降维。权 利 要 求 书 2/2 页 3 CN 115222506 A 3
专利 一种基于XGBoost算法的洗钱交易识别方法及系统
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-18 16:59:30
上传分享
举报
下载
原文档
(370.4 KB)
分享
友情链接
ISO IEC 10165-5 1994 Information technology — Open Systems Interconnection — Structure of management information Generic management information.pdf
ISO IEC 24800-4 2010 Information technology — JPSearch — Part 4 File format for metadata embedded in image data (JPEG and JPEG 2000).pdf
ISO 458-2-1985Plastics. Determination of stiffness in torsion of flexible materials. Part 2_Applicat.pdf
ISO 7201-2-1991Fire extinguishing media. Halogenated hydrocarbons. Part 2_Code of practice for safe.pdf
ISO 21232 2018 Textiles — Determination of moisturizing effect of textile materials by measurement of microclimate between textiles and simulated human skin using sweating guarded hotplate.pdf
ISO-PAS 22101-5 2024 Polyethylene reinforced with short glass fibres (PE-sGF) piping systems for industrial applications Part 5 Fitness for purpose of the system.pdf
ISO 558 1980 Conditioning and testing — Standard atmospheres — Definitions.pdf
ISO 10106 2021 Cork stoppers — Determination of global migration.pdf
ISO 22910 2020 Corrosion of metals and alloys Measurement of the electrochemical critical localized corrosion temperature (E-CLCT) for Ti alloys fabricated via the additive manufacturing method.pdf
ISO 6929 2013 Steel products — Vocabulary.pdf
GB-T 783-2013 起重机械 基本型的最大起重量系列.pdf
GB-T 15636-2008 电离辐射厚度计.pdf
GB-T 14699-2023 饲料 采样.pdf
GB-T 25399-2010 农林拖拉机和机械 液压接头 制动回路.pdf
GB-T 17626.15-2011 电磁兼容 试验和测量技术 闪烁仪 功能和设计规范.pdf
GB-T 15695-2008 信息技术 开放系统互连 表示服务定义.pdf
GB-T 4440-2022 活扳手.pdf
GB-T 3099.3-2017 紧固件术语 表面处理.pdf
GB-T 5117-2012 非合金钢及细晶粒钢焊条.pdf
GB-T 10561-2005 钢中非金属夹杂物含量的测定--标准评级图显微检验法.pdf
1
/
3
10
评价文档
赞助1.5元 点击下载(370.4 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。