(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111172041.5
(22)申请日 2021.10.08
(71)申请人 北京淇瑀信息科技有限公司
地址 100012 北京市朝阳区双营路1 1号院3
号楼2层4单元207
(72)发明人 沈赟 朱维娜
(74)专利代理 机构 北京清诚知识产权代理有限
公司 11691
代理人 何怀燕
(51)Int.Cl.
G06N 20/00(2019.01)
G06Q 10/06(2012.01)
G06Q 40/02(2012.01)
(54)发明名称
基于安装列表的数据安全评估方法、 装置、
设备和介质
(57)摘要
本发明涉及数据信息处理领域, 旨在解决如
何稳定准确高效完成数据安全评估的技术问题。
为此, 本发 明提供了一种基于安装列表的数据安
全评估方法、 装置、 电子设备及介质。 通过建立并
训练存量用户的授信风险模型, 由所述模型使用
存量用户的终端的APP安装列表信息等数据、 以
及存量用户在金融机构业务平台的历史表现数
据来评估其授信风险; 获取与新用户关联的终端
的APP安装列表信息; 将所述新用户终端的APP安
装列表信息输入 所述训练好的授信风险模型, 计
算所述用户的TFIDF指数。 从而能够稳定准确高
效完成对数据安全的评估, 进而可以评估用户的
授信风险、 保障数据的安全性、 可靠性、 增加可信
度。
权利要求书3页 说明书13页 附图3页
CN 113902126 A
2022.01.07
CN 113902126 A
1.一种基于安装列表的数据安全评估方法, 其特 征在于, 包括:
建立并训练存量用户的授信风险模型, 其中, 所述模型使用存量用户的终端的应用程
序APP安装列表信息、 以及存量用户在业务平台的历史表现数据来评估其对应的授信数据
的安全;
获取与新用户关联的终端的AP P安装列表信息;
将所述新用户终端的APP安装列表信息输入训练好的所述授信风险模型, 计算所述新
用户的词频 ‑逆文本频率TFIDF指数, 以确定所述 新用户对应的授信数据的安全。
2.如权利要求1所述的方法, 其特征在于: 所述建立并训练存量用户的授信风险模型,
其中, 所述模 型使用存量用户的终端的APP安装列 表信息、 以及 存量用户在业务平台的历史
表现数据来评估其对应的授信数据的安全, 具体包括:
获取预设数量的已知授信数据的存量用户, 以及获取所述存量用户的终端内安装的
APP安装列表信息, 作为所述模型的训练样本对所述模型训练;
其中, 所述模型评估授信数据的安全具体包括:
获取所述存量用户的与用户关联的历史表现数据;
根据每一APP的安装覆盖用户数、 以及获取的与用户关联的历史表现数据, 计算每一
APP的逾期指标贡献;
根据每一所述存量用户安装的APP安装列表信息, 以及列表上每一APP的逾期指标贡
献, 计算所述存量用户的TFIDF指数。
3.如权利要求2所述的方法, 其特征在于: 所述根据每一APP的安装覆盖用户数、 以及获
取的与用户关联的历史表现数据, 计算每一AP P的逾期指标贡献, 具体包括:
获取安装APP的短期逾期命中用户数、 短期逾期命中的所有用户数、 安装APP的所有用
户数;
根据安装APP的短期逾期命中用户数和短期逾期命中的所有用户数计算该APP的第一
短期逾期 指标贡献;
根据安装APP的所有用户数和安装APP的短期逾期命中用户数计算该APP的第二短期逾
期指标贡献;
获取安装AP P的中期逾期命中用户数和中期逾期命中的所有用户数;
根据安装APP的中期逾期命中用户数和中期逾期命中的所有用户数计算该APP的第一
中期逾期 指标贡献;
根据安装APP的所有用户数和安装APP的中期逾期命中用户数计算该APP的第二中期逾
期指标贡献;
获取安装AP P的长期逾期命中用户数和长期逾期命中的所有用户数;
根据安装APP的长期逾期命中用户数和长期逾期命中的所有用户数计算该APP的第一
长期逾期 指标贡献;
根据安装APP的所有用户数和安装APP的长期逾期命中用户数计算该APP的第二长期逾
期指标贡献;
根据第一短期逾期指标贡献、 第 二短期逾期指标贡献、 第 一中期逾期指标贡献、 第二中
期逾期指标贡献、 第一长期逾期指标贡献和第二长期逾期指标贡献计算APP的逾期指标贡
献;权 利 要 求 书 1/3 页
2
CN 113902126 A
2其中, 所述短期逾期对应的时间段的时长小于所述中期逾期对应的时间段的时长; 所
述中期逾期对应的时间段的时长小于所述长期逾期对应的时间段的时长 。
4.如权利要求3所述的方法, 其特征在于: 所述根据每一存量用户安装的APP列表, 以及
列表上每一AP P的逾期指标贡献, 计算该存量用户的TFIDF指数, 具体包括:
根据所述第一短期逾期指标贡献和所述第二短期逾期指标贡献计算APP第一逾期贡
献;
根据所述第一中期逾期指标贡献和所述第二中期逾期指标贡献计算APP第二逾期贡
献;
根据所述第一长期逾期指标贡献和所述第二长期逾期指标贡献计算APP第三逾期贡
献;
对所述APP第一逾期贡献、 APP第二逾期贡献和APP第三逾期 贡献计算得到APP的逾期指
标贡献;
根据分别得到的每个APP的逾期指标贡献以及所述存量用户安装的APP安装列表信息,
计算所述存量用户的TFIDF指数。
5.根据权利要求2 ‑4任一项所述的方法, 其特征在于, 所述获取预设数量的已知授信数
据的存量用户, 以及获取所述存量用户的终端内安装的APP安装列表信息, 作为所述模型的
训练样本, 还 包括:
对所述AP P安装列表信息进行 预处理。
6.根据权利要求5所述的方法, 其特征在于: 所述对APP安装列表进行预处理, 具体包
括:
若任一APP的安装人数小于第一预定阈值, 则将所述任一APP从所述APP安装列表信息
中剔除;
和/或,
若任一存量用户的终端的APP安装列表信息中的APP数量小于第二预定阈值, 则删除所
述任一存量用户以及对应的终端内安装的AP P安装列表信息 。
7.一种基于安装列表的数据安全评估 装置, 其特 征在于, 包括:
模型构建模块, 用于建立并训练存量用户的授信风险模型, 其中, 所述模型使用存量用
户的终端的应用程序APP安装列表信息、 以及存量用户在业务平台的历史表现数据来评估
其对应的授信数据的安全; 终端
获取模块, 用于获取与新用户关联的终端的AP P安装列表信息;
评估模块, 用于将所述新用户终端的APP安装列表信息输入所述训练好的授信风险模
型, 计算所述新用户的词频 ‑逆文本频率TFIDF指数, 以确 定所述新用户对应的授信数据的
安全。
8.如权利要求7 所述的装置, 其特 征在于: 模型构建模块, 具体包括:
获取预设数量的已知授信数据的存量用户, 以及获取所述存量用户的终端内安装的
APP安装列表信息, 作为所述模型的训练样本对所述模型训练;
其中, 所述模型评估授信数据的安全具体包括: 获取所述存量用户的与用户关联的历
史表现数据; 根据每一APP的安装覆盖用户数、 以及获取的与用户关联的历史表现数据, 计
算每一APP的逾期指标贡献; 根据每一所述存量用户安装的APP列表, 以及列表上每一APP的权 利 要 求 书 2/3 页
3
CN 113902126 A
3
专利 基于安装列表的数据安全评估方法、装置、设备和介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 02:01:51上传分享