(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111435425.1
(22)申请日 2021.11.29
(71)申请人 平安银行股份有限公司
地址 518000 广东省深圳市罗湖区深南 东
路5047号
(72)发明人 季德志
(74)专利代理 机构 深圳市赛恩倍吉知识产权代
理有限公司 4 4334
代理人 陈海云 严林
(51)Int.Cl.
G06F 16/2458(2019.01)
G06F 16/28(2019.01)
G06N 20/00(2019.01)
(54)发明名称
基于人工智能的特征数据提取方法、 装置及
相关设备
(57)摘要
本发明涉及大数据技术领域, 提供一种基于
人工智能的特征数据提取方法、 装置及相关设
备, 所述方法包括: 根据数据仓库类型及预设的
加工引擎对流水型数据集进行逻辑加工, 生成目
标流水型数据集; 对目标流水型数据集进行第一
预处理及第二预处理, 得到第二特征数据集; 对
第二特征数据集进行一阶衍生, 得到第三特征数
据集; 采用预设的多个评价体系对第三特征数据
集中的每个特征数据进行特征评分, 得到每个特
征数据的多个特征评分值后进行特征数据提取,
得到特征数据提取结果。 本发明通过采用预设的
多个评价体系对每个特征数据进行特征评分后
进行特征数据提取, 筛选出有效特征, 提高了特
征数据提取的准确率和有效性。
权利要求书2页 说明书14页 附图2页
CN 114138864 A
2022.03.04
CN 114138864 A
1.一种基于人工智能的特 征数据提取 方法, 其特 征在于, 所述方法包括:
解析接收的特征数据提取请求, 获取流水型数据集及所述流水型数据集对应的数据仓
库类型;
根据所述数据仓库类型及预设的加工引擎对所述流水型数据集进行逻辑加工, 生成 目
标流水型数据集;
对所述目标流水 型数据集进行第一预处 理, 得到第一特 征数据集;
对所述第一特 征数据集进行第二预处 理, 得到第二特 征数据集;
采用预设的一阶衍生算法对所述第二特征数据集进行一阶衍生, 得到第三特征数据
集;
采用预设的多个评价体系对所述第 三特征数据集中的每个特征数据进行特征评分, 得
到每个所述特 征数据的多个特 征评分值;
基于每个所述特征数据的多个特征评分值, 对所述第三特征数据集进行特征数据提
取, 得到所述特 征数据提取请求的特 征数据提取 结果。
2.如权利要求1所述的基于人工智能的特征数据提取方法, 其特征在于, 所述根据 所述
数据仓库类型及预设的加工引擎对所述流水型数据集进行逻辑加工, 生成目标流水型数据
集包括:
从所述特 征数据提取请求中的配置要求中获取模板标识码;
基于所述模板标识码获取对应的配置模板, 根据所述配置模板选择聚合主键、 日期字
段、 数值字段和字符字段;
基于所述聚合主键、 日期字段、 数值字段和字符字段对所述流水型数据集进行配置, 得
到流水型数据集;
根据所述数据仓库类型及预设的加工引擎自动 生成加工逻辑, 并采用所述加工逻辑对
所述流水型数据集进行逻辑加工, 生成目标流水 型数据集。
3.如权利要求1所述的基于人工智能的特征数据提取方法, 其特征在于, 所述对所述目
标流水型数据集进行第一预处 理, 得到第一特 征数据集包括:
根据预设的多个第 一字段类型对所述目标流水型数据集进行第 一次划分, 得到预设的
每个所述第一字段类型的子数据集;
采用预设的每个所述第一字段类型对应的算子对预设的每个所述第一字段类型的子
数据集中的每 个子数据进行算子加工, 得到预设的每 个所述第一字段类型的特 征数据集;
对所述预设的多个第 一字段类型的多个特征数据集进行合并, 并将合并后的多个特征
数据集确定为第一特 征数据集。
4.如权利要求1所述的基于人工智能的特征数据提取方法, 其特征在于, 所述对所述第
一特征数据集进行第二预处 理, 得到第二特 征数据集包括:
根据预设的多个第 二字段类型对所述第 一特征数据集进行第 二次划分, 得到预设的每
个所述第二字段类型的第二特征子数据集, 并将所述预设的多个第二字段类型对应的多个
第二特征子数据确定为第二特 征数据集。
5.如权利要求1至4中任意一项所述的基于人工智能的特征数据提取方法, 其特征在
于, 所述采用预设的一阶衍生算法对所述第二特征数据集进行一 阶衍生, 得到第三特征数
据集包括:权 利 要 求 书 1/2 页
2
CN 114138864 A
2从所述第二特 征集中提取 预设的每 个所述第二字段类型的第二特 征子数据集;
采用预设的每个所述第二字段类型对应的一阶衍生算法对对应预设的每个所述第二
字段类型的第二特征子数据集中的每个特征子数据进 行一阶衍生, 得到预设的每个所述第
二字段类型的第三特 征子数据集;
对所述预设的多个第 二字段类型的多个第 三特征子数据集进行合并, 并将合并后的多
个第三子数据集, 确定为第三特 征数据集。
6.如权利要求1所述的基于人工智能的特征数据提取方法, 其特征在于, 所述基于每个
所述特征数据的多个特征评分值, 对所述第三特征数据集进行特征数据提取, 得到所述特
征数据提取请求的特 征数据提取 结果包括:
采用预设的加权算法对所述第三特征数据集中的每个所述特征数据的多个特征评分
值进行加权计算, 得到每 个所述特 征数据的加权值;
从计算得到的加权值中选取加权值较大的多个特征数据, 确定为所述特征数据提取请
求的特征数据提取 结果。
7.如权利要求5所述的基于人工智能的特征数据提取方法, 其特征在于, 所述预设的第
一字段类型包括数值字段类型, 类别字段类型和日期字段类型, 所述预设的第二字段类型
包括数值型和字符型。
8.一种基于人工智能的特 征数据提取装置, 其特 征在于, 所述装置包括:
解析和获取模块, 用于解析接收的特征数据提取请求, 获取流水型数据集及所述流水
型数据集对应的数据仓库类型;
逻辑加工模块, 用于根据所述数据仓库类型及预设的加工引擎对所述流水型数据集进
行逻辑加工, 生成目标流水 型数据集;
第一预处理模块, 用于对所述目标流水型数据集进行第一预处理, 得到第一特征数据
集;
第二预处 理模块, 用于对所述第一特 征数据集进行第二预处 理, 得到第二特 征数据集;
一阶衍生模块, 用于采用预设的一阶衍生算法对所述第二特征数据集进行一阶衍生,
得到第三特 征数据集;
评分模块, 用于采用预设的多个评价体系 对所述第 三特征数据集中的每个特征数据进
行特征评分, 得到每 个所述特 征数据的多个特 征评分值;
提取模块, 用于基于每个所述特征数据的多个特征评分值, 对所述第三特征数据集进
行特征数据提取, 得到所述特 征数据提取请求的特 征数据提取 结果。
9.一种电子设备, 其特征在于, 所述电子设备包括处理器和存储器, 所述处理器用于执
行所述存储器中存储的计算机程序时实现如权利要求1至7中任意一项所述的基于人工智
能的特征数据提取 方法。
10.一种计算机可读存储介质, 所述计算机可读存储介质上存储有计算机程序, 其特征
在于, 所述计算机程序被处理器执行时实现如权利要求 1至7中任意一项 所述的基于人工智
能的特征数据提取 方法。权 利 要 求 书 2/2 页
3
CN 114138864 A
3
专利 基于人工智能的特征数据提取方法、装置及相关设备
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 01:21:22上传分享