说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202111631123.1 (22)申请日 2021.12.2 9 (65)同一申请的已公布的文献号 申请公布号 CN 113986956 A (43)申请公布日 2022.01.28 (73)专利权人 深圳红途科技有限公司 地址 518000 广东省深圳市南 山区粤海街 道滨海社区滨海 大道3398号赛西科技 大厦17层170 6房 (72)发明人 肖茂林 刘新凯  (74)专利代理 机构 深圳市精英专利事务所 44242 代理人 李燕娥 (51)Int.Cl. G06F 16/245(2019.01)G06N 3/08(2006.01) (56)对比文件 US 20213 34955 A1,2021.10.28 审查员 胡武扬 (54)发明名称 数据异常查询分析方法、 装置、 计算机设备 及存储介质 (57)摘要 本发明实施例公开了数据异常查询分析方 法、 装置、 计算机设备及存储介质。 所述方法包 括: 获取数据库的查询请求和应用系统的接口访 问信息, 以得到查询请求数据; 根据所述查询请 求数据判断所述应用系统的接口是否含有用户 账号信息; 若所述应用系统的接口不含有用户账 号信息, 则获取数据库返回的数据内容; 判断所 述数据内容是否存在个人隐私数据; 若所述数据 内容存在个人隐私数据, 则生 成存在无账号个人 隐私数据异常查询风险信息。 通过 实施本发明实 施例的方法可实现能够准确有效识别应用系统 无账号状态下的个人隐私数据异常查询行为。 权利要求书3页 说明书11页 附图6页 CN 113986956 B 2022.03.25 CN 113986956 B 1.数据异常查询分析 方法, 其特 征在于, 包括: 获取数据库的查询请求和应用系统的接口访问信息, 以得到查询请求数据; 根据所述 查询请求数据判断所述应用系统的接口是否含有用户账号信息; 若所述应用系统的接口不含有用户账号信息, 则获取 数据库返回的数据内容; 判断所述数据内容是否存在个人隐私数据; 具体地, 将所述数据内容输入至识别模型 内进行个人隐私数据识别, 以得到识别结果; 将所述数据内容与预设的数据识别策略进行 匹配, 以得到匹配分值; 根据所述匹配分值以及所述识别结果确定数据类别; 判断所述数据 类别是否是个人隐私数据; 若 所述数据类别是个人隐私数据, 则输出所述数据类别; 若所述 数据类别不是个人隐私数据, 则输出 所述数据内容 不属于个人隐私数据的信息; 所述识别模型是通过若干个带有个人隐私数据具体类型标签的数据作为样本集且采 用多GPU并行计算框架对深度学习网络进行训练所 得的; 所述识别模型是通过若干个带有个人隐私数据具体类型标签的数据作为样本集且采 用多GPU并行计算框架对深度学习网络进行训练所 得的, 可包括: 获取若干个带有个人隐私数据具体类型标签的数据, 以得到样本集, 且将所述样本集 划分为训练集; 训练集是指由样本集划分出来用于训练模型的数据集; 构建ResNet深度学习网络; 将所述训练集装载到多个GPU节点, 以进行梯度求 导, 得到所有节点的求 导结果; 对所有节点的求导结果进行加权平均并更新ResNet深度学习网络的网络参数, 同步更 新所有GPU节点; 判断所述ResNet深度学习网络是否收敛; 若所述ResNet深度学习网络收敛, 则确定所述ResNet深度学习网络为识别模型; 若所述ResNet深度学习网络未收敛, 则执行所述将所述训练集装载到多个GPU节点, 以 进行梯度求 导, 得到所有节点的求 导结果; 若所述数据内容存在个人隐私数据, 则生成存在无账号个人隐私数据异常查询风险信 息。 2.根据权利要求1所述的数据异常查询分析方法, 其特征在于, 所述生成存在无账号个 人隐私数据异常查询风险信息之后, 还 包括: 对所述数据内容中的个人隐私数据进行分析, 结合预警规则进行风险预警。 3.根据权利要求2所述的数据异常查询分析方法, 其特征在于, 所述对所述数据内容中 的个人隐私数据进行分析, 结合预警规则进行风险预警, 包括: 梳理所述数据内容中的个人隐私数据的条目数量和类别, 结合预警规则确定风险等 级; 根据风险等级 进行风险预警。 4.根据权利要求1所述的数据异常查询分析方法, 其特征在于, 所述根据 所述查询请求 数据判断所述应用系统的接口是否含有用户账号信息, 包括: 判断所述应用系统的接口 的请求头内用户ID或令牌字段 是否全部为空; 若所述应用系统 的接口的请求头内用户ID 或令牌字段至少一个不为空, 则确定所述应 用系统的接口含有用户账号信息;权 利 要 求 书 1/3 页 2 CN 113986956 B 2若所述应用系统 的接口的请求头内用户ID 或令牌字段全部为空, 则确定所述应用系统 的接口不含有用户账号信息 。 5.根据权利要求1所述的数据异常查询分析方法, 其特征在于, 所述根据 所述查询请求 数据判断所述应用系统的接口是否含有用户账号信息之后, 还 包括: 若所述应用系统的接口含有用户账号信息, 则进入结束步骤。 6.数据异常查询分析装置, 其特 征在于, 包括: 数据获取单元, 用于获取数据库的查询请求和应用系统的接口访 问信息, 以得到查询 请求数据; 信息判断单元, 用于根据所述查询请求数据判断所述应用系统的接口是否含有用户账 号信息; 内容获取单元, 用于若所述应用系统的接口不含有用户账号信息, 则获取数据库返回 的数据内容; 内容判断单 元, 用于判断所述数据内容是否存在个人隐私数据; 风险生成单元, 用于若所述数据内容存在个人隐私数据, 则生成存在无账号个人隐私 数据异常查询风险信息; 内容判断单 元包括: 模型识别单 元、 匹配单 元、 加权平均单 元、 判断单 元以及输出 单元; 模型识别单元, 用于将所述数据内容输入至识别模型内进行个人隐私数据识别, 以得 到识别结果; 匹配单元, 用于将所述数据内容与预设的数据识别策略进 行匹配, 以得到匹配 分值; 加权平均单元, 用于根据所述匹配分值以及所述识别结果确定数据类别; 判断单元, 用于判断所述数据类别是否是个人隐私数据; 输出单元, 用于若所述数据类别是个人隐私 数据, 则输出 所述数据类别; 内容判断单元还包括模型生成单元, 用于通过若干个带有个人隐私数据 具体类型标签 的数据作为样本集且 采用多GPU并行计算框架对深度学习网络进行训练, 以得到识别模型; 所述模型生成单元包括样本集获取子单元、 网络构建子单元、 求导子单元、 参数更新子 单元以及判断子单 元; 样本集获取子单元, 用于获取若干个带有个人隐私数据具体类型标签的数据, 以得到 样本集, 且将所述样本集划分为训练集; 网络构建子单元, 用于构建ResNet深度学习网络; 求导子单元, 用于将所述训练集装载到多个GPU节点, 以进行梯度求导, 得到所有节点的求 导结果; 参数更新子单元, 用于对所有节点的求导结果进行加权平均并更新ResNet深度学 习网络的网络参数, 同步更新所有GPU节点; 判断子单元, 用于判断所述ResNet深度学习网 络是否收敛; 若所述ResNet深度学习网络收敛, 则确定所述ResNet深度学习网络为识别模 型; 若所述ResNet深度学习网络未收敛, 则执行所述将所述训练集装载到多个GPU节点, 以 进行梯度求 导, 得到所有节点的求 导结果。 7.根据权利要求6所述的数据异常查询分析装置, 其特 征在于, 还 包括: 分析单元, 用于对所述数据内容中的个人隐私数据进行分析, 结合预警规则进行风险 预警。 8.根据权利要求7 所述的数据异常查询分析装置, 其特 征在于, 所述分析 单元包括: 梳理子单元, 用于梳理所述数据内容中的个人隐私数据的条目数量和类别, 结合预警 规则确定风险等级;权 利 要 求 书 2/3 页 3 CN 113986956 B 3

.PDF文档 专利 数据异常查询分析方法、装置、计算机设备及存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据异常查询分析方法、装置、计算机设备及存储介质 第 1 页 专利 数据异常查询分析方法、装置、计算机设备及存储介质 第 2 页 专利 数据异常查询分析方法、装置、计算机设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:56:35上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。