说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111680778.8 (22)申请日 2021.12.3 0 (71)申请人 江苏通付盾科技有限公司 地址 215000 江苏省苏州市中国(江苏)自 由贸易试验区苏州片区苏州工业园区 东长路88号苏州2.5产业园C2栋4F (72)发明人 汪德嘉 史曙光 杨博雅  (74)专利代理 机构 北京融智邦 达知识产权代理 事务所(普通 合伙) 11885 代理人 吴强 (51)Int.Cl. G06F 21/44(2013.01) G06K 9/62(2022.01) H04L 9/40(2022.01) (54)发明名称 一种基于人工智能技术的跨浏览器设备指 纹特征生成方法 (57)摘要 本发明公开了一种基于人工智能技术的跨 浏览器设备指纹特征生成方法, 该方法包括以下 步骤: 对采集到的指纹数据进行数据预处理; 对 指纹特征进行特征衍生并扩充特征字段; 对指纹 数据进行降维可视化和关联矩阵可视化操作; 对 备选指纹特征的特征区分度及特征稳定度进行 计算; 对备选指纹特征进行筛选; 将筛选出的指 纹特征采用拼接组合后加密 的方式或比较指纹 特征差异性的方式生成指纹特征。 本发明采用人 工智能的方式进行设备采集特征的衍生, 从而增 加了特征的维度, 更有利于选取较好的特征指 标, 提高了设备指纹在跨浏览器上识别的准确 度; 同时本发 明在特征选择中兼顾特征稳定性和 区分性两 个维度。 权利要求书2页 说明书5页 附图1页 CN 114386014 A 2022.04.22 CN 114386014 A 1.一种基于人工智能技术的跨浏览器设备指纹特征生成方法, 其特征在于, 该方法包 括以下步骤: 步骤S1、 对 采集到的指纹数据进行 数据预处 理; 步骤S2、 根据预处 理后的指纹数据对指纹特 征进行特征衍生并扩充特 征字段; 步骤S3、 对指纹数据进行降维可视化和关联矩阵可视化操作并生成备选指纹特 征; 步骤S4、 采用适应性方法分别对备选指纹特 征的特征区分度及特 征稳定度进行计算; 步骤S5、 根据业务需求和场景并结合特征区分度及特征稳定度对备选指纹特征进行筛 选; 步骤S6、 将筛选出的指纹特征采用拼接组合后加密的方式或比较指纹特征差异性的方 式生成指纹特 征。 2.根据权利要求1所述的一种基于人工智能技术的跨浏览器设备指纹特征生成方法, 其特征在于, 步骤S1 中所述对采集到的指纹数据进 行数据预 处理包括对指纹数据进 行缺失 值处理、 异常值处 理及数据归一 化处理。 3.根据权利要求2所述的一种基于人工智能技术的跨浏览器设备指纹特征生成方法, 其特征在于, 所述缺失值处理采用零值填充、 均值填充或最大最小填充的方法, 所述异常值 处理采用3倍方差法则或箱线图分析的方法, 所述数据归一化处理采用最大/最小归一化或 z‑score归一 化的方法。 4.根据权利要求1所述的一种基于人工智能技术的跨浏览器设备指纹特征生成方法, 其特征在于, 所述特 征衍生包括对指纹特 征进行one‑hot编码、 暴力交叉及合成特 征。 5.根据权利要求1或4所述的一种基于人工智能技术的跨浏览器设备指纹特征生成方 法, 其特征在于, 步骤S3中所述对指纹数据进行降维可视化操作包括采用主成分分析方法 对降维后的指纹特 征进行数据分布分析、 对比分析及统计量分析。 6.根据权利要求1所述的一种基于人工智能技术的跨浏览器设备指纹特征生成方法, 其特征在于, 步骤S 3中所述对指纹数据进 行关联矩阵可视化操作包括采用皮尔逊相关系数 计算不同指纹特 征之间的相关性系数, 对高相关性的特 征进行剔除保留一个。 7.根据权利要求6所述的一种基于人工智能技术的跨浏览器设备指纹特征生成方法, 其特征在于, 采用传统统计学 的方式, 并依据控制变量的思想, 固定在同一浏览器下, 计算 不同设备在备选指纹特 征下的频率分布情况, 且特 征区分度计算公式如下: 其中, ui表示第i个特征的特征区分度, fk, i表示在第k个浏览器 上不同设备在第i个特征 的值分布情况, unique函数是去重函数, 返回特征不同值的数量个数, nk表示第k个浏览器 上共有多少设备, i表示第i个特征, k表示第k个浏览器, K表示浏览器类型总数, m表示指纹 特征总数。 8.根据权利要求1或7所述的一种基于人工智能技术的跨浏览器设备指纹特征生成方 法, 其特征在于, 采用传统统计学和掩码生成的方式对备选指纹特征 的特征稳定度进行计权 利 要 求 书 1/2 页 2 CN 114386014 A 2算, 计算公式如下: 其中, pi表示第i个特征根据方差计算指纹特征稳定指标, fj, i表示在所有浏览器版本 下, 第j个设备在第i个特征上值分布情况, D函数是计算方差的函数, j表示第j个设备, J表 示设备总数, i表示第i个特 征, m表示指纹特 征总数。 9.根据权利要求8所述的一种基于人工智能技术的跨浏览器设备指纹特征生成方法, 其特征在于, 所述掩码生成的步骤如下: 对于任意两个不同浏览器, 对比每个设备在这两个浏览器下特征值是否一样, 若一样 记为1, 反 之记为0, 2; 对于每个设备, 上述步骤都会生成一个长度为特征值数量的01字符串, 计算每个指纹 特征对应的0和1的数量; 每个指纹特征对应的1的数量大于0的数量则该指纹特征对应的掩码为1, 反之为0, 此 时掩码生成。 10.根据权利要求1所述的一种基于人工智能技术的跨浏 览器设备指纹特征生成方法, 其特征在于, 步骤S6中采用所述拼接组合后加密的方式生成设备指纹后, 选取部分测试数 据, 计算不同设备在同一浏览器版本下生成设备指纹不同的个数占比和同一设备在两个不 同浏览器下生成相同设备指纹的个数占比, 依据这两个比例, 决定是否进一步进行指纹特 征的重新 衍生。权 利 要 求 书 2/2 页 3 CN 114386014 A 3

.PDF文档 专利 一种基于人工智能技术的跨浏览器设备指纹特征生成方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于人工智能技术的跨浏览器设备指纹特征生成方法 第 1 页 专利 一种基于人工智能技术的跨浏览器设备指纹特征生成方法 第 2 页 专利 一种基于人工智能技术的跨浏览器设备指纹特征生成方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 04:24:31上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。