说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111627427.0 (22)申请日 2021.12.28 (71)申请人 天翼物联科技有限公司 地址 510335 广东省广州市海珠区 阅江西 路366号广报中心南塔21层 (72)发明人 陈鑫远 左绘  (74)专利代理 机构 广州嘉权专利商标事务所有 限公司 4 4205 代理人 郑宏谋 (51)Int.Cl. G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 模型训练方法、 API请求过滤方法、 装置和存 储介质 (57)摘要 本发明公开了一种模型训练方法、 API请求 过滤方法、 计算机装置和存储介质, 模型训练方 法包括采集第一API请求数据, 对第一API请求数 据进行标准化格式处理, 获得训练样本集, 对训 练样本集按特征进行分类构建, 获得自体集, 使 用自体集对免疫检测器进行训练等步骤。 本发明 模型训练方法训练的免疫检测器, 对API请求中 携带危险注入信息的检测具有较高的检测速度 和准确率, 当API请求中携带危险注入信息, 能够 将API请求识别为异常请求, 当API请求中没有携 带危险注入信息, 能够将API请求识别为正常请 求, 能够实时、 准确地检测异常或非法API请求, 能够提供统一的、 安全可靠的保障服务。 本发明 广泛应用于 计算机网络技 术领域。 权利要求书2页 说明书10页 附图7页 CN 114372519 A 2022.04.19 CN 114372519 A 1.一种模型训练方法, 其特 征在于, 所述模型训练方法包括: 采集多个第一API请求数据; 对各所述第一API请求数据进行 标准化格式处 理, 获得训练样本集; 对所述训练样本集按特 征进行分类构建, 获得自体集; 获取免疫检测器; 使用所述自体集对所述免疫检测器进行训练。 2.根据权利要求1所述的模型训练方法, 其特征在于, 所述采集多个第 一API请求数据, 包括: 通过爬虫程序主动爬取注入案例; 从所述注入案例中提取 出所述第一API请求数据。 3.根据权利要求1所述的模型训练方法, 其特征在于, 所述对所述第一API请求数据进 行标准化格式处 理, 得到训练样本集, 包括: 使用特殊字符分离法和空格分离法对所述第一API请求数据进行处理, 获得第一特征 信息; 对所述第一特 征信息进行 标记化, 获得令牌信息; 将所述令牌信息组建成攻击语句语法树; 以所述攻击语句语法树组成所述训练样本集。 4.根据权利要求1所述的模型训练方法, 其特征在于, 所述对所述训练样本集按特征进 行分类构建, 获得自体集, 包括: 对所述训练样本集进行朴素贝叶斯聚类分析, 根据所述朴素贝叶斯聚类分析的结果, 将所述训练样本集中的内容分类到正常数据集或者异常数据集; 按照多叉树所需的特征属性标准, 对所述正常数据集进行特征属性提取, 获得第一特 征属性; 以所述第一特 征属性作为多叉树存 储结构中每层结点的主属性, 构造出 所述自体集。 5.根据权利要求 4所述的模型训练方法, 其特 征在于, 所述模型训练方法还 包括: 按照多叉树所需的特征属性标准, 对所述异常数据集进行特征属性提取, 获得第二特 征属性; 以所述第二特征属性作为多叉树存储结构中每层结点的主属性, 构造出所述非自体 集; 使用所述自体集和所述非自体集对所述免疫检测器进行训练。 6.根据权利要求5所述的模型训练方法, 其特征在于, 所述使用所述自体集和所述非自 体集对所述免疫检测器进行训练, 包括: 将所述免疫检测器的参数作为抗体, 将所述自体集和所述非自体集中的数据作为抗 原; 执行多轮迭代过程, 直至所执行的迭代过程总轮数达到轮数阈值; 在一轮所述迭代过 程中, 对所述抗体和所述抗原进行匹配, 获得亲和度; 当所述亲和度超过亲和度阈值, 存储 所述免疫检测器的参数, 反 之则更改所述免疫检测器的参数。 7.一种API请求过 滤方法, 其特 征在于, 所述API请求过 滤方法包括: 获取第二API请求数据; 使用免疫检测器对所述第二API请求数据进行检测; 所述免疫检测器经过权利要求1 ‑6权 利 要 求 书 1/2 页 2 CN 114372519 A 2任一项所述的模型训练方法训练; 获取所述免疫检测器的检测结果; 根据所述免疫检测器的检测结果, 识别所述第二API请求数据为 正常请求或异常请求; 当识别所述第二API请求数据为正常请求, 响应所述第二API请求数据; 当识别所述第 二API请求数据为异常请求, 拒绝或忽略所述第二API请求数据。 8.一种API请求过 滤方法, 其特 征在于, 所述API请求过 滤方法包括: 获取多个第二API请求数据; 对各所述第二API请求数据进行基于概 率队列的排序; 按照排序后各所述第二API请求数据的顺序, 使用免疫检测器依次对各所述第二API请 求数据进行检测; 所述免疫检测器经 过权利要求1 ‑6任一项所述的模型训练方法训练; 获取所述免疫检测器的检测结果; 根据所述免疫检测器的检测结果, 识别各所述第二API请求数据为正常请求或异常请 求; 响应被识别为正常请求的所述第二API请求数据, 拒绝或忽略被识别为正常请求的所 述第二API请求数据。 9.一种计算机装置, 其特征在于, 包括存储器和处理器, 所述存储器用于存储至少一个 程序, 所述处理器用于加载所述至少一个程序以执行权利要求1 ‑6任一项所述的模型训练 方法和/或权利要求7 ‑8任一项所述的API请求过 滤方法。 10.一种存储介质, 其中存储有处理器可执行的程序, 其特征在于, 所述处理器可执行 的程序在由处理器执行时用于执行权利要求1 ‑6任一项所述的模型训练方法和/或权利要 求7‑8任一项所述的API请求过 滤方法。权 利 要 求 书 2/2 页 3 CN 114372519 A 3

.PDF文档 专利 模型训练方法、API请求过滤方法、装置和存储介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法、API请求过滤方法、装置和存储介质 第 1 页 专利 模型训练方法、API请求过滤方法、装置和存储介质 第 2 页 专利 模型训练方法、API请求过滤方法、装置和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:45:00上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。