说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210969237.5 (22)申请日 2022.08.12 (71)申请人 中国科学院信息 工程研究所 地址 100093 北京市海淀区闵庄路甲89号 (72)发明人 朱红松 赵森 王进法 于楠  李志 孙利民  (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 聂俊伟 (51)Int.Cl. H04L 69/06(2022.01) H04L 69/22(2022.01) H04L 47/2441(2022.01) H04L 43/0876(2022.01) G06V 30/19(2022.01)G06V 30/148(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01) (54)发明名称 协议格式分割方法、 设备及存 储介质 (57)摘要 本发明提供一种协 议格式分割方法、 设备及 存储介质, 包括: 获取协议流量的待分割流量图 片; 将待分割流量图片输入至字段分割模型, 以 利用字段分割模型对待分割流量图片进行分割 位置预测, 输出字段分割位置; 将字段分割位置 对应的各协议分割比特序列输入至字段判定孪 生模型, 以利用字段判定孪生模 型对各协议分割 比特序列进行类别判定, 输出协议格式分割结 果。 本发明通过采用字段分割模 型对待分割流量 图片进行一级分割, 得到字段分割位置, 通过字 段判定孪生模型对字段分割位置左右的协议分 割比特序列进行二级判定, 以进一步判定分割位 置是否预测准确的技术手段, 解决了协议格式分 割精度低的技术问题, 从而提高了协议格式分割 的精确度。 权利要求书3页 说明书17页 附图3页 CN 115550460 A 2022.12.30 CN 115550460 A 1.一种协议格式分割方法, 其特 征在于, 包括: 获取目标协议 流量对应的待分割流 量图片; 将所述待分割流量图片输入至字段分割模型, 以利用所述字段分割模型对所述待分割 流量图片进行分割位置预测, 输出字段分割位置; 将所述字段分割位置对应的各协议分割比特序列输入至字段判定孪生模型, 以利用所 述字段判定 孪生模型对各 所述协议分割比特序列进行类别判定, 输出协议格式分割结果; 其中, 所述字段分割模型是基于预先收集的历史协议流量对应的协议流量图片以及所 述协议流量图片的字段分割 序列标签进行迭代训练获得, 所述字段判定孪生模型是基于在 所述协议流量图片 中选取的待训练比特序列以及所述字段分割序列标签进行迭代训练获 得。 2.根据权利要求1所述的协议格式分割方法, 其特征在于, 所述字段分割 模型包括编码 模块、 解码模块和协议分割输出模块, 其中: 所述编码模块包括若干个级联的编码单元; 在所有编码单元中, 除最后一个编码单元 外的每个编码单元均包括第一卷积层和下采样层; 所述最后一个编码单元包括第一卷积 层; 在所有编码单 元中, 除最后两个编码单 元外的每 个编码单 元还包括第三卷积层; 所述解码模块包括若干个级联的解码单元, 所述解码单元均包括上采样层、 第二卷积 层、 特征连接层和第四卷积层; 所述协议分割输出模块包括若干个级联的第五卷积层; 所述第三卷积层、 所述第四卷积层和所述第五卷积层对应的网络结构相同; 最后一个解码单 元的第四卷积层的输出作为所述协议分割输出模块的输入。 3.根据权利要求2所述的协议格式分割方法, 其特征在于, 所述将所述待分割流量图片 输入至字段分割模型, 以利用所述字段分割模型对所述待分割流量图片进行分割位置预 测, 输出字段分割位置对应的各协议分割比特序列, 包括: 通过第一个编码单元中的第 一卷积层对所述待分割流量图片进行特征提取, 得到所述 第一个编码单 元中第一卷积层输出的编码特 征图; 通过所述第一个编码单元中的下采样层对所述第一个编码单元输出的编码特征图进 行下采样处理, 得到下采样特征图, 并将所述下采样特征图作为下一个编码单元中的第一 卷积层的输入, 直至得到最后一个编码单 元中第一卷积层输出的编码特 征图; 通过第一个解码单元中的上采样层和第二卷积层对所述最后一个编码单元输出的编 码特征图进行 上采样以及卷积处 理, 得到第一目标处 理特征图; 通过所述第一个解码单元中的特征连接层对所述第一目标处理特征图和与所述第一 个解码单元处于相同深度层级的编 码单元输出的编 码特征图进行特征连接, 得到第一连接 特征图; 通过所述第 一个解码单元中的第四卷积层对所述第 一连接特征图进行卷积处理, 得到 所述第一个解码单元输出的卷积处理特征图, 并将所述第一个解码单元输出的卷积处理特 征图作为下一个解码单 元的输入; 通过所述下一个解码单元中的上采样层和第二卷积层对所述卷积处理特征图进行上 采样以及卷积处 理, 得到第二目标处 理特征图; 通过目标编码单元中的第三卷积层对所述目标编码单元输出的编码特征图进行卷积权 利 要 求 书 1/3 页 2 CN 115550460 A 2处理, 得到与所述第二目标处理特征图尺寸相同的目标特征图, 其中, 所述目标编码单元是 与所述下一个解码单 元处于相同深度层级的编码单 元; 通过所述下一个解码单元中的特征连接层对所述第二目标处理特征图和所述目标特 征图进行 特征连接, 得到第二连接特 征图; 通过所述下一个解码单元中的第四卷积层对所述第 二连接特征图进行卷积处理, 得到 所述下一个解码单 元输出的卷积处 理特征图; 返回执行所述通过所述下一个解码单元中的上采样层和第二卷积层对所述卷积处理 特征图进行上采样以及卷积处理, 得到第二 目标处理特征图的步骤, 直至得到最后一个解 码模块中第四卷积层输出的卷积处 理特征图; 将所述最后 一个解码模块的卷积处理特征图输入至所述协议分割输出模块, 得到所述 协议分割输出模块输出的字段分割位置 。 4.根据权利要求1所述的协议格式分割方法, 其特征在于, 所述字段判定孪生模型由预 设数量的网络结构相同、 模型参数共享的孪生神经网络、 相似度计算层和全连接层构成, 其 中, 所述孪生神经网络的输出作为所述相似度计算层的输入; 所述将所述字段分割位置对应的各协议分割比特序列输入至字段判定孪生模型, 以利 用所述字段判定孪生模型对各所述协议分割比特序列进行类别判定, 输出协 议格式分割结 果, 包括: 在所述待分割流 量图片中选取与所述字段分割位置相邻的各协议分割比特序列; 分别将各所述协议分割比特序列输入至所述孪生神经网络 中, 得到每一所述孪生神经 网络输出的特 征向量; 通过所述相似度计算层计算各 所述特征向量之间的相似度向量; 将所述相似度向量输入至所述全连接层, 得到所述全连接层输出的格式分割结果。 5.根据权利要求4所述的协议格式分割方法, 其特征在于, 所述孪生神经网络包括特征 融合层、 时序特 征提取层和空间特 征提取层; 所述分别将各所述协议分割比特序列输入至所述孪生神经网络中, 得到各所述协议分 割比特序列的特 征向量, 包括: 针对每一所述协议分割比特序列, 将所述协议分割比特序列分别输入至所述 时序特征 提取层以及所述空间特征提取层, 以利用所述时序特征提取层提取所述协 议分割比特序列 的时序特征向量, 以及利用所述空间特征提取层提取所述协 议分割比特序列的空间特征向 量; 将所述时序特征向量和所述空间特征向量输入至所述特征融合层, 以利用所述特征融 合层对所述时序特 征向量和所述空间特 征向量进行 特征融合, 得到所述特 征向量。 6.根据权利要求1所述的协议格式分割方法, 其特征在于, 所述字段分割 模型基于如下 步骤训练得到: 获取历史协议 流量, 并提取 所述历史协议 流量的格式信息; 基于所述历史协议 流量的格式信息, 生成多张协议 流量图片; 针对每一所述协议流量图片, 将所述协议流量图片输入至待训练字段分割模型, 得到 所述待训练字段分割模型输出的预测分割位置; 基于所述预测分割位置和所述协议流量图片中的字段分割序列标签, 计算模型损失权 利 要 求 书 2/3 页 3 CN 115550460 A 3

.PDF文档 专利 协议格式分割方法、设备及存储介质

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 协议格式分割方法、设备及存储介质 第 1 页 专利 协议格式分割方法、设备及存储介质 第 2 页 专利 协议格式分割方法、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:13:38上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。