(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111661592.8
(22)申请日 2021.12.31
(71)申请人 西安电子科技大 学
地址 710071 陕西省西安市太白南路2号
(72)发明人 董庆宽 赵晓倩 樊凯 任晓龙
李丽 高文鑫
(74)专利代理 机构 陕西电子 工业专利中心
61205
专利代理师 王品华
(51)Int.Cl.
H04L 9/40(2022.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于概念漂移和深度学习的网络流量入侵
检测方法
(57)摘要
本发明公开了一种基于概念漂移和深度学
习的网络流量入侵检测方法, 主要解决现有概念
漂移检测成本较高及网络流量特征发生改变时
入侵检测准确率低的问题。 其方案为: 获取并预
处理训练样 本集和测试样本集; 构建自编码器网
络, 用训练样本集对其进行逐层无监督训练; 构
建多层卷积神经网络, 用训练样 本集对其进行训
练; 构建多层长短时记忆网络, 用训练样本集对
其进行训练; 采用训练好的自编码器网络对测试
样本集进行特征选择, 得到48维的测试样本集,
将该测试样本集分别输入到训练好的多层卷积
神经网络和训练好的多层长短时记忆网络, 对其
输出结果加权求和, 得到入侵检测结果。 本发明
在网路流量特征发生改变时有较高的准确率, 可
用于网络安全维护。
权利要求书3页 说明书6页 附图1页
CN 114513328 A
2022.05.17
CN 114513328 A
1.一种基于概念漂移和深度学习的网络流 量入侵检测方法, 其特 征在于, 包括:
(1)从KDD CUP99数据集中获取训练样本集Xtrain和测试样本集Xtest, 并对其进行数值化
和数据标准归一 化的预处 理, 得到预处 理后119维训练样本集X ′train和测试样本集X ′test;
(2)构建由输入层、 第一隐含层、 第一批量归一化层、 第二隐含层、 第二批量归一化层依
次级联组成的自编码器网络;
(3)采用预处理后的训练样本集X ′train, 利用Adam优化器对多层自编码器网络进行逐层
无监督训练, 得到48维的训练样本集X ″train;
(4)构建由输入层、 第一卷积层、 第一最大池化层、 第一批量归一化层、 第二卷积层、 第
二最大池化层、 第二批量归一 化层、 全连接层、 输出层依次级联组成的多层卷积神经网络;
(5)采用48维的训练样本集X ″train, 利用Adam优化器对多层卷积神经网络模型进行优化
训练, 得到训练好的多层卷积神经网络模型;
(6)构建由输入层、 第一长短时记忆网络层、 第一Dropout层、 第二长短时记忆网络层、
第二Dropout层、 全连接层、 输出层依次级联组成的多层长短时记 忆网络;
(7)采用48维的训练样本集X ″train, 利用Adam优化器对多层 长短时记忆网络进行优化训
练,得到训练好的多层长短时记 忆网络;
(8)将预处理后的测试样本集X ′test输入到训练好的自编码器网络, 得到48维 的测试样
本集X″test;
(9)对48维的测试样本集X ″test进行概念漂移检测 和入侵检测:
(9a)构造两个滑动窗口, 截取测试样本集X ″test中长度为N的数据, 并设置概念漂移检测
阈值X, 其中N 为1000, X的范围为2.0~7.0;
(9b)将第二个滑动窗口的数据分别输入到训练好的多层卷积神经网络和训练好的多
层长短时记忆网络中, 再将这两个网络的输出结果进行加权求和, 得到第二个滑动窗口数
据的入侵检测分类结果;
(9c)计算两个滑动窗口数据之间的Was serstein距离W, 作为 概念漂移检测结果;
(9d)将Was serstein距离W与概念漂移检测阈值X进行比较, 判断是否发生漂移:
若W<X,则没有发生 概念漂移, 此时将第二个滑动窗口向前移动长度N, 返回(9b);
若W>=X,则发生了概念漂移, 此时采用第二个滑动窗口中的数据对训练好的长短时记
忆网络进行再训练, 再将第一个滑动窗口的位置移动到第二个滑动窗口的位置, 并将第二
个滑动窗口向前移动长度N,返回(9b);
(9e)重复上述(9b)~(9d)操作, 直到第二个滑动窗口将48维的测试样本集X ″test的数据
全部检测完毕;
(9f)将所有第二个滑动窗口中的入侵检测分类结果拼接起来, 得到48维的测试样本集
X″test入侵检测分类结果。
2.根据权利要求1所述的方法, (1)所述的预处 理如下:
数值化, 是采用独热编码将从KDD CUP99数据集中获取的训练样本集Xtrain和测试样本
集Xtest中的符号特 征转化为数值特 征;
数据标准归一化, 是先对数值化后的训练样本集和测试样本集中的数值特征进行标准
化, 再将每个数值归一到[0,1]区间,最后得到119维的训练样本集X ′train和测试样本集
X′test。权 利 要 求 书 1/3 页
2
CN 114513328 A
23.根据权利要求1所述的方法, 其中(2)中构建的自编码器网络, 各层参数如下:
输入层输入预处 理后的训练样本集X ′train;
第一隐含层的参数维度为96维;
第二隐含层的参数维度为 48维;
所有隐含层的激活函数均使用Relu。
4.根据权利要求1所述的方法, 其中(3)中采用预处理后的训练样本集X ′train, 利用Adam
优化算法对多层自编码器网络进行 逐层无监 督训练, 实现如下:
(3a)将每一个相连的隐含层和批量归一化层看作一个整体, 作为一个中间层, 将多层
自编码器网络中除最后一个中间层外的每层均与该层相邻的下一中间层、 及与该层具有对
应结构的额外一层组成网络模型;
(3b)将此网络模型的输入与输出结果代入到均方误差损失函数, 求得一次训练后的损
失值;
(3c)根据每次训练得到的损失值, 变化采用Adam优化器对网络参数进行梯度更新, 直
到达到设定的最大网络训练次数T1, 得到训练好的多层自编码器网络 。
5.根据权利要求1所述的方法, 其中(4)中构建的多层卷积神经网络, 各层参数如下:
输入层输入48维的训练样本集X ″train;
第一卷积层的输入通道数为 48, 输出通道数为24, 卷积核大小为3;
第一最大池化层的卷积核大小为3;
第二卷积层的输入通道数为24, 输出通道数为16, 卷积核大小为3;
第二最大池化层的卷积核大小为3;
全连接层的维度为10;
输出层的参数为1, 激活函数为sigmo id函数。
6.根据权利 要求1所述的方法, 其中(5)中的利用Adam优化器对多层卷积神经网络模型
进行优化训练, 实现如下:
(5a)将多层卷积神经 网络的输出结果与48维的训练样本集X ″train的标签特征代入到交
叉熵损失函数, 求得一次训练后的损失值;
(5b)根据每次训练得到的损失值, 变化采用Adam优化器对网络参数进行梯度更新, 直
到达到设定的最大网络训练次数T2, 得到训练好的多层卷积神经网络 。
7.根据权利要求1所述的方法, 其中(4)中构建的多层长短时记 忆网络, 各层参数如下:
输入层输入48维的训练样本集X ″train;
第一长短时记 忆网络层的维度参数为32;
第一Dropout层的过 滤参数为0.3;
第二长短时记 忆网络层的维度参数为16;
第二Dropout层的过 滤参数为0.3;
全连接层的参数为10;
输出层的参数为1, 激活函数为sigmo id函数;
8.根据权利 要求1所述的方法, 其中(7)中的利用Adam优化器对多层长短时记忆网络进
行优化训练, 实现如下:
(7a)将多层 长短时记忆网络的输出结果与48维的训练样本集X ″train的标签特征代入到权 利 要 求 书 2/3 页
3
CN 114513328 A
3
专利 基于概念漂移和深度学习的网络流量入侵检测方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 00:19:50上传分享