说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210542820.8 (22)申请日 2022.05.18 (65)同一申请的已公布的文献号 申请公布号 CN 114863179 A (43)申请公布日 2022.08.05 (73)专利权人 合肥工业大 学 地址 230000 安徽省合肥市经济技 术开发 区翡翠路420号合肥工业大学翡翠湖 校区科教楼 (72)发明人 史骏 张元 汪逸飞 杨皓程  周泰然 李想 郑利平  (74)专利代理 机构 合肥中谷知识产权代理事务 所(普通合伙) 34146 专利代理师 袁锦波 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/82(2022.01)G06V 10/77(2022.01) G06V 10/80(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G16H 50/20(2018.01) (56)对比文件 CN 113378791 A,2021.09.10 WO 2022073452 A1,202 2.04.14 CN 109034253 A,2018.12.18 Peng Li et.al.Bi- Modal Learn ing With Channel-Wise Attention for Multi-Label Image Classificati on. 《IEEE Access》 .2020, 第2169-3536页. 韩旭 等.基 于注意力机制及多尺度特 征融 合的番茄叶片缺素图像分类方法. 《农业工程学 报》 .2021,第37 卷(第17期),第17 7-188页. 审查员 刘志军 (54)发明名称 基于多尺度特征嵌入和交叉注意力的内窥 镜图像分类方法 (57)摘要 本发明提出了一种基于多尺度特征嵌入和 交叉注意力的内窥镜图像分类方法, 包括: 获取 已标注好的N类内窥镜图像; 建立基于多尺度特 征嵌入和多头交叉注意力的深度学习网络; 构建 内窥镜图像分类器; 利用建立好的分类器实现预 测内窥镜图像类别。 本发明通过多尺度特征嵌入 将深层特征图中丰富的语义信息和浅层特征图 中的几何细 节信息进行融合, 并结合交叉注意力 机制消除不同尺度特征图之间的语义信息和几 何信息歧义来挖掘出更有效的特征, 完成对内窥 镜图像的精准分类, 从而辅助医生进行诊断阅 片, 提高阅片效率。 权利要求书4页 说明书9页 附图2页 CN 114863179 B 2022.12.13 CN 114863179 B 1.一种基于多尺度特征嵌入和 交叉注意力的内窥镜图像分类方法, 其特征在于, 所述 方法包括: 步骤1、 获取N种类别C ×H×W的内窥镜图像样本, 对所述样本进行预处理后得到训练集 E, E={E1, E2, ..., En, ..., EN}; En表示第n类内窥镜图像样 本, 第n类共有P个图像, 表示第n类预处理后的内窥镜图像样本中的第p 个图像; C表示图 像通道, H表示图像高度, W表示图像宽度, n =1, 2, ..., N; 步骤2、 建立深度 学习网络, 通过所述深度 学习网络的卷积神经网络对所述内窥镜图像 的样本数据集进行处理, 以输出不同卷积阶段的特征图, 将所述不同卷积阶段的特征图经 过降维处 理后形成降维输出 特征图 i=1, 2, 3, 4; 具体为: 步骤2.1、 建立深度学习网络, 所述深度学习网络包括: 多尺度特征提取模块、 多尺度特 征嵌入模块和多头交叉注意力编码器模块; 步骤2.2、 构建多尺度特 征提取模块: 所述多尺度特征提取模块由四个卷积神经网络阶段构成, 依次包括: 第 一卷积阶段、 第 二卷积阶段、 第三卷积阶段、 第四卷积阶段; 将第p个图像 输入所述多尺度特征提 取模块中, 并经过所述第一 卷积阶段、 第二 卷积 阶段、 第三卷积阶段、 第四卷积阶段分别得到第 一卷积阶段输出的特征图 第二卷积阶 段输出的特 征图 第三卷积阶段输出的特 征图 第四卷积阶段输出的特 征图 步骤2.3、 构建多尺度特 征嵌入模块: 所述多尺度特征嵌入模块由4个不同的嵌入层并联而成, 4个嵌入层对应4个 i=1, 2, 3, 4, 每 个嵌入层包 含一个卷积层和一个降维处 理; 将四个卷积阶段输出特征图 输入到多尺度特征嵌入模块 中, i =1, 2, 3, 4, 分别经过卷积核为25‑i×25‑i的卷积层并经过降维处理后分别输出特征图 i=1, 2, 3, 4; 步骤3、 将所述降维输出特征图 输入至预先构建的多尺度特征嵌入的多 头交叉注意 力编码器中, 进行归一 化及上采样处 理后输出 特征图Un, p; 具体为: 步骤3.1、 构建多尺度特 征嵌入的多头交叉注意力编码器: 所述多尺度特征嵌入的多头交叉注意力编码器模块由嵌入4个卷积 阶段的特征和L个 多头交叉注意力编码器串联而成; 将4个特征图 输入所述多尺度特征嵌入模块中, 并分别经过一个LN层进行归 一化处理, 从通道交叉 的角度对特征图 进行转换, 具体利用式(1)得到通道交叉 特征图 i=1, 2, 3, 4: 式(1)中transpose( ·)代表特征图的转置处理, 代表有Ci个大小为权 利 要 求 书 1/4 页 2 CN 114863179 B 2Hi·Wi的像素特征图, 代表有Hi·Wi个大小为Ci个通道交叉的像素特征 图; 步骤3.2、 将通道交叉特征图 进行多尺度嵌入, 具体利用式(2)得到多尺度特 征嵌入特 征图 式(2)中concat( ·)代表特征向量拼接操作, 表示 经过多尺度特征嵌入和转置 后的通道交叉 特征图; 步骤3.3、 将特征图 作为第1个多头交叉注意力编码器模块的 输入, 第c个多头交叉注意力编码 器模块的输出作为第c+1个多头交叉注意力编 码器模块的 输入; 任意第c个多头交叉注意力编码器模块包括: 2个线性变换层, M个并联的交叉注意力 层; c=1, 2, . .., L; 步骤3.4、 将特征图 f=1, 2, 3, 4输入到第c个多头交叉注意力编码器模块, 将特征图 分别与两个权重矩阵WmK, WmV相乘, 将特征图 i=1, 2, 3, 4, 分别与四个权 重矩阵 相乘, 输出 特征图Kn, p、 Vn, p、 f=1, 2, 3, 4, 具体公式如式(3)所示: 式(3)中, φ( ·)代表归一化函数; 步骤3.5、 将多尺度特征嵌入模块输出特征图 输入第1个 多头交叉注意力编码器中, 分别经过线性变换处理输入至M 头交叉注意力层中, 将 分别与Kn, p相乘, 最后通过Softmax函数激活后与Vn, p相乘得到输 出, 具体公式如式(4)所示: 式(4)中, ψ( ·)是归一化函数, δ(·)是Softmax函数; 步骤3.6、 以注意力特征图 为基础, 动态地融合不同头部的沣意力特征图来形成 新的注意力特 征图, 具体公式如式(5)所示: 式(5)中, 是一个可学习的变换矩阵, 通过 将多头注意力特征图融合 并生成 新的注意力特 征图; 将得到M个交叉注意力层输出 i=1, 2, 3, 4, m=1, 2, ..., M, 再利用式(6)所示 得到特征图 c=1, 2, . .., L, i=1, 2, 3, 4: 权 利 要 求 书 2/4 页 3 CN 114863179 B 3

.PDF文档 专利 基于多尺度特征嵌入和交叉注意力的内窥镜图像分类方法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于多尺度特征嵌入和交叉注意力的内窥镜图像分类方法 第 1 页 专利 基于多尺度特征嵌入和交叉注意力的内窥镜图像分类方法 第 2 页 专利 基于多尺度特征嵌入和交叉注意力的内窥镜图像分类方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:48:48上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。