专利基于语义融合生成对抗网络的图像比特增强方法及装置

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210326308.X (22)申请日 2022.03.30 (65)同一申请的已公布的文献号申请公布号 CN 114663315 A (43)申请公布日 2022.06.24 (73)专利权人天津大学地址 300072 天津市南开区卫津路9 2号 (72)发明人刘婧　米晓峰　窦倩倩　苏育挺　 (74)专利代理机构天津市北洋有限责任专利代理事务所 12 201 专利代理师李林娟 (51)Int.Cl. G06T 5/00(2006.01) G06T 7/40(2017.01) G06T 7/90(2017.01) G06V 10/26(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01)G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (56)对比文件 CN 111681192 A,2020.09.18 US 201615 6917 A1,2016.0 6.02 CN 111008938 A,2020.04.14 刘平平.基于卷积神经网络的视频比特深度增强算法研究. 《中国优秀硕士学位论文全文数据库信息科技辑》 .2022,第2022年卷(第01期), Changmeng Peng et al. .CNN-Based Suppression of False Co ntour and Co lor Distorti on in Bit-Depth Enhancement. 《Sensors》 .2021,第21卷(第2期),全文. Jing Zhang et al. .BE-ACGAN: Photo- realistic residual bit-depth enhancement by advanced co nditional GAN. 《Displays》 .2021,全文. 审查员苏晓燕 (54)发明名称基于语义融合生成对抗网络的图像比特增强方法及装置 (57)摘要本发明公开了一种基于语义融合生成对抗网络的图像比特增强方法及装置，方法包括：生成器以残差结构为框架，添加输入图像到输出的全局跳跃连接和语义融合层，将零填充后的高比特图像和语义分割结果作为输入，输出重构后的高比特图像；鉴别器基于VGG网络，具有图像真假预测分支和图像语义类别预测分支，将重构后的高比特图像或真实的高比特图像作为输入，输出为对输入图像是否为重构图像的预测和该图像所属类别的预测；对测试集预处理得到的零填充后的高比特图像和语义分割结果输入到已加载训练模型参数后的生成器网络得到重构高比特图像。装置包括：处理器和存储器。本发明进行像素级别的纹理生成约束；且保留突变区域纹理边缘细节，提高视觉质量。权利要求书2页说明书10页附图2页 CN 114663315 B 2022.11.22 CN 114663315 B 1.一种基于语义融合生成对抗网络的图像比特增强方法，其特征在于，所述方法包括： 1)生成器以残差结构为框架，添加输入图像到输出的全局跳跃连接和语义融合层，将零填充后的高比特图像和语义分割结果作为输入，输出重构后的高比特图像；鉴别器基于VGG网络，具有图像真假预测分支和图像语义类别预测分支，将重构后的高比特图像或真实的高比特图像作为输入，输出为对输入图像是否为重构图像的预测和该图像所属类别的预测； 2)将训练集预处理得到的零填充后的高比特图像和语义分割结果作为生成器的输入数据，并将重构后的高比特或真实高比特图像作为鉴别器的输入数据，使用包括渐变突变区域梯度损失的组合损失函数，通过Adam优化器交替训练生成器网络和鉴别器网络的模型参数； 3)对测试集预处理得到的零填充后的高比特图像和语义分割结果输入到已加载训练模型参数后的生成器网络得到重构高比特图像；其中，梯度损失分为渐变突变区域分别计算，渐变区域使用大的损失权重，渐变区域检测结果使用局部像素值差异计算获得，对图像中的任一像素，局部平均像素值差异计算如下：其中， gi， i＝1， 2， …， P，表示邻近像素， P是邻近像素总数，是P个邻近像素的平均值，全局平均像素值差异计算如下：其中， N是图像像素总数，是像素的平均值，渐变区域检测结果通过比较局部全局平均像素值差异得到： dlocal＜0.05×dglobal (3) 若式(3)成立，则局部区域的中间像素位置为渐变区域，记为1，反之，若不成立，则为突变区域，记为0，最终得到像素级别的二值渐变区域检测结果记为Mflat，则渐变与突变区域梯度损失用下式计算：其中， GHBD和分别表示真实高比特图像和重构高比特图像的梯度图。 2.根据权利要求1所述的一种基于语义融合生成对抗网络的图像比特增强方法，其特征在于，在步骤1)之前，所述方法还包括：对训练集中的图像进行预处理，具体为：对真实高比特图像量化得到低比特图像，对所述低比特图像的比特位进行零填充得到零填充后的高比特图像；使用真实高比特图像获取语义分割结果和渐变区域检测结果。 3.根据权利要求1所述的一种基于语义融合生成对抗网络的图像比特增强方法，其特征在于，所述对测试集预处理，具体为：将真实高比特图像量化为低比特图像，对所述低比特图像的比特位进行零填充得到零权　利　要　求　书 1/2 页 2 CN 114663315 B 2填充后的高比特图像；使用零填充后的高比特图像获取语义分割结果。 4.根据权利要求1所述的一种基于语义融合生成对抗网络的图像比特增强方法，其特征在于，所述生成器为：以残差网络结构为基础的语义融合生成器，由四个残差组组成，每个残差组包括：一语义融合残差块和若干个通用残差块，相邻的残差块之间存在跳跃连接；所述通用残差块由两个卷积层和一个ReLU激活层构成，卷积层使用若干个3 ×3卷积操作。 5.根据权利要求1所述的一种基于语义融合生成对抗网络的图像比特增强方法，其特征在于，所述语义融合层以图像特征和语义分割结果为输入，通过语义分割结果生成与图像特征对应的语义特征信息，对图像特征图进行语义增强。 6.根据权利要求1或5所述的一种基于语义融合生成对抗网络的图像比特增强方法，其特征在于，所述语义融合层由卷积层构成，第一个卷积层和其后的激活层是参数共享的，最后两个卷积层是以激活层的输出为输入得到变换后的语义特征信息。 7.根据权利要求1或5所述的一种基于语义融合生成对抗网络的图像比特增强方法，其特征在于，所述鉴别器由一系列卷积构成，鉴别器后端的第一个分支用于鉴别真假图像，第二个分支将输入图像预测为八个类别之一，两个分支共享前面的所有参数。 8.根据权利要求1或5所述的一种基于语义融合生成对抗网络的图像比特增强方法，其特征在于，所述组合损失函数为：其中， Lreconstruction为L1‑范数的重构损失， Lperception为感知损失， Lgradient为渐变与突变区域梯度损失， Ladversary为生成器对抗损失函数， Lclassification为交叉熵形式的分类损失， α、 β 、 γ、 δ、 ε、 ζ 为各个损失的求和权重。 9.一种基于语义融合生成对抗网络的图像比特增强装置，其特征在于，所述装置包括：处理器和存储器，所述存储器中存储有程序指令，所述处理器调用存储器中存储的程序指令以使装置执行权利要求1 ‑8中的任一项所述的方法步骤。权　利　要　求　书 2/2 页 3 CN 114663315 B 3

专利 基于语义融合生成对抗网络的图像比特增强方法及装置

专利基于语义融合生成对抗网络的图像比特增强方法及装置