说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210342249.5 (22)申请日 2022.03.31 (71)申请人 上海幻维数码创意科技股份有限公 司 地址 200072 上海市 静安区广中西路7 77弄 13号 (72)发明人 吴强 季晓枫  (74)专利代理 机构 上海科盛知识产权代理有限 公司 312 25 专利代理师 应小波 (51)Int.Cl. G06T 13/00(2011.01) G06N 3/04(2006.01) G06T 3/00(2006.01) G06V 10/26(2022.01)G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) (54)发明名称 基于知识蒸馏的实时视频人脸卡通化方法、 设备及介质 (57)摘要 本发明涉及一种基于知识蒸馏的实时视频 人脸卡通化方法、 设备及介质, 该方法包括以下 步骤: 步骤S1、 采用图像语义分割DeepLabv3+网 络进行人像分割; 步骤S2、 通过特征提取模块提 取人脸特征; 步骤S3、 采用Soft ‑AdaLIN归 一化方 法, 将人脸特征与卡通特征相融合; 步骤S4、 基于 融合后的特征, 通过特征重建模块生成卡通图 像; 步骤S5、 基于知 识蒸馏模型, 将步骤S1~S4训 练得的模型作为教师模型, 基于损失函数, 通过 教师模型训练学生模型, 实时生成人脸卡通化视 频。 与现有技术相比, 本发明具有人脸卡通化视 频生成实时性好的优点。 权利要求书1页 说明书5页 附图2页 CN 114926569 A 2022.08.19 CN 114926569 A 1.一种基于知识蒸馏的实时视频 人脸卡通化方法, 其特 征在于, 该 方法包括以下步骤: 步骤S1、 采用图像 语义分割De epLabv3+网络进行 人像分割; 步骤S2、 通过 特征提取模块 提取人脸特征; 步骤S3、 采用Soft ‑AdaLIN归一化方法, 将人脸特 征与卡通特征相融合; 步骤S4、 基于融合后的特 征, 通过特征重建模块 生成卡通图像; 步骤S5、 基于知识蒸馏模型, 将步骤S1~S4训练得到的模型作 为教师模型, 基于损失函 数, 通过教师模型训练学生模型, 实时生成人脸 卡通化视频。 2.根据权利要求1所述的一种基于知识蒸馏的实时视频人脸卡通化方法, 其特征在于, 所述步骤S1中的图像 语义分割De epLabv3+网络包括编码器模块和解码器模块; 所述编码器模块采用深度卷积神经网络DCN N; 所述解码器模块将底层特 征与高层特 征进一步融合, 进行 人像边界分割。 3.根据权利要求2所述的一种基于知识蒸馏的实时视频人脸卡通化方法, 其特征在于, 所述深度卷积神经网络DCNN包含用于引入多尺度信息的带孔洞卷积的空间金字塔池化层 ASPP。 4.根据权利要求1所述的一种基于知识蒸馏的实时视频人脸卡通化方法, 其特征在于, 所述步骤S2中特 征提取模块包 含堆叠的Hourglas s模块, 以及下采样模块和残差模块; 采用堆叠的Hourglas s模块, 渐进地将输入图像抽象成易于编码的形式; 所述残差模块对人脸特 征进行编码并提取用于后续特 征融合的统计信息 。 5.根据权利要求1所述的一种基于知识蒸馏的实时视频人脸卡通化方法, 其特征在于, 所述步骤S3具体为: 采用Soft ‑AdaLIN归一化方法, 通过可学习的权重对输入人脸图像的编码特征统计信 息和卡通特征统计信息进行加 权融合, 再以AdaLIN的方式反规范化解码特征, 保留输入图 像的语义内容。 6.根据权利要求1所述的一种基于知识蒸馏的实时视频人脸卡通化方法, 其特征在于, 所述步骤S4具体为: 所述特征重建模块采用与特征提取部分对称的结构, 包括解码模块、 上采样模块和 Hourglas s模块, 依据编码特 征生成对应的卡 通图像。 7.根据权利要求1所述的一种基于知识蒸馏的实时视频人脸卡通化方法, 其特征在于, 所述步骤S5中的损失函数表达式为: Loss=loss1+loss2 其中, loss1为硬标签与预测值之间的损失, loss2为教师模型输出的软标签与预测值之 间的损失; 所述预测值 为生成的卡 通图像数据。 8.根据权利要求7所述的一种基于知识蒸馏的实时视频人脸卡通化方法, 其特征在于, 所述硬标签为 开源数据集。 9.一种电子设备, 包括存储器和处理器, 所述存储器上存储有计算机程序, 其特征在 于, 所述处 理器执行所述程序时实现如权利要求1~8任一项所述的方法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述程序被处理 器执行时实现如权利要求1~8中任一项所述的方法。权 利 要 求 书 1/1 页 2 CN 114926569 A 2基于知识 蒸馏的实时视频人脸卡通化方 法、 设备及介质 技术领域 [0001]本发明涉及人脸卡通化领域, 尤其是涉及 一种基于知识蒸馏的实时视频人脸卡通 化方法、 设备及 介质。 背景技术 [0002]卡通画一直以幽默、 风趣的艺术效果和鲜明直接 的表达方式为大众所喜爱。 近年 来, 越来越多的人开始在社交网络中使用卡通画作为一种表意的文化载体。 图像卡通风格 渲染尤其是视频图像卡通风格渲 染是一项 具有挑战性的任务, 其目的是将真实视频图像转 换为卡通风格的非真实感图像, 同时保持原视频图像的语义内容和纹 理细节。 [0003]目前, 视频卡 通化任务的主 要难点: [0004]1)实时性 不高: 现有的方法大多针对图片卡 通化; [0005]2)数据获取难度大: 绘制风格精美且统一的卡通画耗时较多、 成本较高, 且转换后 的卡通画和原照片的脸型及五官形状有差异, 因此不构成像素级的成对数据, 难以采用基 于成对数据的图像翻译(Paired  Image Translati on)方法。 [0006]3)照片卡通化后容易丢失身份信息: 基于非成对数据的图像翻译(UnpairedI   mage Translation)方法中的循环一致性损失(Cycle  Loss)无法对输入输出的id进行有效 约束。 [0007]深度神经网络因其较高的学习能力被应用到图像卡通风格渲染中, 有着很高的优 势, 但是, 这种 方法通常难以在转换图像全局 风格和保持图像局部的细节语义内容之间取 得良好的平衡, 易导致风格化程度不足或者丢失图像中的语义细节, 产生人工痕迹 (Artifacts)。 此外, 现有的方法难以满足视频卡 通化的实时性要求。 [0008]针对上述视频人脸卡通化存在的、 实时性不高的缺陷, 需要设计一种 实时视频人 脸卡通化方法。 发明内容 [0009]本发明的目的就是为了克服上述现有技术存在的缺陷而提供了一种实时性高的 基于知识蒸馏的实时视频 人脸卡通化方法、 设备及 介质。 [0010]本发明的目的可以通过以下技 术方案来实现: [0011]根据本发明的第一方面, 提供了一种基于知识蒸馏的实时视频人脸卡通化方法, 该方法包括以下步骤: [0012]步骤S1、 采用图像 语义分割De epLabv3+网络进行 人像分割; [0013]步骤S2、 通过 特征提取模块 提取人脸特征; [0014]步骤S3、 采用Soft ‑AdaLIN归一化方法, 将人脸特 征与卡通特征相融合; [0015]步骤S4、 基于融合后的特 征, 通过特征重建模块 生成卡通图像; [0016]步骤S5、 基于知识蒸馏模型, 将步骤S1~S 4训练得到的模型作为教师模型, 基于损 失函数, 通过教师模型训练学生模型, 实时生成人脸 卡通化视频。说 明 书 1/5 页 3 CN 114926569 A 3

.PDF文档 专利 基于知识蒸馏的实时视频人脸卡通化方法、设备及介质

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于知识蒸馏的实时视频人脸卡通化方法、设备及介质 第 1 页 专利 基于知识蒸馏的实时视频人脸卡通化方法、设备及介质 第 2 页 专利 基于知识蒸馏的实时视频人脸卡通化方法、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:38:15上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。