说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211228272.8 (22)申请日 2022.10.08 (71)申请人 北京世纪好未来教育科技有限公司 地址 100086 北京市海淀区中关村大街32 号19层1901室 (72)发明人 王鹏程 冀志龙  (74)专利代理 机构 北京北汇律师事务所 1 1711 专利代理师 高栋 (51)Int.Cl. G06T 13/40(2011.01) G06T 17/20(2006.01) G06V 40/16(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 训练表情驱动生 成模型的方法、 表情驱动方 法及装置 (57)摘要 本公开提供一种训练表情驱动生成模型的 方法、 表情驱动方法及装置, 其中, 训练表情驱动 生成模型的方法, 包括: 获取样本脸部图像集, 该 样本脸部图像集中包括有同一对象不同表情的 脸部图像; 使用表情驱动生 成模型处理样本集脸 部图像集中的脸部图像, 得到脸部图像的表情驱 动参数; 根据表情驱动参数生 成脸部图像的三维 脸部mesh 结构; 根据三维脸部mesh 结构确定脸部 图像的第一脸部关键点; 获取脸部图像的第二脸 部关键点, 其中, 第二脸部关键点为真实脸部关 键点; 将第一、 第二脸部关键点由三维关键点投 影成二维关键点; 更新表情驱动生成模型的网络 参数以最小化第一、 第二脸部关键点之间的关键 点误差。 由此, 可更好地表示大表情以及驱动同 一对象的不同表情。 权利要求书2页 说明书15页 附图10页 CN 115512014 A 2022.12.23 CN 115512014 A 1.一种训练表情驱动生成模型的方法, 其特 征在于, 包括: 获取样本脸部 图像集, 其中, 所述样本脸部 图像集中包括有 同一对象不同表情的脸部 图像; 使用所述表情驱动 生成模型处理所述样本集脸部图像集中的脸部图像, 得到脸部图像 的表情驱动参数; 根据所述表情驱动参数生成脸部图像的三维脸部mesh结构; 根据所述 三维脸部mesh结构确定脸部图像的第一 脸部关键点; 获取脸部图像的第二 脸部关键点, 其中, 所述第二 脸部关键点 为真实脸部关键点; 根据预设投影函数将所述第一脸部关键点和所述第二脸部关键点由三维关键点投影 成二维关键点; 更新所述表情驱动生成模型的至少部分网络参数以最小化所述第一脸部关键点和所 述第二脸部关键点之间的关键点 误差。 2.如权利要求1所述的方法, 其中, 所述表情驱动参数包括形状参数, 所述方法还 包括: 针对所述样本脸部图像集中同一对象不同表情的脸部图像, 使用所述表情 驱动生成模 型处理脸部图像, 得到脸部图像的形状参数; 根据同一对象不同表情的脸部图像对应的形状参数, 确定形状一 致性误差; 更新所述表情驱动生成模型的至少部分网络参数以最小化所述形状一 致性误差。 3.如权利要求1或2所述的方法, 其中, 所述表情 驱动参数包括表情参数, 至少一个对象 不同表情的脸部图像, 是使用条件对抗生成网络基于该对象的一脸部图像和不同表情条件 生成的, 每 个表情条件由表情动作单 元组成, 并且其中, 所述方法还 包括: 针对基于表情条件生成的每个脸部图像, 使用所述表情驱动生成模型处理该脸部图 像, 得到脸部图像的表情参数; 根据所述表情条件确定脸部图像的真实表情参数; 更新所述表情驱动生成模型的至少部分网络参数以最小化所述表情参数和所述真实 表情参数之间的表情参数误差 。 4.如权利要求1至 3中任一项所述的方法, 其中, 所述方法还 包括: 针对每个脸部图像, 根据该脸部图像的三维脸部mesh结构渲染得到该脸部图像对应的 二维脸部图像; 确定该脸部图像及其 渲染得到的二维脸部图像之间的感知损失和/或逐像素损失; 更新所述表情驱动 生成模型的至少部分网络参数以最小化所述感知损失和/或逐像素 损失。 5.如权利要求1所述的方法, 其中, 所述第 二脸部关键点包括眼部关键点和嘴部关键点 中的一个或多个, 所述关键点 误差包括眼部开闭误差和嘴部开闭误差中的一个或多个; 并且其中, 所述更新所述表情驱动生成模型的至少部分网络参数以最小化所述第 一脸 部关键点和所述第二 脸部关键点之间的关键点 误差包括: 更新所述表情驱动生成模型的至少部分网络参数以最小化所述眼部开闭误差和所述 嘴部开闭误差中的一个或多个。 6.如权利要求1或5所述的方法, 其中, 所述获取脸部图像的第二 脸部关键点, 包括:权 利 要 求 书 1/2 页 2 CN 115512014 A 2使用多个关键点预测模型处理脸部 图像, 得到每个脸部 图像对应的多个预测结果, 其 中, 每个预测结果包括第二 脸部关键点的预测坐标; 针对每个第 二脸部关键点, 将该第 二脸部关键点对应的多个预测坐标中关键点间距小 于预设值的预测坐标视为相同坐标, 并将出现次数最多的预测坐标为该第二脸部关键点的 坐标。 7.如权利要求1所述的方法, 其中, 所述表情驱动参数包括形状参数, 并且其中, 所述 根据所述表情驱动参数生成脸部图像的三维脸部mesh结构, 包括: 针对同一对象不同表情的脸部图像, 通过全连接层融合该对象不同表情的脸部图像对 应的形状参数, 得到融合形状参数; 根据所述融合形状参数生成该对象的三维脸部mesh结构, 以得到该对象不同表情的脸 部图像对应的三维脸部mesh结构。 8.一种表情驱动方法, 其特 征在于, 包括: 获取待处 理的脸部图像; 使用如权利要求1至7中任何一项所述的方法训练得到的表情驱动生成模型处理所述 脸部图像, 得到表情驱动参数; 根据所述表情驱动参数进行表情驱动。 9.一种训练表情驱动生成模型的装置, 其特 征在于, 包括: 获取模块, 用于获取样本脸部图像集, 其中, 所述样本脸部图像集中包括有同一对象不 同表情的脸部图像; 训练模块, 用于: 使用所述表情驱动 生成模型处理所述样本集脸部图像集中的脸部图像, 得到脸部图像 的表情驱动参数; 根据所述表情驱动参数生成脸部图像的三维脸部mesh结构; 根据所述 三维脸部mesh结构确定脸部图像的第一 脸部关键点; 获取脸部图像的第二 脸部关键点, 其中, 所述第二 脸部关键点 为真实脸部关键点; 根据预设投影函数将所述第一脸部关键点和所述第二脸部关键点由三维关键点投影 成二维关键点; 以及 更新所述表情驱动生成模型的至少部分网络参数以最小化所述第一脸部关键点和所 述第二脸部关键点之间的关键点 误差。 10.一种电子设备, 其特 征在于, 包括: 处理器; 以及 存储程序的存 储器, 其中, 所述程序包括指令, 所述指令在由所述处理器执行时使所述处理器执行根据权 利要求1‑7中任一项所述的方法。 11.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于 使所述计算机执 行根据权利要求1 ‑7中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115512014 A 3

.PDF文档 专利 训练表情驱动生成模型的方法、表情驱动方法及装置

文档预览
中文文档 28 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 训练表情驱动生成模型的方法、表情驱动方法及装置 第 1 页 专利 训练表情驱动生成模型的方法、表情驱动方法及装置 第 2 页 专利 训练表情驱动生成模型的方法、表情驱动方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 16:21:23上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。