说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210774228.0 (22)申请日 2022.07.01 (71)申请人 OPPO广东移动通信有限公司 地址 523860 广东省东莞 市长安镇乌沙海 滨路18号 (72)发明人 周峰  (74)专利代理 机构 广州德科知识产权代理有限 公司 44381 专利代理师 蔡丽妮 万振雄 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/151(2020.01) G06F 40/279(2020.01) G06F 40/30(2020.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 文本风格迁移方法、 装置、 电子设备及存储 介质 (57)摘要 本申请实施例公开了一种文本风格迁移方 法、 装置、 电子设备及存储介质。 该方法, 包括: 获 取第一风格的第一文本; 通过风格迁移模型对所 述第一文本进行风格迁移, 得到第二风格的第二 文本; 其中, 所述风格迁移模型是通过第一训练 阶段及第二训练阶段训练得到的; 所述第一训练 阶段包括利用构造的第一样本文本训练得到初 始迁移模型, 所述第二训练阶段包括利用第二样 本文本对所述初始迁移模型进行对偶训练, 并根 据所述对偶训练期间的收益奖励 进行优化, 得到 所述风格迁移模型。 上述的文本风格迁移方法、 装置、 电子设备及存储介质, 能够提高文本进行 风格迁移的迁移效果。 权利要求书2页 说明书16页 附图5页 CN 115186056 A 2022.10.14 CN 115186056 A 1.一种文本风格迁移方法, 其特 征在于, 包括: 获取第一 风格的第一文本; 通过风格迁移模型对所述第一文本进行风格迁移, 得到第二 风格的第二文本; 其中, 所述风格迁移模型是通过第一训练阶段及第二训练阶段训练得到的; 所述第一 训练阶段包括利用构 造的第一样本文本训练得到初始迁移模型, 所述第二训练阶段包括利 用第二样本文本对所述初始迁移模型进行对偶训练, 并根据所述对偶训练期间的收益奖励 进行优化, 得到所述 风格迁移模型。 2.根据权利要求1所述的方法, 其特 征在于, 构造所述第一样本文本, 包括: 通过风格分类器识别初始样本文本对应的第 三风格, 并确定所述初始样本文本 中各个 分词对所述第三 风格的风格贡献权 重; 根据所述各个分词对所述第 三风格的风格贡献权重, 从所述初始样本文本 中选取一个 或多个第一分词进行删除, 以得到所述第一样本文本; 和/或, 根据所述各个分词对所述第 三风格的风格贡献权重, 从所述初始样本文本中选取一个或多个第二分词, 将各个所述第 二分词分别替换为第三分词, 以得到所述第一样本文本 。 3.根据权利要求2所述的方法, 其特征在于, 所述根据所述各个分词对所述第 三风格的 风格贡献权重, 从所述初始样本文本中选取一个或多个第一分词进行删除, 以得到所述第 一样本文本, 包括: 随机生成所述各个分词对应的删除概 率; 根据删除比例、 所述各个分词对应的风格贡献权重及所述初始样本文本的文本长度, 确定所述各个分词对应的删除阈值; 从所述初始样本文本中, 选取对应的删除概率小于删除阈值的分词作为第一分词, 并 删除所述第一分词, 以得到所述第一样本文本 。 4.根据权利要求2所述的方法, 其特征在于, 所述将各个所述第 二分词分别替换为第 三 分词, 包括: 向掩码语言模型输入目标第 二分词的语义簇信 息及风格标签, 所述风格标签用于表征 第四风格; 所述目标第二分词为任一所述第二分词; 通过所述掩码语言模型根据 所述语义簇信 息确定所述第 二分词对应的语义聚类簇, 并 从所述语义聚类簇中查找与所述 风格标签匹配的目标第三分词; 将所述目标第二分词替换为所述目标第三分词。 5.根据权利要求1~4任一项所述的方法, 其特征在于, 所述构造所述第 一样本文本, 包 括: 对初始样本文本中的至少部分 分词对应的词序进行调整, 以得到所述第一样本文本 。 6.根据权利要求1~4任一项所述的方法, 其特征在于, 所述初始迁移模型包括第一转 换器及第二转换器; 所述利用第二样本文本对所述初始迁移模型进行对偶训练, 并根据所 述对偶训练期间的收益奖励进行优化, 得到所述 风格迁移模型, 包括: 通过所述第一 转换器将第一 风格的第二样本文本转换为第二 风格的第三文本; 通过所述第二 转换器将所述第二 风格的第三文本转换为所述第一 风格的第四文本; 根据所述第三文本及所述第四文本, 确定所述第三文本对应的收益奖励; 根据多个所述第 二样本文本分别对应的第 三文本的收益奖励, 对所述初始迁移模型进权 利 要 求 书 1/2 页 2 CN 115186056 A 2行优化, 得到所述 风格迁移模型。 7.根据权利要求6所述的方法, 其特征在于, 所述根据所述第三文本及所述第 四文本, 确定所述第三文本对应的收益奖励, 包括: 通过风格分类器识别所述第 三文本在所述第 二风格对应的置信度, 并根据所述置信度 确定所述第三文本对应的风格奖励; 确定所述第四文本与 所述第二样本文本之间的损失, 并根据所述损失确定所述第 三文 本对应的内容奖励; 根据所述 风格奖励 及内容奖励, 确定所述第三文本对应的收益奖励。 8.根据权利要求7所述的方法, 其特征在于, 所述根据所述置信度确定所述第 三文本对 应的风格奖励, 包括: 确定所述置信度 所属的置信度区间, 并将所述置信度区间对应的奖励确定为所述第 三 文本对应的风格奖励。 9.根据权利要求7所述的方法, 其特征在于, 所述根据所述置信度确定所述第 三文本对 应的风格奖励, 包括: 根据所述置信度确定第一 风格奖励; 通过训练 的风格语言模型确定所述第 三文本与 所述第二风格对应的第 二风格奖励; 所 述风格语言模型至少根据与所述第二 风格对应的样本文本集 合训练得到; 将所述第一风格奖励与所述第 二风格奖励进行融合, 得到所述第 三文本对应的风格奖 励。 10.根据权利要求6所述的方法, 其特征在于, 所述根据多个所述第二样本文本分别对 应的第三文本的收益奖励, 对所述初始迁移模型进行优化, 得到所述 风格迁移模型, 包括: 通过贪心算法计算奖励基准, 并根据 所述奖励基准对多个所述第 二样本文本分别对应 的第三文本的收益奖励进行归一 化处理; 根据归一化处理后的收益奖励对所述初始迁移模型进行优化, 得到所述风格迁移模 型。 11.一种文本风格迁移装置, 其特 征在于, 包括: 文本获取模块, 用于获取第一 风格的第一文本; 风格迁移模块, 用于通过风格迁移模型对所述第一文本进行风格迁移, 得到第二风格 的第二文本; 其中, 所述风格迁移模型是通过第一训练阶段及第二训练阶段训练得到的; 所述第一 训练阶段包括利用构 造的第一样本文本训练得到初始迁移模型, 所述第二训练阶段包括利 用第二样本文本对所述初始迁移模型进行对偶训练, 并根据所述对偶训练期间的收益奖励 进行优化, 得到所述 风格迁移模型。 12.一种电子设备, 其特征在于, 包括存储器及处理器, 所述存储器中存储有计算机程 序, 所述计算机程序被所述处理器执行时, 使得所述处理器实现如权利要求 1~10任一项 所 述的方法。 13.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现如权利要求1~10任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115186056 A 3

.PDF文档 专利 文本风格迁移方法、装置、电子设备及存储介质

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本风格迁移方法、装置、电子设备及存储介质 第 1 页 专利 文本风格迁移方法、装置、电子设备及存储介质 第 2 页 专利 文本风格迁移方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:13:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。