说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210764389.1 (22)申请日 2022.06.30 (71)申请人 青岛海尔科技有限公司 地址 266101 山东省青岛市崂山区海尔路1 号海尔工业园 申请人 青岛海尔智能家电科技有限公司   海尔智家 股份有限公司 (72)发明人 邓邱伟 窦方正 刘朝振 张旭  区波 翟建光  (74)专利代理 机构 北京康信知识产权代理有限 责任公司 1 1240 专利代理师 刘旺贵 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01)G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 文本意图的识别方法和装置、 存储介质和电 子装置 (57)摘要 本申请公开了一种文本意图的识别方法和 装置、 存储介质和电子装置, 涉及智 能家居技术 领域, 该文本意图的识别方法包括: 获取待识别 的文本信息; 对文本信息进行文本特征提取, 得 到文本特征向量集; 对文本特征向量集中的每个 文本特征向量分别进行槽填充处理, 得到各自对 应的语义类别向量, 其中, 语义类别向量集用于 指示文本信息中每个字 符各自对应的语义类别; 对文本特征向量集和各个语义类别向量进行意 图解析, 以识别出文本信息所携带的操作意图。 本申请解决了现有的文本意图的识别方法的识 别准确率较低的技 术问题。 权利要求书2页 说明书12页 附图3页 CN 115269774 A 2022.11.01 CN 115269774 A 1.一种文本意图的识别方法, 其特 征在于, 包括: 获取待识别的文本信息; 对所述文本信息进行文本特 征提取, 得到文本特 征向量集; 对所述文本特征向量集中的每个文本特征向量分别进行槽填充处理, 得到各自对应的 语义类别向量, 其中, 所述语义类别向量集用于指示所述文本信息中每个字符各自对应的 语义类别; 对所述文本特征向量集和各个所述语义类别向量进行意图解析, 以识别出所述文本信 息所携带的操作意图。 2.根据权利要求1所述的方法, 其特征在于, 对所述文本特征向量集和各个所述语义类 别向量进行意图解析, 以识别出 所述文本信息所携带的操作意图, 包括: 获取所述文本特征向量集中位于起始标志位的参考特征向量以及各个所述语义类别 向量, 其中, 所述文本特征向量集包括所述参考特征向量以及与所述文本信息中包含的各 个字符各自对应的字符特 征向量; 将所述参考特征向量和各个所述语义类别向量输入第 一注意力网络, 以得到第 一输出 向量, 其中, 所述第一注意力网络用于利用与所述语义类别向量匹配的注意力权重, 对所述 文本特征向量集进行意图解析; 将所述第一输出向量和所述参考特征向量联合输入第 一意图识别网络, 以得到识别出 的意图类别向量, 其中, 所述 意图类别向量用于指示所述文本信息的所述操作意图。 3.根据权利要求2所述的方法, 其特征在于, 所述将所述参考特征向量和各个所述语义 类别向量输入第一注意力网络, 以得到第一输出向量包括: 获取与所述第一注意力网络匹配的第一权 重矩阵、 第二权 重矩阵和第三权 重矩阵; 获取对第一特征向量和各个参考语义类别向量分别进行点积计算的点积值, 其中, 所 述第一特征向量由所述参考特征向量和所述第一权重矩阵确定, 所述参考语义类别向量由 所述语义类别向量和所述第二权 重矩阵确定; 对各个所述 点积值各自进行归一 化处理得到多个第一 参考值; 将每个所述第 一参考值与全部的第 二特征向量进行加权求和计算, 得到所述第 一输出 向量, 其中, 所述第二特 征向量由所述 参考特征向量和所述第三权 重矩阵确定 。 4.根据权利要求2所述的方法, 其特征在于, 所述对所述文本特征向量集中的每个文本 特征向量分别进行槽填充处 理, 得到各自对应的语义类别向量包括: 将所述参考特征向量输入第二 意图识别网络, 以得到意图参 考向量; 利用与所述意图参考向量匹配的注意力权重, 对所述文本特征向量集进行槽填充解 析, 得到所述语义类别向量。 5.根据权利要求4所述的方法, 其特征在于, 所述利用与 所述意图参考向量匹配的注意 力权重, 对所述文本特 征向量集进行槽填充解析, 得到所述语义类别向量包括: 将所述意图参考向量和所述文本特征向量集输入第 二注意力网络, 得到多个第 二输出 向量, 其中, 所述第二注意力网络用于利用与所述意图参考向量匹配的注意力权重, 对所述 文本特征向量集进行槽填充解析, 所述第二输出向量与所述文本特征向量集中的每一个文 本特征向量一一对应; 将各个所述第 二输出向量与 各自对应的所述文本特征向量进行拼接, 得到多个拼接向权 利 要 求 书 1/2 页 2 CN 115269774 A 2量; 利用与所述第二注意力网络相连的多个槽填充网络对所述多个拼接向量分别进行解 析, 以得到各自对应的所述语义类别向量。 6.根据权利要求1至5任一项所述的方法, 其特征在于, 所述获取待识别的文本信息之 前, 还包括: 获取多条训练样本文本信息以及各自对应的意图类别标签; 利用所述训练样本文本信 息以及对应的意图类别标签对初始第 一注意力网络、 初始第 一意图识别网络、 初始第二注意力网络、 初始第二意图识别网络以及多个初始槽填充网络 进行联合训练, 直至第一意图识别网络连续输出的多个损失值均小于目标阈值, 其中, 所述 初始第二意图识别网络与所述初始第二注意力网络连接, 所述初始第二注意力网络与所述 多个初始槽填充网络连接, 所述多个初始槽填充网络与所述初始第一注意力网络连接, 所 述初始第一注意力网络与所述初始第一 意图识别网络连接 。 7.根据权利要求6所述的方法, 其特征在于, 所述利用所述训练样本文本信 息以及对应 的意图类别标签对初始第一注 意力网络、 初始第一意图识别网络、 初始第二注 意力网络、 初 始第二意图识别网络以及多个初始槽填充网络进行 联合训练, 包括: 获取训练中的第一意图识别网络在当前训练回合输出的分类概率值, 其中, 所述分类 概率值用于指示基于当前训练样本文本信息识别出的意图类别与意图类别标签所指示的 类别是否一 致; 利用所述分类概率值的对数值和基于所述分类概率值所确定出的调制因子, 确定所述 损失值, 其中, 所述调制因子由数值1和所述分类概 率值的差值的γ次方确定, γ为常数。 8.一种文本意图的识别装置, 其特 征在于, 包括: 获取单元, 用于获取待识别的文本信息; 特征提取单元, 用于对所述文本信息进行文本特 征提取, 得到文本特 征向量集; 语义解析单元, 用于对所述文本特征向量集中的每个文本特征向量分别进行槽填充处 理, 得到各自对应的语义类别向量, 其中, 所述语义类别向量集用于指示所述文本信息中每 个字符各自对应的语义类别; 意图解析单元, 用于对所述文本特征向量集和各个所述语义类别向量进行意图解析, 以识别出 所述文本信息所携带的操作意图。 9.一种计算机可读的存储介质, 其特征在于, 所述计算机可读的存储介质包括存储的 程序, 其中, 所述 程序运行时执 行权利要求1至7中任一项所述的方法。 10.一种电子装置, 包括存储器和 处理器, 其特征在于, 所述存储器中存储有计算机程 序, 所述处 理器被设置为 通过所述计算机程序执 行权利要求1至7中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115269774 A 3

.PDF文档 专利 文本意图的识别方法和装置、存储介质和电子装置

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本意图的识别方法和装置、存储介质和电子装置 第 1 页 专利 文本意图的识别方法和装置、存储介质和电子装置 第 2 页 专利 文本意图的识别方法和装置、存储介质和电子装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:13:25上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。