说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210499420.3 (22)申请日 2022.05.09 (71)申请人 青岛日日顺乐信云科技有限公司 地址 266000 山东省青岛市平度市同和街 道办事处同和路8 8号 申请人 青岛日日顺乐信信息科技 服务有限 公司 (72)发明人 李边芳 张峰 耿晓娜 邓栋  王智 陈福生  (74)专利代理 机构 济南知来知识产权代理事务 所(普通合伙) 37276 专利代理师 曹丽 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/332(2019.01)G06F 16/36(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于NLP技术的智慧问答方法 (57)摘要 本发明提出了一种基于NLP技术的智慧问答 方法, 包括: 步骤1: 获取实体识别和关系抽取的 训练数据, 采样若干份以往客户对话数据的意图 并打上意图标签, 对实体表达的关系打上关系标 签, 表示不同的意图下, 不同实体组合对应不同 的关系, 实现对话过程的意图识别和关系属性查 找; 步骤2: 编码语料特征数据, 设计实体识别、 关 系抽取以及意图识别的神经网络并训练, 得到最 终的模型; 步骤3: 获取原始加载的客服对话数 据, 对客服对话数据进行预处理, 将预处理后的 对话数据中抽取特征, 将抽取的意图识别特征分 类, 通过分类预测本句话的意图所在的意图类别 区间, 借此, 本发明具有达到智 能推理和推荐的 效果, 客户语义识别效果好, 不会出现答非所问 的优点。 权利要求书1页 说明书7页 附图2页 CN 114860934 A 2022.08.05 CN 114860934 A 1.一种基于N LP技术的智慧问答方法, 其特 征在于, 包括: 步骤1: 获取实体识别和关系抽取的训练数据, 采样若干份以往客户对话数据的意图并 打上意图标签, 对实体表达的关系打上关系标签, 表示不同的意图下, 不同实体组合对应不 同的关系, 以实现对话过程的意图识别和关系属性 查找; 步骤2: 编码语料特征数据, 设计实体识别、 关系抽取以及意图识别的神经网络并训练, 得到最终的模型; 步骤3: 获取原始加载的客服对话数据, 对客服对话数据进行预处理, 将预处理后的对 话数据输入第二步中抽取特征, 将抽取 的意图识别特征进行分类, 通过分类预测本句话的 意图所在的意图类别区间, 将抽取 的实体识别特征进行实体预测, 然后将关系特征预测出 两个实体的具体关系, 最后通过实体类别以及关系去查找知识库中对应的疏导答案并将疏 导答案返回给客户。 2.根据权利要求1所述的一种基于NLP技术的智慧问答方法, 其特征在于, 所述步骤1中 实体识别训练数据是指将对话数据中关键信息进 行标注作为关键实体标签; 所述关系抽取 训练数据是指对话语料数据中对实体的关系进行标注, 标注后的对话数据的作为关系训练 数据。 3.根据权利要求1所述的一种基于NLP技术的智慧问答方法, 其特征在于, 所述步骤1还 包括进行语料数据增强, 生 成更多的对话数据语料, 以丰富深度学习的语料特征, 所述语料 数据增强是将两类训练语料分别替换不同的同义词, 或者相似句, 让机器人学到更多的特 征, 进行语料 数据增强, 生成更多的对话数据语料, 以丰富深度学习的语料 特征。 4.根据权利要求1所述的一种基于NLP技术的智慧问答方法, 其特征在于, 所述步骤2中 模型的流程是先通过意图识别任务预测出本句话的意图范围, 然后在本意图范围继续通过 实体识别任务预测出句 子中具体的实体, 然后通过关系抽取任务预测出实体的关系, 最后 将本句话的最符合的答案返回给客户。 5.根据权利要求1所述的一种基于NLP技术的智慧问答方法, 其特征在于, 步骤3 中将抽 取的意图识别 特征首先通过softmax函数进行分类, 通过分类预测 本句话的意图所在的意 图类别区间内, 将抽取的实体识别特征通过softmax进行实体预测, 然后将关系特征通过 softmax预测出两个实体的具体关系, 最后通过实体类别以及关系去查找知识库中对应的 的疏导答案。 6.根据权利要求5所述的一种基于NLP技术的智慧问答方法, 其特征在于, 所述将抽取 的特征通过softmax函数进 行分类, 是指通过分类函数预测本句话中客服问题的意图、 关键 实体以及实体关系, 根据关系类别进行答案获取和推荐。权 利 要 求 书 1/1 页 2 CN 114860934 A 2一种基于NLP技术的智慧问答 方法 技术领域 [0001]本发明属于在线智能客服智能问答技术领域, 特别涉及一种基于NLP技术的智 慧 问答方法。 背景技术 [0002]目前, 客服服务行业涉及各行各业, 而客服往往是服务行业中企业人数最多的岗 位。 相对于其他岗位, 人员流动大, 每次新进客服培训成本和时间成本巨大。 在实施过程中 都是基于纯人工打字跟客服交流解决问题, 效率缓慢很难快速找到很好的解决以往同类问 题的话术方案, 需要边打字边查知识库, 效率极低。 传统的客服自动问答系统都是基于简单 的关键字匹配, 全文检索, 达不到智能推理和推荐的效果, 客户语义识别效果也非常差, 答 非所问的现象尤其多。 [0003]因此, 针对以上问题, 本发明提出了一种基于NLP技术的智慧问答方法, 解决上述 问题。 发明内容 [0004]本发明提出一种基于N LP技术的智慧问答方法, 解决了现有技 术中的问题。 [0005]本发明的技 术方案是这样实现的: 一种基于N LP技术的智慧问答方法, 包括: [0006]步骤1: 获取实体识别和关系抽取的训练数据, 采样若干份以往客户对话数据的意 图并打上意图标签, 对实体表达的关系打上关系标签, 表示不同的意图下, 不同实体组合对 应不同的关系, 以实现对话过程的意图识别和关系属性 查找; [0007]步骤2: 编码语料特征数据, 设计实体识别、 关系抽 取以及意图识别的神经网络并 训练, 得到最终的模型; [0008]步骤3: 获取原始加载的客服对话数据, 对客服对话数据进行预处理, 将预处理后 的对话数据输入第二步中抽取特征, 将抽取 的意图识别特征进行分类, 通过分类预测本句 话的意图所在的意图类别区间, 将抽取 的实体识别特征进行实体预测, 然后将关系 特征预 测出两个实体的具体关系, 最后通过实体类别以及关系去查找知识库中对应的疏导答案并 将疏导答案返回给客户。 [0009]作为一种优选 的实施方式, 所述步骤1中实体识别训练数据是指将对话数据 中关 键信息进 行标注作为关键实体标签; 所述关系抽取训练数据是指对话语料数据中对实体的 关系进行 标注, 标注后的对话数据的作为关系训练数据。 [0010]作为一种优选的实施方式, 所述步骤1还包括进行语料数据增强, 生成更多的对话 数据语料, 以丰富深度学习的语料特征, 所述语料数据增强是将两类训练语料分别替换不 同的同义词, 或者相似句, 让机器人学到更多的特征, 进行语料数据增强, 生成更多的对话 数据语料, 以丰富深度学习的语料 特征。 [0011]作为一种优选 的实施方式, 所述步骤2中模型的流程是先通过意图识别任务预测 出本句话的意图范围, 然后在本意图范围继续通过实体识别任务预测出句子中具体的实说 明 书 1/7 页 3 CN 114860934 A 3

.PDF文档 专利 一种基于NLP技术的智慧问答方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于NLP技术的智慧问答方法 第 1 页 专利 一种基于NLP技术的智慧问答方法 第 2 页 专利 一种基于NLP技术的智慧问答方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:52:39上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。