说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211111015.6 (22)申请日 2022.09.13 (65)同一申请的已公布的文献号 申请公布号 CN 115203240 A (43)申请公布日 2022.10.18 (73)专利权人 永鼎行远 (南京) 信息科技有限公 司 地址 210000 江苏省南京市雨 花台区凤信 路6号3号楼6层6 01室 (72)发明人 邵珠峰 许芬 吴迪 张瑶  连英群  (74)专利代理 机构 北京鑫知翼知识产权代理事 务所(普通 合伙) 11984 专利代理师 张云珠(51)Int.Cl. G06F 16/245(2019.01) G06F 16/22(2019.01) G06F 16/25(2019.01) G06F 16/31(2019.01) G06F 16/33(2019.01) H04M 3/51(2006.01) (56)对比文件 CN 113688221 A,2021.1 1.23 CN 114626731 A,202 2.06.14 US 2021/ 0142791 A1,2021.0 5.13 审查员 李欢 (54)发明名称 一种基于通话数据检索的总线消息处理系 统 (57)摘要 本发明涉及信息处理领域, 尤其涉及一种基 于通话数据检索的总线消息处理系统, 本发明通 过设置数据获取模块, 数据存储模块, 数据处理 模块以及数据输出模块, 通过将预设时段内通话 信息转化为文本信息并对关键词进行提取, 根据 关键词的关联关系建立关联数据集合, 计算关联 数据集合对应的关键词匹配系数以表征关键词 与信息源的关联关系以及关键词在文本信息中 出现的频率和频次, 并对关联数据集合进行筛 选, 选取与对应通话信息主要内容最匹配的数据 源并输出, 并且, 在整个通话过程中, 后续时段对 于关联数据集合的筛选根据第一次筛选的结果 确定筛选方式, 以减少干扰关键词的影响, 减少 误判和误提取, 以提高输出数据源与通话信息的 匹配度和精准度。 权利要求书3页 说明书8页 附图1页 CN 115203240 B 2022.12.09 CN 115203240 B 1.一种基于通 话数据检索的总线消息处 理系统, 其特 征在于, 包括: 数据获取模块, 其用以获取通 话过程中产生的通 话信息; 数据存储模块, 其用以存 储数据源以及通 话过程中产生的通 话信息以及文本信息; 数据处理模块, 其与所述数据存储模块以及数据获取模块相连接并完成数据交换, 所 述数据处理模块将通话过程中产生的通话信息转化为文本信息, 并在预设T1时间段后根据 所述文本信息中关键词的关联关系建立关联数据集合, 并对所述关联数据集合进行筛选, 并根据筛 选结果调用数据源; 以及, 所述数据处理模块在预设T1时间后每隔T2时段, 识别对应文本信息中的关键词 并建立关联数据集合, 根据所述关联数据集合是否为重复关联数据集合确定筛选方式, 对 所述关联 数据集合进行筛 选, 并根据筛 选结果调用数据源; 数据输出模块, 其与所述数据处理模块相连接, 以将所述数据处理模块调用的数据源 输出至需求端; 所述数据存储模块内存储有若干数据源, 任一所述数据源与若干不同关键词建立关联 关系, 并将所述若干不同关键词储存至同一数据集合, 记为预存关联数据集合, 对于任一数 据源, 所述数据存 储模块将与所述数据源关联的若干关键词之间建立关联关系; 所述数据处理模块将通话信息实时转码为文本信息, 在通话进行预设时间T1时, 所述 数据处理模块提取所述文本信息中的多个关键词, 对关键词进行区分, 将存在关联关系的 关键词储存至同一数据集合内, 记为关联数据集合, 并分别计算所述关联数据集合对应的 关键词匹配系数 F, 其中, N表示所述关联数据集合内关键词数量占所述文本信息字数数量的比例, N0表示 关键词数量占所述文本信息字数数量的预设比例, Q表示所述关联数据集合的关键词在所 述文本信息中对应位置的平均信息间隔长度, Q0表示预设信息间隔长度, P表 示所述关联数 据集合内子集个数与对应预存关联 数据集合内子集个数的比值, P≤1, P0表示预设比值; 所述数据处理模块内预设第 一预设关键词匹配系数对比参量F01以及第 二预设关键词 匹配系数对比参量F02, F02>F01, 所述数据处理模块依次将关键词匹配系数F与所述第一 预设关键词匹配系数对比参量F01以及第二预设关键词匹配系数对比参量F02进 行对比, 对 所述关联 数据集合进行筛 选, 调用数据源, 其中, 当存在关键词匹配系数F大于等于所述第二预设关键词匹配系数对比参量F02时, 所述 数据处理模块仅调用与该关键词匹配系数 F对应的关联 数据集合相关联的数据源; 当存在关键词 匹配系数F大于等于所述第一预设关键词 匹配系数对比参量F01且小于 所述第二预设关键词匹配系数对比参量F02时, 所述数据处理模块将所述关键词匹配系数F 记录至一数据集合内, 记为二次判定用关键词匹配系 数集合, 并进行二次判定确定需调用 数据源; 当全部关键词 匹配系数F均小于所述第一预设关键词匹配系数对比参量F0时, 所述数 据处理模块判定无需调用数据源; 所述数据处理模块内预设关键词匹配系数差值 f0, 当所述数据处理模块进行二次判定权 利 要 求 书 1/3 页 2 CN 115203240 B 2时, 所述数据 处理模块将所述二次判定用关键词匹配系 数集合内的关键词匹配系 数F按照 由大至小的顺序进行排序形成关键词匹配系数数列, 并按照由大至小的顺序依次计算所述 关键词匹配系 数数列中相邻两关键词匹配系 数F的差值, 并与预设关键词匹配系数差值f0 进行对比, 当ΔF>f0时, 则所述数据处理模块停止计算, 确定已计算差值的关键词匹配系 数F, 并调用与所述已计算差值的关键词匹配系数对应的关联 数据集合相关联的数据源。 2.根据权利要求1所述的基于通话数据检索的总 线消息处理系统, 其特征在于, 所述数 据处理模块将已调用数据源相关联的所述关联数据集合中的关键词进 行标记, 并记录标记 总数量B 。 3.根据权利要求2所述的基于通话数据检索的总 线消息处理系统, 其特征在于, 所述数 据处理模块在所述通话进行预设时间T1后, 每隔T2时间段确定需要调用的数据源, 所述数 据处理模块根据T2时间段内通话信息对应的文本信息提取关键词, 并形成若干 关联数据集 合, 并分别计算所述关联 数据集合对应的关键词匹配系数 F, 所述数据处理模块判定所述关联数据集合中是否存在被标记关键词, 若存在, 则判定 所述关联数据集合为重复关联数据集合, 并计算所述重复关联数据集合对应的第一预设关 键词匹配系数对比参量修正值F01 ’以及第二预设关键词匹配系数对比参量修正值F02 ’, 设 定F01’=F01+f1×k, F02’=F02‑f2×k, 其中, f1表示第 一预设修正量, f2表示第 二预设修正 量, k表示 为所述重复关联 数据集合中被标记关键词的数量与所述标记总数量B的比值。 4.根据权利要求3所述的基于通话数据检索的总 线消息处理系统, 其特征在于, 所述数 据处理模块在T2时间段内调用数据源时, 对所述关联数据集合进行筛选, 依次将关键词匹 配系数F与不同的参量进 行对比, 所述数据处理模块确定筛选方式时, 根据所述关键词匹配 系数F对应关联 数据集合是否为重复关联 数据集合确定所需对比参 量, 其中, 当所述关键词 匹配系数F对应数据集合不为重复关联数据集合时, 所述数据处理模块 将该关键词匹配系数F与所述第一预设关键词匹配系数对比参量修正F01 ’以及第二预设关 键词匹配系数对比参 量修正值F02’进行对比; 当所述关键词 匹配系数F对应数据集合为重复关联数据集合时, 所述第一预设关键词 匹配系数对比参 量F01以及第二预设 关键词匹配系数对比参 量F02进行对比。 5.根据权利要求4所述的基于通话数据检索的总 线消息处理系统, 其特征在于, 所述数 据处理模块依次将关键词匹配系数 F与不同的参 量进行对比, 调用数据源, 其中, 当存在所述重复关联数据集合对应的关键词匹配系数F大于等于所述第 二预设关键词 匹配系数对比参量F02时, 或/和, 当存在所述关联数据集合对应的关键词匹配系数F大于等 于所述第二预设 关键词匹配系数对比参 量修正值F02’时, 所述数据处 理模块仅调用与关键词匹配系数 F对应的关联 数据集合相关联的数据源; 当存在重复关联数据集合对应的关键词匹配系数F大于等于所述第 一预设关键词匹配 系数对比参量F01且小于所述第二预设关键词匹配系数对比参量F02时, 或/和, 当存在关联 数据集合对应的关键词匹配系数F大于等于所述第一预设关键词匹配系数对比参量修正   F01’且小于所述第二预设 关键词匹配系数对比参 量修正值F02’时, 所述数据处理模块将所述关键词 匹配系数F记录至一数据集合内, 记为二次判定用关 键词匹配系数集 合, 并进行二次判定确定需调用数据源; 当全部关键词 匹配系数F均小于所述第一预设关键词匹配系数对比参量F0时, 所述数权 利 要 求 书 2/3 页 3 CN 115203240 B 3

.PDF文档 专利 一种基于通话数据检索的总线消息处理系统

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于通话数据检索的总线消息处理系统 第 1 页 专利 一种基于通话数据检索的总线消息处理系统 第 2 页 专利 一种基于通话数据检索的总线消息处理系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:00:01上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。