说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210664462.8 (22)申请日 2022.06.13 (71)申请人 北京哈希泰格信息科技有限公司 地址 100089 北京市海淀区西四环中路19 号1号楼5层- 569号 (72)发明人 张玉睿 赵强 任海琨  (74)专利代理 机构 苏州国卓知识产权代理有限 公司 323 31 专利代理师 金伟 (51)Int.Cl. G06F 40/30(2020.01) G06F 16/36(2019.01) (54)发明名称 一种基于人工智能技术的信息处理方法及 系统 (57)摘要 本发明公开一种基于人工智能技术的信息 处理方法及系统。 所述方法包括: 接收多模态信 息文件输入; 对输入的多模态信息文件作为整体 进行阅读理解, 对多模态信息文件进行语义向量 建模和表 示, 通过自然语言处理对语义向量在自 然语言语义结构上进行关系映射, 映射为该数据 集的特定目标的知 识图谱; 提供分类浏览、 导航、 搜索、 计算等接口, 直接调用这些接口输出所需 处理结果。 采用本发明技术方案, 能够大幅度降 低信息系统软件工程开发复杂度,提升了大规模 文件信息处理效率和质量, 降低人工智能技术应 用门槛, 降低了企业将数据变成生产要素复杂 度 和门槛, 提升数据信息创造价值的可能, 让人工 智能技术的信息处 理应用的普惠性成为可能。 权利要求书2页 说明书5页 附图2页 CN 115081457 A 2022.09.20 CN 115081457 A 1.一种基于人工智能技 术的信息处 理方法, 其特 征在于, 包括: 通过文件对象识别接口接收多模态信息文件输入, 将接收到的文件对象作为整体识 别; 对输入的多模态信 息进行信息理解, 构建领域语言模型, 对信 息语义转换和融合, 并表 示为人可认知理解的信息语义编码, 得到领域语义向量数据集表示; 通过语言语义模型训练对领域语义向量数据集在自然语言语义结构上进行自然语言 关系映射, 将领域语义向量数据集中多组特定关系映射为该数据集的特定目标的知识图 谱, 并将接入的业务逻辑管理系统与特定数据集相结合, 根据领域行业动态构建语义表示, 提供一个业务逻辑语义表示框架, 实现对语言向量表示与业务逻辑、 人 的自然表达自动化 映射。 2.如权利要求1所述的一种基于人工智能技术的信 息处理方法, 其特征在于, 多模态信 息文件包括网页、 doc格式文件、 pdf格式文件、 txt格式文件、 音频文件、 视频文件。 3.如权利要求1所述的一种基于人工智能技术的信 息处理方法, 其特征在于, 对输入的 多模态信息进行信息理解, 具体为使用机器人模拟模式, 对输入的多模态信息进行信息理 解, 通过机器人模拟人浏览、 阅读、 看视频、 听音频的模式, 实现对文件内容信息的获取。 4.如权利要求1所述的一种基于人工智能技术的信 息处理方法, 其特征在于, 在对文件 进行信息转译过程中, 计算框架开始对其文本语义信息、 上下文信息进行语义向量建模和 表示, 通过语义结构框架, 建立文档在数据集 合范围内的语义向量表示。 5.如权利要求1所述的一种基于人工智能技术的信 息处理方法, 其特征在于, 通过语言 语义模型对语义向量在自然语言语义结构上进行关系映射, 在特定词语、 句子、 段落、 上下 文结构上表示语义内容。 6.如权利要求5所述的一种基于人工智能技术的信 息处理方法, 其特征在于, 所述语言 语义模型 是基于特定数据集训练的基础语言模型。 7.如权利要求1所述的一种基于人工智能技术的信息处理方法, 其特征在于, 还包括: 预留业务逻辑映射接口, 通过这个业务逻辑映射接口接入公司业务逻辑映射的管理系统, 实现对特定数据集和公司业务相结合, 最终实现对系统运行中, 该算法和模型系统为业务 目标服务。 8.一种基于人工智能技术的信息处理系统, 其特征在于, 包括: 文件对象识别接口、 信 息处理单元和系统输出接口; 文件对象识别接口, 用于 接收多模态信息文件输入; 信息处理单元, 用于对输入的多模态信息文件作为整体进行阅读理解, 对多模态信息 文件进行语义向量建模和表示, 通过自然语言处理对语义向量在自然语言语义结构上进 行 关系映射, 映射 为该数据集的特定目标的知识图谱; 系统输出接口, 用于提供分类浏览、 导航、 搜索、 计算接口, 调用这些接口输出所需处理 结果。 9.如权利要求8所述的一种基于人工智能技术的信 息处理系统, 其特征在于, 信 息处理 单元具体包括: 语义向量建模模块、 自然语言映射模块、 知识图谱映射模块和业务逻辑映射 模块; 语义向量建模模块, 用于动态根据行业、 领域对多模态信息文件进行语义向量建模和权 利 要 求 书 1/2 页 2 CN 115081457 A 2表示; 自然语言映射模块, 用于对语义向量在自然语言语义结构上进行关系映射; 知识图谱映射模块, 用于将n组特定关系映射 为数据集的特定目标的知识图谱; 业务逻辑映射模块, 用于将接入的业务逻辑管理系统与特定数据集相结合, 根据领域 行业动态构建语义表示, 提供一个业务逻辑语义表示框架, 实现对计算语言向量表示与业 务逻辑、 人的自然表达自动化映射。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中包括: 至少一 个存储器和至少一个处 理器; 存储器用于存 储一个或多个程序指令; 处理器, 用于运行一个或多个程序指令, 用以执行如权利要求1 ‑7任一项所述的一种基 于人工智能技 术的信息处 理方法。权 利 要 求 书 2/2 页 3 CN 115081457 A 3

.PDF文档 专利 一种基于人工智能技术的信息处理方法及系统

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于人工智能技术的信息处理方法及系统 第 1 页 专利 一种基于人工智能技术的信息处理方法及系统 第 2 页 专利 一种基于人工智能技术的信息处理方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:52:45上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。