说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210830873.X (22)申请日 2022.07.15 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 郦炀宁 向玥佳 陈曦  (74)专利代理 机构 华进联合专利商标代理有限 公司 44224 专利代理师 张思佳 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/194(2020.01) G06F 16/335(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 对象扩展方法、 装置、 计算机设备和存储介 质 (57)摘要 本申请涉及一种对象扩展方法、 装置、 计算 机设备、 存储介质和计算机程序产品。 所述方法 包括: 获取种子对象集、 以及该种子对象集对应 的候选对象集; 对种子对象集中的各正类种子对 象和各负类种子对象分别进行语义特征提取, 获 得各正类种子对象各自对应的正类子语义特征、 以及各负类种子对象各自对应的负类子语义特 征; 对各正类子语义特征和各负类子语义特征进 行特征融合处理, 获得该种子对象集的综合语义 特征; 基于候选对象集中各候选对象各自对应的 候选对象特征与综合语义特征进行特征匹配得 到的结果, 从各候选对象中筛选出满足扩展条件 的扩展对象。 采用上述方法可以提高对象扩展结 果的准确性。 权利要求书3页 说明书17页 附图8页 CN 115186676 A 2022.10.14 CN 115186676 A 1.一种对象扩展方法, 其特 征在于, 所述方法包括: 获取种子对象集、 以及所述种子对象集对应的候选对象集; 对所述种子对象集中的各种子对象分别进行语义特征提取, 获得各所述种子对象各自 对应的子语义特征; 所述种子对 象包括正类种子对 象和负类种子对 象; 所述子语义特征包 括各所述正类种子对象各自对应的正类子语义特征、 以及各所述负 类种子对象各自对应的 负类子语义特 征; 对各所述正类子语义特征和各所述负类子语义特征进行特征融合处理, 获得所述种子 对象集的综合语义特 征; 基于所述候选对象集中各候选对象各自对应的候选对象特征分别与所述综合语义特 征进行特征匹配得到的结果, 从各 所述候选对象中筛 选出满足扩展条件的扩展对象。 2.根据权利要求1所述的方法, 其特征在于, 所述对各所述正类子语义特征和各所述负 类子语义特 征进行特征融合, 获得 所述种子对象集的综合语义特 征, 包括: 分别对同一类别的各子语义特征进行特征融合处理, 获得同一类别的各所述子语义特 征对应的目标语义特征; 所述目标语义特征包括各所述正类种子对象共同表征的正类语义 特征、 以及各 所述负类种子对象共同表征的负类 语义特征; 结合所述 正类语义特征和所述负类 语义特征, 获得所述种子对象集的综合语义特 征。 3.根据权利要求2所述的方法, 其特征在于, 所述对同一类别的各子语义特征进行特征 融合处理, 获得同一类别的各 所述子语义特 征对应的目标语义特 征, 包括: 获取同一类别的各子语义特 征各自对应的置换等变处 理结果; 对各所述置换等变处 理结果进行置换不变处 理, 获得置换不变处 理结果; 根据所述置换不变处 理结果确定同一类别的各 所述子语义特 征对应的目标语义特 征。 4.根据权利要求3所述的方法, 其特征在于, 所述获取同一类别的各子语义特征各自对 应的置换等变处 理结果, 包括: 基于学习矩阵和偏置特征, 对 同一类别的各子语义特征进行线性运算, 获得各所述子 语义特征各自对应的线性 运算结果; 对各所述子语义特征各自对应的线性运算结果分别进行编码处理, 获得各所述子语义 特征各自对应的置换等变处 理结果。 5.根据权利要求4所述的方法, 其特征在于, 所述对各所述子语义特征各自对应的线性 运算结果分别进行编码处 理, 获得各所述子语义特 征各自对应的置换等变处 理结果, 包括: 对所述子语义特征对应的线性运算结果、 以及基于多层感知神经网络获得的所述线性 运算结果的非线性输出进 行叠加处理, 获得各所述子语义特征各自对应的置换等变处理结 果。 6.根据权利要求3所述的方法, 其特征在于, 所述对各所述置换等变处理结果进行置换 不变处理, 获得置换不变处 理结果, 包括: 对各所述置换等变处 理结果进行求和处 理, 获得求和结果; 对所述求和结果进行二 次编码处理, 获得各所述置换等变处理结果对应的置换不变处 理结果。 7.根据权利要求2所述的方法, 其特征在于, 所述结合所述正类语义特征和所述负类语 义特征, 获得所述种子对象集的综合语义特 征, 包括:权 利 要 求 书 1/3 页 2 CN 115186676 A 2对所述正类语义特征和所述负类 语义特征进行拼接处 理, 获得拼接语义特 征; 基于所述拼接语义特征在语义空间中的映射结果, 确定所述种子对象集的综合语义特 征。 8.根据权利要求1至7中任意一项所述的方法, 其特征在于, 所述对所述种子对象集中 的各种子对象分别进行语义特 征提取, 获得 各所述种子对象各自对应的子语义特 征, 包括: 获取包含同一种子对象的多个种子文本; 对各所述种子文本分别进行语义分析, 确定所述种子对象在各所述种子文本中的候选 子语义特 征; 基于各所述候选子语义特 征, 确定所述种子对象对应的子语义特 征。 9.根据权利要求8所述的方法, 其特征在于, 所述基于各所述候选子语义特征, 确定所 述种子对象对应的子语义特 征, 包括: 对各所述候选子语义特征进行池化处理, 获得各所述候选子语义特征对应的池化语义 特征; 对所述池化语义特 征进行归一 化处理, 获得所述种子对象对应的子语义特 征。 10.根据权利要求1至7中任意 一项所述的方法, 其特 征在于, 所述方法还 包括: 对所述候选对象集中各候选对象分别进行语义特征提取, 获得各所述候选对象各自对 应的候选语义特 征; 对各所述候选语义特征分别进行编码处理, 获得各所述候选对象各自对应的候选对象 特征。 11.根据权利要求1至7中任意一项所述的方法, 其特征在于, 所述对象扩展方法基于目 标神经网络模型实现, 训练得到所述目标神经网络模型的过程, 包括: 获取候选样本集和种子样本集, 并从所述候选样本集和所述种子样本集中确定正类训 练样本和负类训练样本; 所述正类训练样本包括所述种子样本集中的正类种子样本; 所述 负类训练样本包括所述种子样本集中的负类种子样本、 以及所述候选样本集中与所述种子 样本集中各种子样本的语义类型相异的负类候选样本; 使用所述 正类训练样本和所述负类训练样本进行模型训练, 获得目标神经网络模型。 12.一种对象扩展装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取种子对象集、 以及所述种子对象集对应的候选对象集; 语义特征提取模块, 用于对所述种子对象集中的各种子对象分别进行语义特征提取, 获得各所述种子对象各自对应的子语义特征; 所述种子对象包括正类种子对象和负 类种子 对象; 所述子语义特征包括各所述正类种子对 象各自对应的正类子语义特征、 以及各所述 负类种子对象各自对应的负类子语义特 征; 综合语义特征确定模块, 用于对各所述正类子语义特征和各所述负类子语义特征进行 特征融合处 理, 获得所述种子对象集的综合语义特 征; 对象扩展模块, 用于基于所述候选对象集中各候选对象各自对应的候选对象特征分别 与所述综合语义特征进行特征匹配得到的结果, 从各所述候选对象中筛选出满足扩展 条件 的扩展对象。 13.一种计算机设备, 包括存储器和 处理器, 所述存储器存储有计算机程序, 其特征在 于, 所述处 理器执行所述计算机程序时实现权利要求1至1 1中任一项所述的方法的步骤。权 利 要 求 书 2/3 页 3 CN 115186676 A 3

.PDF文档 专利 对象扩展方法、装置、计算机设备和存储介质

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 对象扩展方法、装置、计算机设备和存储介质 第 1 页 专利 对象扩展方法、装置、计算机设备和存储介质 第 2 页 专利 对象扩展方法、装置、计算机设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:12:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。