说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111204240.X (22)申请日 2021.10.15 (71)申请人 合肥智能语音创新发展 有限公司 地址 230088 安徽省合肥市高新区习友路 3333号中 国 (合肥) 国际智能语音产业 园A区2号科研楼15 01室 (72)发明人 谢智鹏 万根顺 高建清 刘聪 王智国 胡国平 (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 代理人 钱湾湾 (51)Int.Cl. G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 一种标签信息确定方法及其相关 设备 (57)摘要 本申请公开了一种标签信息确定方法及其 相关设备, 该方法包括: 先 获取待标注数据; 再在 确定用户触发预设操作过程之后, 将该待标注数 据发送给该用户, 以便在获取到该用户针对该待 标注数据输入的用户识别信息 之后, 根据该用户 识别信息, 确定待标注数据的标签信息, 如此能 够实现自动确定标签信息的目的。 可见, 因上述 “待标注数据的标签信息 ”是借助预设操作过程 中所涉及的用户输入数据进行确定的, 使得该 “待标注数据的标签信息 ”属于预设操作过程的 附加产物, 如此能够有效地降低标签信息的获取 成本。 权利要求书2页 说明书15页 附图2页 CN 113947145 A 2022.01.18 CN 113947145 A 1.一种标签信息确定方法, 其特 征在于, 所述方法包括: 获取待标注数据; 在确定用户触发预设操作过程之后, 将所述待标注数据发送给 所述用户; 在获取到所述用户针对所述待标注数据输入的用户识别信 息之后, 根据 所述用户识别 信息, 确定所述待标注数据的标签信息 。 2.根据权利要求1所述的方法, 其特征在于, 所述用户的个数为N, 且所述用户识别信 息 的个数为 N; 其中, N 为正整数; 所述待标注数据的标签信息的确定过程, 包括: 从N个用户识别 信息中筛 选出满足第二条件的目标识别 信息; 根据所述目标识别 信息, 确定所述待标注数据的标签信息 。 3.根据权利要求2所述的方法, 其特 征在于, 所述目标识别 信息的确定过程, 包括: 对所述N个用户识别 信息进行聚类处 理, 得到至少一个候选信息集; 从所述至少一个候选信息集中确定目标信息集; 其中, 所述目标信息集的用户识别信 息个数不低于所述至少一个候选信息集中除了所述目标信息集以外的其他任意一个候选 信息集的用户识别 信息个数; 根据所述目标信息集, 确定所述目标识别 信息。 4.根据权利要求2所述的方法, 其特 征在于, 所述目标识别 信息的确定过程, 包括: 对所述N个用户识别 信息进行投票处 理, 得到至少一个候选识别 信息的投票个数; 根据至少一个候选识别信 息的投票个数, 从所述至少一个候选识别信 息中确定所述目 标识别信息; 其中, 所述 目标识别信息的投票个数不低于所述至少一个候选识别信息中除 了所述目标识别 信息以外的其 他任意一个候选识别 信息的投票个数。 5.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 对所述待标注数据进行 标签识别处 理, 得到所述待标注数据的标签识别结果; 所述在确定用户触发预设操作过程之后, 将所述待标注数据发送给 所述用户, 包括: 若确定所述标签识别结果满足第一条件, 则在确定用户触发预设操作过程之后, 将所 述待标注数据发送给 所述用户。 6.根据权利要求5所述的方法, 其特征在于, 所述根据所述用户识别信息, 确定所述待 标注数据的标签信息, 包括: 若确定所述用户识别信 息与所述标签识别结果之间的相似度达到预设相似度阈值, 则 将所述用户识别 信息, 确定为所述待标注数据的标签信息 。 7.根据权利要求5所述的方法, 其特 征在于, 所述方法还 包括: 根据所述标签识别结果的置信度, 确定所述标签识别结果是否满足第一条件。 8.根据权利要求7 所述的方法, 其特 征在于, 所述待标注数据包括至少一帧音频 数据; 所述标签识别结果的置信度的确定过程, 包括: 获取各帧所述音频 数据的音素识别结果; 根据各帧所述音频 数据的音素识别结果, 确定各帧所述音频 数据的置信度; 根据所述至少一帧音频 数据的置信度, 确定所述标签识别结果的置信度。 9.根据权利要求8所述的方法, 其特征在于, 所述音频数据的帧数为M; 第m帧音频数据 的音素识别结果包括Gm个音素归属信息; 其中, M为 正整数, m为 正整数, m≤ M, Gm为正整数;权 利 要 求 书 1/2 页 2 CN 113947145 A 2所述第m帧音频 数据的置信度的确定过程, 包括: 根据第g个音素归属信息, 确定所述第 g个音素归属信息的信息量; 其中, g为正整数, g ≤Gm; 根据所述Gm个音素归属信息的信息量的和值, 确定所述第m帧音频 数据的置信度。 10.根据权利要求5所述的方法, 其特 征在于, 所述方法还 包括: 若确定所述标签识别结果满足第三条件, 则根据所述标签识别结果, 确定所述待标注 数据的标签信息 。 11.根据权利要求1所述的方法, 其特 征在于, 所述待标注数据为语音数据; 所述方法还 包括: 在获取到所述用户针对所述待标注数据输入的用户音频数据之后, 将所述用户识别信 息, 确定为所述用户音频 数据的标签信息 。 12.根据权利要求1所述的方法, 其特 征在于, 所述待标注数据为语音数据; 所述方法还 包括: 在获取到所述用户针对所述待标注数据输入的用户音频数据之后, 对所述用户音频数 据和所述待标注数据进行合并处 理, 得到合并音频 数据; 所述根据所述用户识别 信息, 确定所述待标注数据的标签信息, 包括: 根据所述用户识别 信息, 确定所述 合并音频 数据的标签信息 。 13.一种标签信息确定装置, 其特 征在于, 包括: 数据获取 单元, 用于获取待标注数据; 数据发送单元, 用于在确定用户触发预设操作过程之后, 将所述待标注数据发送给所 述用户; 标签确定单元, 用于在获取到所述用户针对所述待标注数据输入的用户识别信息之 后, 根据所述用户识别 信息, 确定所述待标注数据的标签信息 。 14.一种设备, 其特 征在于, 所述设备包括: 处 理器、 存储器、 系统总线; 所述处理器以及所述存 储器通过 所述系统总线相连; 所述存储器用于存储一个或多个程序, 所述一个或多个程序包括指令, 所述指令当被 所述处理器执行时使所述处 理器执行权利要求1至12任一项所述的方法。 15.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有指令, 当所述指令在终端设备上运行时, 使得所述终端设备执行权利要求1至12任一项所述的方 法。权 利 要 求 书 2/2 页 3 CN 113947145 A 3
专利 一种标签信息确定方法及其相关设备
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-19 02:00:18
上传分享
举报
下载
原文档
(537.3 KB)
分享
友情链接
T-CADERM 5019—2023 急性有机磷农药中毒诊治要求.pdf
GB-T 38591-2020 建筑抗震韧性评价标准.pdf
GB-T 35284-2017 信息安全技术 网站身份和系统安全要求与评估方法.pdf
GB-T 24421.2-2023 服务业组织标准化工作指南 第2部分:标准体系构建.pdf
GB-T 42381.8-2023 数据质量 第8部分:信息和数据质量:概念和测量.pdf
CB-T 4521-2022 船舶行业企业工业管道和气体橡胶软管安全管理规定.pdf
GM-T 0064-2018 限域通信(RCC)密码检测要求.pdf
GB-T 23456-2018 磷石膏.pdf
GB-T 16296.1-2018 声学 测听方法 第1部分:纯音气导和骨导测听法.pdf
GB-T 13575.1-2022 普通和窄V带传动 第1部分:基准宽度制.pdf
SY-T 7647-2021 气藏型储气库地面工程设计规范.pdf
GB-T 24600-2009 城镇污水处理厂污泥处置 土地改良用泥质.pdf
TB-T 1804-2017 铁道车辆空调 空调机组.pdf
GB-T 28454-2020 信息技术 安全技术 入侵检测和防御系统(IDPS)的选择、部署和操作.pdf
法律法规 银川市建筑节能管理条例2011-12-12.pdf
GB 29743.1-2022 机动车冷却液 第1部分:燃油汽车发动机冷却液.pdf
GB-T 14914.6-2021 海洋观测规范 第6部分:数据处理与质量控制.pdf
思度安全-DSMM-019 数据安全事件应急管理规范V1.0.pdf
SY-T 7657.4-2021 天然气 利用光声光谱-红外光谱-燃料电池联合法测定组成 第4部分:燃料电池法测定氢含量.pdf
T-CSES 41—2021 二氧化碳捕集利用与封存术语.pdf
1
/
3
20
评价文档
赞助1.5元 点击下载(537.3 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。