说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210731090.6 (22)申请日 2022.06.24 (71)申请人 东软睿驰汽车技 术 (大连) 有限公司 地址 116000 辽宁省大连市经济技 术开发 区九号办公区发展大厦515 (72)发明人 王雪 曹斌  (74)专利代理 机构 北京超成律师事务所 1 1646 专利代理师 王晓菲 (51)Int.Cl. G06F 16/9536(2019.01) G06F 40/253(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 基于网络评论的用户性别确定方法、 装置和 电子设备 (57)摘要 本发明提供了一种本发明提供的一种基于 网络评论的用户性别确定方法、 装置和电子设 备, 涉及人工智 能技术领域。 通过获取网络评论 语料, 并对所述网络评论语料进行预处理, 得到 预处理后的网络评论语料; 根据语法特征模型, 确定预处理后的网络评论语料对应的目标语法 特征, 所述目标语 法特征用于确定网络评论语料 的用户性别的语 言特征, 所述目标语 法特征包括 以下的一种或多种: 词类、 词组和句式; 根据所述 目标语法特征属于每种用户性别的评价值, 确定 每个所述目标语 法特征的熵权值; 根据网络评论 语料对应的目标语法特征属于每种用户性别的 熵权值, 确定用户性别。 以此通过语法特征以及 熵权值, 可以有效的判断评论的性别, 提升了性 别识别的准确性。 权利要求书2页 说明书14页 附图3页 CN 115033806 A 2022.09.09 CN 115033806 A 1.一种基于网络 评论的用户性别确定方法, 其特 征在于, 所述方法包括: 获取网络评论语料, 并对所述网络评论语料进行预处理, 得到预处理后的网络评论语 料; 根据语法特征模型, 确定所述预处理后的网络评论语料对应的目标语法特征, 所述目 标语法特征为用于确定网络评论语料的用户性别的语言特征, 所述目标语法特征包括以下 的一种或多种: 词类、 词组和句式; 根据所述目标语法特征属于每种用户性别的评价值, 确定每个所述目标语法特征的熵 权值; 根据所述网络评论语料对应的目标语法特征属于每种用户性别的熵权值, 确定用户性 别。 2.根据权利要求1所述的方法, 其特征在于, 根据语法特征模型, 确定所述预处理后的 网络评论语料对应的目标语法特 征的步骤, 包括: 获取所述预处 理后的网络 评论语料中的语法特 征; 根据所述语法特征模型对应的语法特征范围, 确定所述语法特征中的目标语法特征, 所述语法特 征范围中的每 个语法特征的卡方值符合预设要求。 3.根据权利要求1所述的方法, 其特征在于, 根据 所述目标语法特征属于每种用户性别 的评价值, 确定每 个所述目标语法特 征的熵权值的步骤, 包括: 根据每个所述目标语法特征对应的指标种类, 确定每个所述目标语法特征对于每种用 户性别的评价 值, 其中, 每 个所述目标语法特 征包括至少一种指标; 基于所述评价 值计算每种用户性别中每 个所述目标语法特 征对应的指标的比重; 根据每种指标的比重, 计算所述指标的熵权值。 4.根据权利要求1所述的方法, 其特征在于, 根据 所述网络评论语料对应的目标语法特 征属于每种用户性别的熵权值, 确定用户性别的步骤, 包括: 获取所述网络评论语料对应的目标语法特征中, 属于男性性别的熵权值和属于女性性 别的熵权值; 将属于男性性别的每个目标语法特征对应的熵权值和属于女性性别的每个目标语法 特征对应的熵权值, 分别进行加 和; 根据男性 性别熵权值和女性 性别熵权值, 确定每 个用户性别。 5.根据权利要求4所述的方法, 其特征在于, 根据男性性别熵权值和女性性别熵权值, 确定每个用户性别的步骤, 包括: 若所述男性性别熵权值大于所述女性性别熵权值, 则所述网络评论语料的用户性别为 男性; 若所述男性性别熵权值小于所述女性性别熵权值, 则所述网络评论语料的用户性别为 女性。 6.根据权利要求1所述的方法, 其特征在于, 所述语法特征模型通过网络评论样本训练 得到。 7.根据权利要求1所述的方法, 其特征在于, 获取网络评论语料, 并对所述网络评论语 料进行预处理, 得到预处 理后的网络 评论语料的步骤, 包括: 获取用户评论的网络页面, 从所述网络页面中抽取网络 评论语料;权 利 要 求 书 1/2 页 2 CN 115033806 A 2对所述网络 评论语料进行分词操作。 8.一种基于网络 评论的用户性别确定装置, 其特 征在于, 所述装置包括: 语料获取模块, 获取网络评论语料, 并对所述网络评论语料进行预处理, 得到预处理后 的网络评论语料; 特征确定模块, 根据语法特征模型, 确定所述预处理后的网络评论语料对应的目标语 法特征, 所述 目标语法特征为用于确定网络评论语料 的用户性别的语言特征, 所述 目标语 法特征包括以下的一种或多种: 词类、 词组和句式; 权值确定模块, 根据所述目标语法特征属于每种用户性别的评价值, 确定每个所述目 标语法特 征的熵权值; 性别确定模块, 根据 所述网络评论语料对应的目标语法特征属于每种用户性别的熵权 值, 确定用户性别。 9.一种电子设备, 包括存储器、 处理器, 所述存储器中存储有可在所述处理器上运行的 计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现上述权利要求1至7任一 项所述的方法的步骤。 10.一种机器可读存储介质, 其特征在于, 所述机器可读存储介质存储有机器可执行指 令, 所述机器可执行指令在被处理器调用和执行时, 机器可执行指令促使处理器实现权利 要求1至7任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 115033806 A 3

.PDF文档 专利 基于网络评论的用户性别确定方法、装置和电子设备

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于网络评论的用户性别确定方法、装置和电子设备 第 1 页 专利 基于网络评论的用户性别确定方法、装置和电子设备 第 2 页 专利 基于网络评论的用户性别确定方法、装置和电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:12:11上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。