说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111668305.6 (22)申请日 2021.12.3 0 (71)申请人 合肥工业大 学 地址 230009 安徽省合肥市包河区屯溪路 193号 (72)发明人 余本功 宋宇婷 杨善林 张强  周开乐 张书文 谢星雨 罗贺  丁帅  (74)专利代理 机构 北京久诚知识产权代理事务 所(特殊普通 合伙) 11542 代理人 余罡 (51)Int.Cl. G06F 16/35(2019.01) G06K 9/62(2022.01) G06F 40/211(2020.01)G06F 40/284(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于Bi-LS TM-GCN的多标签文本分类方法和 系统 (57)摘要 本发明提供一种基于Bi ‑LSTM‑GCN的多标签 文本分类方法、 系统、 存储介质和电子设备, 涉及 文本分类领域。 本发明实施例 分别利用Bi ‑LSTM 提取文本特征, 综合考虑了不同粒度的信息; 利 用GCN提取标签隐层关系, 并结合注意力的思想, 捕获句子中对分类效果提高更有效的重要词汇; 融合含有全局特征的句级特征用于标签预测; 最 终获得更加全面的特征信息从而提高多标签分 类效果。 权利要求书2页 说明书8页 附图1页 CN 114357167 A 2022.04.15 CN 114357167 A 1.一种基于Bi ‑LSTM‑GCN的多标签文本分类方法, 其特征在于, 包括Bi ‑LSTM模型和GCN 模型, 包括: 获取并预处 理多标签文本和对应的标签 类别集合; 将预处理后的多标签文本 输入Bi‑LSTM模型, 获取词级特 征和句级特 征; 根据预处理后的标签类别集合, 获取标签语义表示集合; 以及获取各个标签类别两两 之间的共现概 率, 确定共现矩阵; 将所述标签语义表示集合和共现矩阵输入GCN模型中, 建立关于标签的无向图, 获取各 个标签类别之间的隐层关系信息; 根据所述词级特征和隐层关系信息, 获取赋权后的词级特征; 融合所述句级特征和赋 权后的词级特 征, 获取所述多标签文本的预测分类结果。 2.如权利要求1所述的多标签文本分类方法, 其特征在于, 所述预处理过程包括词嵌入 处理。 3.如权利要求1所述的多标签文本分类方法, 其特征在于, 所述获取标签语义表示集 合, 包括: 根据预处 理后的标签 类别集合, 获取各个标签 类别对应的单词数量; 向量化各个标签 类别对应的所有单词和所述多标签文本 至同一维度; 平均化向量 化后的各个单词, 获取 单个标签 类别的语义表示; 根据所述各个单个标签 类别的语义表示, 获取 所述标签 语义表示 集合。 4.如权利要求3所述的多标签文本分类方法, 其特 征在于, 所述获取 各个标签 类别两两之间的共现概 率, 确定邻接矩阵, 包括: 根据所述预处理后的标签类别集合中各个标签类别的出现概率, 获取各个标签类别 两 两之间的共现概 率; 根据各个所述共现概 率, 获取各个标签 类别两两之间的共现关系; 根据各个所述共现关系, 获取共现矩阵; 所述建立关于标签的无向图, 包括: 采用预处理后的标签类别集合作为所述无向图的节点集合, 采用所述标签语义表示集 合作为所述无向图的对应节点的语义特 征, 采用邻接矩阵作为所述无向图的邻接矩阵。 5.如权利要求4所述的多标签文本分类方法, 其特征在于, 所述获取各个标签类别之间 的隐层关系信息, 包括: 其中, A表示所述邻接矩阵, I表示单位矩阵, 表示无向图G的度矩阵, σ (·)是激活函数, W为权重参数矩阵, H(l)H(l+1)分别表示第l和l+1层的特征, 表 示最后一层的特 征, 即隐层关系信息 。 6.如权利要求5所述的多标签文本分类方法, 其特 征在于, 所述根据所述词级特征和隐层关系信息, 参考注意力机制 获取赋权后的词级特征, 包权 利 要 求 书 1/2 页 2 CN 114357167 A 2括: Y=softmax(H ·XT) 其中, H表示隐层关系信息; XT表示各个词级特征的集合X的转置矩阵; Y表示权重矩阵; 表示各个词级特 征的得分集 合; 所述融合所述句级特征和赋权后的词级特征, 获取所述多标签文本的预测分类结果, 包括: S=fc(hn) 其中, fc表示Functi on函数; O表示融合信息; hn表示所述句级特 征; 将所述融合信息O通过sigmoid函数返回不同的概率值, 从而进行所述多标签文本的分 类预测。 7.如权利要求1~6任一项所述的多标签文本分类方法, 其特征在于, 采用二元交叉熵 函数作为损失函数。 8.一种基于Bi ‑LSTM‑GCN的多标签文本分类系统, 其特征在于, 包括Bi ‑LSTM模型和GCN 模型, 包括: 预处理模块, 用于获取并预处 理多标签文本和对应的标签 类别集合; 第一提取模块, 用于将预处理后的多标签文本输入Bi ‑LSTM模型, 获取词级特征和句级 特征; 确定模块, 用于根据 预处理后的标签类别集合, 获取标签语义表示集合; 以及获取各个 标签类别两两之间的共现概 率, 确定共现矩阵; 第二提取模块, 用于将所述标签语义表示集合和共现矩阵输入GCN模型中, 建立关于标 签的无向图, 获取 各个标签 类别之间的隐层关系信息; 预测模块, 用于根据 所述词级特征和隐层 关系信息, 获取赋权后的词级特征; 融合所述 句级特征和赋权后的词级特 征, 获取所述多标签文本的预测分类结果。 9.一种存储介质, 其特征在于, 其存储有用于基于Bi ‑LSTM‑GCN的多标签文本分类的计 算机程序, 其中, 所述计算机程序使得计算机执行如权利要求1~7任一项所述的多标签文 本分类方法。 10.一种电子设备, 其特 征在于, 包括: 一个或多个处 理器; 存储器; 以及 一个或多个程序, 其中所述一个或多个程序被存储在所述存储器中, 并且被配置成由 所述一个或多个处理器执行, 所述程序包括用于执行如权利要求 1~7任一项 所述的多标签 文本分类方法。权 利 要 求 书 2/2 页 3 CN 114357167 A 3

.PDF文档 专利 基于Bi-LSTM-GCN的多标签文本分类方法和系统

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于Bi-LSTM-GCN的多标签文本分类方法和系统 第 1 页 专利 基于Bi-LSTM-GCN的多标签文本分类方法和系统 第 2 页 专利 基于Bi-LSTM-GCN的多标签文本分类方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:55:55上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。