(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210784238.2
(22)申请日 2022.07.05
(71)申请人 中国电子科技 集团公司电子科 学研
究院
地址 100041 北京市石景山区双园路1 1号
(72)发明人 欧阳小叶 郭大宇 王亚珅
刘弋锋
(74)专利代理 机构 工业和信息化部电子专利中
心 11010
专利代理师 袁鸿
(51)Int.Cl.
G06F 40/30(2020.01)
G06F 40/242(2020.01)
G06F 40/216(2020.01)
G06F 40/211(2020.01)
(54)发明名称
基于语义增强网络的平台企业网络舆论情
感分析方法
(57)摘要
本申请公开了一种基于语义增强网络的平
台企业网络舆论情感分析方法, 包括: 基于平台
企业舆情相关文本和构建的平台企业舆论情感
词典, 形成平台企业舆论情感数据集; 对所述平
台企业舆论情感数据集中句子的词进行多级向
量表示, 以获得句子中单词的语义向量; 对所述
平台企业舆情相关文本进行句法分析, 计算出句
法分析树的概率值; 基于平台企业舆论情感数据
集的语义向量进行语义增强匹配, 以获得语义增
强的语义向量; 基于语义增强的语义向量进行句
子嵌入表 示; 基于句子嵌入表 示的结果进行情感
预设, 以获得预测结果。 本申请的方法利用 深度
学习技术实现快速高效的情感分析, 针对网络财
经文本的情绪分析, 有助于了解公众的情绪状
态, 及时获取舆论和态度。
权利要求书3页 说明书7页 附图1页
CN 115329769 A
2022.11.11
CN 115329769 A
1.一种基于语义增强网络的平台企业网络 舆论情感分析 方法, 其特 征在于, 包括:
基于互联网中监测到的平台企业舆情相关文本和构建的平台企业舆论情感词典, 形成
平台企业舆论情感数据集;
对所述平台企业舆论情感数据集中句子的词进行多级向量表示, 以获得句子中单词的
语义向量;
对所述平台企业舆情相关文本进行句法分析, 计算出句法分析树的概率值, 并进行去
噪处理;
基于去噪后的所述平台企业舆情相关文本, 以及, 平台企业舆论情感数据集的语义向
量进行语义增强匹配, 以获得语义增强的语义向量;
基于语义增强的语义向量进行句子嵌入表示;
基于句子嵌入表示的结果进行情感预设, 以获得 预测结果。
2.如权利要求1所述的基于语义增强网络的平台企业网络舆论情感分析方法, 其特征
在于, 基于互联网中监测到的平台企业舆情相关文本和构建的平台企业舆论情感词典, 形
成平台企业舆论情感数据集包括:
将互联网中监测到的平台企业舆情相关文本和构建的平台企业舆论情感词典作为文
本输入数据, 利用TF/IDF算法进行筛选, 以形成由正面情感词典和负面情感词典两部分组
成的平台企业舆论情感数据集。
3.如权利要求2所述的基于语义增强网络的平台企业网络舆论情感分析方法, 其特征
在于, 对所述平台企业舆论情感数据集中句 子的词进行多级向量表示, 以获得句 子中单词
的语义向量包括:
基于所述平台企业舆论情感数据集中句子的词:
使用卷积网络进行字符级向量表示;
基于GloVe词嵌入工具, 以获得词级向量表示;
基于Bert嵌入工具 得到句子级别向量表示;
串联字符级向量表示、 词级向量表示以及句子级别向量表示, 并将串联信息, 通过
Albert模型进行编码, 以获得句子中单词的语义向量:
其中, ew表示单词的语义向量,
表示词w的字符级向量表示,
为词w的词级向量表
示,
表示词w的句子级向量表示。
4.如权利要求3所述的基于语义增强网络的平台企业网络舆论情感分析方法, 其特征
在于, 对所述平台企业舆情相关文本进 行句法分析, 计算出句法分析树的概率值, 并进行去
噪处理包括:
利用PCFG句法分析模型对平台企业舆情相关文本进行句法分析, 计算出句法分析树的
概率值;
依据概率值对所有分析树进行排序, 选择概率值靠前的句法分析树作为分析结果; 以
及
根据PCFG得到句子中每 个词的概 率值对句法树进行剪枝, 去掉 概率低的词。
5.如权利要求4所述的基于语义增强网络的平台企业网络舆论情感分析方法, 其特征权 利 要 求 书 1/3 页
2
CN 115329769 A
2在于, 基于去噪后的所述平台企业舆情相关文本, 以及, 平台企业舆论情感数据集的语义向
量进行语义增强匹配, 以获得语义增强的语义向量包括:
基于去噪后的所述平台企业舆情相关文本, 和, 平台企业舆论情感数据集进行语义增
强匹配, 以构建语义增强矩阵M∈Rd×d。
6.如权利要求5所述的基于语义增强网络的平台企业网络舆论情感分析方法, 其特征
在于, 基于语义增强的语义向量进行句子嵌入表示包括:
将所述语义增强矩阵作为输入, 进行 卷积操作:
其中σ(·)是ReLU函数, z(l,f)表示第l层的f类型输出端口的特征映射, 表示, z(l,f)=Mf,
为窗口大小, W(l,f)和b(l)为参数, Fl‑1表示第(l ‑1)层特征数;
使用
和
作为池化操作的宽度和高度进行池化操作:
以池化输出的匹配向量被映射到低维空间中去, 得到匹配向量[v1,...,vn];
将匹配向量作为句子嵌入模块的输入, 利用一个GRU单元, 得到输出隐藏向量[h ′1...,
h′n]作为句子嵌入表示。
7.如权利要求5所述的基于语义增强网络的平台企业网络舆论情感分析方法, 其特征
在于, 基于句子嵌入表示的结果进行情感预设, 以获得 预测结果包括:
将隐藏向量[h ′1...,h′n], 作为情感预测模块的输入, 定义匹配得分g(s,m,c):
其中, Wd1、 Wd2、 Wd、 bd2、 bd1是参数, ts是在训练中习得的虚拟文本向量, hi是隐藏向量
[h′1...,h′n]的第i个隐藏状态,
是词w的最终隐藏状态。
8.一种基于语义增强网络的平台企业网络 舆论情感分析装置, 其特 征在于, 包括:
文本输入模块: 用于基于互联网中监测到的平台企业舆情相关文本和构建的平台企业
舆论情感词典, 形成平台企业舆论情感数据集;
词嵌入模块: 用于对所述平台企业舆论情感数据集中句子的词进行多级向量表示, 以
获得句子中单词的语义向量;
语义增强模块: 用于对所述平台企业舆情相关文本进行句法分析, 计算出句法分析树
的概率值, 并进行去 噪处理; 基于去噪后的所述平台企业舆情相关文本, 以及, 平台企业舆
论情感数据集的语义向量进行语义增强匹配, 以获得语义增强的语义向量;权 利 要 求 书 2/3 页
3
CN 115329769 A
3
专利 基于语义增强网络的平台企业网络舆论情感分析方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:12:18上传分享