(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210213438.2
(22)申请日 2022.03.04
(71)申请人 中国人民大 学
地址 100872 北京市海淀区中关村大街59
号
(72)发明人 杜玮 许伟 江冠燃 周季蕾
(74)专利代理 机构 北京纪凯知识产权代理有限
公司 11245
专利代理师 孙楠
(51)Int.Cl.
G06F 16/335(2019.01)
G06F 16/36(2019.01)
G06F 16/38(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)G06Q 50/20(2012.01)
(54)发明名称
一种基于知识图谱的在线课推荐方法及系
统
(57)摘要
本发明涉及一种基于知识图谱的在线课推
荐方法及系统, 其包括: 根据在线课程的信息和
特征, 提取实体构建在线课程知识图谱; 将知识
图谱中的三元组输入到表示学习模型中进行特
征学习, 得出实体和关系向量; 提取用户的历史
修读记录并与课程库相对应, 获得用户课程 ‑序
列数据; 使用深度学习模型transformer
encoder部分学习加入时间信息的历史记录, 训
练用户画像; 将用户画像与目标课程向量拼接,
获得维度扩展的新向量, 输入到DNN网络, 训练学
习模型; 根据训练后的学习模型输出的点击概
率, 为用户生成推荐列表。 本发明能更好地捕获
用户的时间学习兴趣, 根据目标用户的连续选课
行为向目标用户推荐课程; 可广泛在知识图谱和
深度学习领域中应用。
权利要求书3页 说明书11页 附图4页
CN 114722182 A
2022.07.08
CN 114722182 A
1.一种基于知识图谱的在线课推荐方法, 其特 征在于, 包括:
根据在线课程的信息和特 征, 提取实体构建在线课程知识图谱;
将所述知识图谱中的三元组输入到表示学习 模型中进行特征学习, 得出实体和关系向
量;
提取用户的历史修读记录, 并与课程库相对应, 获得用户课程 ‑序列数据;
对每个用户, 使用深度学习模型transformer encoder部分学习加入时间信息的历史
记录, 训练用户画像, 以刻画用户的喜好;
将用户画像与目标课程向量拼接, 获得维度扩展的新向量, 输入到DNN网络, 训练学习
模型;
根据训练后的所述学习模型输出的点击概 率, 为用户生成推荐列表。
2.如权利要求1所述基于知识图谱的在线课推荐方法, 其特征在于, 所述根据在线课程
的信息和特 征, 提取实体构建在线课程知识图谱, 包括:
根据用户的历史学习记录和课程相关的特 征, 提取实体和关系;
将提取的实体和关系进行编号, 将实体e从0开始编号到n, 将关系r也从0开始编号;
通过关系r关联头实体eh和尾实体et, 将编号构成三元组<eh,r,et>。
3.如权利要求1所述基于知识图谱的在线课推荐方法, 其特征在于, 所述将所述知识图
谱中的三元组输入到表示学习模型中进行 特征学习, 得出实体和关系向量, 包括:
基于负采样方法训练所述学习模型, 对于正例三元组<eh,r,et>通过更换头尾结点得
到负例三元组<eh',r,et′>;
初始化所述学习模型的参数, 包括映射矩阵和节点关系表示向量;
基于正例三元组和负例三元组的学习, 最大化负例三元组头尾节点的距离, 最小化正
例三元组头尾节点的距离, 根据损失函优化模型, 不断更新参数, 直到损失函数停止下降,
学习模型收敛, 学习模型输出实体和关系的表示向量。
4.如权利要求1所述基于知识图谱的在线课推荐方法, 其特征在于, 所述使用深度 学习
模型transformer encoder部分学习加入时间信息的历史记录, 训练用户画像, 包括:
统计用户历史记录的最大长度、 最小长度和平均长度, 选择固定长度作为maxlen为基
准分割历史学习记录, 若用户历史记录不足maxlen则补0, 并加上正无穷数;
对用户历史序列进行顺序和时间编码, 使课程表示向量中包含知识图谱的信 息和用户
行为信息;
使用多头注意力机制对历史序列训练权重, 将维度d拆分成为h份, 每一份的维度为d/
h, 每一份向量包 含了不同的信息;
多头注意力层的输出送到归一化和残差连接层进行处理, 特征包含残差连接和归一
化, 相当于在输出向量中加入输入向量;
输出进入前馈神经网络Feed Forward Neural Network层经过两层激 活函数做全连接
维度变换;
前馈神经网络的输出 再次输入残差连接与归一 化;
用户历史序列经过transformer的学习后, 输出经过学习后的课程向量序列, 将表示向
量相加作为用户画像的向量表示。
5.如权利要求4所述基于知识图谱的在线课推荐方法, 其特征在于, 所述对用户历史序权 利 要 求 书 1/3 页
2
CN 114722182 A
2列进行顺序和时间编码, 包括:
对每位用户, 每一条记录进行编号, 按照课程学习顺序编码为k=[0, 1, 2..., n], 序 号i
代表用户加入平台后学习的第i门课;
使用注册课程时间间隔进一步捕捉用户行为包含的信息, 计算每一门注册时间ti与注
册第一门课程t0的时间间隔Δt0i;
对时间间隔Δt0i做minmax标准化, 将Δt0i缩放到0‑kmax之间, kmax代表用户历史记录的
长度, 缩放后的时间 间隔表示 为t(vk);
将位置信息和时间信息加 和, 得到最终编码顺序信息TPos(vk)=k+t(vk);
使用sin和cos周期函数, 扩展 TPos(vk)维度与课程向量表示的维度相同;
将TPos(vk)输入到对应课程的向量表示中, 使课程表示向量中包含知识图谱的信息和
用户行为信息 。
6.如权利要求1所述基于知识图谱的在线课推荐方法, 其特征在于, 所述将用户画像与
目标课程向量 拼接, 获得维度扩展的新向量, 输入到DN N网络, 训练学习模型, 包括:
经过DNN网络做全连接变换, 使用梯度下降方法迭代更新权重, 利用若干个权重系数矩
阵W, 偏倚向量b来和输入值向量x进行线性运算和 激活运算, 从输入层开始, 一层层的向后
计算, 一直到运算到输出层, 得到输出结果值, DNN输出的数据范围设置为0 ‑1, 表示预测推
荐分数;
将用户集合划分为训练集和测试集, 将训练集输入到学习模型中学习, 直到学习模型
收敛。
7.如权利要求1所述基于知识图谱的在线课推荐方法, 其特征在于, 所述根据训练后的
所述学习模型输出的点击概 率, 为用户生成推荐列表, 包括:
采用测试数据的用户集输入训练好的学习 模型中, 课程候选集合为除输入模型学习外
的全部课程, 以模拟真实场景;
在候选集中的每一个候选物品, 都和用户历史记录组合进行学习模型学习, 输出点击
概率;
对所有物品的点击概率值从高到低进行排序, 选择排序后的前K个物品作为推荐结果,
输出物品的id编号;
重复上述过程, 直到 输出所有用户的推荐列表。
8.一种基于知识图谱的在线课推荐系统, 其特 征在于, 包括:
提取模块, 根据在线课程的信息和特 征, 提取实体构建在线课程知识图谱;
特征学习模块, 将所述知识图谱中的三元组输入到表示学习模型中进行特征学习, 得
出实体和关系向量;
数据获取模块, 提取用户的历史修读记录, 并与课程库相对应, 获得用户课程 ‑序列数
据;
处理模块, 对每个用户, 使用深度学习模型transformer encoder部分学习加入时间信
息的历史记录, 训练用户画像, 以刻画用户的喜好;
训练模块, 将用户画像与目标课程向量拼接, 获得维度扩展的新向量, 输入到DNN网络,
训练学习模型;
推荐列表生成模块, 根据训练后的所述学习模型输出的点击概率, 为用户生成推荐列权 利 要 求 书 2/3 页
3
CN 114722182 A
3
专利 一种基于知识图谱的在线课推荐方法及系统
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:52:54上传分享