专利一种基于知识图谱的在线课推荐方法及系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210213438.2 (22)申请日 2022.03.04 (71)申请人中国人民大学地址 100872 北京市海淀区中关村大街59 号 (72)发明人杜玮　许伟　江冠燃　周季蕾　 (74)专利代理机构北京纪凯知识产权代理有限公司 11245 专利代理师孙楠 (51)Int.Cl. G06F 16/335(2019.01) G06F 16/36(2019.01) G06F 16/38(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06Q 50/20(2012.01) (54)发明名称一种基于知识图谱的在线课推荐方法及系统 (57)摘要本发明涉及一种基于知识图谱的在线课推荐方法及系统，其包括：根据在线课程的信息和特征，提取实体构建在线课程知识图谱；将知识图谱中的三元组输入到表示学习模型中进行特征学习，得出实体和关系向量；提取用户的历史修读记录并与课程库相对应，获得用户课程 ‑序列数据；使用深度学习模型transformer encoder部分学习加入时间信息的历史记录，训练用户画像；将用户画像与目标课程向量拼接，获得维度扩展的新向量，输入到DNN网络，训练学习模型；根据训练后的学习模型输出的点击概率，为用户生成推荐列表。本发明能更好地捕获用户的时间学习兴趣，根据目标用户的连续选课行为向目标用户推荐课程；可广泛在知识图谱和深度学习领域中应用。权利要求书3页说明书11页附图4页 CN 114722182 A 2022.07.08 CN 114722182 A 1.一种基于知识图谱的在线课推荐方法，其特征在于，包括：根据在线课程的信息和特征，提取实体构建在线课程知识图谱；将所述知识图谱中的三元组输入到表示学习模型中进行特征学习，得出实体和关系向量；提取用户的历史修读记录，并与课程库相对应，获得用户课程 ‑序列数据；对每个用户，使用深度学习模型transformer encoder部分学习加入时间信息的历史记录，训练用户画像，以刻画用户的喜好；将用户画像与目标课程向量拼接，获得维度扩展的新向量，输入到DNN网络，训练学习模型；根据训练后的所述学习模型输出的点击概率，为用户生成推荐列表。 2.如权利要求1所述基于知识图谱的在线课推荐方法，其特征在于，所述根据在线课程的信息和特征，提取实体构建在线课程知识图谱，包括：根据用户的历史学习记录和课程相关的特征，提取实体和关系；将提取的实体和关系进行编号，将实体e从0开始编号到n，将关系r也从0开始编号；通过关系r关联头实体eh和尾实体et，将编号构成三元组＜eh,r,et＞。 3.如权利要求1所述基于知识图谱的在线课推荐方法，其特征在于，所述将所述知识图谱中的三元组输入到表示学习模型中进行特征学习，得出实体和关系向量，包括：基于负采样方法训练所述学习模型，对于正例三元组＜eh,r,et＞通过更换头尾结点得到负例三元组＜eh',r,et′＞；初始化所述学习模型的参数，包括映射矩阵和节点关系表示向量；基于正例三元组和负例三元组的学习，最大化负例三元组头尾节点的距离，最小化正例三元组头尾节点的距离，根据损失函优化模型，不断更新参数，直到损失函数停止下降，学习模型收敛，学习模型输出实体和关系的表示向量。 4.如权利要求1所述基于知识图谱的在线课推荐方法，其特征在于，所述使用深度学习模型transformer encoder部分学习加入时间信息的历史记录，训练用户画像，包括：统计用户历史记录的最大长度、最小长度和平均长度，选择固定长度作为maxlen为基准分割历史学习记录，若用户历史记录不足maxlen则补0，并加上正无穷数；对用户历史序列进行顺序和时间编码，使课程表示向量中包含知识图谱的信息和用户行为信息；使用多头注意力机制对历史序列训练权重，将维度d拆分成为h份，每一份的维度为d/ h，每一份向量包含了不同的信息；多头注意力层的输出送到归一化和残差连接层进行处理，特征包含残差连接和归一化，相当于在输出向量中加入输入向量；输出进入前馈神经网络Feed Forward Neural Network层经过两层激活函数做全连接维度变换；前馈神经网络的输出再次输入残差连接与归一化；用户历史序列经过transformer的学习后，输出经过学习后的课程向量序列，将表示向量相加作为用户画像的向量表示。 5.如权利要求4所述基于知识图谱的在线课推荐方法，其特征在于，所述对用户历史序权　利　要　求　书 1/3 页 2 CN 114722182 A 2列进行顺序和时间编码，包括：对每位用户，每一条记录进行编号，按照课程学习顺序编码为k＝[0， 1， 2...， n]，序号i 代表用户加入平台后学习的第i门课；使用注册课程时间间隔进一步捕捉用户行为包含的信息，计算每一门注册时间ti与注册第一门课程t0的时间间隔Δt0i；对时间间隔Δt0i做minmax标准化，将Δt0i缩放到0‑kmax之间， kmax代表用户历史记录的长度，缩放后的时间间隔表示为t(vk)；将位置信息和时间信息加和，得到最终编码顺序信息TPos(vk)＝k+t(vk)；使用sin和cos周期函数，扩展 TPos(vk)维度与课程向量表示的维度相同；将TPos(vk)输入到对应课程的向量表示中，使课程表示向量中包含知识图谱的信息和用户行为信息。 6.如权利要求1所述基于知识图谱的在线课推荐方法，其特征在于，所述将用户画像与目标课程向量拼接，获得维度扩展的新向量，输入到DN N网络，训练学习模型，包括：经过DNN网络做全连接变换，使用梯度下降方法迭代更新权重，利用若干个权重系数矩阵W，偏倚向量b来和输入值向量x进行线性运算和激活运算，从输入层开始，一层层的向后计算，一直到运算到输出层，得到输出结果值， DNN输出的数据范围设置为0 ‑1，表示预测推荐分数；将用户集合划分为训练集和测试集，将训练集输入到学习模型中学习，直到学习模型收敛。 7.如权利要求1所述基于知识图谱的在线课推荐方法，其特征在于，所述根据训练后的所述学习模型输出的点击概率，为用户生成推荐列表，包括：采用测试数据的用户集输入训练好的学习模型中，课程候选集合为除输入模型学习外的全部课程，以模拟真实场景；在候选集中的每一个候选物品，都和用户历史记录组合进行学习模型学习，输出点击概率；对所有物品的点击概率值从高到低进行排序，选择排序后的前K个物品作为推荐结果，输出物品的id编号；重复上述过程，直到输出所有用户的推荐列表。 8.一种基于知识图谱的在线课推荐系统，其特征在于，包括：提取模块，根据在线课程的信息和特征，提取实体构建在线课程知识图谱；特征学习模块，将所述知识图谱中的三元组输入到表示学习模型中进行特征学习，得出实体和关系向量；数据获取模块，提取用户的历史修读记录，并与课程库相对应，获得用户课程 ‑序列数据；处理模块，对每个用户，使用深度学习模型transformer encoder部分学习加入时间信息的历史记录，训练用户画像，以刻画用户的喜好；训练模块，将用户画像与目标课程向量拼接，获得维度扩展的新向量，输入到DNN网络，训练学习模型；推荐列表生成模块，根据训练后的所述学习模型输出的点击概率，为用户生成推荐列权　利　要　求　书 2/3 页 3 CN 114722182 A 3

专利 一种基于知识图谱的在线课推荐方法及系统

专利一种基于知识图谱的在线课推荐方法及系统