专利一种基于K-Means聚类算法的学生发展方向预测方法及系统

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111541954.X (22)申请日 2021.12.16 (71)申请人湖北美和易思教育科技有限公司地址 430000 湖北省武汉市东湖新技术开发区北斗路6号武汉国家地球空间信息产业化基地(新区)一期1.1期A14栋 2层01室 (72)发明人海克洪　朱飞　 (74)专利代理机构武汉红观专利代理事务所 (普通合伙) 42247 代理人曾国辉 (51)Int.Cl. G06Q 10/04(2012.01) G06N 3/04(2006.01) G06K 9/62(2022.01) (54)发明名称一种基于 K-Means聚类算法的学生发展方向预测方法及系统 (57)摘要本发明提供了一种基于K ‑Means聚类算法的学生发展方向预测方法及系统，所述方法包括：采集高职院校的学生学情分析数据，并将其作为训练数据；利用K ‑Means聚类算法对训练数据进行处理，采用特征选择算法对K ‑Means聚类算法进行优化，找出影响高职学生发展方向的主要因素；构建RBF神经网络模型，将影响高职学生发展方向的主要因素输入到RBF神经网络模型进行优化训练，得到训练好的学生发展方向预测模型；利用训练好的学生发展方向预测模型对处理后的待预测学生学情数据进行分析，预测并输出学生未来发展方向的预测结果。本发明充分利用了学情分析数据对学生的未来发展方向进行预测，为制定学生学习计划和职业发展规划提供可行性的建议。权利要求书3页说明书7页附图2页 CN 114154751 A 2022.03.08 CN 114154751 A 1.一种基于K ‑Means聚类算法的学生发展方向预测方法，其特征在于，所述方法包括： S1，采集高职院校的学生学情分析数据，并将其作为训练数据； S2，利用K ‑Means聚类算法对训练数据进行处理，采用特征选择算法对K ‑Means聚类算法进行优化，找出影响高职学生发展方向的主要因素； S3，构建RBF神经网络模型，将影响高职学生发展方向的主要因素输入到RBF神经网络模型进行优化训练，得到训练好的学生发展方向预测模型； S4，获取待预测学生学情数据并对待预测学生学情数据进行处理，利用训练好的学生发展方向预测模型对处理后的待预测学生学情数据进行分析，预测并输出学生未来发展方向的预测结果。 2.如权利要求1所述的一种基于K ‑Means聚类算法的学生发展方向预测方法，其特征在于，步骤S2中，采用特征选择算法对K ‑Means聚类算法进行优化具体包括： S201，对训练数据进行抽样得到样本数据集S＝{S1,S2,…,Sm}，每个数据对象都包含q 个特征属性，即Si＝{Si1,Si2,…,Siq}，将样本数据集划分为k个不同的类别集合C＝{C1, C2,…,Ck},Ci∈C； S202，随机选择一个数据对象Si作为质心， Si∈S，计算各类别集合中的数据对象与Si的欧式距离，从中选择与Si距离最近的d个数据对象； S203， d个数据对象与Si构成新的集合T(c),其他数据对象根据其所属类别构成了新的集合G(c)； S204，依据集合T(c)和G(c)更新各特征属性的特征权重向量，按照权重值从大到小的顺序进行排序，筛选出权重值靠前的z个特征属性。 3.如权利要求2所述的一种基于K ‑Means聚类算法的学生发展方向预测方法，其特征在于，步骤S204具体包括：依据集合T(c)和G(c)更新各特征属性的特征权重向量，得到权重向量集合W＝{W1, W2,…,Wq},其计算公式为：其中， t表示第t个特征属性， t＝1,2, …,q， i＝1,2, …,m， q(c)表示集合T(c)中包含第t 个特征属性的数据个数， q(S(Si))表示样本数据集中包含第t个特征属性的数据个数， diff (t,Si,x)表示数据对象在第t个特征属性上的差值函数， n表示抽取样本数据的次数。 4.如权利要求2所述的一种基于K ‑Means聚类算法的学生发展方向预测方法，其特征在于，步骤S2中，采用特征选择算法对K ‑Means聚类算法进行优化之后还包括：根据筛选出的特征属性，针对每一个聚类重新选择聚类中心，不断地进行更新聚类，根据均衡判别函数判别聚类的程度，当均衡判别函数取最小值时，得到最优的聚类结果，即为影响高职学生发展方向的主要因素。 5.如权利要求4所述的一种基于K ‑Means聚类算法的学生发展方向预测方法，其特征在于，根据均衡判别函数判别聚类的程度包括：计算样本数据集中数据对象xi与所属类别的聚类中心ci之间的聚类的平方，计算公式为：权　利　要　求　书 1/3 页 2 CN 114154751 A 2计算两个类簇间的差异，其计算公式为其中， ci和ci分别为第i个和第j个类簇的聚类中心；均衡判别函数的计算公式为：其中， k为聚类个数， b(c)为类簇之间的差异， w(c)为类簇内部的差异。 6.如权利要求1所述的一种基于K ‑Means聚类算法的学生发展方向预测方法，其特征在于，步骤S3中RBF神经网络模型具体包括：所述RFB神经网络模型为单隐层多层神经网络结构，包括输入层、隐藏层和输出层，输入层的神经元个数为m，输出层神经元个数为n，隐藏层神经元个数为h，隐藏层激活函数为高斯径向基函数，输出层激活函数为线性函数。 7.如权利要求6所述的一种基于K ‑Means聚类算法的学生发展方向预测方法，其特征在于，步骤S 3中，将影响高职学生发展方向的主要因素输入到RBF神经网络模型进行优化训练具体包括：影响高职学生发展方向的主要因素有p个，表示为X＝{x1,x2,…,xp}， y表示预测模型的输出结果，将影响高职学生发展方向的主要因素作为输入变量，将学生的发展方向作为最终的输出变量，则对应的函数关系表示为y＝f(x1,x2,…,xp)。 8.如权利要求7所述的一种基于K ‑Means聚类算法的学生发展方向预测方法，其特征在于，隐藏层激活函数为高斯径向基函数具体包括：设定隐藏层采用径向基函数作为RBF神经网络的高斯函数，其计算公式为：其中， x表示RBF神经网络模型的输入变量， σ 表示隐藏层神经元的宽度参数；利用高斯径向函数可以得到隐藏层的输入与输出Hi之间的非线性对应关系，其表达式为其中， ci表示第i个隐藏层神经节点到输出层神经节点的偏置向量， σi为第i个隐藏层神经元的宽度参数， i ＝1,2,…,h。 9.如权利要求8所述的一种基于K ‑Means聚类算法的学生发展方向预测方法，其特征在于，输出层激活函数为线性函数具体包括：输出层实现从隐藏层到输出层的线性输出， y表示输出层节点的输出，其计算公式为其中， k表示隐藏层中的节点数， wi表示第i个隐藏层到输出层中节点的权重， hi为第i个权　利　要　求　书 2/3 页 3 CN 114154751 A 3

专利 一种基于K-Means聚类算法的学生发展方向预测方法及系统

专利一种基于K-Means聚类算法的学生发展方向预测方法及系统