(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111541954.X
(22)申请日 2021.12.16
(71)申请人 湖北美和易思教育科技有限公司
地址 430000 湖北省武汉市东湖新 技术开
发区北斗路6号武汉国家地球空间信
息产业化基地(新区)一期1.1期A14栋
2层01室
(72)发明人 海克洪 朱飞
(74)专利代理 机构 武汉红观 专利代理事务所
(普通合伙) 42247
代理人 曾国辉
(51)Int.Cl.
G06Q 10/04(2012.01)
G06N 3/04(2006.01)
G06K 9/62(2022.01)
(54)发明名称
一种基于 K-Means聚类算法的学生发展方向
预测方法及系统
(57)摘要
本发明提供了一种基于K ‑Means聚类算法的
学生发展方向预测方法及系统, 所述方法包括:
采集高职院校的学生学情分析数据, 并将其作为
训练数据; 利用K ‑Means聚类算法对训练数据进
行处理, 采用特征选择算法对K ‑Means聚类算法
进行优化, 找出影 响高职学生发展方向的主要因
素; 构建RBF神经网络模型, 将影 响高职学生发展
方向的主要因素输入到RBF神经网络模 型进行优
化训练, 得到训练好的学生发展方向预测模型;
利用训练好的学生发展方向预测模型对处理后
的待预测学生学情数据进行分析, 预测并输出学
生未来发展方向的预测结果。 本发 明充分利用了
学情分析数据对 学生的未来发展方向进行预测,
为制定学生学习计划和职业发展规划提供可行
性的建议。
权利要求书3页 说明书7页 附图2页
CN 114154751 A
2022.03.08
CN 114154751 A
1.一种基于K ‑Means聚类算法的学生发展方向预测方法, 其特 征在于, 所述方法包括:
S1, 采集高职院校的学生学情分析 数据, 并将其作为训练数据;
S2, 利用K ‑Means聚类算法对训练数据进行处理, 采用特征选择算法对K ‑Means聚类算
法进行优化, 找出影响高职学生发展方向的主 要因素;
S3, 构建RBF神经网络模型, 将影响高职学生发展方向的主要因素输入到RBF神经网络
模型进行优化训练, 得到训练好的学生发展方向预测模型;
S4, 获取待预测学生学情数据并对待预测学生学情数据进行处理, 利用训练好的学生
发展方向预测模型对处理后的待 预测学生学情数据进 行分析, 预测并输出学生未来 发展方
向的预测结果。
2.如权利 要求1所述的一种基于K ‑Means聚类算法的学生发展方向预测方法, 其特征在
于, 步骤S2中, 采用特 征选择算法对K ‑Means聚类算法进行优化具体包括:
S201, 对训练数据进行抽样得到样本数据集S={S1,S2,…,Sm}, 每个数据对象都包含q
个特征属性, 即Si={Si1,Si2,…,Siq}, 将样本数据集划分为k个不同的类别集合C={C1,
C2,…,Ck},Ci∈C;
S202, 随机选择一个数据对象Si作为质心, Si∈S, 计算各类别集合中的数据对象与Si的
欧式距离, 从中选择与Si距离最近的d个数据对象;
S203, d个数据对象与Si构成新的集合T(c),其他数据对象根据其所属类别构成了新的
集合G(c);
S204, 依据集合T(c)和G(c)更新各特征属性的特征权重向量, 按照权重值从大到小的
顺序进行排序, 筛 选出权重值靠前的z个特 征属性。
3.如权利 要求2所述的一种基于K ‑Means聚类算法的学生发展方向预测方法, 其特征在
于, 步骤S204具体包括:
依据集合T(c)和G(c)更新各特征属性的特征权重向量, 得到权重向量集合W={W1,
W2,…,Wq},其计算公式为:
其中, t表示第t个特征属性, t=1,2, …,q, i=1,2, …,m, q(c)表示集合T(c)中包含第t
个特征属性的数据个数, q(S(Si))表示样本数据集中包含第t个特征属性的数据个数, diff
(t,Si,x)表示数据对象在第t个特 征属性上的差值 函数, n表示抽取样本数据的次数。
4.如权利 要求2所述的一种基于K ‑Means聚类算法的学生发展方向预测方法, 其特征在
于, 步骤S2中, 采用特 征选择算法对K ‑Means聚类算法进行优化之后还 包括:
根据筛选出的特征属性, 针对每一个聚类重新选择聚类 中心, 不断地进行更新聚类, 根
据均衡判别函数判别聚类的程度, 当均衡判别函数取最小值时, 得到最优的聚类结果, 即为
影响高职学生发展方向的主 要因素。
5.如权利 要求4所述的一种基于K ‑Means聚类算法的学生发展方向预测方法, 其特征在
于, 根据均衡判别函数判别聚类的程度包括:
计算样本数据集中数据对象xi与所属类别的聚类中心ci之间的聚类的平方, 计算公式
为:权 利 要 求 书 1/3 页
2
CN 114154751 A
2计算两个 类簇间的差异, 其计算公式为
其中, ci和ci分别为第i个和第j个 类簇的聚类中心;
均衡判别函数的计算公式为:
其中, k为聚类个数, b(c)为类簇之间的差异, w(c)为类簇内部的差异。
6.如权利 要求1所述的一种基于K ‑Means聚类算法的学生发展方向预测方法, 其特征在
于, 步骤S3中RBF神经网络模型 具体包括:
所述RFB神经网络模型为单隐层多层神经网络结构, 包括输入层、 隐藏层和输出层, 输
入层的神经元个数为m, 输出层神经元个数为n, 隐藏层神经元个数为h, 隐藏层激活函数为
高斯径向基函数, 输出层激活函数为线性 函数。
7.如权利 要求6所述的一种基于K ‑Means聚类算法的学生发展方向预测方法, 其特征在
于, 步骤S 3中, 将影响高职学生 发展方向的主要因素输入到RBF神经网络模型进 行优化训练
具体包括:
影响高职学生发展方向的主要因素有p个, 表示为X={x1,x2,…,xp}, y表示预测模型的
输出结果, 将影响高职学生发展方向的主要因素作为输入变量, 将学生的发展方向作为最
终的输出变量, 则对应的函数关系表示 为y=f(x1,x2,…,xp)。
8.如权利 要求7所述的一种基于K ‑Means聚类算法的学生发展方向预测方法, 其特征在
于, 隐藏层激活函数为高斯径向基函数 具体包括:
设定隐藏层采用径向基函数作为RBF神经网络的高斯 函数, 其计算公式为:
其中, x表示RBF神经网络模型的输入变量, σ 表示隐藏层神经 元的宽度参数;
利用高斯径向函数可以得到隐藏层的输入与输出Hi之间的非线性对应关系, 其表达式
为
其中, ci表示第i个隐藏层神经节点到输出层神经节点的偏置向量, σi为第i个隐藏层神
经元的宽度参数, i =1,2,…,h。
9.如权利 要求8所述的一种基于K ‑Means聚类算法的学生发展方向预测方法, 其特征在
于, 输出层激活函数为线性 函数具体包括:
输出层实现从隐藏层到 输出层的线性输出, y表示输出层节点的输出, 其计算公式为
其中, k表示隐藏层中的节点数, wi表示第i个隐藏层 到输出层中节点的权重, hi为第i个权 利 要 求 书 2/3 页
3
CN 114154751 A
3
专利 一种基于K-Means聚类算法的学生发展方向预测方法及系统
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 23:41:14上传分享