说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211277521.2 (22)申请日 2022.10.19 (71)申请人 江苏益捷 思信息科技有限公司 地址 226000 江苏省南 通市启东经济开发 区林洋路5 00号 (72)发明人 计爱幼  (74)专利代理 机构 北京真致博文知识产权代理 事务所(普通 合伙) 11720 专利代理师 娄华 (51)Int.Cl. G06K 9/62(2022.01) (54)发明名称 一种数据优化聚类方法 (57)摘要 本发明涉及数据处理领域, 具体涉及一种数 据优化聚类方法。 该方法采集数据得到二维矩阵 数据, 利用最大类间方差获取最佳分割阈值, 利 用最佳分割阈值对二维矩 阵数据进行分割处理 得到二值矩阵, 根据二值矩阵得到行、 列累加和 曲线, 根据行、 列累加和曲线得到行、 列特征峰, 根据每个行、 列特征峰进行分析得到每个行、 列 特征峰的分割阈值, 利用每个行、 列特征峰的分 割阈值得到每个行、 列坐标范围, 结合每个行、 列 坐标范围得到每个目标区域, 根据每个目标区域 设置每个初始聚类中心, 基于初始聚类中心对二 值矩阵数据进行聚类分析得到类别集合, 通过所 述初始聚类中心的设置方式能够更接近每个类 别中心点, 从而提高聚类 计算的效率。 权利要求书2页 说明书7页 附图5页 CN 115358349 A 2022.11.18 CN 115358349 A 1.一种数据优化聚类方法, 其特 征在于, 所述方法包括: 采集数据, 进 而得到二维矩阵; 通过对二维矩阵进行阈值分割得到前景数据点集合和背景数据点集合; 将二维矩阵中 属于前景数据点集合中的各数据点设置为1, 将二维矩阵数据中属于背景数据点集合的各 数据点设置为0得到二 值矩阵; 根据二值矩阵得到每个目标的横坐标范围, 包括: 将二值矩阵的每行各数据累加得到 行累加和, 二值矩阵的所有行 的行累加和构成的序列记为行累加和序列, 根据行累加和序 列构建行累加和曲线;  将行累加和曲线分割得到多个行特征峰, 根据每个行特征峰得到每 个行特征峰 的第一斜率、 第二斜率, 根据每个行特征峰的第一斜率、 第二斜率和每个行特征 峰得到每个行特征峰的第一分割阈值, 根据每个行特征峰的第一分割阈值和每个行特征峰 得到每个行特征峰的第二分割阈值; 过每个行特征峰的第二分割阈值作与横轴平行的直 线, 直线与行 特征峰相较于 两点, 两点的横坐标构成每 个目标的横坐标 范围; 同理, 根据二值矩阵得到每个目标的纵坐标范围; 每个目标的横坐标范围和纵坐标范 围构成每 个目标的目标 范围; 在二维矩阵的每个目标的目标范围内放置一个初始聚类点, 基于初始聚类点对二维矩 阵前景数据点进行均值漂移聚类得到所有类别。 2.根据权利要求1所述的一种数据优化 聚类方法, 其特征在于, 所述通过对二维矩阵进 行阈值分割得到前 景数据点集合和背景 数据点集合的方法, 包括: 利用不同的预设分割阈值分别对二维矩阵数据进行分割处理得到第一类别和第二类 别, 根据第一类别和第二类别计算两类别的类别方差, 其中两类别的类别方差的计算公式 如下: 其中  表示第一类别、 第 二类别中数据个数占二维矩阵总数据个数的比例; , 表示第一类别中数据的均值、 第二类别中数据的均值, 表示第一类别与第二类别之间的 类别方差; 每个所述预设分割阈值对应一个所述类别方差, 选取类别方差最大值对应的预设分割 阈值记为最佳分割阈值, 将最佳分割阈值分割得到的第一类别内的所有 数据点记为前景数 据点集合, 将最佳分割阈值分割得到的第二类别内的所有数据点记为背景 数据点集合。 3.根据权利要求1所述的一种数据优化 聚类方法, 其特征在于, 所述根据每个行特征峰 得到每个行特征峰的第一 斜率、 第二斜率的方法, 包括: 获取每个行特征峰的极大值、 第 一极小值和第 二极小值, 根据每个行特征峰的极大值、 第一极小值计算每 个行特征峰的第一 斜率, 其中第一 斜率计算公式为: 其中,  表示每个行特征峰的极大值的横坐标,   表示每个行特征峰的极大值 的纵坐标,   表示每个行特征峰的第一极小值的横坐标,   表示每个行特征峰的 第一极小值的纵坐标,   表示每个行特征峰的第一 斜率;权 利 要 求 书 1/2 页 2 CN 115358349 A 2同理, 根据每 个行特征峰的极大值、 第二极小值计算每 个行特征峰的第二 斜率。 4.根据权利要求1所述的一种数据优化 聚类方法, 其特征在于, 所述根据每个行特征峰 的第一斜率、 第二斜率和每个行特征峰得到每 个行特征峰的第一分割阈值的方法, 包括: 对于每个行特征峰的极大值、 第一极小值和第二极小值, 获取第一极小值和第二极小 值中较大值记为大极小值; 根据每个行特征峰的第一斜率、 第二斜率、 极大值纵坐标和大极小值计算第一分割阈 值的计算公式为: 其中 表示大极小值的纵坐标, 表示每个行特征峰的第一斜率,   表示每个行特征 峰的第二斜率,   表示极大值的纵坐标, 表示每个行特征峰的第一分割阈值, exp()表 示以自然常数为底的指数模型。 5.根据权利要求1所述的一种数据优化 聚类方法, 其特征在于, 所述根据每个行特征峰 的第一分割阈值和每个行特征峰得到每个行特征峰的第二分割阈值的方法, 包括: 获取每 个行特征峰的极大值; 根据每个行特征峰的极大值和每个行特征峰的第一分割阈值计算每 个行特征峰的第二分割阈值的计算公式为: 其中 表示每个行特征峰的第一分割阈值,   表示每个行特征峰的极大值的纵坐标,   表示超参数,   表示经验比例系数, 表示二值矩阵的总列数, exp()表示以自然常数为底 的指数模型。权 利 要 求 书 2/2 页 3 CN 115358349 A 3

.PDF文档 专利 一种数据优化聚类方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据优化聚类方法 第 1 页 专利 一种数据优化聚类方法 第 2 页 专利 一种数据优化聚类方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:42:05上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。