说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210063160.5 (22)申请日 2022.01.19 (71)申请人 西南交通大 学 地址 611756 四川省成 都市高新区西部园 区西南交通大 学 申请人 农业农村 部大数据发展中心 (72)发明人 胡华浪 韩旭 黄进 李剑波  申克建  (74)专利代理 机构 成都弘毅天承知识产权代理 有限公司 5123 0 专利代理师 岳子强 (51)Int.Cl. G06V 20/10(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01)G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于无监督聚类的在建房屋识别方法 (57)摘要 本发明公开了一种基于无监督聚类的在建 房屋识别方法, 涉及计算机视觉技术领域, 包括 以下步骤: 通过图像采集装置采集在建房屋的 图 像数据; 对收集到图像数据中的在建房屋的位置 进行人工标注, 然后将标注后的在建房屋进行裁 剪, 得到在建房屋图像数据集; 设置好聚类的类 别数目, 然后将在建房屋图像数据采用对比聚类 的无监督方式进行类别划分; 各个在建房屋在通 过聚类后都有相应的类别, 将该在建房屋数据的 类别标注到原始图像上的标签; 对于标注上标签 的在建房屋数图像据集, 采用Yolox目标检测算 法进行模型训练; 根据房屋数据的每个类别在测 试集的预测效果, 调整每个类别的置信度阈值; 更有利于模型的训练和收敛, 保持高召回率, 提 高检测精度。 权利要求书3页 说明书7页 附图3页 CN 114581769 A 2022.06.03 CN 114581769 A 1.一种基于无监 督聚类的在建房屋识别方法, 其特 征在于, 包括以下步骤: S1、 制作数据集: 通过图像采集装置采集在建房屋的图像数据; S2、 数据集预处理: 对收集到图像数据中的在建房屋的位置进行人工标注, 然后将标注 后的在建房屋进行裁 剪, 得到在建房屋图像数据集; S3、 数据无监督聚类: 设置好聚类的类别数目, 然后将S2步骤得到的在建房 屋图像数据 采用对比聚类的无监 督方式进行类别划分; S4、 标签重定义: 各个在建房屋在通过 聚类后都有相应的类别, 将该在 建房屋数据的类 别标注到原 始图像上的标签; S5、 检测模型训练: 对于标注上标签的在建房屋数图像据集, 采用Yolox目标检测算法 进行模型训练; S6、 模型置信度阈值设定: 根据房屋数据的每个类别在测试集的预测效果, 调整每个类 别的置信度阈值。 2.根据权利要求1所述的一种基于无监督聚类的在建房屋识别方法, 其特征在于, 所述 步骤S1中通过图像采集装置采集在建房屋的各个时期、 各个角度、 不同焦距的图像数据。 3.根据权利要求1所述的一种基于无监督聚类的在建房屋识别方法, 其特征在于, 所述 步骤S2中使用Label  Image工具对图像中的在建房屋的位置进行 人工标注。 4.根据权利要求1所述的一种基于无监督聚类的在建房屋识别方法, 其特征在于, 所述 步骤S3中在建房屋图像数据采用对比聚类的无监 督方式进行类别划分包括以下步骤: 在建房屋图像数据样本xi, 使用两种数据增强方式Ta和Tb, 增强后的图像 和 为: 对增强后的图像采用Resnet34作为特 征提取网络, 提取 特征向量表示 为: 其中 和 代表特征向量, f( ·)表示特征提取网络; 特征向量 和 再经过两层非线性感知器(MLP)进行映射 为: 其中 和 表示映射后的特 征向量, g( ·)表示非线性感知器; 定义样本 的损失 为: 权 利 要 求 书 1/3 页 2 CN 114581769 A 2其中τI是实例层次的temperature参数, s( ·)代表余弦相似度运算, N表示设定的batch 大小, 因此经过数据增强过后, batch内共有2N个数据, 对于每一个样 本都可以形成1个正样 本对和2N ‑2个负样本对, 和 分别表示一个batch中第j个样本经过Ta和Tb数据增强后所 提取的特 征向量; 样本在实例层次总损失lins如下式所示: 当数据样本被映射到与聚类cluster数量相同的空间维度 时, 数据特征的每一维可以 看作是该样本属于该类别的概率, 通过特征提取网络提取的特征向量经过两层非线性感知 器将其映射成M, M表示聚类 类别数维向量, 即: 其中gc(·)为非线性感知器, 和 分别表示经过感知器映射过后的M维向量, 则一个 batch内的样本在Ta和Tb数据增强下组成Ya∈RN×M,Yb∈RN×M矩阵; 定义 为Ya中第i列, 同理, 为Yb第i列, 因此样本 与 在集群层次的损失 定 义为: 其中τC是集群层次的temperture参数, M表示聚类类别数, 为样本在Ta数据增强下第j 个类别的聚类分配, 同理, 表示样本在Tb数据增强下第j个 类别的聚类分配; 样本在集群层次总损失lclu为下式所示: H(Y)为聚类分配概率的信息熵, 是为了避免网络将所有实例都分配到一个聚类簇中, 具体表示如下式所示: 权 利 要 求 书 2/3 页 3 CN 114581769 A 3

.PDF文档 专利 一种基于无监督聚类的在建房屋识别方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于无监督聚类的在建房屋识别方法 第 1 页 专利 一种基于无监督聚类的在建房屋识别方法 第 2 页 专利 一种基于无监督聚类的在建房屋识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 09:12:08上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。