说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111237748.X (22)申请日 2021.10.2 2 (71)申请人 北京工业大 学 地址 100124 北京市朝阳区平乐园10 0号 (72)发明人 王立春 李爽 王少帆 孔德慧 尹宝才 (74)专利代理 机构 北京市中 闻律师事务所 11388 代理人 冯梦洪 (51)Int.Cl. G06V 10/772(2022.01) G06V 10/774(2022.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 一种面向零样本识别的字典学习方法及装 置 (57)摘要 公开一种面向零样本识别的字典学习方法 及装置, 可以从类别层面和图像层面分别建立视 觉空间和语义空间之间的对齐, 从而实现高精度 的零样本图像识别。 方法包括: (1)基于跨域字典 学习方法训练类别层的跨域字典; (2)基于步骤 (1)学习的类别层跨域字典生成图像的语义属 性; (3)基于步骤(2)生成的 图像语义属性训练图 像层的跨域字典; (4)基于步骤(3)学习的图像层 跨域字典完成对不可 见类别图像的识别任务。 权利要求书4页 说明书8页 附图2页 CN 114037879 A 2022.02.11 CN 114037879 A 1.一种面向零样本识别的字典学习方法, 其特 征在于: 该 方法包括以下步骤: (1)基于跨 域字典学习方法训练类别层的跨 域字典; (2)基于步骤(1)学习的类别层跨 域字典生成图像的语义属性; (3)基于步骤(2)生成的图像 语义属性训练图像层的跨 域字典; (4)基于步骤(3)学习的图像层跨 域字典完成对不可 见类别图像的识别任务。 2.根据权利要求1所述的面向零样本识别的字典学习方法, 其特征在于: 所述步骤(1) 包括: (1.1)通过计算可 见类别图像的类别中心提取视 觉空间的类别原型Pv, 为公式(1): 其中, Yv是样本特 征矩阵; H为样本标签矩阵; (1.2)将类别原型Pv与类别语义属性Ps组成一对输入, 训练类别层的跨域字典, 通过约 束类别原型与类别语义属 性共享稀疏系数在类别层面建立视觉空间和语义空间之间的联 系, 具体表达式为公式(2): 其中, 第一项为视觉空间字典重构误差项; 第二项为语义空间字典的重构误差项; Dv为 视觉空间字典; Ds为语义空间字典; Xp为稀疏系数矩阵; λ为调和参数; (1.3)为了降低可见类别和不可见类别之间的域差异对模型精度造成的影响, 提升模 型对不可 见类别样本的识别能力, 引入不可 见类别的自适应损失函数, 为公式(3): 其中, 为待求解的不可见类的类别原型; 为不可见类别的语义属性矩阵; 为不 可见类别对应的稀疏系数矩阵; 类别层的联合损失函数为公式(4): 类别层的训练目标是最小化式(4)所示的损失函数, 待求解出变量包括: 视觉空间字典 Dv; 语义空间字典Ds; 可见类别原型Pv; 不可见类别原型 可见类稀疏系数Xp; 不可见类稀 疏系数 3.根据权利要求2所述的面向零样本识别的字典学习方法, 其特征在于: 所述步骤(2) 包括: (2.1)利用视 觉空间字典Dv生成图像的稀疏系数 Xy, 具体表达式为公式(5): 其中, 第一项为重构误差项; 第 二项为约束项, 约束生成的图像稀疏系数与其所属类别 基于同一个视 觉空间字典Dv生成的稀疏系数相近; wx为调和参数; (2.2)利用语义空间字典Ds和其所属类别语义属性Ps联合生成图像语义属性Ys, 具体表 达式为公式(6): 权 利 要 求 书 1/4 页 2 CN 114037879 A 2其中, wp为调和参数。 4.根据权利要求3所述的面向零样本识别的字典学习方法, 其特征在于: 所述步骤(3) 包括: 为了更加深入地挖掘图像的信息, 提升模型的泛化性能, 利用步骤(2)生成的图像语义 属性训练图像层的跨 域字典, 具体表达式为公式(7): 其中, 第一项为视觉空间的重构误差项; 第二项为语义空间的重构误差项; 和 分别为视 觉空间和语义空间在图像层的字典; X为稀疏系数; μ为调和参数。 5.根据权利要求4所述的面向零样本识别的字典学习方法, 其特征在于: 所述步骤(4) 包括: 在视觉空间比较方面: 不可见类别语义属性 首先通过图像层语义空间字典 生成稀疏系数Xu, 为公式 (8): 再利用视觉空间字典 生成类别在视觉空间的表达 分别度量测 试图像与每 个类别描述 的距离并根据距离判断测试图像的类别, 为公式(9): 在稀疏域比较方面: 测试图像根据图像层的视觉空间字典提取其在稀疏空间的表达, 为公式(10): 度量xu与各类别在稀疏空间的描述Xu[c]之间的距离, 距离测试图像最近的类别为该图 像的类别, 为公式(1 1): 在语义空间比较方面: 首先根据图像层的视觉空间字典对测试图像进行编码, 得到xu; 然后根据图像层的语义 空间字典生成图像的语义属性 度量ys与各类别语义属性的距离并根据距离 判断测试图像的类别, 为公式(12): 6.根据权利要求5所述的面向零样本识别的字典学习方法, 其特征在于: 该方法在两个 基于零样 本识别任务的图像数据集: A wA数据集、 aPY数据集上进 行实验, 并且将识别精度与 目前主流零样本识别模型进行对比, 包括SJE、 EZSL、 SYNC、 SAE、 CDL、 ALE、 CONSE、 LATEM、 DEVISE; AwA是一个动物图像数据集, 其中包含50种动物类别以及30475张图像, 每个类有85 个带注释的属性; 零样本识别实验的标准划分是将40个类别用作可见类别, 将其他10个类 别用作不可 见类别。 7.一种面向零样本识别的字典学习装置, 其特 征在于: 该装置包括:权 利 要 求 书 2/4 页 3 CN 114037879 A 3
专利 一种面向零样本识别的字典学习方法及装置
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-19 02:01:12
上传分享
举报
下载
原文档
(893.4 KB)
分享
友情链接
GB-T 41514-2022 钢结构货架使用安全与评估规范.pdf
GM-T 0110-2021 密钥管理互操作协议规范.pdf
GB-T 26471-2023 塔式起重机 安装、拆卸与爬升规则.pdf
DB37-T 3160-2018 渔港安全管理规范 山东省.pdf
中兴 通讯数据中心液冷技术白皮书 2022 .pdf
NIST.SP.800-53r5 Security and Privacy Controls for Information Systems and Organizations.pdf
GB-T 27912-2011 金融服务 生物特征识别 安全框架.pdf
法律法规 银川市建筑节能管理条例2011-12-12.pdf
GB-T 25810-2019 染料 产品标志、标签、包装、运输和贮存通则.pdf
DB37-T 3444-2018 学生资助服务规范 山东省.pdf
T-CFA 03110323—2022 铸件加工单元数字化技术要求.pdf
DB52-T 1542.3-2021 政务服务平台 第3部分:运维管理规范 贵州省.pdf
SL-T 794-2020 堤防工程安全监测技术规程.pdf
GB-T 33138-2016 存储备份系统等级和测试方法.pdf
GB-T 25122.5-2018 轨道交通 机车车辆用电力变流器 第5部分:城轨车辆牵引变流器.pdf
GB-T 31014-2014 声学 水声目标强度测量实验室方法.pdf
GB-T 4023-2015 半导体器件 分立器件和集成电路 第2部分:整流二极管.pdf
JY-T 0568-2020 电感耦合等离子体质谱分析方法通则.pdf
GB-T 3408.2-2008 大坝监测仪器 应变计 第2部分:振弦式应变计.pdf
GB-T 27000-2023 合格评定 词汇和通用原则.pdf
1
/
3
15
评价文档
赞助1.5元 点击下载(893.4 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。