说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111675970.8 (22)申请日 2021.12.31 (71)申请人 交叉信息核心技 术研究院 (西安) 有 限公司 地址 710077 陕西省西安市雁塔区天谷八 路软件新城二期B2座1 1层 (72)发明人 董润沛 马恺声  (74)专利代理 机构 北京中巡通大知识产权代理 有限公司 1 1703 代理人 张弘 (51)Int.Cl. G06N 3/08(2006.01) G06N 5/04(2006.01) (54)发明名称 模型压缩 方法、 系统、 部署方法、 设备及 存储 介质 (57)摘要 本发明提供一种模型压缩方法、 系统、 部署 方法、 设备及存储介质, 包括: 获取数据集以及已 经预训练的待压缩的神经网络, 设置DGMS算法的 相关参数; 根据待压缩的神经网络, 使用k ‑means 算法初始化 混合高斯模型的系数, 得到参数化的 混合高斯模 型的权重, 根据权重分配产生最初的 量化划分集合; 基于量化划分集合, 使用DGMS算 法对待压缩的神经网络进行量化训练, 使用随机 梯度下降方法优化神经网络参数和用于量化的 相关参数; 训练完毕后, 使用最终获得的神经网 络参数以及量化相关参数, 获得量化后的神经网 络模型, 并使用量化后的神经网络模 型进行模型 推理。 本发 明采用量化技术对神经网络模型进行 压缩, 减少模型 大小, 提高模型推理速度。 权利要求书3页 说明书13页 附图2页 CN 114418089 A 2022.04.29 CN 114418089 A 1.一种基于可微分 混合高斯权 重共享的模型压缩方法, 其特 征在于, 包括: 获取数据集以及已经 预训练的待压缩的神经网络, 设置DGMS算法的相关参数; 根据待压缩的神经网络, 使用k ‑means算法初始化混合 高斯模型的系数, 得到参数化的 混合高斯模型的权 重, 根据权 重分配产生 最初的量 化划分集 合; 基于量化划分集合, 使用DGMS算法对待压缩的神经网络进行量化训练, 使用随机梯度 下降方法优化神经网络参数和用于量 化的相关参数; 训练完毕后, 使用最终获得的神经网络参数以及量化相关参数, 获得量化后的神经网 络模型, 并使用量 化后的神经网络模型进行模型推理。 2.根据权利要求1所述的基于可微分 混合高斯权 重共享的模型压缩方法, 其特 征在于, 所述获取数据集以及已经预训练的待压缩的神经网络, 设置DGMS算法的相关参数, 具 体包括: 获取数据集 和L层深度神经网络F, 权重为 GM分量数量K+1 以及初始化温度系数 3.根据权利要求1所述的基于可微分 混合高斯权 重共享的模型压缩方法, 其特 征在于, 所述根据待压缩的神经网络, 使用k ‑means算法初始化混合 高斯模型的系数, 得到参数 化的混合高斯模型的权 重; 具体包括: 基于参数估计, 使用最大似然估计对统计信 息进行分析; 将K+1单峰高斯分量的混合作 为全精度网络的平滑子分布近似估计, 由 参数化的高斯混合近似GMθ 形成任意形状的分布密度的有效表征; 使用k‑means算法初始化高斯混合近似, 将高斯混合作为权重 的统计先 验, 则有: 上式作为高斯模型GMθ的参数化似然; 其中, 是混合高斯模 型的参数表征, 且πk表示第k个高斯模型分量 权重, μk和γk分别表示第k个混合高斯模型分量的均值和方差 。 4.根据权利要求1所述的基于可微分 混合高斯权 重共享的模型压缩方法, 其特 征在于, 所述根据权重分配产生 最初的量 化划分集 合, 具体包括: 使用参数化的高斯混合将权重划分为几个区域; 每个区域都与一个高斯分量相关联, 其中平均值用作权重分配的区域显着性, 即自适应 量化集合QA={ μ0, μ1,…, μK}, 其中 μ0=0; 定义基于GM子分布估计的区域决策指示器IS:RM→{0,1}K×M, 用于所有K+1个区域; 然后, 对 于每个数据点 wj, 量化的低位宽表示Ψ(wj; θ )~DQ的公式为权 利 要 求 书 1/3 页 2 CN 114418089 A 2其中, 表示在给定区域k的情况下wj的后验概率, k由θk={ πk, μk,γk} 参数化, 表示 为: 上式是根据GM子分布计算的的软标准化 区域置信度, 将其视为基于加权径向基函数核 的最近邻聚类, 基于加权径向基函数核计算了权重wj与相应区域显着性之间的软对称距 离。 5.根据权利要求 4所述的基于可微分 混合高斯权 重共享的模型压缩方法, 其特 征在于, 所述基于量 化划分集 合, 使用DGMS算法对待压缩的神经网络进行量 化训练, 具体包括: 采用基于温度的softmax使得分布采样过程变得可微, 并且估计 的区域置信 度预测: 其中τ被设置为可调整离 散化估计级别的可 学习温度超参数; 基于所述可微分区域显着性采样过程, 重新构造 压缩表征Φk(wj; θ, τ )~DS如下: 式中, θ为前述定义的混合高斯模型的参数表示, τ是可调整离散化估计级别的可学习 温度超参数。 6.根据权利要求5所述的基于可微分 混合高斯权 重共享的模型压缩方法, 其特 征在于, 所述使用随机梯度下降方法优化神经网络参数和用于量 化的相关参数, 具体包括: 使用任务损失函数对训练结构进行评估; 反向传播并使用随机梯度下降算法更新 参数。 7.一种基于可微分 混合高斯权 重共享的模型压缩系统, 其特 征在于, 包括: 获取输入模块, 用于获取数据集以及已经预训练的待压缩的神经网络, 设置DGMS算法 的相关参数; 算法初始化模块, 用于根据待压缩的神经网络, 使用k ‑means算法初始化混合 高斯模型 的系数, 得到参数化的混合高斯模型的权 重, 根据权 重分配产生 最初的量 化划分集 合; 逐层量化训练模块, 用于基于量化划分集合, 使用DGMS算法对待压缩的神经网络进行权 利 要 求 书 2/3 页 3 CN 114418089 A 3

.PDF文档 专利 模型压缩方法、系统、部署方法、设备及存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型压缩方法、系统、部署方法、设备及存储介质 第 1 页 专利 模型压缩方法、系统、部署方法、设备及存储介质 第 2 页 专利 模型压缩方法、系统、部署方法、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 00:20:18上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。