说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211040427.5 (22)申请日 2022.08.29 (71)申请人 北京交通大 学 地址 100044 北京市海淀区西直门外上园 村3号 (72)发明人 刘真 寇泽 冯铭泽 贺翔  (74)专利代理 机构 北京市商 泰律师事务所 11255 专利代理师 黄晓军 (51)Int.Cl. G06N 5/04(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 3/10(2006.01) G06F 9/50(2006.01) (54)发明名称 面向海量数据实时处理的云边协同自适应 深度推理方法 (57)摘要 本发明提供了一种面向海量数据实时处理 的云边协同自适应深度推理方法。 该方法包括: 将DNN模型进行模型量化, 根据得到的量化模型 对DNN模型进行DAG构建; 对DAG网络进行可行分 割点的搜索, 得到优化后的潜在分割点集; 基于 优化后的潜在分割点集对DNN模型各层在终端设 备上运行的累积推理延迟、 数据传输延迟和累积 量化损失进行数据拟合, 利用以带宽为变量的权 重函数对DNN模型各层的累积推理延迟、 数据传 输延迟和累积量化损失的目标函数进行加权优 化, 得到最优的分割点; 根据所述最优分割点将 DNN模型进行分割。 本发明考虑到模型量化带来 的精度损失, 将精度损失和时延根据网络质量的 变化进行加权优化, 以满足用户在不同的网络质 量下对服 务质量的不同需求。 权利要求书3页 说明书10页 附图2页 CN 115392467 A 2022.11.25 CN 115392467 A 1.一种面向海量数据实时处 理的云边协同自适应深度推理方法, 其特 征在于, 包括: 将需要部署的DNN模型进行模型量化, 根据得到的量化模型对DNN模型进行有向无环图 DAG构建; 对所述DAG网络进行可行分割点的搜索, 找到DAG中的所有割点, 将符合约束 的割点加 入到潜在分割点 集, 对所述潜在分割点 集进行优化处 理, 得到优化后的潜在分割点 集; 基于优化后的潜在分割点集对DNN模型各层在终端设备上运行的累积推理延迟、 数据 传输延迟和累积量化损失进 行数据拟合, 将离散的数据拓展到连续域上, 分别得到DNN模型 各层的累积推理延迟、 数据传输延迟和累积量 化损失; 利用以带宽为变量的权重函数对所述DNN模型各层的累积推理延迟、 数据传输延迟和 累积量化损失的目标函数进行加权优化, 得到最优的分割点; 根据所述最优分割点将所述DNN模型进行分割后, 分别在终端设备和云上执行任务推 理, 并得到推理结果。 2.根据权利要求1所述的方法, 其特征在于, 所述的将需要部署的DNN模型进行模型量 化, 根据得到的量 化模型对DN N模型进行有向无环图DAG构建, 包括: 对需要部署的DNN模型进行预训练, 通过量化器将预训练后的DNN模型的权重和激活量 化为8比特, 得到量 化模型, 只在终端设备 上部署量 化模型, 在云上部署原 始DNN模型; 根据得到的量化模型对DNN模型进行DAG构建, 给定一个DNN模型, 构造一个DAG, 通过G =<V,E>来表示它, V表示DAG中顶点的集合, E表示DAG中边的集合, 每个顶点vi∈V对应DNN 模型的某一层, 有向边ei=<vi,vj>∈E表示vj把vi的输出作为它自己的输入, 使用di来表示 每条边ei的值, 其中di表示vi的输出数据大小, 将输入层作为v0, 将e0=<v0,v1>的值d0作为原 始输入数据大小。 3.根据权利要求2所述的方法, 其特征在于, 所述的对所述DAG网络进行可行分割点的 搜索, 找到DAG中的所有割点, 将符合约束的割点加入到潜在分割点集, 对所述潜在分割点 集进行优化处 理, 得到优化后的潜在分割点 集, 包括: 对于所述DAG网络首先搜索DAG网络中的所有割点, 该割点为DAG中的顶点, 被移除后将 使得DAG不再连接, 所述DAG网络中包括多个逻辑块, 使用最小割方法在由一个或几个顶点 组成的逻辑块中找到具有最小输出数据大小的分割点, 在一个逻辑块中找到一个潜在的分 割点, 所有割点和逻辑 块内的所有最小割点分别构成割点 集和最小割集; 如果输出数据大小满足di<d0, 则将割点集中的潜在分割点添加到潜在分割点集 中, 在 最小割集中, 当 时, 潜在分割点也被添加到潜在分割点集 其中 是通过最 小割方法获得的逻辑 块内的输出数据大小的最小和; 对于链式拓扑DNN和DAG网络, 移除 中 连续并具有相同输出 数据大小的分割点; 对潜在分割 点集 进行优化处理, 从潜在分割 点集 中删除神经网络BN层, 去除连续且 数据输出量相等的点, 得到优化后的潜在分割点 集 4.根据权利要求3所述的方法, 其特征在于, 所述的基于优化后的潜在分割点集对DNN 模型各层在终端设备上运行的累积推理延迟、 数据传输延迟和累积量化损失进行数据拟 合, 将离散的数据拓展到连续域上, 分别得到DNN模型各层的累积推理延迟、 数据传输延迟 和累积量 化损失, 包括: 设置DNN模型具有N层, 其中 为非负整数集, 设B为网络带宽, 用di表示第i层的输出数据权 利 要 求 书 1/3 页 2 CN 115392467 A 2大小, 设 代表第i层的数据传输延迟, 用 表示在终端设备上执行DNN模型的第i 层的推理延迟; 将wi(·)和ai(·)表示为第i层给定位宽的权重和激活, 通过使用均方误差函数MSE, 分 别用 和 来表示第i层的权重和激 活的量化误差; 设 代表第i层的量 化权重损失和激活的总和, 即 假设DNN模型在x层分割, 将DNN模型第x层的目标函数定义如下: 其中 表示从输入层到第x层的累积推理延迟, 是第x层的数据传输延迟, 是从输入层到第x层的累积量 化损失, 自变量x是DN N模型的分割层, 将 定义为: 通过最小 ‑最大方法归一 化延迟和损失, 使式(2)中各值具有相同的数值维度, 定义 为: 其中X分别代表标准化前tedge、 ttrans和lquant的值, Xmin和Xmax分别表示tedge、 ttrans和lquant 中的最小和最大值, Xnormal表示归一 化值, 介于0和1之间; 在潜在分割点的集合 中, 潜在分割 点对应DNN模型中的层, 层的输出数据大小g(x)随 层x值的递增呈指数递减, 累积 推理时间f(x)和累积量化损失h(x)随层 x值的递增呈线性递 增, 用凸函数f、 g和h 分别表示累积推理时延、 数据传输延迟和累积量化损失, f和h是递增的 线性函数, g是递减的凸函数, 目标函数重写为: 的优化是一个凸优化问题。 5.根据权利要求4所述的方法, 其特征在于, 所述的利用以带宽为变量的权重函数对所 述DNN模型各层的累积 推理延迟、 数据传输延迟和累积量化损失的目标函数进 行加权优化, 得到最优的分割点, 包括: 利用以带宽为变量的权重函数对所述DNN模型各层的累积推理延迟、 数据传输延迟和 累积量化损失的目标函数进行加权优化, 将 改写为: 其中, ω(B)以带宽B为变量, 表示为 ω(B)与带宽成比例, ω(B)的值介 于0和1之间, k控制ω(B)的平滑度, 当带宽较小时, 延迟在目标函数 中的权重较大, 而 当带宽较大时, 量 化损失的权 重较大; 加权优化后的目标函数为:权 利 要 求 书 2/3 页 3 CN 115392467 A 3

.PDF文档 专利 面向海量数据实时处理的云边协同自适应深度推理方法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 面向海量数据实时处理的云边协同自适应深度推理方法 第 1 页 专利 面向海量数据实时处理的云边协同自适应深度推理方法 第 2 页 专利 面向海量数据实时处理的云边协同自适应深度推理方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:15:52上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。