说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210992657.5 (22)申请日 2022.08.18 (71)申请人 重庆大学 地址 400044 重庆市沙坪坝区沙正 街174号 (72)发明人 李秀华 李辉 孙川 徐峥辉  郝金隆 蔡春茂 范琪琳 杨正益  文俊浩  (74)专利代理 机构 重庆缙云专利代理事务所 (特殊普通 合伙) 50237 专利代理师 王翔 (51)Int.Cl. H04W 16/22(2009.01) H04W 16/18(2009.01) G06F 9/50(2006.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G16Y 20/10(2020.01) G16Y 20/30(2020.01) G16Y 30/00(2020.01) (54)发明名称 一种车联网中基于边缘计算和深度强化学 习的动态服 务放置方法 (57)摘要 本发明公开一种车联网中基于边缘计算和 深度强化学习的动态服务放置方法, 包括以下步 骤: 1)建立网络与服务请求模型, 获取网络与服 务请求相关信息; 2)建立网络与服务请求计算模 型; 3)构建状态空间、 动作空间、 策略函数和奖励 函数; 4)构建演员网络和批评家网络, 并对演员 网络和批评家网络进行训练; 5)演员网络生成服 务放置策略, 并输入到批评家网络中; 6)所述批 评家网络评估服务放置策略的策略质量, 若评估 不通过, 则更新演员网络参数, 并返回步骤5), 若 评估通过, 则输出服务放置策略。 本发明在考虑 车辆的移动性、 变化的需求和对不同类型服务请 求的动态 性的同时, 最小化最大的边缘资源使用 和服务延迟。 权利要求书3页 说明书10页 附图2页 CN 115550944 A 2022.12.30 CN 115550944 A 1.一种车联网中基于边缘计算和深度强化学习的动态服务放置方法, 其特征在于, 包 括以下步骤: 1)建立所述网络与服 务请求模型, 获取网络与服 务请求相关信息 。 2)建立网络与服 务请求计算模型; 3)构建状态空间、 动作空间、 策略函数和奖励函数; 4)构建演员网络和批 评家网络, 并对演员网络和批 评家网络进行训练; 5)演员网络生成服 务放置策略, 并输入到 批评家网络中; 6)所述批评家网络评估服务放置策略的策略质量, 若评估不通过, 则更新演员网络参 数, 并返回步骤5), 若评估通过, 则输出服 务放置策略。 2.根据权利要求1所述的一种车联网中基于边缘计算和深度强化学习的动态服务放置 方法, 其特征在于, 所述网络与服务请求相关信息包括边缘服务器信息、 车辆信息、 服务信 息; 所述边缘服务器信息包括边缘服务器集合E, 边缘服务器e, 边缘服务器e的剩余资源容 量Ce; 所述车辆信息包括车辆集 合V。 所述服务信息包括服务集合S、 请求服务 s的车辆数量 λs、 一次可以处理一个服务实例或 可以提供并行连接的车辆数量 ε、 服务请求消息中指 定时间t和车辆位置loc、 边缘服务器部 署服务s所消耗的资源量Rs、 时延需求阈值Ds; 所述服务实例包括车联网环境中的媒体文件 下载、 合作意识消息和环境 通知服务。 3.根据权利要求1所述的一种车联网中基于边缘计算和深度强化学习的动态服务放置 方法, 其特征在于, 所述网络与服务请求计算模型包括总服务时延计算模型、 边缘资源使用 率计算模型; 总服务时延计算模型如下 所示: 式中, 为总服务时延; 为传播时延和排队时延; dist(v,s)为 车辆v与服务 s部署的边 缘服务器之间的欧氏距离; c为信号 通过通信介质的传播速度; 当请求服务s的车辆数量λs≤ε时, 排队时延 当请求服务s的车辆数量λs>ε时, 排队时延 满足下式: 式中, 数量差 λ ′s= λs‑ε; 传播时延 如下所示: 式中, dist(v,s)为车辆v与服务s部署的边缘服务器之间的欧氏距离; c为信号通过通权 利 要 求 书 1/3 页 2 CN 115550944 A 2信介质的传播速度。 边缘资源使用率计算模型如下 所示: 边缘资源使用率 是服务实例消耗的资源与边缘服务器的可用资源之间的比率, 如下 所示: 式中, 参数 Ce为边缘服务器e的剩余资源容量; 为边缘资源使用率; Rs为边 缘服务器部署服 务s所消耗的资源量。 4.根据权利要求1所述的一种车联网中基于边缘计算和深度强化学习的动态服务放置 方法, 其特 征在于, 所述状态空间通过状态空间集ω表征, 即: ω={[v1,loc1,s],[v2,loc2,s],...,[vn,locn,s]}t    (6) 式中, s∈S; v1,v2,...,vn为一组车辆集合; loc1,loc2,...,locn为在t时, 请求服务s的 车辆位置集 合。 5.根据权利要求1所述的一种车联网中基于边缘计算和深度强化学习的动态服务放置 方法, 其特 征在于, 所述动作空间用于描述在边 缘服务器上放置服 务时所采取的动作; 其中, 在给定的时刻t所采取的动作a如下 所示: 式中, π 是在时间单位t对ω的观察集生成动作所需的策略函数; 表示服务s部署于 边缘服务器e; 表示服务s没有部署于边 缘服务器e。 6.根据权利要求1所述的一种车联网中基于边缘计算和深度强化学习的动态服务放置 方法, 其特征在于, 所述策略函数π是演员网络执行的函数, 用于将状态空间映射到动作空 间, 即π:ω →a; 策略函数π 的目标是最小化最大边缘资源使用和服务 时延, 并通过使用参数β 来控制资 源使用与服 务时延的相对重要性; 策略函数π表示如下: 式中, β 为权 重系数。 所述策略函数π的约束包括映射约束 时延约束 资源约束 7.根据权利要求1所述的一种车联网中基于边缘计算和深度强化学习的动态服务放置 方法, 其特 征在于, 所述奖励函数如下 所示: 式中, 为即时奖励。 γ为奖励系数。 为t时刻的服 务时延。权 利 要 求 书 2/3 页 3 CN 115550944 A 3

.PDF文档 专利 一种车联网中基于边缘计算和深度强化学习的动态服务放置方法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种车联网中基于边缘计算和深度强化学习的动态服务放置方法 第 1 页 专利 一种车联网中基于边缘计算和深度强化学习的动态服务放置方法 第 2 页 专利 一种车联网中基于边缘计算和深度强化学习的动态服务放置方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:11:05上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。