说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111384733.6 (22)申请日 2021.11.22 (71)申请人 天津大学 地址 300072 天津市南 开区卫津路9 2号 (72)发明人 田栢苓 李品品 宗群  (74)专利代理 机构 天津市北洋 有限责任专利代 理事务所 12 201 代理人 刘国威 (51)Int.Cl. G06F 30/20(2020.01) G06F 17/18(2006.01) G06Q 10/04(2012.01) G06F 119/10(2020.01) (54)发明名称 逃跑者位置不确定的多智能体分布式围捕 方法 (57)摘要 本发明属于多智能体分布式围捕策略研究 领域, 为提出一种逃跑者位置不确定的多智能体 分布式围捕方法, 实现对单个或多个逃跑者的捕 获, 能够避免相互碰撞, 保证围捕任务的安全性。 本发明, 逃跑者位置不确定的多智能体 分布式围 捕方法, 步骤如下: 结合卡尔曼滤波预测算法对 逃跑者的位置进行实时估计, 得到关于逃跑者位 置分布的概率密度函数; 单个逃跑者的围捕策略 设计: 执行基于Voronoi质心的围捕策略, 不断移 向逃跑者的估计位置, 最终实现捕获; 最终使逃 跑者无处可躲从而实现捕获, 即面积最小化策 略。 本发明主 要应用于智能体围捕场合。 权利要求书4页 说明书11页 附图4页 CN 114117768 A 2022.03.01 CN 114117768 A 1.一种逃 跑者位置不确定的多智能体分布式围捕方法, 其特 征是, 步骤如下: 基于卡尔曼滤波的目标估计和预测算法: 结合卡尔曼滤波预测算法对逃跑者的位置进 行实时估计, 得到关于逃 跑者位置分布的概 率密度函数; 单个逃跑者的围捕策略设计: 考虑多个追捕者围捕一个逃跑者的场景, 首先在有界区 域中根据每个智能体的位置, 计算出每个智能体所在的沃罗诺伊图Voronoi图, 并将该 Voronoi图用作每个智能体的无碰撞安全域, 然后每个智能体在其对应的安全域内执行基 于Voronoi质心的围捕策略, 不断移向逃 跑者的估计位置, 最终 实现捕获; 多个逃跑者的围捕策略设计: 考虑多个追捕者围捕多个逃跑者的场景, 每个追捕者策 略的设计目的就是随时间的变化而不断减少逃跑者的安全可达区域的面积, 最终使逃跑者 无处可躲从而实现捕获, 即面积最小化策略。 2.如权利要求1所述的逃跑者位置不确定的多智能体分布式围捕方法, 其特征是, 详细 步骤如下: 基于卡尔曼 滤波的目标估计和预测算法: 在有界凸环境Q∈R2中, 存在np个追捕者和ne个逃跑者, 其 中第i个追捕者的位置表示为 第i个追捕者pi的运动可以由以下运动学 方程描述: 其中 表示第i个追捕 者的初始位置, 为它们的控制输入, 且追捕 者的最大速度 vmax相等, 即: 由于追捕者无法获取逃跑者的准确位置, 因此将逃跑者的估计位置用概率密度函数φe (q)来进行定义, 其中q点表示有界凸环境Q中的任意位置, φe(q)的值则表示逃跑者位于q 点的概率, φe(q)>0且 满足 ∫Qφe(q)dq=1; 将第j个逃跑者的估计位置表示为 则在每个时刻t, np个追捕者与 该逃跑者j之间的最小距离 定义为: 定义捕获半径rc>0, 那么该系统的目标就是针对每个逃跑者, 保证在tc时刻至少使一 个追捕者满足捕获条件, 即: dmin(tc)<rc      (4) 在围捕过程中, np个追捕者根据不同的策略实时分配目标逃跑者, 当环境中ne个逃跑者 均满足捕获条件时则代 表整个系统的围捕任务完成; 接下来, 每个智能体使用卡尔曼滤波方法来估计 逃跑者的位置分布φe(q), 以最小均方 误差为最佳估计准则, 采用信号与噪声的状态空间模型, 利用前一时刻的估计值和当前时 刻的观测值 来更新对状态变量的估计, 求出当前时刻的估计值; 单个逃跑者的围捕策略设计: 具体步骤如下:权 利 要 求 书 1/4 页 2 CN 114117768 A 2第一步: 计算每个智能体所在的Voroni分区, 对于第i个追捕者pi, 定义其所在的标准 Voronoi分区为: 第二步: 引入成本函数来评估追捕者的围捕性能, 对于每个追捕者i, 引入配置成本Hi, 以评估其在其区域Vi内对逃跑者位置跟踪的性能, 将逃跑者的位置估计表示为概率密度函 数φe(q), 则定义成本函数如下 所示: 其中Vi表示第i个追捕者所在的Voronoi 分区, 因此对于 所有的追捕者, 总配置成本表示 为: 根据Voro noi图的性质, 上述配置成本函数简化 为 第三步: 优化成本函数: 当追捕者不知道逃跑者的确切位置时, 他们应该向逃跑者概率 分布最高的位置移动, 此时追捕者距离逃跑者较近, 由式(13)可知, 此时配置成本H也较低; 反之当追捕者距离逃跑者越远时, 配置成本则会逐渐增加, 由于Voronoi分区是静态的, 且 φe(q)不随时间变化, 由此可知, 降低配置成本H的一个控制策略即向Voronoi分区的质心 移动; 类似于物理质量和质心, 定义第i个追捕者所在的Voronoi分 的质量 和质心 如下 式所示: 根据上式对成本函数进行梯度优化, 得到的结果 为: 第四步: 推导追捕者的围捕策略。 由式(15)可知, 当满足 即当所有 追捕者位于其Voronoi分区的质心 位置时, H处于局部极小值, 因此, 设计每个追捕者的控制 策略为: 其中kp>0为增益系数, 通过向Voronoi 分区的质心移动, 追捕者可以降低其局部配置成 本并收敛到静态位置; 多个逃跑者的围捕策略设计: 具体步骤如下:权 利 要 求 书 2/4 页 3 CN 114117768 A 3

.PDF文档 专利 逃跑者位置不确定的多智能体分布式围捕方法

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 逃跑者位置不确定的多智能体分布式围捕方法 第 1 页 专利 逃跑者位置不确定的多智能体分布式围捕方法 第 2 页 专利 逃跑者位置不确定的多智能体分布式围捕方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:19:02上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。