专利逃跑者位置不确定的多智能体分布式围捕方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111384733.6 (22)申请日 2021.11.22 (71)申请人天津大学地址 300072 天津市南开区卫津路9 2号 (72)发明人田栢苓　李品品　宗群　 (74)专利代理机构天津市北洋有限责任专利代理事务所 12 201 代理人刘国威 (51)Int.Cl. G06F 30/20(2020.01) G06F 17/18(2006.01) G06Q 10/04(2012.01) G06F 119/10(2020.01) (54)发明名称逃跑者位置不确定的多智能体分布式围捕方法 (57)摘要本发明属于多智能体分布式围捕策略研究领域，为提出一种逃跑者位置不确定的多智能体分布式围捕方法，实现对单个或多个逃跑者的捕获，能够避免相互碰撞，保证围捕任务的安全性。本发明，逃跑者位置不确定的多智能体分布式围捕方法，步骤如下：结合卡尔曼滤波预测算法对逃跑者的位置进行实时估计，得到关于逃跑者位置分布的概率密度函数；单个逃跑者的围捕策略设计：执行基于Voronoi质心的围捕策略，不断移向逃跑者的估计位置，最终实现捕获；最终使逃跑者无处可躲从而实现捕获，即面积最小化策略。本发明主要应用于智能体围捕场合。权利要求书4页说明书11页附图4页 CN 114117768 A 2022.03.01 CN 114117768 A 1.一种逃跑者位置不确定的多智能体分布式围捕方法，其特征是，步骤如下：基于卡尔曼滤波的目标估计和预测算法：结合卡尔曼滤波预测算法对逃跑者的位置进行实时估计，得到关于逃跑者位置分布的概率密度函数；单个逃跑者的围捕策略设计：考虑多个追捕者围捕一个逃跑者的场景，首先在有界区域中根据每个智能体的位置，计算出每个智能体所在的沃罗诺伊图Voronoi图，并将该 Voronoi图用作每个智能体的无碰撞安全域，然后每个智能体在其对应的安全域内执行基于Voronoi质心的围捕策略，不断移向逃跑者的估计位置，最终实现捕获；多个逃跑者的围捕策略设计：考虑多个追捕者围捕多个逃跑者的场景，每个追捕者策略的设计目的就是随时间的变化而不断减少逃跑者的安全可达区域的面积，最终使逃跑者无处可躲从而实现捕获，即面积最小化策略。 2.如权利要求1所述的逃跑者位置不确定的多智能体分布式围捕方法，其特征是，详细步骤如下：基于卡尔曼滤波的目标估计和预测算法：在有界凸环境Q∈R2中，存在np个追捕者和ne个逃跑者，其中第i个追捕者的位置表示为第i个追捕者pi的运动可以由以下运动学方程描述：其中表示第i个追捕者的初始位置，为它们的控制输入，且追捕者的最大速度 vmax相等，即：由于追捕者无法获取逃跑者的准确位置，因此将逃跑者的估计位置用概率密度函数φe (q)来进行定义，其中q点表示有界凸环境Q中的任意位置， φe(q)的值则表示逃跑者位于q 点的概率， φe(q)＞0且满足 ∫Qφe(q)dq＝1；将第j个逃跑者的估计位置表示为则在每个时刻t， np个追捕者与该逃跑者j之间的最小距离定义为：定义捕获半径rc＞0，那么该系统的目标就是针对每个逃跑者，保证在tc时刻至少使一个追捕者满足捕获条件，即： dmin(tc)＜rc (4) 在围捕过程中， np个追捕者根据不同的策略实时分配目标逃跑者，当环境中ne个逃跑者均满足捕获条件时则代表整个系统的围捕任务完成；接下来，每个智能体使用卡尔曼滤波方法来估计逃跑者的位置分布φe(q)，以最小均方误差为最佳估计准则，采用信号与噪声的状态空间模型，利用前一时刻的估计值和当前时刻的观测值来更新对状态变量的估计，求出当前时刻的估计值；单个逃跑者的围捕策略设计：具体步骤如下：权　利　要　求　书 1/4 页 2 CN 114117768 A 2第一步：计算每个智能体所在的Voroni分区，对于第i个追捕者pi，定义其所在的标准 Voronoi分区为：第二步：引入成本函数来评估追捕者的围捕性能，对于每个追捕者i，引入配置成本Hi，以评估其在其区域Vi内对逃跑者位置跟踪的性能，将逃跑者的位置估计表示为概率密度函数φe(q)，则定义成本函数如下所示：其中Vi表示第i个追捕者所在的Voronoi 分区，因此对于所有的追捕者，总配置成本表示为：根据Voro noi图的性质，上述配置成本函数简化为第三步：优化成本函数：当追捕者不知道逃跑者的确切位置时，他们应该向逃跑者概率分布最高的位置移动，此时追捕者距离逃跑者较近，由式(13)可知，此时配置成本H也较低；反之当追捕者距离逃跑者越远时，配置成本则会逐渐增加，由于Voronoi分区是静态的，且 φe(q)不随时间变化，由此可知，降低配置成本H的一个控制策略即向Voronoi分区的质心移动；类似于物理质量和质心，定义第i个追捕者所在的Voronoi分的质量和质心如下式所示：根据上式对成本函数进行梯度优化，得到的结果为：第四步：推导追捕者的围捕策略。由式(15)可知，当满足即当所有追捕者位于其Voronoi分区的质心位置时， H处于局部极小值，因此，设计每个追捕者的控制策略为：其中kp＞0为增益系数，通过向Voronoi 分区的质心移动，追捕者可以降低其局部配置成本并收敛到静态位置；多个逃跑者的围捕策略设计：具体步骤如下：权　利　要　求　书 2/4 页 3 CN 114117768 A 3

专利 逃跑者位置不确定的多智能体分布式围捕方法

专利逃跑者位置不确定的多智能体分布式围捕方法