(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211300162.8
(22)申请日 2022.10.21
(71)申请人 华东理工大 学
地址 200237 上海市徐汇区梅陇路13 0号
(72)发明人 代明智 冯翔
(51)Int.Cl.
G06F 16/9537(2019.01)
G06F 17/16(2006.01)
G06K 9/62(2022.01)
G06N 20/00(2019.01)
(54)发明名称
基于情感偏好与迁移行为的联邦学习无人
机协同决策方法及系统
(57)摘要
本发明公开了一种基于情感偏好与迁移行
为的联邦 学习无人机协同决策方法及系统, 该方
法包括:采集探测目标物的位置信息; 采集探测
无人机当前时刻的位置和速度, 协同探测无人机
之间的位置信息共享, 生 成探测无人机下一时刻
的位置和速度; 依据所述目标位置空间确定最佳
的探测无人机群任务阵列; 依据全局三维距离构
造评价函数, 最终优化产生最优的探测无人机阵
列位置矩阵。 通过加入方向位置增量策略, 产生
对模型对最优解搜索的方向约束, 解决了模型搜
索范围过宽, 搜索过于随机化以及容易陷入局部
最优的问题; 同时融入了非线性余弦自适应的交
叉和变异策略, 以提高目标解的多样性。 最后, 通
过融入基于聚类划分联邦学习的概念, 以保证协
同探测无人机群获取目标位置数据的独立性和
隐私性。
权利要求书3页 说明书8页 附图4页
CN 115525842 A
2022.12.27
CN 115525842 A
1.基于情感偏好与迁移行为的联邦学习无人机协同决策方法及系统, 其特征在于, 包
括:
采集探测目标物的位置信息;
采集探测无 人机当前时刻的位置和速度;
探测无人机与所属机构之间的通信, 生成探测无 人机下一时刻的位置和速度;
依据全局三维距离构造 评价函数;
依据所述目标位置空间和评价 函数确定最佳的探测无 人机群任务阵列;
通过加入方向位置增量策略, 产生对 模型对最优解搜索的方向约束;
通过融入非线性 余弦自适应的交叉和变异策略, 以提高目标解的多样性;
基于聚类划分联邦学习的概念, 保证探测无 人机群数据的独立 性和隐私性。
2.根据权利要求1所述的基于情感偏好与迁移行为的联邦学习无人机协同决策方法,
其特征在于, 所述的探测目标物的位置信息集 合表示为:
Tar_pos={L ong,Lat,High}
其中, Long表示探测目标物的经度, Lat表示探测目标物的纬度, 而High表示探测目标
物的高度。
3.根据权利要求1所述的基于情感偏好与迁移行为的联邦学习无人机协同决策方法,
其特征在于, 所述的探测无 人机当前时刻的位置和速度包括:
探测无人机k当前时刻t的位置:
其中k代表第k个探测无人
机, 于是当前时刻t探测无 人机k的任务阵列可表示 为个体矩阵
探测无人机k当前时刻t的速度: Dro_vel={vk,t}, vk,t=α×(Xm,t‑Xk,t)+β×(Xe,t‑Xk,t),
其中Xm,t为当前无人机群任务阵列群体中的最优阵列个体矩阵, Xm,t为当前无人机群任务阵
列个体矩阵的最优邻居个 体矩阵。
4.根据权利要求1所述的基于情感偏好与迁移行为的联邦学习无人机协同决策方法,
其特征在于, 探测无人机之间的位置信息共享, 生成探测无人机下一时刻的位置和速度包
括:
探测无人机k下一时刻t+1的速度: vk,t+1=α×(Xm,t+1‑Xk,t+1)+β×(Xe,t+1‑Xk,t+1)。
探测无人机k下一时刻t+1的位置: 下一时刻t+1探测无人机k的任务阵列可表示为Xi,t+1
=Xi,t+wtvk,t‑1+vk,t, 其中wt是一个随着t线性递减的惯性权重函数, wt=wend+(wstart‑wend),
其中wstart表示惯性权 重的开始值, wend表示惯性权 重的结束值。
5.根据权利要求1所述的基于情感偏好与迁移行为的联邦学习无人机协同决策方法,
其特征在于, 依据全局三维距离构造的评价 函数包括:
探 测 无 人 机 阵 列 中 某 个 无 人 机 k 与 其 所 有 探 测 目 标 物 的 距 离 之 和 :
探测无人机阵列中任意无 人机c与无人机d的最小距离: mi n‖Dro_posc‑Dro_posd‖ 。
于是全局的三维距离评价函数可以构造为:
其中l权 利 要 求 书 1/3 页
2
CN 115525842 A
2代表探测无人机的数 目。 评价函数fit(l,X)的值越小, 探测无人机群的任务阵列排布就越
佳。
6.根据权利要求5所述的全局三维距离构造的评价函数, 其特征在于, 依据所述目标位
置空间和评价 函数确定的最佳探测无 人机群任务阵列Xop可表示为:
7.根据权利要求1所述的基于情感偏好与迁移行为的联邦学习无人机协同决策方法,
其特征在于, 通过加入方向位置增量策略, 产生对 模型对最优解搜索的方向约束, 包括:
两个方向的位置增量 为Xrk,t和Xlk,t, 其更新方式如下:
其中dt=σt/s, s是一个非负 常数。 σt是步长大小, 它代表每次迭代跳转的距离, 且σt+1=
eta·σt, eta同样为非负常数。
于是方向位置增量
可表示为:
其中f(Xrk,t)和f(Xlk,t)分别代表个体在 位置Xrk,t和Xlk,t的评价函数值。 sign是一个符
号函数, 当f(Xrk,t)‑r(Xlk,t)<0时, 函数值为 ‑1, 且f(Xrk,t)‑f(Xlk,t)>0时,函数值为1。 同时,
当f(Xrk,t)‑f(Xlk,t)=0时, 函数值 为0。
于是, 下一时刻t+1探测无 人机k的任务阵列Xk,t+1=Xk,t+wtvk,t‑1+vk,t将转换为:
其中, 式中Xk,t+1和Xk,t分别代表个体i在第t次和第t+1次迭代探测无人机k的任务阵列。
η代表增量系数,
代表第t次迭代的方向增量。 相较于原无人机位置任务阵列,
可以
在优化过程中有方向的搜索最优解, 而不是仅仅随机地更新无人机的位置信息, 从而辅助
模型更加高效地搜索最佳探测无 人机阵列。
8.根据权利要求1所述的基于情感偏好与迁移行为的联邦学习无人机协同决策方法,
其特征在于, 通过融入非线性余弦自适应的交叉和变异策略, 以提高目标解的多样性, 包
括:
非线性余弦自适应交叉算子Pc:
非线性余弦自适应 变异算子Pm:权 利 要 求 书 2/3 页
3
CN 115525842 A
3
专利 基于情感偏好与迁移行为的联邦学习无人机协同决策方法及系统
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 05:47:28上传分享