(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211217427.8
(22)申请日 2022.10.04
(71)申请人 中南大学
地址 410083 湖南省长 沙市岳麓区麓山 南
路932号
(72)发明人 梁廷轩 刘安丰
(51)Int.Cl.
G06F 30/27(2020.01)
G06F 30/18(2020.01)
G06F 17/16(2006.01)
(54)发明名称
群智网络中基于矩阵补全与强化学习的数
据收集方法
(57)摘要
本发明公开了一种群智网络中基于矩阵补
全与强化学习的数据收集方法, 包含如下3个关
键方法: (1)工 人可信度的检验: 当网格中存在可
信工人时, 优先招募可信工人, 并以可信工人提
交的数据来检验此网格中可信度未定工人的可
信度; (2)当网络中含可信工人的网格数量满足
矩阵补全要求时, 采用矩阵补全 方法推断出其它
无可信工人网格中的数据; 同时, 将可信工人与
推断出的数据作为真实数据, 并采取与(1)类似
的方法来检验可信度未定工人的可信度; (3)当
网络中含可信工人的网格数量大于矩 阵补全要
求时, 采用强化学习方法从中选取对于矩阵补全
最有益的一部分网格来收集数据, 并使用矩阵补
全方法推断出剩余网格中的数据, 以减少数据收
集成本。
权利要求书4页 说明书7页 附图3页
CN 115510753 A
2022.12.23
CN 115510753 A
1.一种群智网络 中基于矩阵补全与强化学习的数据收集方法, 该方法将群智网络划分
为若干个网格, 并将数据收集任务划分为若干个周期, 平台需要在每个周期内招募工人收
集数据以获得每个网格的真实数据, 但网络中存在不可信或者恶意的工人提交低质量甚至
是恶意数据, 从而破坏平台的数据收集任务; 为此, 本发明使用已知的可信工人提交的数据
来检验其他工人 的可信度, 进而在招募工人时招募可信工人进行数据收集, 并采用矩阵补
全方法来补全无可信工人 的网格中的数据以提高数据质量; 同时, 本发明采用强化学习的
方法优化包含可信工人 的网格选取过程, 以进一步减少需要招募的工人数量, 具体实施包
括以下步骤:
步骤一、 开始时, 网络中可信工人较少, 平台能够选取的含可信 工人的网格数量未满足
矩阵补全的要求数量m, 此时, 平台在含可信工人的网格中招募1个可信工人与多个可信度
未定的工人, 并将可信工人提交的数据作为对应网格的真实数据, 而在无可信工人 的网格
中招募w个工人, 并将w个工人提交数据的加权平均值作为对应网格的真实数据; 同时, 平台
在含可信工人 的网格中以可信工人提交的数据来检验其对应网格中其他可信度未定工人
提交数据的真实性, 并计算 他们的信任度, 从而检验工人的可信度;
步骤二、 重复执行步骤一, 当平台能够选取的含可信工人的网格数量满足矩阵补全的
要求数量m时, 平台在这m个含可信工人的网格中各招募1个可信工人与多个可信度未定的
工人, 并将可信工人提交的数据作为对应网格的真实数据; 同时, 平台在无可信工人的网格
中招募w个工人, 并采用矩阵补 全方法推断出这些无可信工人的网格中的数据, 并将 推断出
的数据作为对应网格的真实数据; 最后, 平台 以可信工人提交的数据与推 断出的数据来检
验对应网格中招募的可信度未定 工人提交数据的真实性, 进 而检验他们的可信度;
步骤三、 重复执行步骤二, 当平台能够选取的含可信工人的网格数量大于矩阵补全的
要求数量m时, 使用强化学习方法从这些含可信工人的网格中选取对于矩阵补全最有益的m
个网格来招募可信工人收集数据, 并使用矩阵补全方法推断出剩余网格中的数据。
2.根据权利要求1所述检验工人可信度的方法, 其特征在于, 如果网格的真实数据 是可
信工人提交的数据或者是矩阵补全方法推断出的数据, 那么该网格中招募的可信度未定工
人的可信度可按如下 方法检验:
步骤一中所述工人的信任度按如下公式计算:
其中, 在周期τ内, 第i个网格中的工人
提交的数据为
第i个网格的真实数据为
首先根据网格的真实数据计算工人提交数据
的准确度ρs, 如果工人提交数据的准确
度大于等于
则提高工人的信任度, 否则降低工人信任度;
表示更新前工人的历史信
任度,
表示更新后工人的信任度, β表示历史信任度的权重,
表示工人信任度的上
限,
表示工人信任度的下限;权 利 要 求 书 1/4 页
2
CN 115510753 A
2按照上述方法计算完工人信任度后, 如果工人的信任度
大于等于
则将其归入可信
工人集合; 如果工人的信任度
小于
则将其归入不可信工人集合; 而如果工人的信任度
大于等于
小于
则将其归 入可信度未定 工人集合。
3.根据权利要求1所述的方法, 基于已收集到的m个网格的真实数据, 采用矩阵补全方
法推断出其 余网格数据的具体步骤如下:
(1)根据前n ‑1个周期的完整数据以及当前周期收集到的m个网格的数据构 建待补全矩
阵Xm×n, 其中, m为划分的网格数, 元素xi,j表示第前n ‑j个周期收集到的第i个网格的真实数
据, 当前周期未收集到数据的网格真实数据设置为 Null;
(2)随机初始化隐变量矩阵Pr×m和Qr×n, 其中r的取值范围为r≤min(m,n), 隐向量pi表示
矩阵Pr×m的第i列, 隐向量qj表示矩阵Qr×n的第j列;
(3)按照下式初始化偏置b, b的值表示矩阵Xm×n中非Null元素的平均值, N表示矩阵中非
Null元素的个数:
(4)初始化偏置向量bp, bq为零向量, 向量bp的长度为m, 向量bq的长度为 n, 即:
bp=[0,0,. .., 0]m×1; bq=[0, 0, . .., ]n×1
(5)初始化完整矩阵
为全零矩阵, 即:
(6)使用隐向量pi、 qj以及偏置b、 bp、 bq按照下式计算矩阵
中元素
的值, 其中bp,i
表示向量bp的第i个元 素, bq,j表示向量bq的第j个元 素;
(7)根据计算 值
与原始值xi,j按照下式计算估计误差ei,j:
(8)根据估计误差ei,j, 按照下式更新参数pi, qj, bp和bq的值, 其中α 为学习率, 取值范围
为α ∈(0,1], λ为 正则系数, 取值范围为 λ∈[0,1]:
权 利 要 求 书 2/4 页
3
CN 115510753 A
3
专利 群智网络中基于矩阵补全与强化学习的数据收集方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 05:48:52上传分享