专利群智网络中基于矩阵补全与强化学习的数据收集方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211217427.8 (22)申请日 2022.10.04 (71)申请人中南大学地址 410083 湖南省长沙市岳麓区麓山南路932号 (72)发明人梁廷轩　刘安丰　 (51)Int.Cl. G06F 30/27(2020.01) G06F 30/18(2020.01) G06F 17/16(2006.01) (54)发明名称群智网络中基于矩阵补全与强化学习的数据收集方法 (57)摘要本发明公开了一种群智网络中基于矩阵补全与强化学习的数据收集方法，包含如下3个关键方法： (1)工人可信度的检验：当网格中存在可信工人时，优先招募可信工人，并以可信工人提交的数据来检验此网格中可信度未定工人的可信度； (2)当网络中含可信工人的网格数量满足矩阵补全要求时，采用矩阵补全方法推断出其它无可信工人网格中的数据；同时，将可信工人与推断出的数据作为真实数据，并采取与(1)类似的方法来检验可信度未定工人的可信度； (3)当网络中含可信工人的网格数量大于矩阵补全要求时，采用强化学习方法从中选取对于矩阵补全最有益的一部分网格来收集数据，并使用矩阵补全方法推断出剩余网格中的数据，以减少数据收集成本。权利要求书4页说明书7页附图3页 CN 115510753 A 2022.12.23 CN 115510753 A 1.一种群智网络中基于矩阵补全与强化学习的数据收集方法，该方法将群智网络划分为若干个网格，并将数据收集任务划分为若干个周期，平台需要在每个周期内招募工人收集数据以获得每个网格的真实数据，但网络中存在不可信或者恶意的工人提交低质量甚至是恶意数据，从而破坏平台的数据收集任务；为此，本发明使用已知的可信工人提交的数据来检验其他工人的可信度，进而在招募工人时招募可信工人进行数据收集，并采用矩阵补全方法来补全无可信工人的网格中的数据以提高数据质量；同时，本发明采用强化学习的方法优化包含可信工人的网格选取过程，以进一步减少需要招募的工人数量，具体实施包括以下步骤：步骤一、开始时，网络中可信工人较少，平台能够选取的含可信工人的网格数量未满足矩阵补全的要求数量m，此时，平台在含可信工人的网格中招募1个可信工人与多个可信度未定的工人，并将可信工人提交的数据作为对应网格的真实数据，而在无可信工人的网格中招募w个工人，并将w个工人提交数据的加权平均值作为对应网格的真实数据；同时，平台在含可信工人的网格中以可信工人提交的数据来检验其对应网格中其他可信度未定工人提交数据的真实性，并计算他们的信任度，从而检验工人的可信度；步骤二、重复执行步骤一，当平台能够选取的含可信工人的网格数量满足矩阵补全的要求数量m时，平台在这m个含可信工人的网格中各招募1个可信工人与多个可信度未定的工人，并将可信工人提交的数据作为对应网格的真实数据；同时，平台在无可信工人的网格中招募w个工人，并采用矩阵补全方法推断出这些无可信工人的网格中的数据，并将推断出的数据作为对应网格的真实数据；最后，平台以可信工人提交的数据与推断出的数据来检验对应网格中招募的可信度未定工人提交数据的真实性，进而检验他们的可信度；步骤三、重复执行步骤二，当平台能够选取的含可信工人的网格数量大于矩阵补全的要求数量m时，使用强化学习方法从这些含可信工人的网格中选取对于矩阵补全最有益的m 个网格来招募可信工人收集数据，并使用矩阵补全方法推断出剩余网格中的数据。 2.根据权利要求1所述检验工人可信度的方法，其特征在于，如果网格的真实数据是可信工人提交的数据或者是矩阵补全方法推断出的数据，那么该网格中招募的可信度未定工人的可信度可按如下方法检验：步骤一中所述工人的信任度按如下公式计算：其中，在周期τ内，第i个网格中的工人提交的数据为第i个网格的真实数据为首先根据网格的真实数据计算工人提交数据的准确度ρs，如果工人提交数据的准确度大于等于则提高工人的信任度，否则降低工人信任度；表示更新前工人的历史信任度，表示更新后工人的信任度， β表示历史信任度的权重，表示工人信任度的上限，表示工人信任度的下限；权　利　要　求　书 1/4 页 2 CN 115510753 A 2按照上述方法计算完工人信任度后，如果工人的信任度大于等于则将其归入可信工人集合；如果工人的信任度小于则将其归入不可信工人集合；而如果工人的信任度大于等于小于则将其归入可信度未定工人集合。 3.根据权利要求1所述的方法，基于已收集到的m个网格的真实数据，采用矩阵补全方法推断出其余网格数据的具体步骤如下： (1)根据前n ‑1个周期的完整数据以及当前周期收集到的m个网格的数据构建待补全矩阵Xm×n，其中， m为划分的网格数，元素xi,j表示第前n ‑j个周期收集到的第i个网格的真实数据，当前周期未收集到数据的网格真实数据设置为 Null； (2)随机初始化隐变量矩阵Pr×m和Qr×n，其中r的取值范围为r≤min(m,n)，隐向量pi表示矩阵Pr×m的第i列，隐向量qj表示矩阵Qr×n的第j列； (3)按照下式初始化偏置b， b的值表示矩阵Xm×n中非Null元素的平均值， N表示矩阵中非 Null元素的个数： (4)初始化偏置向量bp， bq为零向量，向量bp的长度为m，向量bq的长度为 n，即： bp＝[0,0,. ..， 0]m×1； bq＝[0， 0， . ..， ]n×1 (5)初始化完整矩阵为全零矩阵，即： (6)使用隐向量pi、 qj以及偏置b、 bp、 bq按照下式计算矩阵中元素的值，其中bp,i 表示向量bp的第i个元素， bq,j表示向量bq的第j个元素； (7)根据计算值与原始值xi,j按照下式计算估计误差ei,j： (8)根据估计误差ei,j，按照下式更新参数pi， qj， bp和bq的值，其中α 为学习率，取值范围为α ∈(0,1]， λ为正则系数，取值范围为 λ∈[0,1]：权　利　要　求　书 2/4 页 3 CN 115510753 A 3

专利 群智网络中基于矩阵补全与强化学习的数据收集方法

专利群智网络中基于矩阵补全与强化学习的数据收集方法