说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111474996.6 (22)申请日 2021.12.0 6 (71)申请人 哈尔滨工业大 学 (深圳) 地址 518055 广东省深圳市南 山区桃源街 道深圳大 学城哈尔滨工业大 学校区 (72)发明人 刘川意 韩培义 周宇星  (74)专利代理 机构 广东深田律师事务所 4 4573 代理人 傅俏梅 瞿丹丹 (51)Int.Cl. G06F 30/20(2020.01) G06F 21/62(2013.01) (54)发明名称 面向结构化仿真数据的质量评估 方法、 系统 和设备 (57)摘要 本发明提供了一种面向结构化仿真数据的 质量评估方法和系统, 包括: 根据原始数据构建 仿真数据生成模 型; 数据拥有者使用包含隐私信 息的原始数据对仿真数据生 成模型进行训练, 得 到仿真数据; 将原始数据和仿真数据输入评估系 统, 评估仿真数据的可用性和仿真数据的隐私 性, 选择质量最高的仿真数据发布; 所述原始数 据和仿真数据为结构化数据, 由若干条数据记录 组成, 每条记录有若干字段, 仿真数据的字段与 原始数据的字段完全相同。 本发 明使用仿真数据 代替原始数据参与数据流通进行质量评估, 由于 仿真数据的数据条目都是合 成的, 不与现实中的 任何实体产生关联, 也不需要其他的假设或先验 知识, 有效避免了隐私泄露的风险, 评估全面、 可 靠, 通用性 好。 权利要求书2页 说明书8页 附图3页 CN 114357714 A 2022.04.15 CN 114357714 A 1.一种面向结构化仿真数据的质量评估方法, 其特 征在于, 包括 步骤: 根据原始数据构建仿真数据生成模型; 数据拥有者使用包含隐私信 息的原始数据对仿真数据生成模型进行训练, 得到仿真数 据; 将所述原始数据和所述仿真数据输入评估系统, 评估所示仿真数据的可用性和所述仿 真数据的隐私性, 选择质量 最高的仿真数据发布; 其中, 所述原始数据和所述仿真数据为结构化数据, 由若干条数据记录组成, 每条记录 有若干字段, 所述仿真数据的字段与所述原 始数据的字段完全相同。 2.如权利要求1所述的面向结构化仿真数据的质量评估方法, 其特征在于, 在评估所述 仿真数据的可用性和所述仿 真数据的隐私性步骤中, 还包括将数据拥有者对数据用途的假 设输入评估系统。 3.如权利要求1所述的面向结构化仿真数据的质量评估方法, 其特征在于, 根据 所述仿 真数据与所述原始数据在潜在的数据分析任务中效果相似程度评估所述仿真数据的可用 性。 4.如权利要求1所述的面向结构化仿真数据的质量评估方法, 其特征在于, 根据 所述仿 真数据暴露原 始数据信息的风险程度评估所述仿真数据的隐私性。 5.如权利要求1 ‑4任一项所述的面向结构化仿真数据的质量评估方法, 其特 征在于, 所述仿真数据的可用性评估 包括: 评估在特定分析任务中所述仿真数据和所述原 始数据的效果相似程度; 评估所述原 始数据中的字段关联关系在所述仿真数据中的保留程度; 评估各字段中的所述仿真数据与所述原 始数据的统计量是否一 致; 评估在不同的映射情况 下, 所述仿真数据与所述原 始数据的相似程度; 所述仿真数据的隐私性评估 包括: 评估特定分析任务中恶意分析者对隐私字段的真实预测效果; 评估所述仿真数据防御成员推断攻击的效果; 评估所述仿真数据记录暴露所述原 始数据条目的风险程度; 评估在不同的映射情况 下, 所述仿真数据与所述原 始数据的相似程度。 6.一种面向结构化仿真数据的质量评估系统, 其特 征在于, 包括: 可用性评估模块, 用于评估使用仿真数据与使用原始数据在潜在的数据分析任务中效 果相似程度; 仿真数据的隐私性评估 模块, 用于 评估仿真数据暴露原 始数据信息的风险程度。 7.如权利要求1所述的面向结构化仿真数据的质量评估系统, 其特征在于, 所述可用性 评估模块包括: 模拟分析单元, 用于评估在特定分析任务中所述仿真数据和所述原始数据的效果相似 程度; 关联评估单元, 用于评估所述原始数据中的字段关联关系在所述仿真数据中的保留程 度; 统计评估单元, 用于评估各字段中的所述仿真数据与所述原始数据的统计量是否一 致;权 利 要 求 书 1/2 页 2 CN 114357714 A 2随机映射单元, 用于评估在不同的映射情况下, 所述仿真数据与所述原始数据的相似 程度; 所述仿真数据的隐私性评估 模块包括: 隐私预测单 元, 用于评估特定分析任务中恶意分析者对隐私字段的真实预测效果; 成员推断单 元, 用于评估所述仿真数据防御成员推断攻击的效果; 暴露风险单 元, 用于关注所述仿真数据记录暴露所述原 始数据条目的风险程度; 随机映射单元, 用于评估在不同的映射情况下, 所述仿真数据与所述原始数据的相似 程度。 8.如权利要求7所述的面向结构化仿真数据的质量评估系统, 其特征在于, 所述随机映 射单元构建多个随机映射器, 将每一个记录输入所述 随机映射器内, 使各数据点从原始空 间映射到向量空间坐标进行比对, 以评估所述原 始数据和所述仿真数据的差异。 9.一种终端设备, 其特征在于, 包括处理器、 与所述处理器通信连接的存储器, 以及, 与 网络设备进行通信的接口; 其中, 所述存储器上存储可在所述处理器上运行的计算机程序, 以实现权利要求1 ‑5中任一项所述的面向结构化仿真数据的质量评估方法。 10.一种计算机可读存储介质, 用于存储计算机程序, 其特征在于, 所述计算机程序被 处理器执行时实现如权利要求1 ‑5中任一项所述的方法中的步骤。权 利 要 求 书 2/2 页 3 CN 114357714 A 3

.PDF文档 专利 面向结构化仿真数据的质量评估方法、系统和设备

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 面向结构化仿真数据的质量评估方法、系统和设备 第 1 页 专利 面向结构化仿真数据的质量评估方法、系统和设备 第 2 页 专利 面向结构化仿真数据的质量评估方法、系统和设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:56:44上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。