说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211026008.6 (22)申请日 2022.08.25 (65)同一申请的已公布的文献号 申请公布号 CN 115098271 A (43)申请公布日 2022.09.23 (73)专利权人 北京医百 科技有限公司 地址 100012 北京市朝阳区来广营朝来科 技园18号院1 1号楼7层 专利权人 天津易赋诊互联网医院有限公司 (72)发明人 曲坛 黄缚鹏 李翔宇 郭丽  (74)专利代理 机构 北京晋德允升知识产权代理 有限公司 1 1623 专利代理师 王戈 (51)Int.Cl. G06F 9/50(2006.01)(56)对比文件 CN 113344104 A,2021.09.0 3 审查员 王妍 (54)发明名称 一种多线程数据处理方法、 装置、 设备及介 质 (57)摘要 本说明书实施例公开一种多线程数据处理 方法、 装置、 设备及介质, 多线 程数据处理方法包 括: 获取原始数据集合; 将原始数据集合划分成 若干不重合的数据区间, 生 成与各数据区间一一 对应的数据处理线程, 并且对任一数据处理线 程, 使该数据处理线程对该数据处理线程对应的 数据区间执行预设数据处理操作; 对 该数据处理 线程对应的数据区间执行预设数据处理操作包 括: 确定该数据处理线程对应的数据区间中的可 用数据, 并将该数据处理线程对应的数据区间中 的可用数据, 移动到该数据处理线程对应的存储 地址; 对各数据区间执行预设数据处理操作后, 将各数据处理线程对应的存储地址中的数据组 成目标数据集 合。 权利要求书3页 说明书13页 附图1页 CN 115098271 B 2022.12.02 CN 115098271 B 1.一种多 线程数据处 理方法, 其特 征是, 包括: 获取原始数据集 合; 生成目标 数据集合, 所述目标 数据集合由所述原 始数据集 合中的可用数据组成; 其中, 生成目标数据集合, 所述目标数据集合由所述原始数据集合中的可用数据组成, 包括: 将所述原始数据集合划分成若干不重合的数据区间, 生成与 各数据区间一一对应的数 据处理线程, 并且对任一数据处理线程, 使该数据 处理线程对该数据 处理线程对应的数据 区间执行预设数据处理操作; 对该数据处理线程对应的数据区间执行预设数据处理操作包 括: 确定该数据 处理线程对应的数据区间中的可用数据, 并将该数据 处理线程对应的数据 区间中的可用数据, 移动到该 数据处理线程对应的存 储地址; 对各数据区间执行所述预设数据处理操作后, 将各数据处理线程对应的存储地址 中的 数据组成目标 数据集合; 构建包含若干计数位的辅助空间, 对任一所述数据处理线程, 该数据处理线程对应一 个所述计数位, 该数据 处理线程对应的数据 空间也对应该计数位, 每个所述计数位的初始 值为第一预设值, 对任一所述数据 处理线程, 若该数据 处理线程完成对其对应的数据区间 的预设处理操作, 则将该数据处理线程对应的计数位设置为第二预设值, 当各所述数据 处 理线程对应的计数位都设置为第二预设值时, 释放原 始数据集 合占用的内存; 其中, 所述原始数据存储于计算机的GPU, 所述数据处理线程对应的存储地址为该数据 处理线程的缓冲区, 所述对各数据区间执行所述预设数据 处理操作后, 将各数据 处理线程 对应的存 储地址上的可用数据移动至GPU, 以便对目标 数据集合进行后续处 理。 2.如权利要求1所述的方法, 其特 征是, 所述方法还 包括: 确定各数据处理线程的执行顺序, 以使各数据处理线程按照所述执行顺序执行所述预 设数据处 理操作。 3.如权利要求2所述的方法, 其特 征是, 确定各 数据处理线程的执 行顺序, 包括: 根据各数据处理线程对应的数据区间的数据量, 确定各 数据处理线程的执 行顺序。 4.如权利要求1所述的方法, 其特征是, 将所述原始数据集合划分成若干不重合的数据 区间, 生成与各数据区间一一对应的数据处理线程, 并且对任一数据处理线程, 使 该数据处 理线程对该 数据处理线程对应的数据区间执 行预设数据处 理操作, 包括: 根据各数据区间的数据量, 确定各 数据区间执 行预设数据处 理操作的顺序; 对任一数据区间, 生成该数据区间对应的数据处理线程, 并在使该数据区间对应的数 据处理线程对该数据区间执行预设数据处理操作后, 生成下一数据区间对应的数据处理线 程, 使所述下一数据区间对应的数据 处理线程, 对所述下一数据区间执行所述预设数据 处 理操作。 5.如权利要求2至4中任一项所述的方法, 其特 征是, 所述方法还 包括: 对任一数据处理线程, 使该数据处理线程对该数据处理线程对应的数据区间执行预设 数据处理操作后, 根据该数据处理线程对应的存储地址确定下一数据处理线程对应的存储 地址。 6.如权利要求5所述的方法, 其特 征是, 所述方法还 包括: 构建存储地址指针;权 利 要 求 书 1/3 页 2 CN 115098271 B 2根据该数据处理线程对应的存 储地址确定下一数据处 理线程对应的存 储地址, 包括: 该数据处理线程对该数据处理线程对应的数据区间执行所述预设数据处理操作后, 更 新所述存 储地址指针; 根据更新后的所述存 储地址指针确定下一数据处 理线程对应的存 储地址。 7.如权利要求1所述的方法, 其特征是, 确定该数据处理线程对应的数据区间中的可用 数据, 包括: 根据该数据处理线程对应的数据区间中各数据的状态或类型, 确定该数据处理线程对 应的数据区间中的可用数据; 或, 将该数据 处理线程对应的数据区间中的非重复数据确定 为可用数据; 或, 对各数据区间执 行所述预设数据处 理操作后, 所述方法还 包括: 释放所述原始数据集合占用的内存, 被释放的内存用于容纳其他待进行所述预设数据 处理操作的数据。 8.一种多 线程数据处 理装置, 其特 征是, 包括: 准备模块, 用于获取原 始数据集 合; 处理模块, 用于生成目标数据集合, 所述目标数据集合由所述原始数据集合中的可用 数据组成; 其中, 生成目标数据集合, 所述目标数据集合由所述原始数据集合中的可用数据组成, 包括: 将所述原始数据集合划分成若干不重合的数据区间, 生成与 各数据区间一一对应的数 据处理线程, 并且对任一数据处理线程, 使该数据 处理线程对该数据 处理线程对应的数据 区间执行预设数据处理操作; 对该数据处理线程对应的数据区间执行预设数据处理操作包 括: 确定该数据 处理线程对应的数据区间中的可用数据, 并将该数据 处理线程对应的数据 区间中的可用数据, 移动到该 数据处理线程对应的存 储地址; 对各数据区间执行所述预设数据处理操作后, 将各数据处理线程对应的存储地址 中的 数据组成目标 数据集合; 其中, 所述原始数据存储于计算机的GPU, 所述数据处理线程对应的存储地址为该数据 处理线程的缓冲区, 所述对各数据区间执行所述预设数据 处理操作后, 将各数据 处理线程 对应的存 储地址上的可用数据移动至GPU, 以便对目标 数据集合进行后续处 理。 9.一种多 线程数据处 理设备, 其特 征是, 包括: 至少一个处 理器; 以及, 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 使 所述至少一个处理器能够执行权利要求 1至7中任一项 所述的多线程数据处理 方法。 10.一种计算机可读存储介质, 其特征是, 所述计算机可读存储介质存储有计算机可执 行指令, 所述计算机可执行指 令被处理器执行时实现权利要求1至7中任一项 所述的多线程权 利 要 求 书 2/3 页 3 CN 115098271 B 3

.PDF文档 专利 一种多线程数据处理方法、装置、设备及介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种多线程数据处理方法、装置、设备及介质 第 1 页 专利 一种多线程数据处理方法、装置、设备及介质 第 2 页 专利 一种多线程数据处理方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:09:08上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。