说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111647796.6 (22)申请日 2021.12.2 9 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦二层 (72)发明人 陈致远 方晓敏 王凡 何径舟  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 代理人 杜月 (51)Int.Cl. G16C 20/50(2019.01) G16C 20/70(2019.01) G06N 3/08(2006.01) G06N 3/12(2006.01) (54)发明名称 分子集合生成方法及装置、 终端和存 储介质 (57)摘要 本公开公开了分子集合生 成方法及装置、 终 端和存储介质, 涉及计算机技术领域, 尤其涉及 药物从头设计技术领域。 具体实现方案为: 通过 预筛选模型获取初始化分子集合中的第一初始 化分子子集; 获取第一初始化分子子集中至少一 个初始化分子的物理信息, 并基于物理信息, 对 至少一个初始化分子进行筛选, 得到筛选后的分 子集合; 获取筛选后的分子集合中至少一个分子 的生化实验评估值; 基于至少一个 分子的生化实 验评估值, 得到目标分子集合。 本公开实施例可 以提高分子集合生成的效率, 减少资源成本的消 耗, 提高实用性, 进 而提高用户的使用体验。 权利要求书3页 说明书12页 附图6页 CN 114429797 A 2022.05.03 CN 114429797 A 1.一种分子集 合生成方法, 包括: 通过预筛选模型获取初始化分子集 合中的第一初始化分子 子集; 获取所述第 一初始化分子子集中至少一个初始化分子的物理信 息, 并基于所述物理信 息, 对所述至少一个初始化分子进行筛 选, 得到筛选后的分子集 合; 获取所述筛选后的分子集 合中至少一个分子的生 化实验评估值; 基于所述至少一个分子的生 化实验评估值, 得到目标分子集 合。 2.根据权利要求1所述的方法, 其中, 所述通过预筛选模型获取初始化分子集合中的第 一初始化分子 子集, 包括: 采用遗传算法, 对所述初始化分子集 合进行筛 选, 得到第二初始化分子 子集; 通过预筛选模型, 对所述第二初始化分子子集中的至少一个初始化分子进行筛选, 得 到第一初始化分子 子集。 3.根据权利要求2所述的方法, 其中, 所述通过预筛选模型, 对所述第二初始化分子子 集中的至少一个初始化分子进行筛 选, 得到第一初始化分子 子集, 包括: 获取所述预筛选模型对应的选择策略, 所述选择策略包括分子评分和空间多样性条 件; 获取所述第 二初始化分子子集中满足所述选择策略的至少一个初始化分子, 得到第 一 初始化分子 子集。 4.根据权利要求1所述的方法, 其中, 所述基于所述至少一个分子的生化实验评估值, 得到目标分子集 合, 包括: 重新获取第 三初始化分子子集, 并将所述第 三初始化分子子集作为所述第 一初始化分 子子集, 并重新执行获取所述筛选后的分子集合中至少一个分子的生化实验评估值的步 骤; 若所述筛选后的分子集合中各分子的对应的生化实验评估值的变化量小于变化量阈 值, 则停止执 行获取第三初始化分子 子集的步骤。 5.根据权利要求1所述的方法, 其中, 在所述通过预筛选模型获取初始化分子集合中的 初始化分子 子集之前, 还 包括: 通过神经网络模型, 采样获取到 至少一个初始化种子; 通过生成模型, 获取 所述至少一个初始化种子对应的初始化分子集 合。 6.根据权利要求5所述的方法, 其中, 通过神经网络模型, 采样获取到至少一个初始化 种子, 包括: 采用神经网络模型, 从初始化的模型隐空间中采样得到 至少一个初始化种子; 或者 采用所述神经网络模型, 从已生成的空间中采样得到所述至少一个初始化种子 。 7.根据权利要求1所述的方法, 其中, 在所述基于所述至少一个分子的生化实验评估 值, 得到目标分子集 合之后, 还 包括: 获取所述目标分子集 合中至少一个目标分子对应的属性信息和验证信息; 基于所述至少一个目标分子对应的所述属性信 息和所述验证信 息, 对所述预筛选模型 进行训练, 得到训练后的预筛 选模型。 8.一种分子集 合生成装置, 包括:权 利 要 求 书 1/3 页 2 CN 114429797 A 2子集获取 单元, 用于通过 预筛选模型获取初始化分子集 合中的第一初始化分子 子集; 分子筛选单元, 用于获取所述第一初始化分子子集中至少一个初始化分子的物理信 息, 并基于所述物理信息, 对所述至少一个初始化分子进行筛 选, 得到筛选后的分子集 合; 评估值获取单元, 用于获取所述筛选后的分子集合中至少一个分子的生化实验评估 值; 集合获取单元, 用于基于所述至少一个分子的生 化实验评估值, 得到目标分子集 合。 9.根据权利要求8所述的装置, 其中, 所述子集获取单元包括集合筛选子单元和子集筛 选子单元, 所述子集 获取单元用于通过预筛选模型获取初始 化分子集合中的第一初始化分 子子集时: 所述集合筛选子单元, 用于采用遗传算法, 对所述初始化分子集合进行筛选, 得到第二 初始化分子 子集; 所述子集筛选子单元, 用于通过预筛选模型, 对所述第二初始化分子子集中的至少一 个初始化分子进行筛 选, 得到第一初始化分子 子集。 10.根据权利要求9所述的装置, 其中, 所述子集筛选子单元, 用于通过预筛选模型, 对 所述第二初始化分子子集中的至少一个初始化分子进行筛选, 得到第一初始化分子子集 时, 具体用于: 获取所述预筛选模型对应的选择策略, 所述选择策略包括分子评分和空间多样性条 件; 获取所述第 二初始化分子子集中满足所述选择策略的至少一个初始化分子, 得到第 一 初始化分子 子集。 11.根据权利要求8所述的装置, 其中, 所述集合获取单元包括子集重获子单元和步骤 停止子单元, 所述集合获取单元用于基于所述至少一个分子的生化实验评估值, 得到目标 分子集合时: 所述子集重获子单元, 用于重新获取第三初始化分子子集, 并将所述第三初始化分子 子集作为所述第一初始 化分子子集, 并重新执行获取所述筛选后的分子集合中至少一个分 子的生化实验评估值的步骤; 所述步骤停止子单元, 用于若所述筛选后的分子集合中各分子的对应的生化实验评估 值的变化 量小于变化 量阈值, 则停止执 行获取第三初始化分子 子集的步骤。 12.根据权利要求8所述的装置, 其中, 所述装置还包括种子获取单元和集合生成单元, 用于在所述 通过预筛选模型获取初始化分子集 合中的初始化分子 子集之前: 所述种子获取 单元, 用于通过神经网络模型, 采样获取到 至少一个初始化种子; 所述集合生成单元, 用于通过生成模型, 获取所述至少一个初始化种子对应的初始化 分子集合。 13.根据权利要求12所述的装置, 其中, 所述种子获取单元, 用于通过神经网络模型, 采 样获取到 至少一个初始化种子时, 具体用于: 采用神经网络模型, 从初始化的模型隐空间中采样得到 至少一个初始化种子; 或者 采用所述神经网络模型, 从已生成的空间中采样得到所述至少一个初始化种子 。 14.根据权利要求8所述的装置, 其中, 所述装置还包括模型训练单元, 用于在所述基于权 利 要 求 书 2/3 页 3 CN 114429797 A 3

.PDF文档 专利 分子集合生成方法及装置、终端和存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 分子集合生成方法及装置、终端和存储介质 第 1 页 专利 分子集合生成方法及装置、终端和存储介质 第 2 页 专利 分子集合生成方法及装置、终端和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:55:48上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。