说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221095712 2.4 (22)申请日 2022.08.10 (71)申请人 上海科技大 学 地址 201210 上海市浦东 新区华夏中路393 号 (72)发明人 郑杰 王诗珂 刘勇 吴敏  冯艺苗 刘鑫  (74)专利代理 机构 上海光华专利事务所(普通 合伙) 31219 专利代理师 倪静 (51)Int.Cl. G16B 40/00(2019.01) G16B 5/00(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称 基于对比学习的合成致死基因搭档的推荐 方法、 装置、 终端及 介质 (57)摘要 本申请公开了一种基于对比学习的合成致 死基因搭档的推荐方法、 装置、 终端及介质, 通过 获取基因数据, 将基因数据中的待匹配基因和被 推荐基因分别组成多个候选基因对, 将候选基因 对输入训练完毕的对比学习模型得到各候选基 因对的基因嵌入, 基于各候选基因对的基因嵌 入, 计算各候选基因对中两基因的相似度, 作为 各候选基因对的得分结果, 选定得分最高的候选 基因对中的被推荐基因作为待匹配基因的合成 致死基因搭档。 本申请利用对比学习框架达到仅 用已知的合成致死基因作为正样本训练模型并 推荐合成致死基因搭档的效果, 排除现有技术对 负样本的依赖, 有效缓解基因样本的稀缺问题, 较现有技 术相比具 备优越的预测性能。 权利要求书2页 说明书10页 附图4页 CN 115240778 A 2022.10.25 CN 115240778 A 1.一种基于对比学习的合成致死基因搭档的推荐方法, 其特 征在于, 包括: 获取基因数据, 其中, 所述基因数据包括被 推荐基因数据列表和待匹配 基因数据; 将所述被推荐基因数据列表中的各被推荐基因数据分别与所述待匹配基因数据组成 多个候选基因对, 将所述候选基因对输入训练完毕的对比学习模型, 得到所述各候选基因 对的基因嵌入; 基于所述各候选基因对的基因嵌入, 计算各候选基因对中待匹配基因数据和被推荐基 因数据的相似度, 作为各候选基因对的得分结果; 选定得分最高的候选基因对中的被推荐基因作为所述待匹配基因的合成致死基因搭 档。 2.根据权利要求1所述的基于对比学习的合成致死基因搭档的推荐方法, 其特征在于, 所述对比学习模型的训练步骤, 包括: 获取合成致死基因对数据; 对所述合成致死基因对数据的原 始特征做数据增强处 理, 得到增强特 征; 将所述原始特征和增强特征输入所述对比学习模型, 得到所述合成致死基因对数据的 基因嵌入; 基于所述合成致死基因对数据的基因嵌入, 优化所述对比学习 模型以最大化所述合成 致死基因对数据中第一基因和第二基因的相似度。 3.根据权利要求2所述的基于对比学习的合成致死基因搭档的推荐方法, 其特征在于, 所述数据增强处 理的步骤, 包括: 获取每个特征维度下 所述合成致死基因对数据中所有基因的特 征均值; 随机选定所述合成致死基因对数据中第 一基因和第 二基因的部分特征维度, 利用所述 特征均值替换所述部分特 征维度下的原 始特征。 4.根据权利要求2所述的基于对比学习的合成致死基因搭档的推荐方法, 其特征在于, 所述合成致死基因对数据的基因嵌入包括目标分支嵌入和在线分支嵌入, 由如下步骤得 到: 将所述原始特征输入所述对比学习 模型的目标分支, 经目标编码器处理后得到目标分 支嵌入; 将所述增强特征输入所述对比学习 模型的在线分支, 经在线编码器处理后得到在线分 支嵌入; 其中, 所述在线编码器和目标编码器具有相同结构与不同权重值, 二者均为前馈网络 模型, 包括三个线性变换层, 其中, 所述线性变换层之 间还包括批标准化处理环节和激活函 数层。 5.根据权利要求4所述的基于对比学习的合成致死基因搭档的推荐方法, 其特征在于, 所述对比学习模型的优化 步骤, 包括: 将所述在线分支嵌入输入预测器; 所述预测器根据所述在线分支嵌入中第一基因的基因嵌入, 预测第二基因的基因嵌 入; 定义损失函数, 使所述预测器的预测结果 不断接近所述目标分支嵌入。 6.根据权利要求1所述的基于对比学习的合成致死基因搭档的推荐方法, 其特征在于,权 利 要 求 书 1/2 页 2 CN 115240778 A 2所述得分结果的计算方式如下: 其中, (gi,gj)表示输入所述对比学习模型的基因对数据, s(gi,gj)表示基因对(gi,gj) 的得分, fθ表示在线编码器, 表示预测器, T表示矩阵转置操作。 7.根据权利要求2所述的基于对比学习的合成致死基因搭档的推荐方法, 其特征在于, 还包括通过交叉验证方式检验所述对比学习模型 的性能, 其中, 所述交叉验证方式包括交 叉验证方式一、 交叉验证方式二、 交叉验证方式三: 交叉验证方式一: 按照基因对划分数据集, 其中, 所述数据集包括训练集、 验证集和测 试集; 交叉验证方式二: 按照基因划分数据集, 其中, 测试集中仅有一个基因在训练集中出 现; 交叉验证方式三: 按照基因划分数据集, 其中, 测试集中的基因不在训练集中出现。 8.一种基于对比学习的合成致死基因搭档的推荐装置, 其特 征在于, 包括: 数据获取模块, 用于获取基因数据, 其中, 所述基因数据包括被推荐基因数据列表和待 匹配基因数据; 对比学习 模块, 用于将所述被推荐基因数据列表中的各被推荐基因数据分别与所述待 匹配基因数据组成多个候选基因对, 将所述候选基因对输入训练完毕的对比学习模型, 得 到所述各候选基因对的基因嵌入; 得分计算模块, 用于基于所述各候选基因对的基因嵌入, 计算各候选基因对中待匹配 基因数据和被 推荐基因数据的相似度, 作为各候选基因对的得分结果; 基因推荐模块, 用于选定得分最高的候选基因对中的被推荐基因作为所述待 匹配基因 的合成致死基因搭档。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被 处理器执行时实现权利要求1至7中任一项所述方法。 10.一种电子终端, 其特 征在于, 包括: 处 理器及存 储器; 所述存储器用于存 储计算机程序; 所述处理器用于执行所述存储器存储的计算机程序, 以使所述终端执行如权利要求1 至7中任一项所述方法。权 利 要 求 书 2/2 页 3 CN 115240778 A 3

.PDF文档 专利 基于对比学习的合成致死基因搭档的推荐方法、装置、终端及介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于对比学习的合成致死基因搭档的推荐方法、装置、终端及介质 第 1 页 专利 基于对比学习的合成致死基因搭档的推荐方法、装置、终端及介质 第 2 页 专利 基于对比学习的合成致死基因搭档的推荐方法、装置、终端及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:04:51上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。