说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111653022.4 (22)申请日 2021.12.3 0 (66)本国优先权数据 202111386722.1 2021.1 1.22 CN (71)申请人 北京中科凡语科技有限公司 地址 100190 北京市海淀区知春路6 3号51 号楼10层10 06 (72)发明人 周玉 孙静远  (74)专利代理 机构 北京庚致知识产权代理事务 所(特殊普通 合伙) 11807 专利代理师 韩德凯 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 可解释神经解码模型的生 成方法、 电子设备 和存储介质 (57)摘要 本公开提供一种可解释神经解码模型的生 成方法, 包括: 获取被试者阅读自然语言句子时 脑成像数据; 生成可解释神经解码模型的训练 集, 其中训练集中神经解码模型的输入为脑成像 数据的体素数据, 输出为自然语言句子的稀 疏可 解释的文本表 示; 使用训练集进行神经解码模型 的训练, 训练时神经解码模型通过构建门控函数 来激活或停用每个层中的部分单元, 达到控制网 络的稀疏化程度的目的。 本公开还包括生成可解 释神经解码模型的电子设备和可读存 储介质。 权利要求书2页 说明书9页 附图3页 CN 114511062 A 2022.05.17 CN 114511062 A 1.一种可解释神经解码模型的生成方法, 包括如下步骤: S1、 获取被试者阅读自然语言 句子时脑成像数据; S2、 生 成可解释神经解码模 型的训练集, 其中训练集中神经解码模型的 输入为脑成像数据的体素数据, 输出为自然语言句子的稀疏可解释的文本表示; S 3、 使用训 练集进行神经解码模型的训练, 训练 时神经解码模型通过构建门控函数来激活或停用每个 层中的部分单 元, 达到控制网络的稀疏化 程度的目的。 2.根据权利要求1所述的可解释神经解码模型的生成方法, 其特征在于: 所述稀疏可解 释的文本表示使用疏化方法处理分布式词表示, 使得 处理后的词表示中每个维度都对应了 一种可解释的含义, 维度上值的大小代 表词汇和该含义的相关程度的大小。 3.根据权利要求2所述的可解释神经解码模型的生成方法, 其特征在于: 所述使用疏化 方法处理分布式词表示包括如下步骤: S201、 使用隐含狄利克雷分析(latent  diriclet   allocation,LDA)在语料库中推断主题模型β; S202、 基于主题模型β 将单词w编码为稀疏向 量vw, 其中每一维度都代 表了该词与对应主题的相关程度。 4.根据权利要求1所述的可解释神经解码模型的生成方法, 其特征在于: 所述可解释神 经解码模型的基础网络 结构是四层前馈神经网络(feed ‑forward network,FFN), 输入层与 脑神经激活具有相同的维数, 而输出层与稀疏 可解释的文本表示具有相同的维数。 5.根据权利要求1所述的可解释神经解码模型的生成方法, 其特征在于: 所述构建门控 函数来激活或停用每个层中的部分单元, 通过如下方式实现: 神经解码模型f在被试者t的 脑神经激活数据上进行训练时, 其层l的输出 是: 其中Wl和bl分别表示层l的权重和偏差项, 是一组可学习的、 与层l的维度相同的嵌入 向量, σ(x)是门控函数 使用sigmoid激 活函数作为门控函数, s是用于控制 门控函数值的整体二值化趋势的参数, 如果s>>1, σ(sx)近似单位阶跃函数, 门控函数将表 现出较强的二 值化趋势; 如果s越接 近1, σ(sx)就越趋 近于常规的sigmo id函数。 6.根据权利要求5所述的可解释神经解码模型的生成方法, 其特征在于: 在训练过程中 不将s设置为固定值, 而是对其进行 逐步退火: 其中, e∈{1,...,E}是当前的训练轮次, E表示总训练轮次数, b∈{1,...,B}是当前训 练批次, 而B是每一轮次中的总批数, smax是超参数。 7.根据权利要求6所述的可解释神经解码模型的生成方法, 其特征在于: 所述神经解码 模型的训练目标 是优化以下回归损失: 权 利 要 求 书 1/2 页 2 CN 114511062 A 2其中, BSi为句子Si引发的脑神经激活, VSi为Si的向量表示。 8.根据权利要求6所述的可解释神经解码模型的生成方法, 其特征在于: 所述神经解码 模型在跨被试者解码时, 通过累积门控函数值来约束梯度更新, 从而保护解码旧被试者较 为重要的网络单 元, 所述累积门控函数值 为: 其中 代表在第t个被试者上训练的解码器其第l层第i个单元的门控函数值, 代 表前t‑1个被试者上训练的解码器的门控函数值, gradl,i为原梯度值; 优选地, 在进行跨被试者 解码时, 神经解码器的训练目标 是优化以下回归损失: 其中R(gt,g<t)是控制网络的整体稀疏化程度的正则化项, λ为控制正则化项在损失函 数中的权 重, BSi为句子Si引发的脑神经激活, VSi为Si的向量表示。 9.一种电子设备, 其特 征在于, 包括: 存储器, 所述存储器存储执行指令; 以及处理器, 所述处理器执行所述存储器存储的执 行指令, 使得 所述处理器执行如权利要求1 ‑8中任一项所述的方法。 10.一种可读存储介质, 其特征在于, 所述可读存储介质中存储有执行指令, 所述执行 指令被处 理器执行时用于实现如权利要求1 ‑8中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114511062 A 3

.PDF文档 专利 可解释神经解码模型的生成方法、电子设备和存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 可解释神经解码模型的生成方法、电子设备和存储介质 第 1 页 专利 可解释神经解码模型的生成方法、电子设备和存储介质 第 2 页 专利 可解释神经解码模型的生成方法、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:55:52上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。