专利可解释神经解码模型的生成方法、电子设备和存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111653022.4 (22)申请日 2021.12.3 0 (66)本国优先权数据 202111386722.1 2021.1 1.22 CN (71)申请人北京中科凡语科技有限公司地址 100190 北京市海淀区知春路6 3号51 号楼10层10 06 (72)发明人周玉　孙静远　 (74)专利代理机构北京庚致知识产权代理事务所(特殊普通合伙) 11807 专利代理师韩德凯 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称可解释神经解码模型的生成方法、电子设备和存储介质 (57)摘要本公开提供一种可解释神经解码模型的生成方法，包括：获取被试者阅读自然语言句子时脑成像数据；生成可解释神经解码模型的训练集，其中训练集中神经解码模型的输入为脑成像数据的体素数据，输出为自然语言句子的稀疏可解释的文本表示；使用训练集进行神经解码模型的训练，训练时神经解码模型通过构建门控函数来激活或停用每个层中的部分单元，达到控制网络的稀疏化程度的目的。本公开还包括生成可解释神经解码模型的电子设备和可读存储介质。权利要求书2页说明书9页附图3页 CN 114511062 A 2022.05.17 CN 114511062 A 1.一种可解释神经解码模型的生成方法，包括如下步骤： S1、获取被试者阅读自然语言句子时脑成像数据； S2、生成可解释神经解码模型的训练集，其中训练集中神经解码模型的输入为脑成像数据的体素数据，输出为自然语言句子的稀疏可解释的文本表示； S 3、使用训练集进行神经解码模型的训练，训练时神经解码模型通过构建门控函数来激活或停用每个层中的部分单元，达到控制网络的稀疏化程度的目的。 2.根据权利要求1所述的可解释神经解码模型的生成方法，其特征在于：所述稀疏可解释的文本表示使用疏化方法处理分布式词表示，使得处理后的词表示中每个维度都对应了一种可解释的含义，维度上值的大小代表词汇和该含义的相关程度的大小。 3.根据权利要求2所述的可解释神经解码模型的生成方法，其特征在于：所述使用疏化方法处理分布式词表示包括如下步骤： S201、使用隐含狄利克雷分析(latent diriclet allocation,LDA)在语料库中推断主题模型β； S202、基于主题模型β 将单词w编码为稀疏向量vw，其中每一维度都代表了该词与对应主题的相关程度。 4.根据权利要求1所述的可解释神经解码模型的生成方法，其特征在于：所述可解释神经解码模型的基础网络结构是四层前馈神经网络(feed ‑forward network,FFN)，输入层与脑神经激活具有相同的维数，而输出层与稀疏可解释的文本表示具有相同的维数。 5.根据权利要求1所述的可解释神经解码模型的生成方法，其特征在于：所述构建门控函数来激活或停用每个层中的部分单元，通过如下方式实现：神经解码模型f在被试者t的脑神经激活数据上进行训练时，其层l的输出是：其中Wl和bl分别表示层l的权重和偏差项, 是一组可学习的、与层l的维度相同的嵌入向量, σ(x)是门控函数使用sigmoid激活函数作为门控函数， s是用于控制门控函数值的整体二值化趋势的参数，如果s>>1， σ(sx)近似单位阶跃函数，门控函数将表现出较强的二值化趋势；如果s越接近1， σ(sx)就越趋近于常规的sigmo id函数。 6.根据权利要求5所述的可解释神经解码模型的生成方法，其特征在于：在训练过程中不将s设置为固定值，而是对其进行逐步退火：其中， e∈{1,...,E}是当前的训练轮次， E表示总训练轮次数， b∈{1,...,B}是当前训练批次，而B是每一轮次中的总批数， smax是超参数。 7.根据权利要求6所述的可解释神经解码模型的生成方法，其特征在于：所述神经解码模型的训练目标是优化以下回归损失：权　利　要　求　书 1/2 页 2 CN 114511062 A 2其中， BSi为句子Si引发的脑神经激活， VSi为Si的向量表示。 8.根据权利要求6所述的可解释神经解码模型的生成方法，其特征在于：所述神经解码模型在跨被试者解码时，通过累积门控函数值来约束梯度更新，从而保护解码旧被试者较为重要的网络单元，所述累积门控函数值为：其中代表在第t个被试者上训练的解码器其第l层第i个单元的门控函数值，代表前t‑1个被试者上训练的解码器的门控函数值， gradl,i为原梯度值；优选地，在进行跨被试者解码时，神经解码器的训练目标是优化以下回归损失：其中R(gt,g<t)是控制网络的整体稀疏化程度的正则化项， λ为控制正则化项在损失函数中的权重， BSi为句子Si引发的脑神经激活， VSi为Si的向量表示。 9.一种电子设备，其特征在于，包括：存储器，所述存储器存储执行指令；以及处理器，所述处理器执行所述存储器存储的执行指令，使得所述处理器执行如权利要求1 ‑8中任一项所述的方法。 10.一种可读存储介质，其特征在于，所述可读存储介质中存储有执行指令，所述执行指令被处理器执行时用于实现如权利要求1 ‑8中任一项所述的方法。权　利　要　求　书 2/2 页 3 CN 114511062 A 3

专利 可解释神经解码模型的生成方法、电子设备和存储介质

专利可解释神经解码模型的生成方法、电子设备和存储介质