专利一种量子张量网络转置和收缩协同的方法和装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211045996.9 (22)申请日 2022.08.30 (71)申请人之江实验室地址 311100 浙江省杭州市余杭区中泰街道之江实验室南湖总部申请人国家超级计算无锡中心 (72)发明人刘勇　刘鑫　史新民　陈垚键　宋佳伟　王臻　郭楚　付昊桓　高捷　吴汶钊　冯赟龙　 (74)专利代理机构杭州浙科专利事务所(普通合伙) 33213 专利代理师孙孟辉 (51)Int.Cl. G06N 10/20(2022.01) G06F 13/28(2006.01)G06F 9/50(2006.01) (54)发明名称一种量子张量网络转置和收缩协同的方法和装置 (57)摘要本发明公开一种量子张量网络转置和收缩协同的方法和装置，基于异构众核处理器，包括：步骤一：根据读取的张量信息，进行张量索引预分类后分块读入异构众核处理器的计算处理单元；步骤二：在计算处理单元中，根据索引信息，对读入的分块张量进行转置；步骤三：再对经过转置后的张量依据索信息进行张量收缩；步骤四：收缩完成后，将收缩结果输出回处理器的内存对应张量块位置并合成完整的新收缩后张量结果。本发明通过高效的张量分块、转置和张量收缩计算策略，合理地避免了中间结果的冗余访存开销，实现了转置和张量收缩计算一体化、提高了张量收缩的速度，有效解决了张量收缩计算时间长、效率低的问题，提高了大规模量子电路计算模拟的速度。权利要求书1页说明书5页附图2页 CN 115146780 A 2022.10.04 CN 115146780 A 1.一种量子张量网络转置和收缩协同的方法，基于异构众核处理器，其特征在于，包括以下步骤：步骤一：根据读取的张量信息，进行张量索引预分类后分块读入异构众核处理器的CPE 计算处理单元；步骤二：在所述CPE计算处理单元中，根据索引信息，对读入的分块张量进行转置；步骤三：再对经过转置后的张量依据索信息进行张量收缩计算；步骤四：收缩计算完成后，将收缩计算结果输出回内存对应张量块位置并合成完整的新收缩后张量结果。 2.如权利要求1所述的一种量子张量网络转置和收缩协同的方法，其特征在于，所述异构众核处理器采用超算芯片 SW26020pro。 3.如权利要求1所述的一种量子张量网络转置和收缩协同的方法，其特征在于，所述步骤一具体为：在张量网络中，根据读取的张量的索引信息，预先对张量索引进行划分，再将划分好索引后的张量分块读入每个CPE计算处理单元。 4.如权利要求3所述的一种量子张量网络转置和收缩协同的方法，其特征在于，所述步骤二具体为：根据读入的索引信息，在每个CP E计算处理单元中根据要收缩的张量索引进行张量转置，生成矩阵乘法的行列式，表达式如下：（3）其中A和B为 4维张量， a、 b、 e、 f、 i、 j 为张量节点的边，即索引。 5.如权利要求4所述的一种量子张量网络转置和收缩协同的方法，其特征在于，所述步骤三具体为：在每一个CPE计算处理单元中进行张量收缩计算，表达式如下：（4）。 6.如权利要求5所述的一种量子张量网络转置和收缩协同的方法，其特征在于，所述步骤四具体为：收缩计算完成后，在每一个CP E计算处理单元中所得的张量收缩计算结果依据读取规则通过DMA直接存储器访问输出回内存对应张量块位置，并合成完整的新收缩后张量，则整个张量收缩计算完成。 7.一种量子张量网络转置和收缩协同的装置，其特征在于，包括一个或多个处理器，用于实现权利要求1 ‑6中任一项所述的一种量子张量网络转置和收缩协同的方法。 8.一种计算机可读存储介质，其特征在于，其上存储有程序，该程序被处理器执行时，实现权利要求1 ‑6中任一项所述的一种量子张量网络转置和收缩协同的方法。权　利　要　求　书 1/1 页 2 CN 115146780 A 2一种量子张量网络转置和收缩协同的方法和装置技术领域 [0001]本发明属于量子电路计算模拟技术领域，涉及一种量子张量网络转置和收缩协同的方法和装置。背景技术 [0002]在基于张量网络法的大规模量子电路模拟过程中，张量网络收缩的张量转置和张量收缩技术已经比较成熟，在国产异构众核处理器的运行平台上，目前张量转置和收缩计算均可单独实现。随着技术的发展，张量网络量子模拟方法越来越得到广泛应用，对张量收缩的性能和效率提出了更高的要求，各种维度和收缩索引离散的张量收缩计算给国产异构众核处理器的硬件潜力发挥带来了较大的挑战。 [0003]基于张量网络收缩的大规模量子电路模拟方法的关键在于张量收缩效率的高低，这极大程度决定了量子模拟器的速度。目前的张量收缩策略采用的策略是张量转置和张量收缩计算分别独立成运算模块，两部分运算模块分别需要额外的D MA访问片外主存操作，转置和收缩分开导致的额外访主存开销影响了量子模拟器的运算效率，因此现有技术在进行张量收缩时，对一些张量收缩算子存在一个缺陷，即由于张量收缩过程中的单位数据量上的计算密集程度不高，因此运算模块的访存成为性能瓶颈，严重抑制张量收缩的速度。我们发现，分别独立的张量转置和张量收缩计算的运算模块，中间结果的存出和导入分别占用了不必要的访存带宽，限制了量子模拟的速度，且使用原有张量转置和收缩策略不能充分地发挥出国产异构众核处理器的计算潜力。因此，基于生产后即消费的理念，把张量转置和张量收缩计算两个独立运算模块融合协同起来，整体张量收缩的效率还有优化提升空间。发明内容 [0004]为了解决现有技术中存在的上述技术问题，本发明提出了一种量子张量网络转置和收缩协同的方法和装置，通过张量索引的预分类，将包含要收缩的索引信息通过一次读取读入，继而根据索引信息排列进行张量转置和张量收缩计算，最终通过一次写出将结果输出，避免了中间结果的访存开销，大大提升了张量收缩的效率，其具体技术方案如下：一种量子张量网络转置和收缩协同的方法，基于异构众核处理器，包括以下步骤：步骤一：根据读取的张量信息，进行张量索引预分类后分块读入异构众核处理器的CPE计算处理单元；步骤二：在所述CPE计算处理单元中，根据索引信息，对读入的分块张量进行转置；步骤三：再对经过转置后的张量依据索信息进行收缩计算；步骤四：收缩完成后，将收缩结果输出回内存对应张量块位置并合成完整的新收缩后张量结果。 [0005]进一步的，所述异构众核处理器采用超算芯片 SW26020pro。 [0006]进一步的，所述步骤一具体为：在张量网络中，根据读取的张量的索引信息，预先对张量索引进行划分，再将划分好索引后的张量分块读入每个CPE计算处理单元。说　明　书 1/5 页 3 CN 115146780 A 3

专利 一种量子张量网络转置和收缩协同的方法和装置

专利一种量子张量网络转置和收缩协同的方法和装置