说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211045996.9 (22)申请日 2022.08.30 (71)申请人 之江实验室 地址 311100 浙江省杭州市余杭区中泰街 道之江实验室南湖总部 申请人 国家超级计算无锡中心 (72)发明人 刘勇 刘鑫 史新民 陈垚键  宋佳伟 王臻 郭楚 付昊桓  高捷 吴汶钊 冯赟龙  (74)专利代理 机构 杭州浙科专利事务所(普通 合伙) 33213 专利代理师 孙孟辉 (51)Int.Cl. G06N 10/20(2022.01) G06F 13/28(2006.01)G06F 9/50(2006.01) (54)发明名称 一种量子张量网络转置和收缩协同的方法 和装置 (57)摘要 本发明公开一种量子张量网络转置和收缩 协同的方法和装置, 基于异构众核处理器, 包括: 步骤一: 根据读取的张量信息, 进行张量索引预 分类后分块读入异构众核处理器的计算处理单 元; 步骤二: 在计算处理单元中, 根据索引信息, 对读入的分块张量进行转置; 步骤三: 再对经过 转置后的张量依据索信息进行张量收缩; 步骤 四: 收缩完成后, 将收缩结果输出回处理器的内 存对应张量块位置并合成完整的新收缩后张量 结果。 本发明通过高效的张量分块、 转置和张量 收缩计算策略, 合理地避免了中间结果的冗余访 存开销, 实现了转置和 张量收缩计算一体化、 提 高了张量收缩的速度, 有效解决了张量收缩计算 时间长、 效率低的问题, 提高了大规模量子电路 计算模拟的速度。 权利要求书1页 说明书5页 附图2页 CN 115146780 A 2022.10.04 CN 115146780 A 1.一种量子张量网络转置和收缩协同的方法, 基于异构众核处理器, 其特征在于, 包括 以下步骤: 步骤一: 根据读取的张量信息, 进行张量索引预分类后分块读入异构众核处理器的CPE 计算处理单元; 步骤二: 在所述CPE计算处 理单元中, 根据索引信息, 对读入的分块张量进行转置; 步骤三: 再对经 过转置后的张量依据索信息进行张量收缩计算; 步骤四: 收缩计算完成后, 将收缩计算结果输出回内存对应张量块位置并合成完整的 新收缩后张量结果。 2.如权利要求1所述的一种量子张量网络转置和收缩协同的方法, 其特征在于, 所述异 构众核处 理器采用超算芯片 SW26020pro。 3.如权利要求1所述的一种量子张量网络转置和收缩协同的方法, 其特征在于, 所述步 骤一具体为: 在 张量网络中, 根据读取 的张量的索引信息, 预先对张量索引进行划分, 再将 划分好索引后的张量分块读入每 个CPE计算处 理单元。 4.如权利要求3所述的一种量子张量网络转置和收缩协同的方法, 其特征在于, 所述步 骤二具体为: 根据读入的索引信息, 在每个CP E计算处理单元中根据要收缩的张量索引进 行 张量转置, 生成矩阵乘法的行列式, 表达式如下:                     (3) 其中A和B为 4维张量, a、 b、 e、 f、 i、 j 为张量节点的边, 即索引。 5.如权利要求4所述的一种量子张量网络转置和收缩协同的方法, 其特征在于, 所述步 骤三具体为: 在每一个CPE计算处 理单元中进行张量收缩计算, 表达式如下:          (4) 。 6.如权利要求5所述的一种量子张量网络转置和收缩协同的方法, 其特征在于, 所述步 骤四具体为: 收缩计算完成后, 在每一个CP E计算处理单元中所得的张量收缩计算结果依据 读取规则通过DMA直接存储器访问输出回内存对应张量块位置, 并合成完整的新收缩后张 量, 则整个张量收缩计算完成。 7.一种量子张量网络转置和收缩协同的装置, 其特征在于, 包括一个或多个处理器, 用 于实现权利要求1 ‑6中任一项所述的一种量子张量网络转置和收缩协同的方法。 8.一种计算机可读存储介质, 其特征在于, 其上存储有程序, 该程序被处理器执行时, 实现权利要求1 ‑6中任一项所述的一种量子张量网络转置和收缩协同的方法。权 利 要 求 书 1/1 页 2 CN 115146780 A 2一种量子张量网 络转置和收缩协同的方 法和装置 技术领域 [0001]本发明属于量子电路计算模拟技术领域, 涉及一种量子张量网络转置和收缩协同 的方法和装置 。 背景技术 [0002]在基于张量网络法的大规模量子电路模拟 过程中, 张量网络收缩的张量转置和张 量收缩技术已经比较成熟, 在国产异构众核处理器的运行平台上, 目前张量转置和收缩计 算均可单独实现。 随着技术的发展, 张量网络量子模拟方法越来越得到广泛应用, 对张量收 缩的性能和效率提出了更高的要求, 各种维度和收缩索引离散的张量收缩计算给国产异构 众核处理器的硬件潜力发挥带来了较大的挑战。 [0003]基于张量网络收缩的大规模量子电路模拟 方法的关键在于张量收缩效率的高低, 这极大程度决定了量子模拟 器的速度。 目前的张量收缩策略采用的策略是张量转置和张量 收缩计算分别独立 成运算模块, 两部 分运算模块分别需要额外的D MA访问片 外主存操作, 转 置和收缩分开导致的额外访主存开销影响了量子模拟 器的运算效率, 因此现有技术在进 行 张量收缩时, 对一些张量收缩算子存在一个缺陷, 即由于张量收缩过程中的单位数据量上 的计算密集程度不高, 因此运算模块的访 存成为性能瓶颈, 严重抑制张量收缩的速度。 我们 发现, 分别独立的张量转置和张量收缩计算的运算模块, 中间结果的存出和 导入分别占用 了不必要的访存带宽, 限制 了量子模拟的速度, 且使用原有张量转置和收缩策略不能充分 地发挥出国产异构众核处理器的计算潜力。 因此, 基于生产后即消费 的理念, 把张量转置和 张量收缩计算两个 独立运算模块融合协同起 来, 整体张量收缩的效率还有优化 提升空间。 发明内容 [0004]为了解决现有技术中存在的上述技术问题, 本发明提出了一种量子张量网络转置 和收缩协同的方法和装置, 通过张量索引的预分类, 将包含要收缩的索引信息通过一次读 取读入, 继而根据索引信息排列进行张量转置和张量收缩计算, 最终通过一次写出将结果 输出, 避免了中间结果的访存开销, 大 大提升了张量收缩的效率, 其具体技 术方案如下: 一种量子张量网络转置和收缩协同的方法, 基于异构众核处 理器, 包括以下步骤: 步骤一: 根据读取的张量信息, 进行张量索引预分类后分块读入异构众核处理器 的CPE计算处 理单元; 步骤二: 在所述CPE计算处 理单元中, 根据索引信息, 对读入的分块张量进行转置; 步骤三: 再对经 过转置后的张量依据索信息进行收缩计算; 步骤四: 收缩完成后, 将收缩结果输出回内存对应张量块位置并合成完整的新收 缩后张量结果。 [0005]进一步的, 所述异构众核处 理器采用超算芯片 SW26020pro。 [0006]进一步的, 所述步骤一具体为: 在张量网络中, 根据读取的张量的索引信息, 预先 对张量索引进行划分, 再将划分好索引后的张量分块读入每 个CPE计算处 理单元。说 明 书 1/5 页 3 CN 115146780 A 3

.PDF文档 专利 一种量子张量网络转置和收缩协同的方法和装置

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种量子张量网络转置和收缩协同的方法和装置 第 1 页 专利 一种量子张量网络转置和收缩协同的方法和装置 第 2 页 专利 一种量子张量网络转置和收缩协同的方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:11:13上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。