说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211038180.3 (22)申请日 2022.08.29 (71)申请人 无锡江南计算 技术研究所 地址 214100 江苏省无锡市滨湖区山水东 路188号 (72)发明人 谭弘兵 陈庆强 唐勇 吴铁彬  杨萱 郝子宇 李宏亮  (74)专利代理 机构 浙江千克知识产权代理有限 公司 33246 专利代理师 孙琦 (51)Int.Cl. G06F 9/50(2006.01) G06N 3/04(2006.01) G06N 3/063(2006.01) (54)发明名称 一种支持脉动阵列高效计算的方法及系统 (57)摘要 本发明属于高性能微处理器领域, 涉及一种 支持脉动阵列高效计算的方法及系统。 方法包 括: S1将第一矩阵数据中的行数据在二维脉动阵 列中以第一方向进行传输, 以将第一矩阵数据中 的各行数据预加载至二维脉动阵列中的各行运 算CU中; S2按时钟将第二矩阵数据中带有使能更 新信号的列数据以自上而下延迟依次增加的模 式在二维脉动阵列中以第二方向进行传输, 以将 第二矩阵数据中的各列数据实时输入至二维脉 动阵列中的相应运算CU中; 本发明将第一矩阵数 据中的各行数据预加载至二维脉动阵列中的各 行运算CU中, 其次, 第二矩阵数据中带有使能更 新信号, 并根据所述使能更新信号直接提取预加 载在CU单元中的所需数据。 实现了第一矩阵数据 加载的无缝切换与实时更新。 权利要求书2页 说明书6页 附图6页 CN 115373849 A 2022.11.22 CN 115373849 A 1.一种支持脉动阵列高效计算的方法, 其特 征在于, 包括 步骤: S1、 将第一矩阵数据中的行数据在二维脉动阵列中以第一方向进行传输, 以将第一矩 阵数据中的各 行数据预加载至二维脉动阵列中的各 行运算CU中; S2、 按时钟将第二矩阵数据中带有使能更新信号的列数据以自上而下延迟依次增加的 模式在二 维脉动阵列中以第二方向进 行传输, 以将第二矩阵数据中的各列数据实时输入至 二维脉动阵列中的相应运 算CU中; 步骤S2中, 运算CU根据当前时钟下实时接收到的列数据中带有 的使能更新信号, 提取 预加载在其内部的行数据, 并将所述预加载在其内部的行数据与当前时钟下其实时接收到 的列数据进行第一类型计算, 以得到第一计算结果, 并将第一计算结果与当前时钟下 由第 一方向上与其连接的上一运算CU传输过来的运算结果进行第二类型计算, 以得到第二计算 结果, 并在下一时钟时将第二计算结果传输 至第一方向上与该CU单 元连接的下一CU单 元。 2.根据权利要求1所述的一种支持脉动阵列高效计算的方法, 其特征在于, 步骤S2中, 不论输入至二维脉动阵列中的运 算CU的数据是否有效, 运 算CU均进行相应 计算; 所述第二矩阵数据中仅在其最底部的一行数据中带有有效信号, 步骤S2之后, 根据二 维脉动阵列最底部一行运 算CU的运 算结果带有的所述有效信号判断运 算结果是否有效。 3.根据权利要求1所述的一种支持脉动阵列高效计算的方法, 其特征在于, 步骤S2中, 所述第二矩阵数据传输至二维脉动阵列的过程中, 若出现断流现象, 即传输至二维脉动阵 列中相应运算CU的数据为无效数据, 则该运算CU保持断流前传输至其内部的数据不变, 以 进行运算。 4.根据权利要求1所述的一种支持脉动阵列高效计算的方法, 其特征在于, 所述第 一类 型计算为乘法计算。 5.根据权利要求4所述的一种支持脉动阵列高效计算的方法, 其特征在于, 所述第 二类 型计算为加法计算。 6.一种支持脉动阵列高效计算的系统, 基于权利要求1 ‑5任一项所述的一种支持脉动 阵列高效计算的方法, 其特征在于, 包括第一数据加载模块、 第二数据加载模块、 二维脉动 阵列模块、 累加结果写回模块, 第一数据加载模块、 二维脉动阵列模块、 累加结果写回模块 依次联接, 第二数据加载模块与二维脉动阵列模块联接; 第一数据加载模块, 用于加载第一矩阵数据, 以将第一矩阵数据中的行数据在二维脉 动阵列中以第一方向进行传输, 以将第一矩阵数据中的各行数据预加载至二 维脉动阵列中 的各行运算CU中; 第二数据加载模块, 用于加载第二矩阵数据, 以按时钟将第二矩阵数据中带有使能更 新信号的列数据以自上而 下延迟依次增加的模式在二 维脉动阵列中以第二方向进 行传输, 以将第二矩阵数据中的各列数据实时输入至二维脉动阵列中的相应运 算CU中; 累加结果写回模块, 用于写回二维脉动阵列的最终运 算结果。 7.根据权利要求6所述的一种支持脉动阵列高效计算的系统, 其特征在于, 还包括本地 局部存储器模块, 本地局部存储器模块分别与第一数据加载模块、 第二数据加载模块、 累加 结果写回模块联接 。 8.根据权利要求6所述的一种支持脉动阵列高效计算的系统, 其特征在于, 所述累加结 果写回模块包括累加器缓冲单元、 累加结果写回单元, 二维脉动阵列模块、 累加器缓冲单权 利 要 求 书 1/2 页 2 CN 115373849 A 2元、 累加结果写回单 元、 本地局部存 储器模块依次联接; 所述累加器缓冲单 元, 用于缓冲存 储二维脉动阵列模块输出的运 算结果; 所述累加结果写回单元, 用于根据运算结果中带有的有效信号, 判断是否将运算结果 写回本地局部存 储器模块。 9.根据权利要求6所述的一种支持脉动阵列高效计算的系统, 其特征在于, 二维脉动阵 列模块包括 n*n个运算CU单元; 运算CU单元包括第一矩阵数据影子寄存单元、 第一矩阵数据寄存单元、 累加数据寄存 单元、 更新使能寄存单元、 第二矩阵数据寄存单元、 运算单元, 第一矩阵数据影子 寄存单元、 第一矩阵数据寄存单元、 运算单元依次联接, 累加数据寄存单元与运算单元联接, 第二矩阵 数据寄存单 元与运算单元联接, 更新使能寄存单 元与第一矩阵数据寄存单 元联接; 累加数据寄存单元, 用于寄存第 一方向上上一运算CU单元中的运算单元传输过来的运 算结果, 第一方向上, 相 邻两联接的运算CU 单元的两第一矩阵数据影子 寄存单元联接, 第二 方向上, 相 邻两联接的运算CU 单元的两更新使能寄存单元联接, 第二方向上, 相 邻俩联接的 运算CU单元的两第二矩阵数据寄存单 元联接。 10.根据权利要求9所述的一种支持脉动阵列高效计算的系统, 其特征在于, 所述运算 单元包括相联的乘法运算子单元、 加法运算子单元, 第一矩阵数据寄存单元、 第二矩阵数据 寄存单元分别与乘法运 算子单元联接, 累加数据寄存单 元与加法运 算子单元联接。权 利 要 求 书 2/2 页 3 CN 115373849 A 3

.PDF文档 专利 一种支持脉动阵列高效计算的方法及系统

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种支持脉动阵列高效计算的方法及系统 第 1 页 专利 一种支持脉动阵列高效计算的方法及系统 第 2 页 专利 一种支持脉动阵列高效计算的方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:09:46上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。