(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210914053.9
(22)申请日 2022.08.01
(65)同一申请的已公布的文献号
申请公布号 CN 114968602 A
(43)申请公布日 2022.08.30
(73)专利权人 成都图影视讯科技有限公司
地址 610000 四川省成 都市高新区高朋大
道11号1栋3层K1号
(72)发明人 贺新
(74)专利代理 机构 广州三环 专利商标代理有限
公司 44202
专利代理师 孙朝锐
(51)Int.Cl.
G06F 9/50(2006.01)
G06F 9/54(2006.01)
G06N 3/04(2006.01)
G06N 3/063(2006.01)
G06N 3/08(2006.01)(56)对比文件
CN 113313243 A,2021.08.27
CN 110321064 A,2019.10.1 1
CN 107016175 A,2017.08.04
CN 112488305 A,2021.0 3.12
CN 112799599 A,2021.0 5.14
CN 10958246 3 A,2019.04.0 5
WO 201914190 5 A1,2019.07.25
KR 20160005282 A,2016.01.14
邵巍 等.IPho ne系统中的Q oS控制系统的设
计与实现. 《电子学报》 .20 04,第28卷(第9期),第
5-9页.
Michael Zhang 等.Victim Repl ication:
Maximizi ng Capacity whi le Hiding Wire
Delay in Tiled Chip Multiproces sors. 《ISCA
"05: Proce edings of the 32nd an nual
internati onal symposium o n Computer
Architecture》 .20 05,第336-345页.
审查员 张也
(54)发明名称
资源动态分配型神经网络芯片的构架、 方法
和设备
(57)摘要
本申请实施例公开了一种资源动态分配型
神经网络芯片的构架、 方法和设备, 涉及人工智
能技术领域。 该资源动态分配型神经网络芯片的
构架包括: 数据输入缓存模块, 数据输出缓存模
块, 片上资源优化模块和片上资源分配模块, 该
资源动态分配型神经网络芯片的构架由于设置
了片上资源优化模块, 因此, 可 以根据神经网络
配置参数获得在不同资源配置方式下的时间数
组, 由于时间数组可以反映不同资源配置方式下
的运行效率, 因此, 根据时间数组, 确定目标资源
配置方式可以是较优的资源配置方式, 按照目标
资源配置方式进行数据处理自然可以提高芯片
的数据处 理效率。
权利要求书2页 说明书14页 附图2页
CN 114968602 B
2022.10.21
CN 114968602 B
1.一种资源动态分配型神经网络芯片的构架, 其特 征在于, 包括:
数据输入缓存模块, 用于缓存片上数据总 线的第一神经网络数据并将所述第 一神经网
络数据发送给神经网络计算执 行模块;
数据输出缓存模块, 用于缓存所述神经网络计算执行模块处理后的第二神经网络数
据, 并将所述第二神经网络数据发送给 所述片上 数据总线;
片上资源优化模块, 用于根据神经网络配置参数在不同资源配置方式下的不同参数
值, 获得在不同资源配置方式下的若干第一时间数组; 基于若干所述第一时间数组, 获得若
干第二时间数组; 并基于若干所述第二时间数组, 确定目标资源配置方式; 其中, 所述第一
时间数组包括从外部存储模块读取分片数据的第一时间和计算分片数据所需的第二时间,
所述第二时间数组包括所有数据的读取占用所述片上数据总线的第三时间和计算当前网
络层所有数据所消耗的第四 时间;
片上资源分配模块, 用于根据 所述目标资源配置方式, 配置所述数据输入缓存模块、 所
述神经网络计算执 行模块和所述数据输出缓存 模块。
2.根据权利要求1所述的构架, 其特征在于, 所述神经网络配置参数包括固定参数和可
配置参数; 所述片上资源优化模块, 还用于根据固定参数以及在不同资源配置方式下 的若
干组可配置参数值, 获得若干第一时间数组。
3.根据权利要求2所述的构架, 其特征在于, 所述第 一神经网络数据和所述第 二神经网
络数据均为图像数据。
4.根据权利要求3所述的构架, 其特 征在于, 所述固定参数, 包括:
输入图像数据宽度、 输入图像数据高度、 输入数据通道数、 输出数据通道数、 滤波器大
小、 片上并行计算单元数量以及计算单元组数、 片上计算结果缓存大小、 外部存储模块批量
数据读写长度和片上 数据交换损失时间。
5.根据权利要求3或4所述的构架, 其特征在于, 所述可配置参数包括: 实际输入图像宽
度、 实际输入图像高度和图像数据缓存组数。
6.根据权利要求1所述的构架, 其特征在于, 所述片上资源分配模块通过片上配置总 线
分别与所述数据输入缓存模块、 所述神经网络计算执行模块、 所述数据输出缓存模块以及
片外存储接口模块 通信连接, 所述片外存 储接口模块与所述外 部存储模块通信连接 。
7.一种基于资源动态分配型神经网络芯片的数据处 理方法, 其特 征在于, 包括:
根据神经网络配置参数在不同资源配置方式下的不同参数值, 获得在不同资源配置方
式下的若干第一时间数组; 其中, 所述第一时间数组包括从外部存储模块读取分片数据的
第一时间和计算分片数据所需的第二时间;
基于若干所述第一时间数组, 获得若干第二时间数组;
基于若干所述第 二时间数组, 确定目标资源配置方式; 其中, 所述第 二时间数组包括所
有数据的读取占用片上数据总线的第三时间和计算当前网络层所有数据所消 耗的第四时
间;
根据所述目标资源配置方式, 配置数据输入缓存模块、 神经网络计算执行模块和数据
输出缓存模块; 其中, 所述数据输入缓存模块用于缓存所述片上数据总线的第一神经网络
数据并将所述第一神经网络数据发送给所述神经网络计算执行模块, 所述数据输出缓存模
块用于缓存所述神经网络计算执行模块处理后的第二神经网络数据, 并将所述第二神经网权 利 要 求 书 1/2 页
2
CN 114968602 B
2络数据发送给 所述片上 数据总线。
8.根据权利要求7所述的方法, 其特征在于, 所述神经网络配置参数包括固定参数和可
配置参数; 所述根据神经网络配置参数在不同资源配置方式下 的不同参数值, 获得在不同
资源配置方式下的若干第一时间数组的步骤, 包括:
根据固定参数以及在不同资源配置方式下的若干组可配置参数值, 获得若干第 一时间
数组。
9.根据权利要求7 所述的方法, 其特 征在于, 所述分片数据为图像数据。
10.一种计算机设备, 其特征在于, 该计算机设备包括神经网络芯片, 所述神经网络芯
片包括如权利要求1 ‑6中任一项所述的构架。权 利 要 求 书 2/2 页
3
CN 114968602 B
3
专利 资源动态分配型神经网络芯片的构架、方法和设备
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 13:15:28上传分享