金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210946170.3 (22)申请日 2022.08.08 (71)申请人 昆仑芯 (北京) 科技有限公司 地址 100101 北京市海淀区上地十街10号1 幢4层CW区 (72)发明人 王勇 陈庆澍 王京 欧阳剑  邰秀瑢  (74)专利代理 机构 北京易光知识产权代理有限 公司 11596 专利代理师 王一 武晨燕 (51)Int.Cl. G06F 16/25(2019.01) G06F 17/16(2006.01) G06F 7/523(2006.01) (54)发明名称 数据格式转换的方法、 装置及矩阵处理的方 法、 装置 (57)摘要 本公开提供了数据格式转换的方法、 装置及 矩阵处理的方法、 装置, 涉及计算机技术领域, 尤 其涉及人工智能、 深度学习、 芯片等技术领域。 数 据格式转换的方法的具体实现方案为: 根据目标 矩阵中的各元素, 确定目标矩阵的最大值; 根据 目标数据格式的指数位的数位宽度和目标矩 阵 的最大值, 确定连续的多个数值区间; 根据各元 素与多个数值区间的对应关系, 以及多个数值区 间与目标数据格式的对应关系, 将目标矩阵的原 数据格式转换为目标数据格式。 根据本公开的方 案, 可以降低数据格式转换的运算量, 提升目标 矩阵中的各元素量化精度的同时兼顾各元素可 表示的数值范围。 权利要求书5页 说明书14页 附图4页 CN 115237992 A 2022.10.25 CN 115237992 A 1.一种数据格式转换的方法, 包括: 根据目标矩阵中的各 元素, 确定所述目标矩阵的最大值; 根据目标数据格式的指数位的数位宽度和所述目标矩阵的最大值, 确定连续的多个数 值区间; 以及 根据所述各元素与 所述多个数值区间的对应关系, 以及所述多个数值 区间与所述目标 数据格式的对应关系, 将所述目标矩阵的原数据格式转换为所述目标 数据格式。 2.根据权利 要求1所述的方法, 其中, 所述目标数据格式的数位宽度为16bit, 包括数位 宽度为1bit的符号 位、 数位宽度为2bit的指数位和数位宽度为13bit的尾数位。 3.根据权利要求1或2所述的方法, 其中, 所述根据目标矩阵中的各元素, 确定所述目标 矩阵的最大值, 包括: 根据目标矩阵中的各 元素的浮点数, 确定所述各 元素的绝对值数值; 将所述各 元素的绝对值数值中最大的数值, 确定为所述目标矩阵的最大值。 4.根据权利要求1或2所述的方法, 其中, 所述根据目标数据格式的指数位的数位宽度 和所述目标矩阵的最大值, 确定连续的多个数值区间, 包括: 以所述目标矩阵的最大值作为 最大端点 值和以0作为 最小端点值, 确定数值线段; 根据目标 数据格式的指数位的数位宽度, 将所述数值线段划分为连续的2N个数值区间; 根据所述目标数据格式的尾数位的数位宽度, 利用公式 分别确定所述2N 个数值区间中的每 个数值区间的最小 端点值; 其中, N为所述目标数据格式的指数位的数位宽度, maxa为所述每个数值区间的最大端 点值, maxb为所述每个数值区间的最小端点值, M为所述目标数据格式的尾数位的数位宽 度。 5.根据权利要求1或2所述的方法, 其中, 所述根据所述各元素与所述多个数值区间的 对应关系, 以及所述多个数值区间与所述 目标数据格式的对应关系, 将所述 目标矩阵的原 数据格式转换为所述目标 数据格式, 包括: 根据所述各元素的浮点数与 所述多个数值 区间的对应关系, 以及所述多个数值 区间与 所述目标 数据格式的对应关系, 确定所述各 元素对应的目标 数据格式的指数位; 根据所述各元素的浮点数与 所述多个数值 区间的对应关系, 以及所述多个数值 区间与 所述目标 数据格式的对应关系, 确定所述各 元素对应的目标 数据格式的尾数位; 根据所述各 元素的浮点数, 确定所述各 元素对应的目标 数据格式的符号 位; 根据所述各元素对应的目标数据格 式的符号位、 指数位、 尾数位, 将所述目标矩阵的原 数据格式转换为所述目标 数据格式。 6.根据权利要求5所述的方法, 其中, 所述根据所述各元素的浮点数与 所述多个数值 区 间的对应关系, 以及所述多个数值区间与所述 目标数据格式的对应关系, 确定所述各元素 对应的目标 数据格式的指数位, 包括: 根据所述各 元素的浮点数, 确定所述各 元素的绝对值数值; 根据所述各元素的绝对值数值, 确定所述各元素在所述多个数值 区间中对应的数值 区 间; 根据所述对应的数值 区间与所述目标数据格式的指数位的对应关系, 确定所述各元素权 利 要 求 书 1/5 页 2 CN 115237992 A 2对应的目标 数据格式的指数位。 7.根据权利要求5所述的方法, 其中, 所述根据所述各元素的浮点数与 所述多个数值 区 间的对应关系, 以及所述多个数值区间与所述 目标数据格式的对应关系, 确定所述各元素 对应的目标 数据格式的尾数位, 包括: 根据所述各 元素的浮点数, 确定所述各 元素的绝对值数值; 根据所述各元素的绝对值数值, 确定所述各元素在所述多个数值 区间中对应的数值 区 间; 根据所述对应的数值区间的最大端点值、 所述目标数据格式的尾数位的数位宽度、 以 及所述各元素的绝对 值数值, 利用公式 确定所述各元素对应的目标数据格 式的尾数位; 其中, F为所述各元素对应的目标数据格式的尾数位的值, V为所述各元素的绝对值数 值, k为所述目标数据格式的尾数位的数位宽度, maxc为所述对应的数值区间的最大端点 值。 8.根据权利要求1至7任一项所述的方法, 其中, 所述目标矩阵为深度学习框架中的算 子所利用的矩阵; 所述 目标矩阵中的各元素为对图像信息、 语音信息或文本信息进行特征 提取所得到的数据。 9.一种矩阵处 理的方法, 包括: 对第一目标矩阵和第二目标矩阵进行乘法运算, 得到第 三矩阵; 其中, 所述第 一目标矩 阵和所述第二 目标矩阵的数据格式均为 目标数据格式, 所述 目标数据格式根据权利要求1 至8任一项所述的数据格式转换的方法得到; 以及 根据预设的标准数据格式, 将所述第 三矩阵的数据格式转换为所述预设的标准数据格 式。 10.根据权利要求9所述的方法, 其中, 所述对第一目标矩阵和第二目标矩阵进行乘法 运算, 得到第三矩阵, 包括: 根据第一目标矩阵中的各第 一元素对应的目标数据格式, 确定所述各第 一元素对应的 目标数据格式的符号 位和尾数位; 根据第二目标矩阵中的各第 二元素对应的目标数据格式, 确定所述各第 二元素对应的 目标数据格式的符号 位和尾数位; 根据所述各第 一元素对应的目标数据格式的符号位和尾数位, 以及所述各第 二元素对 应的目标数据格式的符号位和尾数位, 对所述第一目标矩阵和所述第二目标矩阵进行乘法 运算, 得到第三矩阵。 11.根据权利要求10所述的方法, 其中, 在所述第 一目标矩阵和所述第 二目标矩阵进行 乘法运算的过程中, 所述第一元素和对应的第二元素的乘法运算利用公式c=F1*F2*S1*S2 进行; 其中, F1为所述第一元素对应的目标数据格式的尾数位的值, F2为所述对应的第二元素 对应的目标数据格式的尾数位的值, S1为所述第一元素的定浮点转换缩放系数, S2为所述对 应的第二元 素的定浮 点转换缩放系数。 12.根据权利要求11所述的方法, 其中, 根据对所述第 一元素对应的目标数据格式的符权 利 要 求 书 2/5 页 3 CN 115237992 A 3

PDF文档 专利 数据格式转换的方法、装置及矩阵处理的方法、装置

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据格式转换的方法、装置及矩阵处理的方法、装置 第 1 页 专利 数据格式转换的方法、装置及矩阵处理的方法、装置 第 2 页 专利 数据格式转换的方法、装置及矩阵处理的方法、装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 01:01:51上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。