金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210087838.3 (22)申请日 2022.01.25 (71)申请人 南京理工大 学 地址 210094 江苏省南京市玄武区孝陵卫 200号南京理工大 学 (72)发明人 舒祥波 赵翔宇 唐金辉  (74)专利代理 机构 北京高沃 律师事务所 1 1569 代理人 杜阳阳 (51)Int.Cl. G06V 10/44(2022.01) G06V 10/52(2022.01) G06V 10/82(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06K 9/62(2022.01) (54)发明名称 一种基于离散小波注意力模块的图像分类 方法及系统 (57)摘要 本发明提出了一种基于离散小波注意力模 块的图像分类方法及系统, 属于图像 分类技术领 域, 包括构建训练数据集; 构建图像分类模型; 图 像分类模型包括依次连接的特征图提取模块、 特 征提取模块和特征分类模块; 在特征提取模块中 包括离散小波注意力模块, 离散小波注意力模块 基于离散小波变换机制和空间注 意力机制, 对特 征图提取模块输出的特征图进行图像特征的提 取, 并将提取得到的图像特征输入特征分类模 块, 得到图像分类结果; 利用训练数据集对图像 分类模型进行训练, 得到训练好的图像分类模 型; 将待分类的图像尺寸调整为与训练图像相同 的尺寸, 输入到训练好的图像分类模型中, 得到 图像分类结果。 权利要求书2页 说明书8页 附图4页 CN 114419336 A 2022.04.29 CN 114419336 A 1.一种基于离散小波注意力模块的图像分类方法, 其特征在于, 所述图像分类方法包 括: 构建包括训练图像和训练图像的标签的训练数据集; 各训练图像的尺寸相同; 构建图像分类模型; 所述图像分类模型包括依次连接的特征图提取模块、 特征提取模 块和特征分类模块; 所述特征提取模块中包括离散小波注意力模块, 所述离散小波注意力 模块用于基于离散小波变换机制和空间注意力机制, 对特征图提取模块输出的特征图进 行 图像特征的提取, 并将提取 得到的图像特 征输入所述特 征分类模块, 得到图像分类结果; 利用所述训练数据集对所述图像分类模型进行训练, 得到训练好的图像分类模型; 将待分类的图像尺寸调整为与训练图像相同的尺寸, 输入到所述训练好的图像分类模 型中, 得到图像分类结果。 2.根据权利要求1所述的图像分类方法, 其特征在于, 所述特征提取模块还包括: 用于 通道数调整的卷积层。 3.根据权利要求1所述的图像分类方法, 其特征在于, 所述利用所述训练数据集对所述 图像分类模型进行训练, 得到训练好的图像分类模型, 具体包括: 依次将所述训练数据集中的各训练图像输入进所述特 征图提取模块中, 得到特 征图; 将所述特征图输入所述离散小波注意力模块中, 基于离散小波变换机制和空间注意力 机制对所述特 征图进行图像特 征的提取, 得到图像特 征; 将所述图像特 征输入所述特 征分类模块中, 得到训练图像的图像 类别; 根据训练图像的图像类别和训练图像对应的训练图像标签, 计算分类损 失, 并根据所 述分类损失更新所述特 征图提取模块的参数。 4.根据权利要求3所述的图像分类方法, 其特征在于, 所述将所述特征图输入所述离散 小波注意力模块中, 基于离散小波变换机制和空间注意力机制对所述特征图进行图像特征 的提取, 得到图像特 征, 具体包括: 对所述特征图进行离散小波变换, 得到一个低频分量、 高频垂直分量、 高频水平分量和 高频对角分量; 对所述高频垂直分量和所述 高频水平分量做相加 操作, 并通过Softmax操作, 得到全局 分布特征; 将全局分布特 征与所述低频分量做相乘操作, 得到全局细节特 征; 将全局细节特 征叠加到所述低频分量上, 得到图像特 征。 5.根据权利要求1所述的图像分类方法, 其特征在于, 在所述构建包括训练图像和对应 训练图像标签的训练数据集后, 所述图像分类方法还包括对各训练图像进行数据增强, 具 体包括: 依次取出所述训练数据集中的各训练图像; 在所述训练图像周围进行像素扩充, 得到扩充训练图像; 对所述扩充训练图像进行随机 裁剪, 重新得到原 尺寸的剪 裁训练图像; 将所述剪裁训练图像做随机水平翻转, 得到增强训练图像, 将所述增强训练图像替代 原训练图像。 6.一种基于离散小波注意力模块的图像分类系统, 其特征在于, 所述图像分类系统包 括:权 利 要 求 书 1/2 页 2 CN 114419336 A 2训练数据集构建单元, 用于构建包括训练图像和训练图像的标签的训练数据集; 各训 练图像的尺寸相同; 图像分类模型构建单元, 用于构建图像分类模型; 所述图像分类模型包括依次连接的 特征图提取模块、 特征提取模块和特征分类模块; 所述特征提取模块中包括离散小波注意 力模块, 所述离散小波注意力模块用于基于离散小波变换机制和空间注意力机制, 对特征 图提取模块输出的特征图进行图像特征的提取, 并将提取得到的图像特征输入所述特征分 类模块, 得到图像分类结果; 图像分类模型训练单元, 用于利用所述训练数据集对所述图像分类模型进行训练, 得 到训练好的图像分类模型; 图像分类模型应用单元, 用于将待分类的图像尺寸调整为与训练图像相同的尺寸, 输 入到所述训练好的图像分类模型中, 得到图像分类结果。 7.根据权利要求6所述的图像分类系统, 其特征在于, 所述特征提取模块还包括: 用于 通道数调整的卷积层。 8.根据权利要求6所述的图像分类系统, 其特征在于, 所述图像分类模型训练单元包 括: 特征图提取子单元, 用于将所述训练数据集中的各训练图像依次输入进所述特征图提 取模块中, 得到各训练图像对应的特 征图; 图像特征提取子单元, 用于将所述特征图输入所述离散小波注意力模块中, 基于离散 小波变换机制和空间注意力机制对所述特 征图进行图像特 征的提取, 得到图像特 征; 图像类别确定子单元, 用于将所述图像特征输入所述特征分类模块中, 得到训练图像 的图像类别; 参数更新子单元, 用于根据训练图像的图像类别和训练图像对应的训练图像标签, 计 算分类损失, 并根据所述分类损失更新所述特 征图提取模块的参数。 9.根据权利要求6所述的图像分类系统, 其特征在于, 所述图像分类系统中还包括图像 数据增强单元, 用于对所述训练数据集中的各训练图像进行数据增强; 所述图像数据增强 单元包括: 图像扩充子单元, 用于依次取出所述训练数据集中的各训练图像, 在所述训练图像周 围进行像素扩充, 得到扩充训练图像; 图像裁剪子单元, 用于对所述扩充训练图像进行随机裁剪, 重新得到原尺寸的剪裁训 练图像; 图像翻转子单元, 用于将所述剪裁训练图像做随机水平翻转, 得到增强训练图像, 将所 述增强训练图像替代 原训练图像。权 利 要 求 书 2/2 页 3 CN 114419336 A 3

PDF文档 专利 一种基于离散小波注意力模块的图像分类方法及系统

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于离散小波注意力模块的图像分类方法及系统 第 1 页 专利 一种基于离散小波注意力模块的图像分类方法及系统 第 2 页 专利 一种基于离散小波注意力模块的图像分类方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:12:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。