金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211128912.8 (22)申请日 2022.09.16 (71)申请人 重庆邮电大 学 地址 400065 重庆市南岸区南 山街道崇文 路2号 (72)发明人 瞿中 王升烨 樊骏雅 李翠锦  高乐园  (74)专利代理 机构 广州市华学知识产权代理有 限公司 4 4245 专利代理师 黄宗波 (51)Int.Cl. G06V 10/42(2022.01) G06V 10/44(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种改进YOLOX网络结构的小目标检测方法 (57)摘要 本发明涉及目标检测技术领域, 具体涉及一 种改进YOLOX网络结构的小目标检测方法, 通过 引入CSPDarkNet网络并进行改进, 将 多尺度空间 金字塔池化层、 全局自注意力和多尺度特征融合 等模块融入网络模型中, 能够从 复杂数据集中提 取图像的小目标特征, 准确地检测小目标的定位 与有效检测。 主要解决三个方面技术问题, 一是 针对有限使用最大池化卷积使顶层卷积变得过 于稀疏, 导致所提取的特征不完整的问题; 二是 针对CNN缺乏全局建模、 长距离建模的能力问题; 三是针对单一层次提取的特征, 会造成最终的预 测结果与真实情况相差甚远的问题。 权利要求书1页 说明书5页 附图2页 CN 115424029 A 2022.12.02 CN 115424029 A 1.一种改进YOLOX网络结构的小目标检测方法, 其特 征在于, 包括下列步骤: 选择CSPDarkNet网络作为骨干网络进行初始化; 在CSPDarkNet网络的第五层嵌入多尺度空间金字塔池化模块; 在CSPDarkNet网络的第二层、 第五层与路径聚合特征金字塔之间嵌入全局自注意力 模 块; 在原始路径聚合特征金字塔的C3_P3与C3_n3之间嵌入全局自注意力模块构成多尺度 融合模块; 训练及评估改进后的CS PDarkNet网络模型, 用于小目标检测。 2.如权利要求1所述的改进YOLOX网络结构的小目标检测方法, 其特 征在于, 在CSPDarkNet网络的第五层嵌入多尺度空间金字塔池化模块的过程, 具体为将第二层 卷积特征提取的位置信息与语义信息输入到多尺度特征融合阶段, 并将第五层的空间金字 塔池化层替换成多尺度空间金字塔池化模块。 3.如权利要求2所述的改进YOLOX网络结构的小目标检测方法, 其特 征在于, 所述多尺度空间金字塔池化模块通过3 ×3、 5×5、 9×9、 13×13、 17×17池化核尺寸来 增加感受野提取的特征信息数量, 与原空间金字塔池化层的不同在于针对局部信息增加小 核池化卷积3 ×3, 对于全局信息提取增 加17×17的大核池化卷积。 4.如权利要求1所述的改进YOLOX网络结构的小目标检测方法, 其特 征在于, 在CSPDarkNet网络的第二层、 第五层与路径聚合特征金字塔之间嵌入全局自注意力 模 块的过程, 具体为在第二层和第五层分别嵌入一个全局自注意力模块, 改变了原始的 Bottleneckbl ock的普通3 ×3空间卷积。 5.如权利要求1所述的改进YOLOX网络结构的小目标检测方法, 其特 征在于, 在原始路径聚合特征金字塔的C3_P3与C3_n3之间嵌入全局自注意力模块构成多尺度 融合模块的过程, 在路径聚合特征金字塔的特征融合层中的C2与C3_P4之间增加 C2特征提 取的位置信息和语义信息, 并将路径聚合特征金字塔的C3_P3和C3_n3之间嵌入一个全局自 注意力模块 来完成多尺度特 征信息的融合。 6.如权利要求3所述的改进YOLOX网络结构的小目标检测方法, 其特 征在于, 所述多尺度空间金字塔池化模块排列 方式采用递增模式排列, 即增加一组小尺寸池化 层和一组大核尺寸池化层, 5个分支的感受野按照由小到大的方式递增, 小的感受野提取 临 近信息, 大的感受野提取全局信息 。 7.如权利要求1所述的改进YOLOX网络结构的小目标检测方法, 其特 征在于, 所述全局自注意力模块包 含空间注意力机制和通道 注意力机制。 8.如权利要求1所述的改进YOLOX网络结构的小目标检测方法, 其特 征在于, 所述多尺度融合模块首先对CSPDarkNet网络输出的特征使用1 ×1的卷积进行处理, 然 后将得到的特征图上采样到与输入图像相同的大小, 并进入路径聚合特征金字塔的特征融 合层, 最后将融合的特 征使用1×1的卷积进行处 理得到最终预测结果。权 利 要 求 书 1/1 页 2 CN 115424029 A 2一种改进Y OLOX网络结构的小目标 检测方法 技术领域 [0001]本发明涉及目标检测技术领域, 具体涉及一种改进YOLOX网络结构的小目标检测 方法。 背景技术 [0002]YOLOX是在2021年被提出的基于YOLO算法的一种目标检测方法, 并且开发者团队 一直在对YOLOX网络模 型进行改进和维护, 因此基于Y OLOX网络结构的目标检测方法得到了 广泛的应用。 [0003]然而现有的基于 YOLOX网络结构的小目标检测方法存在以下缺 点: [0004]1、 在特征提取阶段, 使用有限核尺寸的最大池化会使高层卷积变得过于稀疏, 捕 获全局特征信息的能力下降, 造成局部和远距离的特征信息丢失, 导致所提取 的特征不完 整。 对于目标检测而言, 目标的呈现形态复杂多变, 当卷积网络进行特征提取时, 若网络无 法从全局的角度去提取目标特征, 会使得最终的预测结果丢失大量的细节信息, 从而导致 检测的准确率降低。 [0005]2、 YOLOX主干特征提取网络为CNN网络, CNN具有平移不变性和局部性, 缺乏全局建 模、 长距离建模的能力。 [0006]3、 低层特征具有较高的分辨率, 包含更多的位置和细节信息, 但语义较低, 噪声较 大。 高层特征语义信息较强, 但分辨率很低, 对细节的感知较差。 对于小目标检测而言, 物体 呈现复杂多变, 例如物体变形, 遮挡物体, 重叠物体等, 而且实际捕捉的图像中小目标的数 目在整个图像像素中占比少, 所以仅使用单一层次的卷积进行特征提取, 会造成最终的预 测结果与真实情况相差甚远。 发明内容 [0007]本发明的目的在 于提供一种改进YOLOX 网络结构的小目标检测方法, 旨在使YOLOX 网络能够从复杂数据集中提取图像的小目标 特征, 准确地检测小目标的定位与有效检测。 [0008]为实现上述目的, 本 发明提供了一种改进YOLOX 网络结构的小目标检测方法, 包括 下列步骤: [0009]选择CSPDarkNet网络作为骨干网络进行初始化; [0010]在CSPDarkNet网络的第五层嵌入多尺度空间金字塔池化模块; [0011]在CSPDarkNet网络的第二层、 第五层与路径聚合特征金字塔之间嵌入全局自注意 力模块; [0012]在原始路径聚合特征金字塔的C3_P3与C3_n3之间嵌入全局自注意力模块构成多 尺度融合模块; [0013]训练及评估改进后的CS PDarkNet网络模型, 用于小目标检测。 [0014]其中, 在CSPDarkNet网络的第五层嵌入多尺度空间金字塔池化模块的过程, 具体 为将第二层卷积特征提取的位置信息与语义信息输入到多尺度特征融合阶段, 并将第五层说 明 书 1/5 页 3 CN 115424029 A 3

PDF文档 专利 一种改进YOLOX网络结构的小目标检测方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种改进YOLOX网络结构的小目标检测方法 第 1 页 专利 一种改进YOLOX网络结构的小目标检测方法 第 2 页 专利 一种改进YOLOX网络结构的小目标检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:58:56上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。