金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111190065.3 (22)申请日 2021.10.12 (71)申请人 江苏大学 地址 212013 江苏省镇江市京口区学府路 301号 (72)发明人 王海 陈妍妍 蔡英凤 陈龙  李祎承 刘擎超 孙晓强  (51)Int.Cl. G06V 10/26(2022.01) G06V 10/774(2022.01) G06V 20/56(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06F 30/27(2020.01) (54)发明名称 一种基于低光照复杂道路场景下的语义分 割方法及系统 (57)摘要 本发明公开了一种基于低光照复杂道路场 景下的语义 分割方法及系统, 本发 明通过自动驾 驶仿真平台和生成对抗网络分别进行合成数据 采集和良好光照下的数据风格迁移工作, 从而构 建了不同的低光照数据集; 本发明在SFNet网络 的基础上,提出了一种新的语义 分割算法来改善 低光照场景下的分割性能, 主要通过改进的 Resnet50+结构作为骨干网络进行特征提取, 在 每一个Resnet  block引入 通道‑空间注意力机制 增强像素的表征能力并在上采样时, 考虑到分辨 率不同造成的差异引入特征对齐模块FAM, 该模 块可以学习高层低分辨率特征到浅层高分辨率 的像素偏移从而实现像素的精 准变化, 从而最大 可能避免细 节丢失问题, 最后通过引入多尺度注 意力模块来进一步提高分割性能。 本发明采用离 线方法预训练语义分割网络从而提高系统的安 全性。 权利要求书4页 说明书7页 附图3页 CN 113902915 A 2022.01.07 CN 113902915 A 1.一种基于低光照复杂道路场景下的语义分割系统, 其特征在于, 包括低光照数据集 构建模块, 语义分割网络模块, 离线 端对端训练模块和车 载摄像头实时分割模块; 所述的低光照数据集构建模块, 用于获取复杂的低光照道路场景图片, 该模块构建的 低光照数据集包括基于仿真平台合成虚拟数据和真实场景数据风格转化后的数据, 其中, 基于仿真平台合成虚拟数据是利用仿真平台CRALA所采集的低光照数据, 所述真实场景数 据风格转化后的数据是使用C ycleaGAN算法对现有的白天数据集CitySacpes进行低光照风 格转换得到; 所述的语义分割网络模块用于获取最后的标签图, 即按照像素所属类别赋予其相应的 类别标签, 得到像素级别的分割结果; 该模块采用改进的Resnet50+作为骨干特征提取网 络, 并在后面上采样时加入特征对齐模块(FAM), 学习每个像素点的运动方向, 在保留细节 的同时逐层 恢复图像的高分辨率避免像素的细节丢失问题, 最后通过多尺度 注意力模块进 一步改善语义分割结果; 所述的离线端对端训练模块用于根据像素级标注图片, 对搭建的语义分割网络进行训 练, 使得损失函数最小, 得到最佳的分割权 重; 所述的车载摄像头实时分割模块, 通过车载摄像头获取实时的道路场景图片, 并将其 送入已经训练好的语义分割神经网络中, 获取实时的低光照道路场景分割结果。 2.根据权利要求1所述的一种基于低光照复杂道路场景下的语义分割系统, 其特征在 于, 所述语义分割网络模块中: 编码 器部分包括改进的骨干网络(Resnet50+)部分和金字塔 池化部分(PPM), 在逐层降低图片分辨率的同时获得更高层的特征图, 并通过PPM扩大感受 野得到全局的上下文信息; 解码器部分包括4个带有特征对齐模块(FAM)的解码器(Dec)模 块, 根据给定的高维特征图和低 维特征图, 网络通过特征对齐模块学习每个像素点的运动 方向, 在尽可能保留细节的同时逐层恢复图像的高分辨 率; 原始图片经过该语义分割网络模块的编码器和解码器之后, 通过由多个卷积层组成的 且最后一层卷积通道数为类别数的分割头 部分得到初始的分割结果。 3.根据权利要求2所述的一种基于低光照复杂道路场景下的语义分割系统, 其特征在 于, 所述多尺度语义分割网络的注意力模块在训练时引入另外一个尺度图片作为网络模块 的原始输入部分, 并通过注意力机制允许网络学习相邻尺度间的相对注意力权重, 然后将 多个尺度的分割结果进行最佳融合; 其中, 针对该模块采取的分层操作, 训练时只需要单独训练一个额外尺寸, 额外尺寸选 取为r=0.5, 训练过程表示 为: L”(r=1)=Up(L(r=0.5) )×A(r=0.5)+(1 ‑A(r=0.5) )×L(r=1)           (1) 由于训练学习的是相邻尺度间的相对权 重, 模型的推理过程表示 为: 权 利 要 求 书 1/4 页 2 CN 113902915 A 2其中r是缩放因子, r=0.5表示缩小2倍, r=2表示放大两倍; Up(·)表示上采样, Do(·) 表示下采样; Attn( α ), Attn(β )为学习到的注意力图; A( ·)表示某尺度下的注意力图, 为 Attn(·)的某一维度; Norm(Z)表示Z对于Attn( β )的相对权重; L ”(·)和L”'(·)分别表示 两个尺度和三个尺度下位于Softmax函数前的logit概率值; X( ·)表示某尺度下语义头之 前的特征图; F3×3(·)、 F1×1(·)分别表示3 ×3和1×1卷积。 4.根据权利要求2所述的一种基于低光照复杂道路场景下的语义分割系统, 其特征在 于, 所述编码器结构组成如下: 浅层特征提取部分(Stem)使图片分辨率降到原图的1/4, 再 经过4个阶段使得在提取高层语义特征的同时分辨率降低到原图1/32, 最后为了获得更抽 象的语义特 征, 使用P PM将上下文信息进行融合; 编码器的网络结构选取Resnet50作为骨干网络, 并仅使用Resnet50前面的卷积层, 卷 积层由一个Stem和4个阶段组成, 每个阶段分别包含3,4,6,3个block, 每一个b lock均采取 残差结构, 使用3个尺寸为3 ×3的小卷积核取代1个7 ×7的大卷积核; 在阶段中使用双重注 意力模块来改进block进而优化骨干网络, 改进后的block称之为Residual  block+, 改进后 的总骨干网络称之为Resnet5 0+。 5.根据权利要求4所述的一种基于低光照复杂道路场景下的语义分割系统, 其特征在 于, 所述Residual  block+主要是在原始残差块的第三个权重层后引入通道注意力和空间 注意力模块; 其中权重层 包括卷积层和批量归一化层; 为了增加网络的非线性能力, 该残差 块采取瓶颈模块, 即在第一个权重层中使用1 ×1卷积核对通道进行降维, 然后通过3 ×3的 卷积核提取 特征, 最后在第三个权 重层中进行相应的升维。 通道注意力和空间注意力模块具体设计如下: 中间特征 作为输入,经过纯通 道注意力模块学习通道注意力图 并与原特征图相乘得到特征 通道 注意力图 的表示如下: AC=σ(F(favg(X)+F(fmax(X))                                           (6) 经过通道注意力机制优化的特征Z再作为输入, 送入到空间注意力机制中学习空间注 意力图 并与优化后的特征Z相乘得到最后的输出 空间注意力图 表示如下: 其中favg(·)表示对输入X在空间上进行平均池化, 池化后的 fmax(·)表 示对输入X在空间上进行最大池化, 池化后的 F(·)表示池化后送入的网 络, 由两个卷积核大小为1 ×1的二维卷积组成; f ”avg(·)表示对输入Z在通道上进行平均池权 利 要 求 书 2/4 页 3 CN 113902915 A 3

.PDF文档 专利 一种基于低光照复杂道路场景下的语义分割方法及系统

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于低光照复杂道路场景下的语义分割方法及系统 第 1 页 专利 一种基于低光照复杂道路场景下的语义分割方法及系统 第 2 页 专利 一种基于低光照复杂道路场景下的语义分割方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:41:13上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。