金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210073220.1 (22)申请日 2022.01.21 (71)申请人 浙江零跑 科技股份有限公司 地址 310051 浙江省杭州市滨江区物联网 街451号1楼 (72)发明人 徐昀 王芬芬 谢钱昆  (74)专利代理 机构 杭州杭诚专利事务所有限公 司 33109 专利代理师 刘正君 (51)Int.Cl. G06V 20/58(2022.01) G06V 20/56(2022.01) G06K 9/62(2022.01) G06V 10/46(2022.01) G06V 10/44(2022.01)G06V 10/764(2022.01) (54)发明名称 一种基于tran sformer的自动驾驶目标检测 方法及系统 (57)摘要 本发明公开了一种基于tran sformer的自动 驾驶目标检测方法, 克服了现有技术中基于 transformer的目标检测方法计算量大、 收敛慢 以及对车辆伪3d检测包含冗杂信息的问题, 方法 包括下列步骤: S1: 利用transformer预测出不同 目标车辆的2d检测框以及相关车辆信息; S2: 根 据预测结果得到车辆的伪3d框。 还提供了一种基 于transformer的自动驾驶目标检测系统。 在计 算不同粒度下的自注意力时添加稀疏注意力机 制, 减少了计算量, 同时在2d检测的基础上, 再预 测3个关键点, 减少网络的重复预测。 权利要求书2页 说明书6页 附图3页 CN 114627446 A 2022.06.14 CN 114627446 A 1.一种基于t ransformer的自动驾驶目标检测方法, 其特 征在于, 它包括下列步骤: S1: 利用t ransformer预测出不同目标 车辆的2d检测框以及相关车辆信息; S2: 根据预测结果得到车辆的伪3d框 。 2.根据权利要求1所述的一种基于transformer的自动驾驶目标检测方法, 其特征在 于, 所述的步骤S1 中, 预测的信息具体包括: 车辆的2d检测框的四个顶 点(e, g, n, m), 车辆车 轮胎的关键点a(xa, ya), b(xb, yb)以及车身分界点c(xc, yc)。 3.根据权利要求1所述的一种基于transformer的自动驾驶目标检测方法, 其特征在 于, 所述的步骤S1的具体步骤为: S1.1: 输入车身图像, 利用若干加入稀疏注意力机制的Stage模块从输入的图像中提取 特征, 得到初始特 征图; S1.2: 将不同Stage模块的输出特征融合得到不同尺度大小的特征信息, 对不同尺度大 小的输出以不同权 重进行加权求和, 输出相同大小的特 征图; S1.3: 通过1 ×1的卷积改变通道数进行对特征图不同任务的分类和识别, 得到不同目 标车辆的2d检测框以及相关车辆信息 。 4.根据权利要求3所述的一种基于transformer的自动驾驶目标检测方法, 其特征在 于, 所述的步骤S1.1中: 将输入图像划分为大小为n ×n的子图像块, 依次经历4个加入稀疏注意力机制的stage 模块, 每经历一个st age模块都输出一个初始特征图; 经过每个stage后的特征图尺寸减半 而维度翻倍。 5.根据权利要求3或4所述的一种基于transformer的自动驾驶目标检测方法, 其特征 在于, 所述的步骤S1.1中, 加入的稀疏注意力机制: A1: 使用不同大小的细粒度将特 征图池化成对应矩阵; A2: 对矩阵进行相关性约束: 每个元素只跟他相对半径为K以及 K+2i(K为超参数, i=0, 1,2…)的元素计算注 意力, 即除了相对半径 不超过K的以及相对半径 为K+2i以外的位置, 注 意力值设为0 。 6.根据权利要求3或4所述的一种基于transformer的自动驾驶目标检测方法, 其特征 在于, 所述的步骤S1.2中, 输出相同大小的特 征图: S1.2.1: 将初始特征图与下一个Stage模块输出的相同大小的中间特征图相加, 得到输 出特征图, 再使用上采样块将输出特征图扩大至与第一个Stage模块中输出的初始特征图 一样大, 得到该Stage模块的最 终输出特征图, 具体地, 要得到相同大小的中间特征图: 输入 图像每多经历一个Sta ge模块, 就使用上采样块将初始特 征图扩大两倍; S1.2.2: 为每一个Stage模块的最终输出特征图添加可学习的影响因子, 与对应stage 模块的输出相乘并求和进行多尺度特 征融合, 得到相同大小的特 征图。 7.根据权利要求2所述的一种基于transformer的自动驾驶目标检测方法, 其特征在 于, 所述的步骤S2中, 车轮胎关键点和车身分 界点都设有类别标签, 类别标签将车辆行驶状 态分为头左、 头右、 尾左、 尾右、 仅头、 仅尾、 仅左、 仅右8类。 8.根据权利要求2所述的一种基于transformer的自动驾驶目标检测方法, 其特征在 于, 所述的步骤S2进一 步表示为: S2.1: 根据检测到的顶点信息, 设置顶点坐标, 根据顶点坐标在图像中建立图像坐标权 利 要 求 书 1/2 页 2 CN 114627446 A 2系, 其中原点 为车辆图像左上角顶点, 沿原点向右为x轴方向, 沿原点向下为y轴方向; S2.2: 根据预测的a、 b 两点坐标计算直线方程L(a,b)=F(xa,ya,xb,yb), 分别计算直线L (a,b)与直线y=yc的交点i, 直线L(a,b)与直线x=xe时的交点j; S 2.3: c点在x轴上的投影与 2d框相交于 点f, 点g沿y轴向下与点i沿x轴向右交于点h(xg,yi), 得到伪3d框各顶点(e, f, g, h, i, j); S2.4: 所有车辆均按照步骤S2.1 ‑S2.3的步骤计算。 9.根据权利要求8所述的一种基于transformer的自动驾驶目标检测方法, 其特征在 于, 所述的步骤S2中, 看不到车轮胎点的情况则 伪3d框与2d框 重合。 10.一种基于transformer的自动驾驶目标检测系统, 应用于用权利要求1 ‑9中任意一 项权利要求所述的一种基于t ransformer的自动驾驶目标检测方法, 其特 征在于, 包括: 特征提取模块: 提取图像全局以及局部信息特 征; 特征提取模块包括若干sta ge模块, 所述sta ge模块包括: 子图像块嵌入层: 为每个子 图像块嵌入一个可学习的位置信息参数, 并通过一个卷积 核和步长都为 n的卷积将其投影到维度通道空间; 稀疏注意力机制模块: 在计算局部的细粒度自注意力和全局的粗粒度注意力时, 减小 计算量; 特征融合模块: 对不同尺度的特 征进行融合; 检测模块: 对输入的特 征进行目标分类与定位。权 利 要 求 书 2/2 页 3 CN 114627446 A 3

PDF文档 专利 一种基于transformer的自动驾驶目标检测方法及系统

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于transformer的自动驾驶目标检测方法及系统 第 1 页 专利 一种基于transformer的自动驾驶目标检测方法及系统 第 2 页 专利 一种基于transformer的自动驾驶目标检测方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:12:24上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。