金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111320361.0 (22)申请日 2021.11.09 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦二层 (72)发明人 张为明 张伟 谭啸 孙昊  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 代理人 单冠飞 (51)Int.Cl. G06N 20/00(2019.01) G06K 9/62(2022.01) G06V 10/774(2022.01) (54)发明名称 用于目标检测任务的预训练模 型生成方法、 装置及设备 (57)摘要 本申请公开了一种用于目标检测任务的预 训练模型生成方法、 装置及设备, 涉及人工智能 领域, 具体涉及深度学习与计算机视觉技术。 具 体实现方案为: 获取样本图像, 并根据样本图像, 生成第一输入 图像、 第二输入图像、 第三输入 图 像和第四输入图像; 根据多个输入图像和预设的 第一模型和第二模型, 生成第一输入图像、 第二 输入图像、 第三输入图像和第四输入图像各自的 目标特征向量; 根据第一输入图像、 第二输入 图 像、 第三输入图像和第四输入图像各自的目标特 征向量计算特征表示对比损失和定位损失; 根据 特征表示对比损失和定位损失, 训练第一模型和 第二模型, 并根据训练好的第一模 型的骨干网络 参数生成预训练模型。 权利要求书3页 说明书11页 附图5页 CN 114202074 A 2022.03.18 CN 114202074 A 1.一种用于目标检测任务的预训练模型生成方法, 包括: 获取样本图像, 并根据所述样本图像, 生成第一输入图像、 第二输入图像、 第三输入图 像和第四输入图像; 所述样本图像中包 含多个目标; 根据所述第一输入图像和预设的第一模型, 生成所述第一输入图像的目标 特征向量; 根据所述第二输入图像、 所述第 三输入图像、 所述第四输入图像和预设的第 二模型, 生 成所述第二输入图像、 所述第三输入图像和所述第四输入图像各自的目标特征向量; 所述 第一模型的网络结构和模型参数初始值与所述第二模型的相同; 根据所述第 一输入图像、 所述第 二输入图像和所述第 三输入图像各自的目标特征向量 计算特征表示对比损失, 并根据所述第一输入图像和所述第四输入图像各自的目标特征向 量计算定位损失; 根据所述特征表示对比损 失和所述定位损 失, 训练所述第一模型和所述第二模型, 并 根据训练好的第一模型的骨干网络参数生成所述预训练模型。 2.根据权利要求1所述的方法, 其中, 所述根据 所述样本图像, 生成第 一输入图像、 第二 输入图像、 第三输入图像和第四输入图像, 包括: 对所述样本图像进行选择性搜索, 以生成第一输入图像; 对所述第一输入图像进行剪切 和伸缩处 理, 以生成所述第二输入图像; 对所述第二输入图像进行 下采样处 理, 以生成所述第三输入图像; 对所述样本图像进行剪切和伸缩处理, 并对经过剪切和伸缩处理后得到的图像进行选 择性搜索, 以生成所述第四输入图像。 3.根据权利要求1所述的方法, 其中, 所述根据所述第一输入图像、 所述第二输入图像 和所述第三输入图像各自的目标 特征向量计算特 征表示对比损失, 包括: 根据所述第一输入图像和所述第二输入图像各自的目标特征向量对同一目标特征进 行对比学习, 计算第一对比损失; 根据所述第一输入图像和所述第三输入图像各自的目标特征向量对同一目标特征进 行对比学习, 计算第二对比损失; 根据所述第一对比损失和所述第二对比损失, 计算所述特 征表示对比损失。 4.根据权利要求1所述的方法, 其中, 所述根据所述第 一输入图像和所述第四输入图像 各自的目标 特征向量计算定位损失, 包括: 根据所述第 一输入图像的目标特征向量, 确定所述第 一输入图像中每个目标候选框的 目标中心点; 根据所述第四输入图像的目标特征向量, 找出与 各自所述目标候选框对应的第 一候选 框集合和 第二候选框集合; 所述第一候选框集合中包含中心 点落在以对应目标候选框的目 标中心点为圆心, 预设长度为半径的范围内的候选框; 所述第二候选框集合中包含中心点 落在所述范围之外的候选 框; 根据所述每个目标候选框的目标中心点、 所述第一候选框集合和所述第二候选框集 合, 计算所述定位损失。 5.根据权利要求1所述的方法, 其中, 所述根据所述特征表示对比损失和所述定位损 失, 训练所述第一模型和所述第二模型, 包括: 根据所述特 征表示对比损失和所述定位损失, 计算模型损失值;权 利 要 求 书 1/3 页 2 CN 114202074 A 2根据所述模型损失值 生成所述第一模型的回传 梯度; 根据所述回传 梯度以指数移动平均值E MA的方式更新所述第二模型的参数。 6.根据权利要求1所述的方法, 其中, 所述根据所述第一输入图像和预设的第一模型, 生成所述第一输入图像的目标 特征向量, 包括: 将所述第一输入图像输入至预设的第一模型, 获得所述第一输入图像的多尺度特征 图, 并根据所述多尺度特 征图生成所述第一输入图像的目标 特征向量。 7.根据权利要求1所述的方法, 其中, 所述根据 所述第二输入图像、 所述第 三输入图像、 所述第四输入图像和预设的第二模型, 生成所述第二输入图像、 所述第三输入图像和所述 第四输入图像各自的目标 特征向量, 包括: 将所述第二输入图像、 所述第 三输入图像和所述第四输入图像分别输入至预设的第 二 模型, 获得所述第二输入图像、 所述第三输入图像和所述第四输入图像各自的多尺度特征 图; 根据所述第二输入图像、 所述第三输入图像和所述第四输入图像各自的多尺度特征 图, 生成所述第二输入图像、 所述第三输入图像和所述第四输入图像各自的目标 特征向量。 8.一种用于目标检测任务的预训练模型生成装置, 包括: 获取模块, 用于获取样本图像, 并根据所述样本图像, 生成第一输入图像、 第二输入图 像、 第三输入图像和第四输入图像; 所述样本图像中包 含多个目标; 第一生成模块, 用于根据所述第一输入图像和预设的第一模型, 生成所述第一输入图 像的目标 特征向量; 第二生成模块, 用于根据 所述第二输入图像、 所述第 三输入图像、 所述第四输入图像和 预设的第二模型, 生成所述第二输入图像、 所述第三输入图像和所述第四输入图像各自的 目标特征向量; 所述第一模型的网络结构和模型参数初始值与所述第二模型的相同; 损失计算模块, 用于根据所述第一输入图像、 所述第二输入图像和所述第三输入图像 各自的目标特征向量计算特征表示对比损失, 并根据所述第一输入图像和所述第四输入图 像各自的目标 特征向量计算定位损失; 训练模块, 用于根据所述特征表示对比损 失和所述定位损 失, 训练所述第一模型和所 述第二模型, 并根据训练好的第一模型的骨干网络参数生成所述预训练模型。 9.根据权利要求8所述的装置, 其中, 所述获取模块具体用于: 对所述样本图像进行选择性搜索, 以生成第一输入图像; 对所述第一输入图像进行剪切 和伸缩处 理, 以生成所述第二输入图像; 对所述第二输入图像进行 下采样处 理, 以生成所述第三输入图像; 对所述样本图像进行剪切和伸缩处理, 并对经过剪切和伸缩处理后得到的图像进行选 择性搜索, 以生成所述第四输入图像。 10.根据权利要求8所述的装置, 其中, 所述损失计算模块具体用于: 根据所述第一输入图像和所述第二输入图像各自的目标特征向量对同一目标特征进 行对比学习, 计算第一对比损失; 根据所述第一输入图像和所述第三输入图像各自的目标特征向量对同一目标特征进 行对比学习, 计算第二对比损失; 根据所述第一对比损失和所述第二对比损失, 计算所述特 征表示对比损失。权 利 要 求 书 2/3 页 3 CN 114202074 A 3

.PDF文档 专利 用于目标检测任务的预训练模型生成方法、装置及设备

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于目标检测任务的预训练模型生成方法、装置及设备 第 1 页 专利 用于目标检测任务的预训练模型生成方法、装置及设备 第 2 页 专利 用于目标检测任务的预训练模型生成方法、装置及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:03:16上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。