金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210081787.3 (22)申请日 2022.01.24 (71)申请人 汇纳科技股份有限公司 地址 201210 上海市浦东 新区中国 (上海) 自由贸易试验区川和路5 5弄6号 (72)发明人 游浩泉 袁德胜 张欣欣 陈宏锐  崔龙 林治强 党毅飞 马卫民  (74)专利代理 机构 上海光华专利事务所(普通 合伙) 31219 专利代理师 赵诗雨 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/44(2022.01) G06V 10/762(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 无监督学习的顶视角头肩角度获取方法、 系 统、 介质及终端 (57)摘要 本发明提供一种无监督学习的顶视角头肩 角度获取方法、 系统、 介质及终端; 所述方法包括 以下步骤: 对目标顶视角图片中行人的头部和肩 部进行水平框标注, 获取第一顶视角图片; 基于 第一顶视角图片获取经人体框标注后带角度的 第二顶视角图片; 将第二顶视角图片输入至旋转 框预测网络, 以使旋转框预测网络输出目标预选 框; 处理目标预选框, 获取对应行人头部和肩部 的带角度的目标旋转框; 本发明提出的顶视角头 肩角度获取方法仅需人工对顶视角图片中数量 较少的人体进行角度标注, 然后通过训练旋转人 体框和水平头肩框, 即可通过旋转框预测网络生 成头肩的旋转框标注, 避免了对密集的头肩进行 重新标注和调整角度的繁琐工作。 权利要求书2页 说明书13页 附图6页 CN 114842499 A 2022.08.02 CN 114842499 A 1.一种无监 督学习的顶视角头肩角度获取 方法, 其特 征在于, 包括以下步骤: 对目标顶视角图片中行人的头部和肩部进行水平框标注, 获取第一顶视角图片; 所述 目标顶视角图片中包括至少一行 人; 基于所述第一顶视角图片获取 经人体框标注后带角度的第二顶视角图片; 将所述第二顶视角图片输入至旋转框预测网络, 以使所述旋转框预测网络输出目标预 选框; 处理所述目标 预选框, 获取对应所述行 人头部和肩部的带角度的目标旋转框 。 2.根据权利要求1所述的无监督学习的顶视角头肩角度获取方法, 其特征在于, 在所述 将所述第二顶视角图片输入至 旋转框预测网络的步骤之前, 所述方法还 包括以下步骤: 搭建所述旋转框预测网络; 训练所述旋转框预测网络, 获取训练好的旋转框预测网络; 所述将所述第 二顶视角图片输入至旋转框预测网络包括以下步骤: 将所述第 二顶视角 图片输入至所述训练好的旋转框预测网络 。 3.根据权利要求2所述的无监督学习的顶视角头肩角度获取方法, 其特征在于, 所述训 练所述旋转框预测网络, 获取训练好的旋转框预测网络包括以下步骤: 步骤一、 对训练顶视角图片中行人的头部和肩部进行水平框标注, 获取第三顶视角图 片; 所述训练顶视角图片中包括至少一行 人; 步骤二、 基于所述第三顶视角图片获取 经人体框标注后带角度的第四顶视角图片; 步骤三、 将所述第四顶视角图片输入至所述旋转框预测网络, 以使所述旋转框预测网 络输出训练预选 框; 步骤四、 处 理所述训练预选 框, 获取对应人体的带角度的训练旋转框; 步骤五、 对所述训练旋转框中的角度与所述第 四顶视角图片中的角度进行差异计算, 获取角度损失值, 以基于所述角度损失值计算总损失值; 步骤六、 循环执行所述步骤一至所述步骤五, 直至所述总损失值不再下降, 获取所述训 练好的旋转框预测网络 。 4.根据权利要求1所述的无监督学习的顶视角头肩角度获取方法, 其特征在于, 所述旋 转框预测网络包括: 特 征提取模块; 所述特征提取模块用于输出分别对应所述行人的人体、 头部及肩部的特征图组; 每一 所述特征图组包括: 第一尺度的第一特征图、 第二尺度的第二特征图及第三尺度的第三特 征图; 所述第二尺度大于所述第一尺度, 所述第二尺度小于所述第三尺度; 每一尺度下的所 有所述第一特 征图对应一特 征矩阵; 在所述将所述第 二顶视角图片输入至旋转框预测网络的步骤之前, 所述方法还包括以 下步骤: 设计所述旋转框预测网络, 以使所述旋转框预测网络加强每一所述特征图组中所 述第三特 征图与所述第一特 征图的融合; 所述将所述第 二顶视角图片输入至旋转框预测网络包括以下步骤: 将所述第 二顶视角 图片输入至设计后的旋转框预测网络 。 5.根据权利要求1所述的无监督学习的顶视角头肩角度获取方法, 其特征在于, 在所述 将所述第二顶视角图片输入至 旋转框预测网络的步骤之前, 所述方法还 包括以下步骤: 对所述第二顶视角图片中标注的头 部、 肩部及人体框分别进行聚类;权 利 要 求 书 1/2 页 2 CN 114842499 A 2配置所述旋转框预测网络的预选框选取策略; 所述预选框选取策略为: 预选框的中心 点及所述中心点上 下左右四个网格; 所述将所述第 二顶视角图片输入至旋转框预测网络包括以下步骤: 将聚类后的第 二顶 视角图片输入至配置后的旋转框预测网络 。 6.根据权利要求1所述的无监督学习的顶视角头肩角度获取方法, 其特征在于, 所述处 理所述目标预选框包括以下步骤: 对所述 目标预选框按类别进行非极大值抑制处理; 所述 类别包括: 人体、 头 部、 肩部。 7.根据权利要求1所述的无监督学习的顶视角头肩角度获取方法, 其特征在于, 所述目 标预选框包括: 所述行人 的人体对应的目标人体预选框、 所述头部对应的目标头部预选框 及所述肩部对应的目标肩部预选 框; 所述获取对应所述行人头部和肩部的带角度的目标旋转框包括以下步骤: 基于Yolov5 算法增加180个通道预测所述角度。 8.一种无监督学习的顶视角头肩角度获取系统, 其特征在于, 包括: 标注模块、 获取模 块、 输入模块及处 理模块; 所述标注模块用于对目标顶视角图片中行人的头部和肩部进行水平框标注, 获取第 一 顶视角图片; 所述目标顶视角图片中包括至少一行 人; 所述获取模块用于基于所述第一顶视角图片获取经人体框标注后带角度的第二顶视 角图片; 所述输入模块用于将所述第 二顶视角图片输入至旋转框预测网络, 以使所述旋转框预 测网络输出目标 预选框; 所述处理模块用于处理所述目标预选框, 获取对应所述行人头部和肩部的带角度的目 标旋转框 。 9.一种存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被处理器执行时 实现权利要求1至7中任一项所述的无监 督学习的顶视角头肩角度获取 方法。 10.一种终端, 其特 征在于, 包括: 处 理器及存 储器; 所述存储器用于存 储计算机程序; 所述处理器用于执行所述存储器存储的计算机程序, 以使所述终端执行权利要求1至7 中任一项所述的无监 督学习的顶视角头肩角度获取 方法。权 利 要 求 书 2/2 页 3 CN 114842499 A 3

PDF文档 专利 无监督学习的顶视角头肩角度获取方法、系统、介质及终端

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 无监督学习的顶视角头肩角度获取方法、系统、介质及终端 第 1 页 专利 无监督学习的顶视角头肩角度获取方法、系统、介质及终端 第 2 页 专利 无监督学习的顶视角头肩角度获取方法、系统、介质及终端 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:12:23上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。