金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210080806.0 (22)申请日 2022.01.24 (71)申请人 北京智源人工智能研究院 地址 100083 北京市海淀区中关村东路1号 院8号楼三层B201D-1 (72)发明人 陈智强 余山 陈阳  (74)专利代理 机构 北京辰权知识产权代理有限 公司 11619 专利代理师 付婧 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/82(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01)G06K 9/62(2022.01) (54)发明名称 一种等变网络训练方法、 装置、 电子设备及 存储介质 (57)摘要 本发明公开了一种等变网络训练方法、 装 置、 电子设备及存储介质, 方法包括: 针对图像集 中的每一图像, 对图像进行目标群变换, 将变换 后的图像和图像输入等变网络进行学习, 获取等 变网络的输出损失; 获取等变网络对图像学习的 第一特征图和对变换后的图像学习的第二特征 图, 根据第一特征图和第二特征图确定等变损 失; 利用输出损失和等变损失对等变网络的参数 进行优化。 在不需要改变网络结构 的基础上, 通 过在常规深度网络结构的损失函数中引入等变 损失, 并通过使用原始图像和经过目标群变换的 图像输入网络, 来引导网络学习目标变换群上的 等变性, 从而获得目标变换群的等变网络, 避免 了为特定的变换群人工设计对应的等变网络 。 权利要求书1页 说明书7页 附图3页 CN 114528976 A 2022.05.24 CN 114528976 A 1.一种等变网络训练方法, 其特 征在于, 所述方法包括: 针对训练图像集中的每一图像, 对所述图像进行目标群变换, 将变换后的图像和所述 图像输入预 先构建的等变网络进行 学习, 并获取 所述等变网络的输出损失; 获取所述等变网络对所述图像学习的第一特征图和对所述变换后的图像学习的第二 特征图, 并根据所述第一特 征图和所述第二特 征图确定等变损失; 在所述等变网络不满足收敛条件时, 利用所述输出损失和所述等变损失对所述等变网 络的参数进行优化。 2.根据权利要求1所述的方法, 其特征在于, 所述根据所述第 一特征图和所述第 二特征 图确定等变损失, 包括: 对所述第一特 征图进行目标群 变换; 利用变换后的第一特 征图和所述第二特 征图确定等变损失。 3.根据权利要求2所述的方法, 其特征在于, 所述利用变换后的第 一特征图和所述第 二 特征图确定等变损失, 包括: 将变换后的第一特 征图与所述第二特 征图之间的等变度量 误差确定为 等变损失。 4.根据权利要求1所述的方法, 其特征在于, 所述利用所述输出损失和所述等变损失对 所述等变网络的参数进行优化, 包括: 利用所述输出损失和所述 等变损失确定总体损失; 根据所述总体损失对所述 等变网络的参数进行优化。 5.根据权利要求 4所述的方法, 其特 征在于, 所述总体损失的计算公式如下: Loss=CLS+λ* MSE 其中, CLS为输出损失, λ为 等变损失的权 重, MSE为 等变损失。 6.根据权利要求1所述的方法, 其特 征在于, 所述获取 所述等变网络的输出损失, 包括: 当所述等变网络的任务 为分类任务时, 获取 所述等变网络学习到的分类结果; 利用所述分类结果和所述图像的分类标签 计算输出损失。 7.根据权利要求1至6任一项所述的方法, 其特征在于, 所述目标群为旋转群、 缩放群、 平移群、 剪切群中的任意 一种。 8.一种等变网络训练装置, 其特 征在于, 所述装置包括: 学习模块, 用于针对训练图像集中的每一图像, 对所述图像进行目标群变换, 将变换后 的图像和所述图像输入预 先构建的等变网络进行 学习; 损失获取模块, 用于获取所述等变网络的输出损 失, 并获取所述等变网络对所述图像 学习的第一特征图和对所述变换后的图像学习的第二特征图, 并根据所述第一特征图和所 述第二特 征图确定等变损失; 参数优化模块, 用于在所述等变网络不满足收敛条件时, 利用所述输出损 失和所述等 变损失对所述 等变网络的参数进行优化。 9.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求 1‑7任一项所述方法的步 骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述程序被处理 器执行时实现如权利要求1 ‑7任一项所述方法的步骤。权 利 要 求 书 1/1 页 2 CN 114528976 A 2一种等变网 络训练方 法、 装置、 电子设备及存储介质 技术领域 [0001]本发明涉及人工智能技术领域, 具体涉及一种等变网络训练方法、 装置、 电子设备 及存储介质。 背景技术 [0002]通常, 图像中可视对象的旋转、 缩放等变换, 会改变可视对象的外观, 这样就会给 神经网络带来很大 的学习空间。 目前可行 的解决途径是增强神经网络的解耦能力, 获得更 紧凑的潜在学习空间, 卷积神经网络具有内在的平移解耦能力, 不管对 象在输入中的位置 如何, 都能够学习到基本特征。 为了进一步提高网络的解耦能力, 有 人提出了群等变理论和 旋转群等变网络 。 [0003]现有的等变网络主要依靠人工设计, 然而这种人工设计的方式只能在简单的等变 群上达到等变效果, 很多复杂的变换群上很难人工设计出对应的等变网络。 这就限制 了在 更加复杂的变换群上的等变网络发挥作用, 并且人工设计负担也比较大。 发明内容 [0004]本发明的目的是针对上述现有技术的不足提出的一种等变网络训练方法、 装置、 电子设备及存 储介质, 该目的是通过以下技 术方案实现的。 [0005]本发明的第一方面 提出了一种等变网络训练方法, 所述方法包括: [0006]针对训练图像集中的每一图像, 对所述图像进行目标群变换, 将变换后的图像和 所述图像输入预 先构建的等变网络进行 学习, 并获取 所述等变网络的输出损失; [0007]获取所述等变网络对所述图像学习的第一特征图和对所述变换后的图像学习的 第二特征图, 并根据所述第一特 征图和所述第二特 征图确定等变损失; [0008]在所述等变网络不满足收敛条件时, 利用所述输出损失和所述等变损失对所述等 变网络的参数进行优化。 [0009]在本申请的一些实施例中, 所述根据所述第一特征图和所述第二特征图确定等变 损失, 包括: [0010]对所述第一特征图进行目标群变换; 利用变换后的第一特征图和所述第二特征图 确定等变损失。 [0011]在本申请的一些实施例中, 所述利用变换后的第一特征图和所述第二特征图确定 等变损失, 包括: [0012]将变换后的第一特 征图与所述第二特 征图之间的等变度量 误差确定为 等变损失。 [0013]在本申请的一些实施例中, 所述利用所述输出损失和所述等变损失对所述等变网 络的参数进行优化, 包括: [0014]利用所述输出损失和所述等变损失确定总体损失; 根据所述总体损失对所述等变 网络的参数进行优化。 [0015]在本申请的一些实施例中, 所述总体损失的计算公式如下:说 明 书 1/7 页 3 CN 114528976 A 3

PDF文档 专利 一种等变网络训练方法、装置、电子设备及存储介质

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种等变网络训练方法、装置、电子设备及存储介质 第 1 页 专利 一种等变网络训练方法、装置、电子设备及存储介质 第 2 页 专利 一种等变网络训练方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:12:21上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。