金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211121663.X (22)申请日 2022.09.15 (71)申请人 山东大学 地址 266200 山东省青岛市 即墨区滨 海路 72号 申请人 上海新时达电气股份有限公司 (72)发明人 郑艳伟 黄博文 王鹏 于东晓  孙恩涛 杜超  (74)专利代理 机构 青岛华慧泽专利代理事务所 (普通合伙) 37247 专利代理师 刘娜 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种基于可学习数据增强的小规模数据集 扩增方法 (57)摘要 本发明公开了一种基于可学习数据增强的 小规模数据集扩增方法, 包含以下步骤: 对小规 模数据集中的原始图像以概率p进行数据增强; 将数据增强后的图像输入生成对抗网络的判别 器中, 同时, 随机采样一个正态分布的噪声作为 生成对抗网络中生成器的输入, 由生成器生成一 张图像, 并输入判别器中, 生成器和判别器进行 交替训练, 优化目标函数; 在训练过程中, 概率p 以及生成对抗网络的参数进行不断学习更新; 随 机采样多个正态分布的噪声分别输入训练完成 的生成对抗网络的生成器中, 分别生成相应的 图 像, 实现小规模数据集的扩增。 本发明所公开的 方法可以生成大量高质量图像, 实现了小规模数 据集的扩增, 同时避免了生 成的图像与原始数据 不一致的情况。 权利要求书3页 说明书8页 附图1页 CN 115482433 A 2022.12.16 CN 115482433 A 1.一种基于可 学习数据增强的小规模数据集扩增方法, 其特 征在于, 包 含以下步骤: 步骤一, 数据增强: 对小规模数据集中的原始图像以概率p进行数据增强, 获得数据增 强后的图像; 步骤二, 生成对抗网络训练: 将数据增强后的图像输入生成对抗网络的判别器中, 同 时, 随机采样一个正态分布的噪声作为生成对抗网络中生成器的输入, 由生成器生成一张 图像, 并输入判别器中, 由判别器判断输入的图像是真实图像还是生 成图像, 生成器和判别 器进行交替训练, 优化 目标函数; 在训练过程中, 概率p以及生成对抗网络的参数进行不断 学习更新, 重复步骤一和步骤二, 完成生成对抗网络的训练; 步骤三, 小规模数据集扩增: 随机采样多个正态分布的噪声分别输入训练完成的生成 对抗网络的生成器中, 分别生成相应的图像, 实现小规模数据集的扩增。 2.根据权利要求1所述的一种基于可学习数据增强的小规模数据集扩增方法, 其特征 在于, 步骤一中, 数据增强的方法包括几何变换、 像素变换和图像滤波。 3.根据权利要求2所述的一种基于可学习数据增强的小规模数据集扩增方法, 其特征 在于, 所述几何变换包括 位移变换、 等比缩放和非等比缩放。 4.根据权利要求2所述的一种基于可学习数据增强的小规模数据集扩增方法, 其特征 在于, 所述像素变换包括亮度变化、 对比度变化、 饱和度变化、 噪声添加 和随机擦除。 5.根据权利要求1所述的一种基于可学习数据增强的小规模数据集扩增方法, 其特征 在于, 步骤一的具体方法如下: 将原始图像以概率p依次进 行位移变换、 等比缩放、 非等比缩 放、 亮度变化、 对比度变化、 饱和度变化、 噪声添加、 随机擦除以及图像滤波, 获得数据增强 后的图像。 6.根据权利要求5所述的一种基于可学习数据增强的小规模数据集扩增方法, 其特征 在于, 所述 位移变换 是以概率p对图像进行整体的位移, 变换 过程如下: tx,ty~U(‑0.1,0.1) 其中, 概率p是一个初始值为0.5的可学习参数; tx,ty分别表示图像宽和高缩放的倍数; i11~U(0,1), 是0到1的一个随机数, 用于确定位移变换操作是否执行; U()表示均匀分布, Translate表示位移变换操作, w和h表示图像的宽和高; round()表示取整; X0表示原始图 像; X11为位移变换后的图像; 所述等比缩放是以概 率p将图像的宽和高按照相同的比例进行缩放, 变换 过程如下: s~U(0.5,2) 其中, i12~U(0,1), 是0到1的一个随机数, 用于确定等比缩放操作是否执行; Scale表示 缩放操作, s为图像宽和高的缩放倍数; Cr op是裁剪操作, 用于将图像的宽和高重新变为w和 h, 以保持图像尺寸 不变, X12是等比缩放后的图像; 所述非等比缩放是以概率p将图像的宽和高按照不同的比例进行缩放缩, 变换过程如 下:权 利 要 求 书 1/3 页 2 CN 115482433 A 2s1~U(0.5,2), s2 ~U(0.5,2) 其中, i13~U(0,1), 是0到1的一个随机数, 用于确定非等比缩放操作是否执行, s1,s2分 别为图像宽和高的缩放 倍数, X13表示非等比缩放后的图像。 7.根据权利要求5所述的一种基于可学习数据增强的小规模数据集扩增方法, 其特征 在于, 所述亮度变化是以概 率p对图像的亮度进行变化, 变化过程如下: b~U(0.5,1.5) 其中, i21~U(0,1), 是0到1的一个随机数, 用于确定亮度变 化操作是否执行, U()表示均 匀分布, Bright表示亮度变化操作, b为亮度变化的倍数, X13表示非等比缩放后的图像, X21 表示亮度变化后的图像; 所述对比度变化是以概 率p对图像的对比度进行变化, 变化过程如下: c~U(0.7,1.2) 其中, i22~U(0,1), 是0到1的一个随机数, 用于确定对比度变化操作是否执行, Contrast表示对比度变化操作, c为对比度变化的倍数, X22表示对比度变化后的图像; 所述饱和度变化是以概 率p对图像的饱和度进行变化, 变化过程如下: s~U(0.6,1.2) 其中, i23~U(0,1), 是0到1的一个随机数, 用于确定饱和度变化操作是否执行, Saturati on表示饱和度变化操作, s为饱和度变化的倍数, X23表示饱和度变化后的图像; 所述噪声添加是以概 率p为图像添加一个随机噪声, 变化过程如下: r,g,b~N(0,1) 其中, i24~U(0,1), 是0到1的一个随机数, 用于确定是否添加噪声, (m,n)表示图像上的 一个像素坐标, 且0≤m<w,0≤n<h, w和h表示图像的宽和高, r,g,b是三个正态分布 的随机 数, 分别对应 像素的三个分量R,G,B; N()表示 正态分布; X24表示噪声添加操作后的图像; 所述随机擦除是以概 率p随机选择图像中的一个区域将其去除, 变化过程如下: cx,cy~U(0.3,0.6) left=round( (cx‑0.25)×w) low=round( (cy‑0.25)×h) right=round( (cx+0.25)×w) high=round( (cy+0.25)×h)权 利 要 求 书 2/3 页 3 CN 115482433 A 3

PDF文档 专利 一种基于可学习数据增强的小规模数据集扩增方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于可学习数据增强的小规模数据集扩增方法 第 1 页 专利 一种基于可学习数据增强的小规模数据集扩增方法 第 2 页 专利 一种基于可学习数据增强的小规模数据集扩增方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:58:56上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。