金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210092443.2 (22)申请日 2022.01.26 (71)申请人 江苏联合职业 技术学院苏州工业园 区分院 地址 215123 江苏省苏州市工业园区松涛 街208号 (72)发明人 肖培  (74)专利代理 机构 南京九致知识产权代理事务 所(普通合伙) 32307 专利代理师 严巧巧 (51)Int.Cl. G06V 20/58(2022.01) G06V 10/44(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01)G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于数据集的机器学习模型处理方法 和系统 (57)摘要 本申请公开了一种基于数据集的机器学习 模型处理方法和系统, 该方法包括: 获取待识别 的交通信号指示图片; 对于每张第一图片, 获取 第一图片中的符合预定条件的像素点, 其中, 预 定条件包括: 像素值相同的相邻的像素点或者像 素值差值小于预定值的相邻的像素点; 将符合预 定条件的像素点连接成为像素区域; 在待标注的 图片中依次寻找 每张第一图片 对应的像素区域; 对于在待标注的图片中寻找到的像素区域, 增加 标签信息, 将增加标签信息 之后的图片作为一组 训练数据。 通过本申请解决了 现有技术中人工标 注训练数据所导致的成本高和效率低的问题, 从 而实现了训练数据的自动标注和生成, 提高了训 练数据的标注效率, 同时降低了成本 。 权利要求书2页 说明书7页 附图1页 CN 114550129 A 2022.05.27 CN 114550129 A 1.一种基于数据集的机器学习模型处 理方法, 其特 征在于, 包括: 获取待识别的交通信号指示图片, 其中, 所述待识别的交通信号指示图片为多张第一 图片, 每张所述第一图片均包括 一种交通信号指示; 对于每张所述第 一图片, 获取所述第 一图片中的符合预定条件的像素点, 其中, 所述预 定条件包括: 像素值相同的相邻的像素点或者像素值差值小于预定值的相邻的像素点; 将所述符合预定条件的像素点连接成为像素区域; 在所述待标注的图片中依次寻找每张所述第一图片对应的像素区域; 对于在所述待标注的图片中寻找到的像素区域, 增加标签信 息, 其中, 所述标签信 息用 于指示该像素区域所属于的第一图片对应的交通信号指示, 将增加标签信息之后的图片作 为一组训练数据; 使用多组训练数据对机器学习模型进行训练, 其中, 训练收敛后的所述机器学习模型 用于进行交通信号指示的识别。 2.根据权利要求1所述的方法, 其特征在于, 使用多组训练数据对机器学习模型进行训 练包括: 判断增加标签信息后的图片的数量是否超过阈值; 如果未超过阈值, 则获取人工预先标注的训练数据, 其中, 所述人工标注的训练数据中 的用于指示待标注图片中的交通信号指示的标签信息是 人工在待标注的图片中增 加的; 使用所述多组训练数据和所述人工预先标注的训练数据对所述机器学习模型进行训 练。 3.根据权利要求2所述的方法, 其特 征在于, 所述阈值 为预先配置的。 4.根据权利要求1至3中任一项所述的方法, 其特征在于, 使用多组训练数据对机器学 习模型进行训练包括: 获取所有的训练数据; 将所有的训练数据分为第一部分和第二部分, 其中, 所述第一部分用于所述机器学习 模型的训练, 所述第二部分用于对训练好的机器学习模型进行验证。 5.根据权利要求1至4中任一项所述的方法, 其特征在于, 使用多组训练数据对机器学 习模型进行训练包括: 在使用第二部分对训练好的机器学习模型进行验证, 得到验证失败的结果的情况下, 增加所述第一部分中的数据量, 减少所述第二部分中的数据量; 使用增加数据量后的所述第 一部分对所述机器学习 模型进行训练, 使用减少数据量的 后的所述第二部分对训练后的所述机器学习模型进行验证, 直到得到验证成功的结果。 6.一种基于数据集的机器学习模型处 理系统, 其特 征在于, 包括: 第一获取模块, 用于获取待识别的交通信号指示图片, 其中, 所述待识别的交通信号指 示图片为多张第一图片, 每张所述第一图片均包括 一种交通信号指示; 第二获取模块, 用于对于每张所述第一图片, 获取所述第一图片中的符合预定条件的 像素点, 其中, 所述预定条件包括: 像素值相同的相 邻的像素点或者像素值差值小于预定值 的相邻的像素点; 连接模块, 用于将所述符合预定条件的像素点连接成为像素区域; 寻找模块, 用于在所述待标注的图片中依次寻找每张所述第一图片对应的像素区域;权 利 要 求 书 1/2 页 2 CN 114550129 A 2标注模块, 用于对于在所述待标注 的图片中寻找到的像素区域, 增加标签信息, 其中, 所述标签信息用于指示该像素区域所属于的第一图片对应的交通信号指示, 将增加标签信 息之后的图片作为 一组训练数据; 训练模块, 用于使用多组训练数据对机器学习模型进行训练, 其中, 训练收敛后的所述 机器学习模型用于进行交通信号指示的识别。 7.根据权利要求6所述的系统, 其特 征在于, 所述训练模块用于: 判断增加标签信息后的图片的数量是否超过阈值; 如果未超过阈值, 则获取人工预先标注的训练数据, 其中, 所述人工标注的训练数据中 的用于指示待标注图片中的交通信号指示的标签信息是 人工在待标注的图片中增 加的; 使用所述多组训练数据和所述人工预先标注的训练数据对所述机器学习模型进行训 练。 8.根据权利要求6所述的系统, 其特 征在于, 所述阈值 为预先配置的。 9.根据权利要求6 至8中任一项所述的系统, 其特 征在于, 所述训练模块用于: 获取所有的训练数据; 将所有的训练数据分为第一部分和第二部分, 其中, 所述第一部分用于所述机器学习 模型的训练, 所述第二部分用于对训练好的机器学习模型进行验证。 10.根据权利要求9所述的系统, 其特 征在于, 所述训练模块用于: 在使用第二部分对训练好的机器学习模型进行验证, 得到验证失败的结果的情况下, 增加所述第一部分中的数据量, 减少所述第二部分中的数据量; 使用增加数据量后的所述第 一部分对所述机器学习 模型进行训练, 使用减少数据量的 后的所述第二部分对训练后的所述机器学习模型进行验证, 直到得到验证成功的结果。权 利 要 求 书 2/2 页 3 CN 114550129 A 3

PDF文档 专利 一种基于数据集的机器学习模型处理方法和系统

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于数据集的机器学习模型处理方法和系统 第 1 页 专利 一种基于数据集的机器学习模型处理方法和系统 第 2 页 专利 一种基于数据集的机器学习模型处理方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:12:19上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。