金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210095031.4 (22)申请日 2022.01.26 (71)申请人 上海易康源医疗健康科技有限公司 地址 200120 上海市浦东 新区中国(上海) 自由贸易试验区临港新片区新杨公路 860号10幢 (72)发明人 曾祥云 朱姬渊  (74)专利代理 机构 上海硕力知识产权代理事务 所(普通合伙) 31251 专利代理师 王法男 (51)Int.Cl. G06V 30/22(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01)G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 5/04(2006.01) (54)发明名称 手写文本识别方法及系统 (57)摘要 本申请涉及一种手写文本识别方法及系统, 包括获取样 本数据, 并根据样 本数据生成样本适 应集和样 本验证集; 根据所述样 本适应集和初始 手写识别模型进行内循环, 并生成临时识别模 型; 根据所述临时识别模型和所述样本验证集进 行外循环, 并获取平均CTC损失; 根据所述平均 CTC损失对所述初始手写识别模型进行更新, 并 生成更新后手写识别模型; 获取待识别样本, 将 所述待识别样本输入所述更新后手写识别模型, 得到实际输出结果, 实现通过少量样本就可以学 习到医生的手写风格, 然后快速适配手写风格, 本发明解决了收集手写样本难, 标注难得情况。 权利要求书2页 说明书6页 附图2页 CN 114445827 A 2022.05.06 CN 114445827 A 1.一种手写 文本识别方法, 其特 征在于, 所述方法包括: 步骤S100: 获取样本数据, 并根据样本数据生成样本适应集和样本验证集; 步骤S200: 根据所述样本适应集和初始手写识别模型进行内循环, 并生成临时识别模 型; 步骤S300: 根据所述临时识别模型和所述样本验证集进行外循环, 并获取平均CTC损 失; 步骤S400: 根据所述平均CTC损失对所述初始手写识别模型进行更新, 并生成更新后 手 写识别模型; 步骤S500: 获取待识别样本, 将所述待识别样本输入所述更新后 手写识别 模型, 得到实 际输出结果。 2.根据权利要求1所述的手写文本识别方法, 其特征在于, 步骤S300: 根据所述临时识 别模型和所述样本验证集进行外循环, 并获取平均CTC损失; 具体包括: 步骤S310: 根据所述临时识别模型进行推理并获取与所述样本适应集对应的推理验证 集; 步骤S320: 根据所述推理验证集与所述样本验证集获取平均CTC损失。 3.根据权利要求1所述的手写文本识别方法, 其特征在于, 所述内循环中具有预设特定 数量的样本适应 循环; 具体包括: 步骤S200: 根据所述样本适应集和初始手写识别模型进行内循环, 并生成临时识别模 型; 具体包括: 步骤S210: 根据所述初始手写识别模型生成多个适应循环识别模型, 各所述适应循环 识别模型与所述初始手写识别模型的参数的形状一样, 但是参数值 不一样; 步骤S220: 将所述样本适应集分别放入各所述适应循环识别模型中, 并分别获取单次 CTC损失, 根据各所述单次CTC损失对所述初始手写识别模型进行更新, 并获取所述临时识 别模型。 4.根据权利要求1 ‑3任一项所述的手写文本识别方法, 其特征在于, 步骤S400: 根据所 述平均CTC损失对所述初始手写识别模型进行更新, 并生成更新后手写识别模型, 具体包 括: 步骤S410: 根据所述平均CTC损失对所述初始手写识别模型进行更新, 并生成原始识别 模型; 步骤S420: 获取手写样本数据, 并根据所述手写样本数据对所述原始识别模型进行调 整, 并在调整后生成更新后手写识别模型。 5.一种手写 文本识别系统, 其特 征在于, 所述系统包括: 样本获取模块, 用于获取样本数据, 并根据样本数据生成样本适应集和样本验证集; 内循环模块, 用于根据所述样本适应集和初始手写识别模型进行内循环, 并生成临时 识别模型; 外循环模块, 用于根据所述临时识别模型和所述样本验证集进行外循环, 并获取平均 CTC损失; 模型更新模块, 用于根据所述平均CTC损失对所述初始手写识别 模型进行更新, 并生成 更新后手写识别模型;权 利 要 求 书 1/2 页 2 CN 114445827 A 2样本识别模块, 用于获取待识别样本, 将所述待识别样本输入所述更新后手写识别模 型, 得到实际输出 结果。 6.根据权利要求6所述的手写 文本识别系统, 其特 征在于, 所述外循环模块还用于: 根据所述临时识别模型进行推理并获取与 所述样本适应集对应的推理验证集; 根据 所 述推理验证集与所述样本验证集获取平均CTC损失。 7.根据权利要求6所述的手写 文本识别系统, 其特 征在于, 所述内循环模块还用于: 根据所述初始手写识别模型生成多个适应循环识别模型, 各所述适应循环识别模型与 所述初始手写识别模型 的参数的形状一样, 但是参数值不一样; 将所述样本适应集分别放 入各所述适应循环识别模型中, 并分别获取单次CTC损失, 根据各所述单次CTC损失对所述 初始手写识别模型进行 更新, 并获取 所述临时识别模型; 所述系统还 包括模型调整模块, 所述模型调整模块用于: 根据所述平均CTC损失对所述初始手写识别 模型进行更新, 并生成原始识别模型; 获取 手写样本数据, 并根据所述手写样本数据对所述原始识别模型进行调整, 并在调整后生成 更新后手写识别模型。 8.一种计算机设备, 包括存储器和处理器, 所述存储器存储有计算机程序, 其特征在 于, 所述处 理器执行所述计算机程序时实现权利要求1至4中任一项所述方法的步骤。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被 处理器执行时实现权利要求1至4中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114445827 A 3

PDF文档 专利 手写文本识别方法及系统

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 手写文本识别方法及系统 第 1 页 专利 手写文本识别方法及系统 第 2 页 专利 手写文本识别方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:12:18上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。