金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210071342.7 (22)申请日 2022.01.21 (71)申请人 上海易康源医疗健康科技有限公司 地址 200120 上海市浦东 新区中国(上海) 自由贸易试验区临港新片区新杨公路 860号10幢 (72)发明人 曾祥云 朱姬渊  (74)专利代理 机构 上海硕力知识产权代理事务 所(普通合伙) 31251 专利代理师 王法男 (51)Int.Cl. G06V 20/62(2022.01) G06V 30/10(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01)G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于图像和文本信息融合的文字识别方法 及系统 (57)摘要 本申请涉及一种基于图像和文本信息融合 的文字识别方法及系统, 包括获取待处理图像, 并基于预设的文本识别网络对所述待处理图进 行特征抽取并获取当前图像特征; 根据所述当前 图像特征和预先标注的人工标注标签, 生成CTC 损失, 并基于所述CTC损失对预先设置的特征抽 取模型进行更新; 根据所述当前图像特征进行文 本标签预测, 并生成当前文本标签; 根据所述当 前文本标签对进行预先设置的对比度损失模型 的训练更新, 并获取文本相似结果。 本发明实现 融合图片和文本信息而进行文字识别, 进而通过 加载知识库中的文本信息, 帮助提升文字识别的 准确率。 权利要求书2页 说明书5页 附图2页 CN 114445809 A 2022.05.06 CN 114445809 A 1.一种基于图像和文本信息融合的文字识别方法, 其特 征在于, 所述方法包括: 步骤S100: 获取待处理图像, 并基于预设的文本识别 网络对所述待处理图进行特征抽 取并获取当前图像特 征; 步骤S200: 根据所述当前图像特征和预先标注的人工标注标签, 生成CTC损失, 并基于 所述CTC损失对预 先设置的特 征抽取模型进行 更新; 步骤S300: 根据所述当前图像特 征进行文本标签预测, 并生成当前文本标签; 步骤S400: 根据所述当前文本标签对进行预先设置的对比度损失模型的训练更新, 并 获取文本相似结果。 2.根据权利要求1所述的基于图像和文本信 息融合的文字识别方法, 其特征在于, 步骤 S400: 根据所述当前文本标签对进行预先设置的对比度损失模型的训练更新, 并获取文本 相似结果, 具体包括: 步骤S410: 基于预设的中文字形相似度模型根据所述当前文本标签获取与所述当前文 本标签相似度达 到预设特定值的特定数量的当前待挑选文字; 步骤S420: 分别计算特定数量的所述当前待挑选文字与所述人工标注标签y之间, 以及 特定数量的所述当前待挑选文字与所述当前文本标签之 间的对比度损失, 并获取对比度损 失值; 步骤S430: 根据所述对比度损失值进行预先设置的对比度损失模型的训练更新, 并获 取文本相似结果。 3.根据权利要求2所述的基于图像和文本信 息融合的文字识别方法, 其特征在于, 所述 特定数量 为至少10 0个。 4.根据权利要求1 ‑3任一项所述的基于 图像和文本信息融合的文字识别方法, 其特征 在于, 步骤S300: 根据所述当前图像特征进行文本标签预测, 并生成当前文本标签, 具体包 括: 对所述当前图像特 征采用Softmx进行文本标签预测, 并生成当前文本标签。 5.根据权利要求1 ‑3任一项所述的基于 图像和文本信息融合的文字识别方法, 其特征 在于, 步骤S100: 获取待处理图像, 并基于预设的文本识别网络对所述待处理图进 行特征抽 取并获取当前图像特 征, 具体包括: 获取待处理图像, 并基于预设的crnn网络对所述待处理图进行特征抽取并获取当前图 像特征。 6.一种基于图像和文本信息融合的文字识别系统, 其特 征在于, 所述系统包括: 图像处理模块, 用于获取待处理图像, 并基于预设的文本识别网络对所述待处理图进 行特征抽取并获取当前图像特 征; 人工标注模块, 用于根据所述当前图像特征v和预先标注的人工标注标签, 生成CTC损 失, 并基于所述CTC损失对预 先设置的特 征抽取模型进行 更新; 标签预测模块, 用于根据所述当前图像特 征进行文本标签预测, 并生成当前文本标签; 结果获取模块, 用于根据所述当前文本标签对进行预先设置的对比度损失模型的训练 更新, 并获取文本相似结果。 7.根据权利要求6所述的基于图像和文本信 息融合的文字识别系统, 其特征在于, 所述 结果获取模块还用于:权 利 要 求 书 1/2 页 2 CN 114445809 A 2基于预设的中文字形相似度模型根据所述当前文本标签获取与所述当前文本标签相 似度达到预设特定值的特定数量的当前待挑选文字; 分别计算特定数量的所述当前待挑选 文字与所述人工标注标签之 间, 以及特定数量的所述当前待挑选文字与所述当前文本标签 之间的对比度损失, 并获取对比度损失值; 根据所述对比度损失值进行预先设置的对比度 损失模型的训练更新, 并获取文本相似结果。 8.根据权利要求6所述的基于图像和文本信息融合的文字识别系统, 其特 征在于, 所述标签预测模块还用于对所述当前图像特征采用Softmx进行文本标签预测, 并生成 当前文本标签; 所述图像处理模块还用于获取待处理图像, 并基于预设的crnn网络对所述待处理图进 行特征抽取并获取当前图像特 征。 9.一种计算机设备, 包括存储器和处理器, 所述存储器存储有计算机程序, 其特征在 于, 所述处 理器执行所述计算机程序时实现权利要求1至 5中任一项所述方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至 5中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114445809 A 3

PDF文档 专利 基于图像和文本信息融合的文字识别方法及系统

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于图像和文本信息融合的文字识别方法及系统 第 1 页 专利 基于图像和文本信息融合的文字识别方法及系统 第 2 页 专利 基于图像和文本信息融合的文字识别方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:12:24上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。