金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210502303.8 (22)申请日 2022.05.09 (71)申请人 深圳市商汤科技有限公司 地址 518000 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (72)发明人 程龙 梁鼎 侯朝晖  (74)专利代理 机构 北京中知恒瑞知识产权代理 事务所(普通 合伙) 11889 专利代理师 袁忠林 (51)Int.Cl. G06V 30/418(2022.01) G06V 10/74(2022.01) G06V 10/80(2022.01) G06V 30/18(2022.01) G06V 30/19(2022.01)G06V 10/25(2022.01) G06K 9/62(2022.01) G06V 30/148(2022.01) (54)发明名称 文档处理方法、 装置、 电子设备及存 储介质 (57)摘要 本公开提供了一种文档处理方法、 装置、 电 子设备及存储介质, 其中, 该方法包括: 获取待处 理的目标文档图像; 基于目标文档图像进行文字 特征提取, 得到目标文档图像中各个文字的第一 文字特征信息; 将第一文字特征信息与预设模板 图像中提取的各个文字的第二文字特征信息进 行匹配, 得到特征匹配度; 基于特征匹配度确定 针对目标文档图像的文字处理结果。 本公开利用 文字特征匹配的方式实现了有关目标文档图像 的识别, 在特征匹配度足够高的情况下, 参照预 设模板图像可以灵活识别各种字段长度, 识别的 准确率较高。 权利要求书2页 说明书12页 附图2页 CN 114821623 A 2022.07.29 CN 114821623 A 1.一种文档处 理方法, 其特 征在于, 包括: 获取待处 理的目标文档图像; 基于所述目标文档图像进行文字特征提取, 得到所述目标文档图像中各个文字的第 一 文字特征信息; 将所述第一文字特征信息与预设模板图像中提取的各个文字的第二文字特征信息进 行匹配, 得到特 征匹配度; 基于所述特 征匹配度确定针对所述目标文档图像的文字处 理结果。 2.根据权利要求1所述的方法, 其特征在于, 所述基于所述目标文档图像进行文字特征 提取, 得到所述目标文档图像中各个文字的第一文字特 征信息, 包括: 对所述目标文档图像进行文字检测, 得到所述目标文档图像中各个文字的内容信 息以 及每个文字在所述目标文档图像中的坐标信息; 基于所述各个文字的内容信 息以及每个文字在所述目标文档图像中的坐标信 息, 对所 述各个文字进行文字特 征提取, 得到针对所述各个文字的第一文字特 征信息。 3.根据权利要求2所述的方法, 其特征在于, 所述基于所述各个文字的内容信 息以及每 个文字在所述目标文档图像中的坐标信息, 对所述各个文字进行文字特 征提取, 包括: 针对所述各个文字中的第一文字, 基于每个文字在所述目标文档图像中的坐标信息, 从所述各个文字中选取与所述第一文字关联的其 他文字; 基于选取的所述其他文字的内容信 息、 所述第 一文字的内容信 息以及所述第 一文字与 所述其他文字之间的关联关系, 确定所述第一文字的第一文字特 征信息。 4.根据权利要求2所述的方法, 其特征在于, 所述基于所述各个文字的内容信 息以及每 个文字在所述目标文档图像中的坐标信息, 对所述各个文字进行文字特 征提取, 包括: 获取训练好的文字特征提取网络; 所述文字特征提取网络预先学习 有文档图像样本中 各个文字之间的关联关系; 针对所述各个文字包括的每个文字, 基于所述文字特征提取网络预先学习的关联关 系、 所述各个文字的内容信息以及每个文字在所述目标文档图像中的坐标信息对每个文字 进行文字特征提取, 得到所述文字特征提取网络输出的针对每个文字的第一文字特征信 息。 5.根据权利要求2至4任一所述的方法, 其特征在于, 所述对所述目标文档图像进行文 字检测, 包括: 利用光学字符识别OCR方式, 将所述目标文档图像转换为文档文本; 基于文字特征模板库对所述文档文本进行文字划分, 得到所述文档文本包括的各个文 字的内容信息 。 6.根据权利要求2至5任一所述的方法, 其特征在于, 所述将所述第一文字特征信息与 预设模板图像中提取的各个文字的第二文字特 征信息进行匹配, 得到特 征匹配度, 包括: 针对所述目标文档图像中的第 一文字, 将所述第 一文字的第 一文字特征信 息与预设模 板图像中提取的各个文字的第二文字特征信息进 行匹配, 得到所述第一文字与所述预设模 板图像中的各个第二文字之间的特 征匹配度; 所述基于所述特 征匹配度确定针对所述目标文档图像的文字处 理结果, 包括: 针对所述目标文档图像中的第 一文字, 从所述预设模板图像中的各个第 二文字中选取权 利 要 求 书 1/2 页 2 CN 114821623 A 2特征匹配度符合预设要求的第二文字; 基于选取出的所述第二文字的预设标注标签, 确定所述第一文字的文字处 理结果; 基于所述第一文字的文字处 理结果, 确定针对所述目标文档图像的文字处 理结果。 7.根据权利要求6所述的方法, 其特征在于, 所述预设模板图像中预先标注有至少一个 感兴趣字段; 所述基于所述第一文字的文字处理结果, 确定针对所述 目标文档图像的文字 处理结果, 包括: 针对所述预设模板图像中的每个感兴趣字段, 基于所述感兴趣字段指示的预设标注标 签, 确定与所述感兴趣字段对应的第一文字的文字处 理结果; 将所述至少一个感兴趣区域确定的文字处理结果, 确定为针对所述目标文档图像的文 字处理结果。 8.根据权利要求1至7任一所述的方法, 其特征在于, 所述获取待处理的目标文档图像, 包括: 响应于用户端的图像获取指令, 获取待处 理的目标文档图像; 在所述基于所述特征匹配度确定针对所述目标文档图像的文字处理结果之后, 所述方 法还包括: 将所述文字处理结果返回至所述用户端; 所述用户端用于展示所述目标文档图像与 所 述预设模板图像之间的文字处 理比对结果。 9.一种文档处 理装置, 其特 征在于, 包括: 获取模块, 用于获取待处 理的目标文档图像; 提取模块, 用于基于所述目标文档图像进行文字特征提取, 得到所述目标文档图像中 各个文字的第一文字特 征信息; 匹配模块, 用于将所述第 一文字特征信 息与预设模板图像中提取的各个文字的第 二文 字特征信息进行匹配, 得到特 征匹配度; 处理模块, 用于基于所述特 征匹配度确定针对所述目标文档图像的文字处 理结果。 10.一种电子设备, 其特征在于, 包括: 处理器、 存储器和总线, 所述存储器存储有所述 处理器可执行 的机器可读指令, 当电子设备运行时, 所述处理器与所述存储器之间通过总 线通信, 所述机器可读指 令被所述处理器执行时执行如权利要求 1至8任一所述的文档处理 方法的步骤。 11.一种计算机可读存储介质, 其特征在于, 该计算机可读存储介质上存储有计算机程 序, 该计算机程序被处 理器运行时执 行如权利要求1至8任一所述的文档处 理方法的步骤。权 利 要 求 书 2/2 页 3 CN 114821623 A 3

PDF文档 专利 文档处理方法、装置、电子设备及存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文档处理方法、装置、电子设备及存储介质 第 1 页 专利 文档处理方法、装置、电子设备及存储介质 第 2 页 专利 文档处理方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:59:19上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。