金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210484612.7 (22)申请日 2022.05.06 (71)申请人 四川野马科技有限公司 地址 610000 四川省成 都市成都市高新区 天府大道北段167 7号 (72)发明人 罗官  (51)Int.Cl. G06Q 10/06(2012.01) G06Q 10/10(2012.01) G06Q 50/26(2012.01) G06F 16/35(2019.01) G06F 40/216(2020.01) G06V 30/148(2022.01) G06K 9/62(2022.01) G06V 10/26(2022.01) G06V 10/74(2022.01)G06V 30/19(2022.01) (54)发明名称 一种环评报告质量检查系统及其方法 (57)摘要 本发明属于质量检查技术领域, 公开了一种 环评报告质量检查系统及其方法, 系统包括报告 内容识别单元、 报告内容分类单元、 质量检查单 元、 综合评价单元 以及存储单元。 方法包括如下 步骤: 建立报告内容识别模型、 报告内容分类模 型以及质量检查模型; 采集当前环评报告, 获取 当前报告内容; 将当前环评报告的当前报告内容 进行分类; 对当前环评报告的项目资质内容和项 目评价内容进行文本相似度检查; 对客观评价内 容进行质量智能检查; 输出主观评价内容进行质 量人工检查; 根据质量智能评分和质量人工评分 进行综合评价。 本发明解决了 现有技术存在的人 力成本投入过大、 检查效率低下、 容易造成信息 检查疏漏以及准确性低的问题。 权利要求书3页 说明书8页 附图2页 CN 114580978 A 2022.06.03 CN 114580978 A 1.一种环评报告质量检查系统, 其特征在于: 包括报告内容识别单元、 报告内容分类单 元、 质量检查单元、 综合评价单元以及存储单元, 所述的报告内容识别单元、 报告内容分类 单元、 质量检查单元以及综合评价单元依 次连接, 所述的报告内容识别单元连接有外部的 环评报告数据库, 所述的存储单元分别与报告内容识别单元、 报告内容分类单元以及质量 检查单元连接, 所述的质量检查单 元和综合评价单 元均连接有外 部的人机交 互装置; 报告内容识别单元, 用于根据历史环评报告进行训练建立报告内容识别模型, 并使用 报告内容识别模型自动识别输入的环评报告, 得到当前报告内容; 报告内容分类单元, 用于根据历史环评报告进行训练建立报告内容分类模型, 使用报 告内容分类模型提取当前报告内容的关键词, 根据关键词将当前报告内容分类为项目资质 内容和项目评价内容, 并根据关键词将项目评价内容分类为主观评价内容和客观评价内 容; 质量检查单元, 用于根据历史环评报告进行训练建立质量检查模型, 使用质量检查模 型对项目资质内容和项目评价内容进 行文本相似度检查, 对项目资质内容进 行项目资质检 查, 对客观评价内容和主观评价内容进行质量智能检查, 向人机交互装置输出主观评价内 容进行质量人工检查; 综合评价单 元, 用于根据质量检查单 元得到的检查结果进行综合评价; 存储单元, 用于保存各个单 元的所有中间数据和结果数据。 2.根据权利要求1所述的环评报告质量检查系统, 其特征在于: 所述的报告内容识别单 元包括均与存储单元连接的报告输入模块、 格式转换模块、 图像分割模块以及文本识别模 块, 所述的报告输入模块、 格式转换模块、 图像分割模块以及文本识别模块依次连接, 且报 告输入模块连接有外部的环评报告数据库, 所述的文本识别模块与报告内容分类单元连 接。 3.根据权利要求2所述的环评报告质量检查系统, 其特征在于: 所述的报告内容分类单 元包括均与存储单元连接的关键词提取模块和报告内容分类模块, 所述的关键词提取模块 与报告内容分类模块连接, 且关键词提取模块与报告内容识别单元 的文本识别模块连接, 所述的报告内容分类模块与质量检查单 元连接。 4.根据权利要求3所述的环评报告质量检查系统, 其特征在于: 所述的质量检查单元包 括均与存储单元连接的文本相似度检查模块、 项目资质检查模块、 质量智能检查模块以及 质量人工检查模块, 所述的文本相似度检查模块与项目资质检查模块连接, 且文本相似度 检查模块与报告内容分类单元的报告内容分类模块连接, 所述的项目资质检查模块分别与 质量智能检查模块和质量人工检查模块连接, 所述的质量智能检查模块和质量人工检查模 块分别与综合评价单元连接, 且质量智能检查模块和质量人工检查模块均连接有外部的人 机交互装置。 5.根据权利要求4所述的环评报告质量检查系统, 其特征在于: 所述的存储单元设置有 缓存模块和存储模块, 所述的存储模块设置有评分规则数据库、 关键词数据库以及报告内 容数据库, 所述的报告内容数据库包括项目资质内容数据库和项目评价内容数据库, 项目 评价内容数据库设置有主观评价内容分区和客观评价内容分区, 所述的缓存模块设置有图 像数据库和报告内容数据库。 6.一种环评报告质量检查方法, 基于如权利要求5所述的环评报告质量检查系统, 其特权 利 要 求 书 1/3 页 2 CN 114580978 A 2征在于: 包括如下步骤: 采集历史环评报告, 并根据历史环评报告建立报告内容识别模型、 报告内容分类模型 以及质量检查模型; 采集当前环评报告, 使用报告内容识别模型 得到当前环评报告的当前报告内容; 使用报告内容分类模型将当前环评报告的当前报告内容分类为项目资质内容和项目 评价内容, 并将项目评价内容分类为主观评价内容和客观评价内容; 使用质量检查模型根据历史环评报告对当前环评报告的项目资质内容和项目评价内 容进行文本相似度检查; 文本相似度检查通过后, 使用质量检查模型根据评分规则对客观评价内容进行质量智 能检查, 得到质量智能评分; 使用质量检查模型输出主观评价内容进行质量人工检查, 得到质量人工 评分; 根据质量智能评分和质量人工 评分进行综合评价。 7.根据权利要求6所述的环评报告质量检查方法, 其特征在于: 使用报告内容识别模型 得到当前环评报告的报告内容, 包括如下步骤: 使用报告内容识别模型当前环评报告转换为图像格式, 得到当前环评报告图像, 并对 当前环评报告图像进行 预处理; 对预处理后的当前环评报告图像进行分割, 得到各文本区域的若干当前环评报告分割 图像; 对各个当前环评报告分割图像进行文本识别, 得到对应的当前报告内容文本段落。 8.根据权利要求7所述的环评报告质量检查方法, 其特征在于: 使用报告内容分类模型 将当前环评报告的当前报告内容进行分类, 包括如下步骤: 遍历所有当前报告内容文本段落进行分类, 报告内容分类模型提取当前报告内容文本 段落的关键词; 根据关键词的词频计算关键词的权 重和hash值; 根据各关键词的权重和对应的hash值进行加权计算, 得到当前报告内容文本段落的 Simhash值; 获取报告内容数据库中任一历史报告内容的Simhash值, 并获取当前报告内容文本段 落的Simhash值与历史报告内容的Simhash值的海明距离; 若海明距离属于相似范围, 则当前报告内容文本段落属于对应的类别并存储至对应的 报告内容数据库, 结束当前报告内容文本段落的分类, 并获取下一报告内容文本段落进行 分类, 直至所有报告内容文本段落分类完成, 否则获取下一历史环评报告的Simhash值进 行 海明距离计算, 并重复本步骤, 直至报告内容数据库中所有历史环评报告均参与海明距离 计算; 若所有历史环评报告的Simhash值与当前报告内容文本段落的Simhash值的海明距离 均不属于相似范围, 则删除当前报告内容文本段落, 获取下一当前报告内容文本段落进行 分类, 直至所有当前报告内容文本段落分类完成。 9.根据权利 要求8所述的环评报告质量检查方法, 其特征在于: 使用Text Rank算法提取 当前报告内容文本段落的关键词, 包括如下步骤: 将当前报告内容文本段落分类为若干 完整的句子;权 利 要 求 书 2/3 页 3 CN 114580978 A 3

PDF文档 专利 一种环评报告质量检查系统及其方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种环评报告质量检查系统及其方法 第 1 页 专利 一种环评报告质量检查系统及其方法 第 2 页 专利 一种环评报告质量检查系统及其方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:59:58上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。