金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210937128.5 (22)申请日 2022.08.05 (71)申请人 广州中长康达信息技 术有限公司 地址 510000 广东省广州市天河区思成路 19号601房 (72)发明人 李超 李亚超 吴双笛 郭富  (74)专利代理 机构 广州哲力 智享知识产权代理 有限公司 4 4494 专利代理师 姜国红 (51)Int.Cl. G06F 16/215(2019.01) G06F 16/22(2019.01) G06F 16/25(2019.01) (54)发明名称 多源数据融合方法、 智能终端以及存 储介质 (57)摘要 本发明提供一种多源 数据融合方法、 智能终 端以及存储介质, 该多源数据融合方法包括: S101: 采集多源数据, 根据多源数据的字 段信息、 来源构建多源U/C矩阵; S102: 根据可信 度对多源 U/C矩阵进行排序, 基于排序结果融合数据。 本发 明能够减少空值率和提高数据的准确性, 数据质 量好, 提高了数据融合效果、 扩展了多源数据融 合的应用范围。 权利要求书1页 说明书9页 附图2页 CN 115374094 A 2022.11.22 CN 115374094 A 1.一种多源数据融合方法, 其特 征在于, 所述多源数据融合方法包括: S101: 采集多源数据, 根据多源数据的字段信息、 来源构建多源U/ C矩阵; S102: 根据可信度对所述多源U/ C矩阵进行排序, 基于排序结果融合数据。 2.如权利要求1所述的多源数据融合方法, 其特征在于, 所述采集多源数据的步骤具体 包括: 获取数据源中数据的格式, 根据格式从数据源中采集数据。 3.如权利要求2所述的多源数据融合方法, 其特征在于, 所述根据格式从数据源中采集 数据的步骤 还包括: 与所述数据源连接, 获取所述数据源传输的数据, 并根据所述数据的格式预处理所述 数据。 4.如权利要求3所述的多源数据融合方法, 其特征在于, 所述根据 所述数据的格式预处 理所述数据的步骤具体包括: 将文件中的中文字段转换为英文字段。 5.如权利要求1所述的多源数据融合方法, 其特征在于, 所述根据多源数据的字段信 息、 来源构建多源U/ C矩阵的步骤具体包括: 获取所述数据对应的数据源以及所述数据源中的字段, 根据所述字段、 数据源之间的 对应关系构建多源U/ C矩阵。 6.如权利要求5所述的多源数据融合方法, 其特征在于, 所述根据 可信度对所述多源U/ C矩阵进行排序的步骤具体包括: 根据所述多源U/C矩阵获取每个字段对应的消费者、 生产者, 基于所述消费者、 生产者 获取字段的可信度以对所述多源U/ C矩阵进行排序。 7.如权利要求6所述的多源数据融合方法, 其特征在于, 所述基于所述消费者、 生产者 获取字段的可信度以对所述多源U/ C矩阵进行排序的步骤具体包括: 基于所述消费者、 生产者获取每个数据源中的字段的可信度, 通过所述可信度建立优 先级矩阵。 8.如权利要求7所述的多源数据融合方法, 其特征在于, 所述基于排序 结果融合数据的 步骤具体包括: 获取所述多源数据中的待融合数据, 根据 所述优先级矩阵确定不同数据源中所述待融 合数据的可信度, 基于可信度排序从所述待融合数据中选取 数据进行融合。 9.一种智能终端, 其特征在于, 所述智能终端包括处理器、 存储器, 所述处理器与所述 存储器通信连接, 所述存储器存储有计算机程序, 所述计算机程序被用于执行如权利要求 1‑8任一项所述的多源数据融合方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有程序数 据, 所述程序数据被用于执 行如权利要求1 ‑8任一项所述的多源数据融合方法。权 利 要 求 书 1/1 页 2 CN 115374094 A 2多源数据融合 方法、 智能终端以及存 储介质 技术领域 [0001]本发明涉及大数据处理技术领域, 尤其涉及一种多源数据融合方法、 智能终端以 及存储介质。 背景技术 [0002]随着计算机及数码电子产品的普及以及互联 网的迅速发展, 人们每天都可以接触 到海量的多源数据, 对多源数据进 行融合, 并基于融合后的数据进 行应用, 有利于实现科学 决策以及更广大 范围的应用。 [0003]但在数据融合中, 由于多源数据对应的数据源分散设置, 并不统一, 且由于各个数 据源的建设时间不同, 采集方式不同, 对数据的空值约束不同, 就会导致融合产生的数据空 值率高且数据质量差, 影响了数据融合以及融合后数据的应用。 发明内容 [0004]为了克服现有技术的不足, 本发明提出一种多源数据融合方法、 智能终端以及存 储介质, 采集多源 数据, 通过多源 数据的字段、 来源构建多源U/C矩阵, 并根据该矩阵获取不 同数据源中数据的优先级, 基于该优先级融合数据, 从而能够减少空值率和 提高数据的准 确性, 数据质量 好, 提高了数据融合效果、 扩展了多源数据融合的应用范围。 [0005]为解决上述问题, 本 发明采用的一个技术方案为: 一种多源数据融合方法, 所述多 源数据融合方法包括: S101: 采集多源 数据, 根据多源 数据的字段信息、 来源构建多源U/C矩 阵; S102: 根据可信度对所述多源U/ C矩阵进行排序, 基于排序结果融合数据。 [0006]进一步地, 所述采集多源数据的步骤具体包括: 获取数据源中数据的格式, 根据格 式从数据源中采集数据。 [0007]进一步地, 所述根据格式从数据源中采集数据的步骤还包括: 与所述数据 源连接, 获取所述数据源传输的数据, 并根据所述数据的格式预处 理所述数据。 [0008]进一步地, 所述根据所述数据的格式预处理所述数据的步骤具体包括: 将文件中 的中文字段转换为英文字段。 [0009]进一步地, 所述根据多源数据的字段信息、 来源构建多源U/C矩阵的步骤具体包 括: 获取所述数据对应的数据源以及所述数据源中的字段, 根据所述字段、 数据源之 间的对 应关系构建多源U/ C矩阵。 [0010]进一步地, 所述根据可信度对所述多源U/C矩阵进行排序的步骤具体包括: 根据所 述多源U/C矩阵获取每个字段对应的消费者、 生产者, 基于所述消费者、 生产者获取字段的 可信度以对所述多源U/ C矩阵进行排序。 [0011]进一步地, 所述基于所述消费者、 生产者获取字段的可信度以对所述多源U/C矩阵 进行排序的步骤具体包括: 基于所述消费者、 生产者 获取每个数据源中的字段的可信度, 通 过所述可信度建立优先级矩阵。 [0012]进一步地, 所述基于排序结果融合数据的步骤具体包括: 获取所述多源数据 中的说 明 书 1/9 页 3 CN 115374094 A 3

PDF文档 专利 多源数据融合方法、智能终端以及存储介质

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 多源数据融合方法、智能终端以及存储介质 第 1 页 专利 多源数据融合方法、智能终端以及存储介质 第 2 页 专利 多源数据融合方法、智能终端以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 01:01:52上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。