专利多源数据融合方法、智能终端以及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210937128.5 (22)申请日 2022.08.05 (71)申请人广州中长康达信息技术有限公司地址 510000 广东省广州市天河区思成路 19号601房 (72)发明人李超　李亚超　吴双笛　郭富　 (74)专利代理机构广州哲力智享知识产权代理有限公司 4 4494 专利代理师姜国红 (51)Int.Cl. G06F 16/215(2019.01) G06F 16/22(2019.01) G06F 16/25(2019.01) (54)发明名称多源数据融合方法、智能终端以及存储介质 (57)摘要本发明提供一种多源数据融合方法、智能终端以及存储介质，该多源数据融合方法包括： S101：采集多源数据，根据多源数据的字段信息、来源构建多源U/C矩阵； S102：根据可信度对多源 U/C矩阵进行排序，基于排序结果融合数据。本发明能够减少空值率和提高数据的准确性，数据质量好，提高了数据融合效果、扩展了多源数据融合的应用范围。权利要求书1页说明书9页附图2页 CN 115374094 A 2022.11.22 CN 115374094 A 1.一种多源数据融合方法，其特征在于，所述多源数据融合方法包括： S101：采集多源数据，根据多源数据的字段信息、来源构建多源U/ C矩阵； S102：根据可信度对所述多源U/ C矩阵进行排序，基于排序结果融合数据。 2.如权利要求1所述的多源数据融合方法，其特征在于，所述采集多源数据的步骤具体包括：获取数据源中数据的格式，根据格式从数据源中采集数据。 3.如权利要求2所述的多源数据融合方法，其特征在于，所述根据格式从数据源中采集数据的步骤还包括：与所述数据源连接，获取所述数据源传输的数据，并根据所述数据的格式预处理所述数据。 4.如权利要求3所述的多源数据融合方法，其特征在于，所述根据所述数据的格式预处理所述数据的步骤具体包括：将文件中的中文字段转换为英文字段。 5.如权利要求1所述的多源数据融合方法，其特征在于，所述根据多源数据的字段信息、来源构建多源U/ C矩阵的步骤具体包括：获取所述数据对应的数据源以及所述数据源中的字段，根据所述字段、数据源之间的对应关系构建多源U/ C矩阵。 6.如权利要求5所述的多源数据融合方法，其特征在于，所述根据可信度对所述多源U/ C矩阵进行排序的步骤具体包括：根据所述多源U/C矩阵获取每个字段对应的消费者、生产者，基于所述消费者、生产者获取字段的可信度以对所述多源U/ C矩阵进行排序。 7.如权利要求6所述的多源数据融合方法，其特征在于，所述基于所述消费者、生产者获取字段的可信度以对所述多源U/ C矩阵进行排序的步骤具体包括：基于所述消费者、生产者获取每个数据源中的字段的可信度，通过所述可信度建立优先级矩阵。 8.如权利要求7所述的多源数据融合方法，其特征在于，所述基于排序结果融合数据的步骤具体包括：获取所述多源数据中的待融合数据，根据所述优先级矩阵确定不同数据源中所述待融合数据的可信度，基于可信度排序从所述待融合数据中选取数据进行融合。 9.一种智能终端，其特征在于，所述智能终端包括处理器、存储器，所述处理器与所述存储器通信连接，所述存储器存储有计算机程序，所述计算机程序被用于执行如权利要求 1‑8任一项所述的多源数据融合方法。 10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有程序数据，所述程序数据被用于执行如权利要求1 ‑8任一项所述的多源数据融合方法。权　利　要　求　书 1/1 页 2 CN 115374094 A 2多源数据融合方法、智能终端以及存储介质技术领域 [0001]本发明涉及大数据处理技术领域，尤其涉及一种多源数据融合方法、智能终端以及存储介质。背景技术 [0002]随着计算机及数码电子产品的普及以及互联网的迅速发展，人们每天都可以接触到海量的多源数据，对多源数据进行融合，并基于融合后的数据进行应用，有利于实现科学决策以及更广大范围的应用。 [0003]但在数据融合中，由于多源数据对应的数据源分散设置，并不统一，且由于各个数据源的建设时间不同，采集方式不同，对数据的空值约束不同，就会导致融合产生的数据空值率高且数据质量差，影响了数据融合以及融合后数据的应用。发明内容 [0004]为了克服现有技术的不足，本发明提出一种多源数据融合方法、智能终端以及存储介质，采集多源数据，通过多源数据的字段、来源构建多源U/C矩阵，并根据该矩阵获取不同数据源中数据的优先级，基于该优先级融合数据，从而能够减少空值率和提高数据的准确性，数据质量好，提高了数据融合效果、扩展了多源数据融合的应用范围。 [0005]为解决上述问题，本发明采用的一个技术方案为：一种多源数据融合方法，所述多源数据融合方法包括： S101：采集多源数据，根据多源数据的字段信息、来源构建多源U/C矩阵； S102：根据可信度对所述多源U/ C矩阵进行排序，基于排序结果融合数据。 [0006]进一步地，所述采集多源数据的步骤具体包括：获取数据源中数据的格式，根据格式从数据源中采集数据。 [0007]进一步地，所述根据格式从数据源中采集数据的步骤还包括：与所述数据源连接，获取所述数据源传输的数据，并根据所述数据的格式预处理所述数据。 [0008]进一步地，所述根据所述数据的格式预处理所述数据的步骤具体包括：将文件中的中文字段转换为英文字段。 [0009]进一步地，所述根据多源数据的字段信息、来源构建多源U/C矩阵的步骤具体包括：获取所述数据对应的数据源以及所述数据源中的字段，根据所述字段、数据源之间的对应关系构建多源U/ C矩阵。 [0010]进一步地，所述根据可信度对所述多源U/C矩阵进行排序的步骤具体包括：根据所述多源U/C矩阵获取每个字段对应的消费者、生产者，基于所述消费者、生产者获取字段的可信度以对所述多源U/ C矩阵进行排序。 [0011]进一步地，所述基于所述消费者、生产者获取字段的可信度以对所述多源U/C矩阵进行排序的步骤具体包括：基于所述消费者、生产者获取每个数据源中的字段的可信度，通过所述可信度建立优先级矩阵。 [0012]进一步地，所述基于排序结果融合数据的步骤具体包括：获取所述多源数据中的说　明　书 1/9 页 3 CN 115374094 A 3

专利 多源数据融合方法、智能终端以及存储介质

专利多源数据融合方法、智能终端以及存储介质