金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210952494.8 (22)申请日 2022.08.09 (71)申请人 中国银联股份有限公司 地址 200135 上海市浦东 新区含笑路36号 (72)发明人 何朔 刘红宝 郑建宾 高鹏飞  李亮  (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 专利代理师 彭燕 (51)Int.Cl. H04L 9/00(2022.01) H04L 9/08(2006.01) H04L 9/40(2022.01) (54)发明名称 一种数据匹配方法、 装置、 系统、 设备及 介质 (57)摘要 本申请公开了一种数据匹配方法、 装置、 系 统、 设备及介质, 用以解决现有技术中的安全求 交算法只能在双方数据完全相同时进行安全求 交, 使用场景有限, 影响数据匹配的业务范围的 问题。 由于本申请可以分别获得该第一数据对应 的第一向量以及第二数据对应的第二向量, 并获 取基于该第一向量加密后的第一加密向量, 以及 该第二向量加密后的第二加密向量, 基于第一加 密向量和第二加密向量计算第一加密距离, 并基 于第一加密 距离以及第一目标私钥, 确定第一向 量和第二向量的目标距离, 基于该目标距离以及 预设的第一距离阈值确定第一数据和第二数据 是否匹配, 可以实现第一数据和第二数据的模糊 匹配, 拓宽了使用场景, 保证了匹配过程的安全 性。 权利要求书5页 说明书24页 附图4页 CN 115442021 A 2022.12.06 CN 115442021 A 1.一种数据匹配方法, 其特 征在于, 应用于第一设备, 所述方法包括: 将待匹配的第 一数据输入到预先训练完成的向量转化模型中, 获得所述第 一数据对应 的第一向量; 采用自身生成的第 一目标公钥对所述第 一向量进行半同态加密生成第 一加密向量, 将 所述第一目标公钥以及所述第一加密向量发送给第二设备; 获取所述第二设备发送的基于所述第一加密向量和第二加密向量计算的第一加密距 离, 所述第二加密向量为采用所述第一 目标公钥对第二向量进行半 同态加密后得到的; 所 述第二向量为将第二数据输入到所述第二设备中的预先训练完成的向量转化模型中获得 的; 基于所述第 一加密距离以及与所述第 一目标公钥对应的第 一目标私钥, 确定所述第 一 向量和第二向量的目标距离; 基于所述目标距离以及预设的第 一距离阈值, 确定所述第 一数据以及所述第 二数据是 否匹配。 2.根据权利要求1所述的方法, 其特征在于, 所述将待匹配的第 一数据输入到预先训练 完成的向量 转化模型中, 获得 所述第一数据对应的第一向量包括: 确定所述第一数据对应的第一目标 数据类型; 根据所述第一目标数据类型以及预先保存的数据类型和预先训练完成的向量转化模 型的对应关系, 确定所述第一数据对应的预 先训练完成的第一目标向量 转化模型; 将所述第一数据输入到所述预先训练完成的第 一目标向量转化模型中, 获得所述第 一 数据对应的所述第一向量。 3.根据权利要求2所述的方法, 其特征在于, 所述第一目标数据类型为文本类型、 数字 类型、 图像 类型中的至少一种。 4.根据权利要求3所述的方法, 其特征在于, 若所述第一目标数据类型为文本类型, 所 述第一目标数据类型对应的预先训练完成的第一目标向量转化模型为词向量模型或句向 量模型; 若所述第一 目标数据类型为数字类型, 所述第一 目标数据类型对应的预先训练完 成的第一 目标向量转化模型为独热编码模型; 若所述第一 目标数据类型为图像类型, 所述 第一目标 数据类型对应的预 先训练完成的第一目标向量 转化模型为图像向量模型。 5.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 接收所述第二设备发送的第三加密向量以及所述第二设备生成的第二目标公钥; 其 中, 所述第三加密向量为所述第二设备采用所述第二目标公钥对所述第二向量进 行半同态 加密后得到的; 基于所述第二目标公钥对所述第一向量进行半同态加密生成第四加密向量; 基于所述第 三加密向量以及所述第四加密向量计算得到第 二加密距离, 并将所述第 二 加密距离发送给所述第二设备, 以使 所述第二设备基于所述第二加密距离以及与所述第二 目标公钥对应的第二 目标私钥, 确定所述第一向量和第二向量的目标距离, 并使所述第二 设备基于所述目标距离以及预设的第一距离阈值, 确定所述第一数据以及所述第二数据是 否匹配。 6.根据权利要求1所述的方法, 其特征在于, 所述确定所述第 一向量和第 二向量的目标 距离之后, 所述方法还 包括:权 利 要 求 书 1/5 页 2 CN 115442021 A 2将所述目标距离发送给所述第 二设备, 使所述第 二设备基于所述目标距离以及预设的 第一距离阈值, 确定所述第一数据以及所述第二数据是否匹配。 7.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 将确定的所述第一数据以及所述第二数据是否匹配的匹配结果发送给 所述第二设备。 8.根据权利要求1所述的方法, 其特征在于, 所述采用自身生成的第 一目标公钥对所述 第一向量进行半同态加密生成第一加密向量包括: 针对所述第 一向量中的每个第 一分量, 基于所述第 一目标公钥对所述第 一向量中的每 个第一分量分别进行半同态加密, 生成所述第一加密向量。 9.根据权利要求1或8所述的方法, 其特征在于, 所述第一向量和所述第二向量的长度 均为预设长度。 10.根据权利要求8所述的方法, 其特征在于, 所述第一加密距离是采用以下过程获得 的: 针对所述第 一加密向量中的每个第 一加密分量、 所述第 二向量中的每个第 二分量以及 所述第二加密向量中的每个第二加密分量, 通过半 同态加密算法, 确定加密后的该第一加 密分量与相应的第二分量的乘积, 以及相 应的第二加密分量的第二加密平方分量; 基于该 乘积以及该第二加密平方分量, 确定该第一加密分量对应的加密后的子距离; 基于每个第 一加密分量对应的加密后的子距离, 确定所述第 一加密向量和第 二加密向 量的第一加密距离 。 11.根据权利要求10所述的方法, 其特征在于, 所述基于所述第 一加密距离以及与 所述 第一目标公钥对应的第一目标私钥, 确定所述第一向量和第二向量的目标距离, 包括: 针对所述第 一加密向量中的每个第 一加密分量, 确定该第 一加密分量的第 一加密平方 分量; 基于该第一加密平方分量以及该第一加密分量对应的所述加密后的子距离, 对该第 一加密分量对应的所述加密后的子距离进行 更新; 基于每个第 一加密分量对应的更新后的子距离, 确定所述第 一加密向量和第 二加密向 量的更新后的第一加密距离; 采用与所述第一目标公钥对应的第 一目标私钥, 对所述更新后的第 一加密距离进行解 密, 得到所述第一向量和第二向量的目标距离 。 12.根据权利要求8所述的方法, 其特征在于, 所述第一加密距离是采用以下过程获得 的: 针对所述第 一加密向量中的每个第 一加密分量、 所述第 二向量中的每个第 二分量以及 所述第二加密向量中的每个第二加密分量, 通过半 同态加密算法, 确定该第一加密分量的 第一加密平方分量、 加密后的该第一加密分量与相应的第二分量的乘积, 以及相应的第二 加密分量的第二加密平方分量; 基于该第一加密平方分量、 该乘积以及该第二加密平方分 量, 确定该第一加密分量对应的加密后的子距离; 基于每个第 一加密分量对应的加密后的子距离, 确定所述第 一加密向量和第 二加密向 量的第一加密距离 。 13.根据权利要求10或12所述的方法, 其特征在于, 通过半同态加密算法, 确定加密后 的该第一加密分量与相应的第二分量的乘积, 包括: 通过半同态加密算法, 确定加密后的指数幂, 其中, 所述指数幂的底数为该第 一加密分权 利 要 求 书 2/5 页 3 CN 115442021 A 3

PDF文档 专利 一种数据匹配方法、装置、系统、设备及介质

文档预览
中文文档 34 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共34页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据匹配方法、装置、系统、设备及介质 第 1 页 专利 一种数据匹配方法、装置、系统、设备及介质 第 2 页 专利 一种数据匹配方法、装置、系统、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:27:31上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。