金融行业标准网
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210509663.0 (22)申请日 2022.05.11 (65)同一申请的已公布的文献号 申请公布号 CN 114611637 A (43)申请公布日 2022.06.10 (73)专利权人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 郭卉  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 陈梅君 (51)Int.Cl. G06F 16/583(2019.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/75(2022.01) G06V 10/764(2022.01) G06V 10/74(2022.01) G06V 10/82(2022.01) (56)对比文件 US 10885099 B1,2021.01.0 5 WO 2022063265 A1,202 2.03.31 叶芷等.百度智能云视频AI 技术助力媒体行 业产业升级. 《人工智能》 .2020,(第02期), 审查员 周丹丹 (54)发明名称 一种数据处理方法、 装置、 设备以及可读存 储介质 (57)摘要 本申请公开了一种数据处理方法、 装置、 设 备以及可读存储介质, 方法包括: 获取目标媒体 数据对应的目标数据帧, 识别目标媒体数据所属 的目标媒体类别、 目标数据帧对应的目标图像特 征以及目标图像类别; 在参数映射表中, 获取目 标媒体类别以及目标图像类别共同指示的目标 匹配参数; 根据目标图像特征与目标匹配参数, 在候选图像特征集合中查找与 目标图像特征相 匹配的匹配图像特征; 候选图像特征集合是由待 召回媒体数据集合中, 每个待召回媒体数据所分 别对应的图像特征所组成的集合; 根据匹配图像 特征以及目标图像特征, 在 待召回媒体数据集合 中确定有效召回媒体数据。 采用本申请, 可以在 媒体数据的检索业 务中, 提高检索准确率。 权利要求书5页 说明书32页 附图9页 CN 114611637 B 2022.08.05 CN 114611637 B 1.一种数据处 理方法, 其特 征在于, 包括: 获取目标媒体数据对应的目标数据帧, 识别所述目标媒体数据所属的目标媒体类别、 所述目标 数据帧对应的目标图像特 征以及目标图像 类别; 在参数映射表中, 获取所述目标媒体类别以及所述目标图像类别共同指示的目标匹配 参数; 所述参数映射表包括配置媒体类别集合、 配置图像类别集合以及 匹配参数集合之间 的映射关系, 所述配置媒体类别集合中的一个配置媒体类别和所述配置图像类别集合中的 一个配置图像类别, 与所述匹配参数集合中的一个配置匹配参数之间存在映射关系; 所述 一个配置匹配参数用于反 映具有对应的配置媒体类别和对应的配置图像类别的数据帧的 图像特征的匹配条件; 根据所述目标图像特征与 所述目标匹配参数, 在候选图像特征集合中查找与 所述目标 图像特征相匹配的匹配图像特征; 所述候选图像特征集合是 由待召回媒体数据集合中, 每 个待召回媒体数据所分别对应的图像特 征所组成的集 合; 根据所述匹配图像特征以及所述目标图像特征, 在所述待召回媒体数据集合中确定有 效召回媒体数据。 2.根据权利要求1所述的方法, 其特征在于, 所述识别所述目标媒体数据 所属的目标媒 体类别、 所述目标 数据帧对应的目标图像特 征以及目标图像 类别, 包括: 将所述目标数据帧输入至多任务识别模型中, 通过所述多任务识别模型中的基础特征 提取层, 提取 所述目标 数据帧对应的图像 基础特征; 将所述图像基础特征输入至所述多任务识别模型中的卷积网络层, 通过所述卷积网络 层与所述图像基础特征, 确定所述 目标数据帧对应的图像嵌入特征, 将所述图像嵌入特征 确定为所述目标图像特 征; 将所述图像基础特征输入至所述多任务识别模型中的图像类别预测层, 通过所述图像 类别预测层与所述图像 基础特征, 确定所述目标 数据帧对应的目标图像 类别; 将所述图像基础特征输入至所述多任务识别模型中的媒体类别预测层, 通过所述媒体 类别预测层与所述图像 基础特征, 确定所述目标媒体数据所属的目标媒体 类别。 3.根据权利要求2所述的方法, 其特征在于, 所述目标数据帧的数量为N个, N个目标数 据帧中包括目标数据帧Si, 所述图像基础特征包括所述目标数据帧Si对应的图像基础特征 Ti, N、 i均为 正整数; 所述通过所述媒体类别预测层与 所述图像基础特征, 确定所述目标媒体数据 所属的目 标媒体类别, 包括: 通过所述媒体类别预测层与所述目标数据帧Si对应的图像基础特征Ti, 确定所述目标 数据帧Si对应的帧媒体 类别; 当确定出所述N个目标数据帧分别对应的帧媒体类别时, 按照N个帧媒体类别对所述N 个目标数据帧进行归类处理, 得到M个数据帧集合; 每个数据帧集合中包含的目标数据帧所 属的帧媒体 类别为相同类别; M为 正整数; 统计所述M个数据帧集合中, 每个数据帧集合所分别包含的目标数据帧的数量, 得到M 个帧数量; 在所述M个帧数量中获取最大帧数量, 将所述最大帧数量对应的数据帧集合, 确定为目 标数据帧集 合;权 利 要 求 书 1/5 页 2 CN 114611637 B 2将所述目标数据帧集合中包含的目标数据帧所属的帧媒体类别, 确定为所述目标媒体 数据所属的目标媒体 类别。 4.根据权利要求1所述的方法, 其特征在于, 所述匹配参数集合中的每个配置匹配参数 包括配置相似度阈值, 所述目标匹配参数包括目标相似度阈值; 所述根据 所述目标图像特征与所述目标匹配参数, 在候选图像特征集合中查找与 所述 目标图像特 征相匹配的匹配图像特 征, 包括: 确定所述目标图像特征分别与所述候选图像特征集合中, 每个候选图像特征之间的特 征相似度, 得到特 征相似度集 合; 将所述特征相似度集合中, 大于所述目标相似度阈值的特征相似度, 确定为目标特征 相似度; 将所述目标特征相似度对应的候选图像特征, 确定为与 所述目标图像特征相匹配的匹 配图像特 征。 5.根据权利要求1所述的方法, 其特征在于, 所述目标数据帧的数量为N个, 所述目标数 据帧对应的目标图像特征包括N个目标数据帧分别对应的目标图像特征, N为正整数; 所述 匹配图像特征的数量为Q个, Q个匹配图像特征 由与N个目标图像特征分别相匹配的匹配图 像特征组成, Q 为正整数; 所述根据 所述匹配图像特征以及所述目标图像特征, 在所述待召回媒体数据集合中确 定有效召回媒体数据, 包括: 在所述待召回媒体数据集合中, 获取所述Q个匹配图像特征分别所属的待召回媒体数 据; 按照所述Q个匹配图像特征分别所属的待召回媒体数据, 对所述Q个匹配图像特征进行 特征分类, 得到W个匹配特征集合; 每个匹配特征集合中包含的匹配图像特征所属的待召回 媒体数据为相同媒体数据; 所述 W个匹配特 征集合中包括匹配特 征集合Rj, W、 j均为 正整数; 统计所述匹配特征集合Rj中包含的匹配图像特征的第一特征数量, 根据所述第一特征 数量以及所述N个目标图像特征, 确定所述匹配特征集合Rj所指示的待召回媒体数据的召 回属性; 在确定出所述W个匹配特征集合分别所指示的待召回媒体数据的召回属性 时, 将所述W 个匹配特征集合分别所指示的待召回媒体数据中的召回属 性为有效属 性的待召回媒体数 据, 确定为所述有效召回媒体数据。 6.根据权利要求5所述的方法, 其特征在于, 所述匹配特征集合Rj中包含的匹配图像特 征包括第一匹配图像特 征与第二匹配图像特 征; 所述根据所述第一特征数量以及所述N个目标图像特征, 确定所述匹配 特征集合Rj所指 示的待召回媒体数据的召回属性, 包括: 在所述N个目标图像特征中, 获取与所述第一匹配图像特征相匹配的第一目标图像特 征, 以及与所述第二匹配图像相匹配的第二目标图像特 征; 将所述第一目标图像特征与 所述第二目标图像特征所包含的特征总数量, 确定为第 二 特征数量; 根据所述第一特征数量、 所述第二特征数量以及所述目标媒体数据, 确定所述匹配特 征集合Rj所指示的待召回媒体数据的召回属性。权 利 要 求 书 2/5 页 3 CN 114611637 B 3

PDF文档 专利 一种数据处理方法、装置、设备以及可读存储介质

文档预览
中文文档 47 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共47页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据处理方法、装置、设备以及可读存储介质 第 1 页 专利 一种数据处理方法、装置、设备以及可读存储介质 第 2 页 专利 一种数据处理方法、装置、设备以及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:59:54上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。