金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211133958.9 (22)申请日 2022.09.16 (71)申请人 百度时代网络技 术 (北京) 有限公司 地址 100080 北京市海淀区东北旺西路8号 中关村软件园17号楼二层A 2 (72)发明人 楚振江 黄川 杨文博 吴永巍  范彪  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 鄢功军 (51)Int.Cl. G06F 16/9532(2019.01) G06F 16/9535(2019.01) G06F 16/955(2019.01) (54)发明名称 候选搜索词的推荐方法、 装置、 设备以及存 储介质 (57)摘要 本公开提供了一种候选搜索词的推荐 方法、 装置、 设备以及存储介质, 涉及大数据、 搜索和推 荐等技术领域。 具体实现方案为: 响应于检测到 目标网址被点击, 确定多个共现关系数据中与目 标网址对应的至少一个目标共现关系数据, 其 中, 多个共现关系数据中的每个共现关系数据包 括彼此具有共现关系的网址和候选搜索词; 获取 至少一个目标共现关系数据的点击率评估值; 根 据至少一个目标共现关系数据的点击率评估值, 确定至少一个目标共现关系数据中的待推荐共 现关系数据; 以及对待推荐共现关系数据中的候 选搜索词进行推荐。 权利要求书3页 说明书10页 附图4页 CN 115455274 A 2022.12.09 CN 115455274 A 1.一种候选 搜索词的推荐方法, 包括: 响应于检测到目标网址被点击, 确定多个共现关系数据中与 所述目标网址对应的至少 一个目标共现关系 数据, 其中, 所述多个共现关系 数据中的每个共现关系 数据包括彼此具 有共现关系的网址和候选 搜索词; 获取所述至少一个目标共现关系数据的点击率评估值; 根据所述至少一个目标共现关系数据的点击率评估值, 确定所述至少一个目标共现关 系数据中的待推荐共现关系数据; 以及 对所述待推荐共现关系数据中的候选 搜索词进行推荐。 2.根据权利要求1所述的方法, 还 包括: 获取多个共现关系数据; 确定与所述每 个共现关系数据对应的搜索词特 征、 网址特 征和交叉 特征; 以及 根据与所述每个共现关系数据对应的搜索词特征、 网址特征和 交叉特征, 确定所述每 个共现关系数据的点击率评估值。 3.根据权利要求2所述的方法, 其中, 所述获取多个共现关系数据包括: 获取搜索引擎的对象行为数据, 其中, 所述对象行为数据记录有至少一个搜索行为和 至少一个点击行为; 将所述对象行为数据根据 行为发生时间进行切分, 得到多个数据分片, 其中, 每个所述 数据分片包括预定时长的行为记录; 以及 根据所述每 个数据分片中记录的搜索行为和点击行为, 确定共现关系数据。 4.根据权利要求2所述的方法, 其中, 所述确定与 所述每个共现关系数据对应的搜索词 特征、 网址特 征和交叉 特征, 包括: 针对所述每 个共现关系数据, 根据所述共现关系数据中的候选 搜索词, 确定 搜索词特 征; 根据所述共现关系数据中的网址, 确定网址特 征; 以及 根据所述共现关系数据中的候选 搜索词与网址之间的相关性, 确定交叉 特征。 5.根据权利要求2所述的方法, 其中, 所述根据与 所述每个共现关系数据对应的搜索词 特征、 网址特 征和交叉 特征, 确定所述每 个共现关系数据的点击率评估值, 包括: 针对所述每 个共现关系数据, 对与所述共现关系数据对应的搜索词特征、 网址特征和 交叉特征进行合并, 得到候选 数据; 以及 利用点击通过率模型, 对所述候选数据进行评估, 得到所述共现关系数据的点击率评 估值。 6.根据权利要求2所述的方法, 还 包括: 对所述多个共现关系数据中的候选搜索词与网址之间的相关性进行评估, 得到相关度 评估值; 以及 删除所述多个所述共现关系数据中所述相关度评估值小于相关度阈值的共现关系数 据。 7.根据权利要求1至6中任一项所述的方法, 其中, 所述根据所述至少一个目标共现关 系数据的点击率评估值, 确定所述至少一个目标共现关系 数据中的待推荐共现关系 数据,权 利 要 求 书 1/3 页 2 CN 115455274 A 2包括: 确定所述至少一个目标共现关系数据中点击率评估值大于点击率阈值的目标共现关 系数据, 作为待推荐共现关系数据。 8.一种候选 搜索词的推荐装置, 包括: 第一确定模块, 用于响应于检测到目标网址被点击, 确定多个共现关系数据中与所述 目标网址对应的至少一个目标共现关系 数据, 其中, 所述多个共现关系 数据中的每个共现 关系数据包括彼此 具有共现关系的网址和候选 搜索词; 获取模块, 用于获取 所述至少一个目标共现关系数据的点击率评估值; 第二确定模块, 用于根据所述至少一个目标共现关系数据的点击率评估值, 确定所述 至少一个目标共现关系数据中的待推荐共现关系数据; 以及 推荐模块, 用于对所述待推荐共现关系数据中的候选 搜索词进行推荐。 9.根据权利要求8所述的装置, 还 包括: 共现关系数据获取模块, 用于获取多个共现关系数据; 特征确定模块, 用于确定与所述每个共现关系数据对应的搜索词特征、 网址特征和 交 叉特征; 以及 点击率评估值确定模块, 用于根据与所述每个共现关系数据对应的搜索词特征、 网址 特征和交叉 特征, 确定所述每 个共现关系数据的点击率评估值。 10.根据权利要求9所述的装置, 其中, 所述共现关系数据获取模块包括: 对象行为数据获取子模块, 用于获取搜索引擎的对象行为数据, 其中, 所述对象行为数 据记录有至少一个搜索行为和至少一个点击行为; 切分子模块, 用于将所述对象行为数据根据行为发生时间进行切分, 得到多个数据分 片, 其中, 每 个所述数据分片包括预定时长的行为记录; 以及 共现关系数据确定子模块, 用于根据所述每个数据分片中记录的搜索行为和点击行 为, 确定共现关系数据。 11.根据权利要求9所述的装置, 其中, 所述特 征确定模块, 包括: 第一特征确定子模块, 用于针对所述每个共现关系数据, 根据所述共现关系数据中的 候选搜索词, 确定 搜索词特 征; 第二特征确定子模块, 用于根据所述共现关系数据中的网址, 确定网址特 征; 以及 第三特征确定子模块, 用于根据所述共现关系数据中的候选搜索词与网址之间的相关 性, 确定交叉 特征。 12.根据权利要求9所述的装置, 其中, 所述 点击率评估值确定模块, 包括: 合并子模块, 用于针对所述每个共现关系数据, 对与所述共现关系数据对应的搜索词 特征、 网址特 征和交叉 特征进行合并, 得到候选数据; 以及 评估子模块, 用于利用点击通过率模型, 对所述候选数据进行评估, 得到所述共现关系 数据的点击率评估值。 13.根据权利要求9所述的装置, 还 包括: 评估模块, 用于对所述多个共现关系数据中的候选搜索词与网址之间的相关性进行评 估, 得到相关度评估值; 以及 删除模块, 用于删除所述多个所述共现关系数据中所述相关度评估值小于相关度阈值权 利 要 求 书 2/3 页 3 CN 115455274 A 3

.PDF文档 专利 候选搜索词的推荐方法、装置、设备以及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 候选搜索词的推荐方法、装置、设备以及存储介质 第 1 页 专利 候选搜索词的推荐方法、装置、设备以及存储介质 第 2 页 专利 候选搜索词的推荐方法、装置、设备以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:35:06上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。