金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210943204.3 (22)申请日 2022.08.08 (71)申请人 天翼安全科技有限公司 地址 100010 北京市东城区朝阳门北 大街 19号中国电信大厦 (72)发明人 危嘉祺 贾晋康 佟欣哲  (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 专利代理师 李迪 (51)Int.Cl. H04L 9/40(2022.01) H04L 61/4511(2022.01) (54)发明名称 一种域名同源判定方法、 装置、 电子设备及 存储介质 (57)摘要 本申请公开了一种域名同源判定方法、 装 置、 电子设备及存储介质, 包括: 获取待检测域 名, 获得待检测域名的第一特征; 将待检测域名 的第一特征输入CDN域名识别模型, 获得域名识 别结果, CDN域名识别模型是基于域名样本的第 一特征按照预设分类模型训练获得的; 若确定待 检测域名为CDN域名, 获得待检测域名的第二特 征; 将待检测域名的第二特征输入域名后缀提取 模型, 获得待检测域名的域名后缀, 域名后缀提 取模型是基于CDN域名样 本的第二特征按照预设 分类模型训练获得的; 在预设黑名单与预设白名 单中分别查找待检测域名的域名后缀, 若确定预 设黑名单或预设白名单中包含与该域名后缀相 同的CDN域名, 确定待检测域名与CDN域名为域名 同源。 权利要求书4页 说明书17页 附图4页 CN 115412306 A 2022.11.29 CN 115412306 A 1.一种域名同源判定方法, 其特 征在于, 包括: 获取待检测域名, 获得所述待检测域名的第一特征, 所述第 一特征包括: 第 一域名统计 特征和第一域名解析特征, 所述待检测域名的第一域名统计特征表征所述待检测域名的结 构特征, 所述待检测域名的第一域名统计特征表征根据被动域名系统PDNS日志 提取的所述 待检测域名的关联 特征; 将所述待检测域名的第一特征输入内容分发网络CDN域名识别模型, 获得域名识别结 果, 其中, 所述CDN域名识别模型是基于域名样本的第一特征按照预设分类模型训练获得 的; 若确定所述域名识别结果为所述待检测域名是CDN域名, 则获得所述待检测域名的第 二特征, 所述第二特征包括: 第二域名统计特征和 第二域名解析特征, 所述待检测域名的第 二域名统计特征表征所述待检测域名的候选域名后缀与域名前缀的结构特征, 所述待检测 域名的第二域名解析特征表征根据所述PDNS日志提取 的所述待检测域名的关联特征及所 述待检测域名的候选域名后缀的关联 特征; 将所述待检测域名的第 二特征输入域名后缀提取模型, 获得所述待检测域名的域名后 缀, 其中, 所述域名后缀提取模型是基于CDN域名样本的第二特征按照所述预设分类模型训 练获得的; 在预设黑名单与预设白名单中分别查找所述待检测域名的域名后 缀, 若确定所述预设 黑名单或所述预设白名单中包含与所述域名后缀相同的CDN域名, 则确定所述待检测域名 与所述CDN 域名为域名同源, 将所述待检测域名加入所述预设黑名单或所述预设白名单。 2.如权利要求1所述的方法, 其特征在于, 所述域名样本包括域名训练样本和域名预测 样本; 通过以下 方式训练获得 所述CDN域名识别模型: 基于所述P DNS日志获得 所述域名训练样本的第一特 征; 将所述域名训练样本的第 一特征按照所述预设分类模型进行当前轮次的迭代训练, 获 得候选CDN域名识别模型; 基于所述P DNS日志获得 所述域名预测样本的第一特 征; 将所述域名预测样本的第一特征输入所述候选CDN域名识别模型进行域名预测, 获得 预测结果; 将预测结果 准确的域名预测样本确定为 新增域名训练样本; 根据所述域名训练样本和所述新增域名训练样本对所述候选CDN域名识别模型执行新 一轮次的迭代训练, 直至 达到预设迭代轮次, 获得 所述CDN域名识别模型。 3.如权利要求1所述的方法, 其特征在于, 所述CDN域名样本包括CDN域名训练样本和 CDN域名预测样本; 通过以下 方式训练获得 所述域名后缀 提取模型: 获得所述CDN域名训练样本的候选域名后缀, 基于所述CDN域名训练样本的候选域名后 缀与所述P DNS日志获得 所述CDN域名训练样本的第二特 征; 基于所述CDN域名训练样本的第二特征和所述CDN域名训练样本的候选域名后缀按照 所述预设 分类模型进行当前轮次的迭代训练, 获得候选域名后缀 提取模型; 获得所述CDN域名预测 样本的候选域名后缀, 基于所述CDN域名预测 样本的候选域名后权 利 要 求 书 1/4 页 2 CN 115412306 A 2缀与所述P DNS日志获得 所述CDN域名预测样本的第二特 征; 将所述CDN域名预测样本的第 二特征输入所述候选域名后 缀提取模型进行域名后缀预 测, 获得预测结果; 将预测结果 准确的CDN 域名预测样本确定为 新增CDN域名训练样本; 根据所述CDN域名训练样本和所述新增CDN域名训练样本对所述候选域名后缀提取模 型执行新一轮次的迭代训练, 直至 达到预设迭代轮次, 获得 所述域名后缀 提取模型。 4.如权利要求2所述的方法, 其特征在于, 基于所述PDNS日志获得所述域名训练样本的 第一特征, 具体包括: 提取所述域名训练样本的第一域名统计特征, 并基于所述PDNS日志提取所述域名训练 样本的第一域名解析特征, 根据所述域名训练样本的第一域名统计特征和所述域名训练样 本的第一 域名解析 特征获得所述域名训练样本的第一特 征; 以及 基于所述P DNS日志获得 所述域名预测样本的第一特 征, 具体包括: 提取所述域名预测 样本的第一域名统计特征, 并基于所述PDNS日志提取所述域名预测 样本的第一域名解析特征, 根据所述域名预测样本的第一域名统计特征和所述域名预测样 本的第一 域名解析 特征获得所述域名预测样本的第一特 征。 5.如权利要求3所述的方法, 其特征在于, 基于所述CDN域名训练样本的候选域名后缀 与所述PDNS日志获得 所述CDN域名训练样本的第二特 征, 具体包括: 基于所述CDN域名训练样本的候选域名后缀提取所述CDN域名训练样本的第二域名统 计特征, 并基于所述CDN域名训练样本的候选域名后缀在所述PDNS日志中提取所述CDN域名 训练样本的第二域名解析特征, 根据所述CDN域名训练样 本的第二域名统计特征和所述CDN 域名训练样本的第二 域名解析 特征获得所述CDN域名训练样本的第二特 征; 以及 基于所述CDN域名预测样本的候选域名 后缀与所述PDNS日志获得所述CDN域名预测样 本的第二特 征, 具体包括: 基于所述CDN域名预测样本的候选域名后缀提取所述CDN域名预测样本的第二域名统 计特征, 并基于所述CDN域名预测样本的候选域名后缀在所述PDNS日志中提取所述CDN域名 预测样本的第二域名解析特征, 根据所述CDN域名预测样 本的第二域名统计特征和所述CDN 域名预测样本的第二 域名解析 特征获得所述CDN域名预测样本的第二特 征。 6.如权利要求3或5所述的方法, 其特征在于, 获取所述CDN域名训练样本的候选域名后 缀, 具体包括: 针对每一CDN 域名训练样本, 提取 所述CDN域名训练样本的域名后缀; 将所述域名训练样本前缀中除第一个子块外的其它子块与所述域名后缀按照相邻原 则依次进行组合, 获得 所述CDN域名训练样本对应的候选域名后缀。 7.一种域名同源判定装置, 其特 征在于, 包括: 第一特征提取单元, 用于获取待检测域名, 获得所述待检测域名的第 一特征, 所述第一 特征包括: 第一域名统计特征和第一域名解析特征, 所述待检测 域名的第一域名统计特征 表征所述待检测域名的结构特征, 所述待检测域名的第一域名统计特征表征根据被动域名 系统PDNS日志提取的所述待检测域名的关联 特征; 域名识别单元, 用于将所述待检测域名的第一特征输入内容分发网络CDN域名识别模 型, 获得域名识别 结果, 其中, 所述CDN域名识别模型是基于域名样本的第一特征按照预设权 利 要 求 书 2/4 页 3 CN 115412306 A 3

PDF文档 专利 一种域名同源判定方法、装置、电子设备及存储介质

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种域名同源判定方法、装置、电子设备及存储介质 第 1 页 专利 一种域名同源判定方法、装置、电子设备及存储介质 第 2 页 专利 一种域名同源判定方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:27:37上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。