金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210899920.6 (22)申请日 2022.07.28 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融街31号 (72)发明人 王思羽 刘坚桥  (74)专利代理 机构 北京康信知识产权代理有限 责任公司 1 1240 专利代理师 张文华 (51)Int.Cl. H04L 9/40(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) (54)发明名称 模型训练方法及装置、 端口 的风险识别方法 (57)摘要 本申请公开了一种模 型训练方法及装置、 端 口的风险识别方法。 其中, 该方法包括: 采集第一 类数据, 其中, 第一类数据包括网络端口及与网 络端口关联的数据; 对第一类数据进行分类, 得 到第二类数据和第三类数据, 其中, 第二类数据 和第三类数据的风险等级是不同的; 对第二类数 据和第三类数据进行特征提取, 得到第一数据 集, 并采用第一数据集中的样 本数据对预设模型 进行训练, 生成风险评估模型。 本申请解决了由 于现有技术存在端口信息来源单一, 数据维度 低, 无法与企业的生产实际相结合造成的在对网 络端口进行风险识别时, 整体识别效果差的技术 问题。 权利要求书2页 说明书10页 附图5页 CN 115277205 A 2022.11.01 CN 115277205 A 1.一种模型训练方法, 其特 征在于, 包括: 采集第一类数据, 其中, 所述第一类数据包括网络端口及与所述网络端口关联的数据; 对所述第 一类数据进行分类, 得到第 二类数据和第 三类数据, 其中, 所述第 二类数据和 所述第三类数据的风险等级是不同的; 对所述第二类数据和第三类数据进行特征提取, 得到第一数据集, 并采用所述第一数 据集中的样本数据对预设模型进行训练, 生成风险评估 模型。 2.根据权利要求1所述的方法, 其特征在于, 对所述第一类数据进行分类, 得到第二类 数据和第三类数据, 包括: 根据所述第一类数据创建第二数据集和第三数据集, 其中, 所述第二数据集为与所述 网络端口关联的软件资源数据及硬件资源数据的集合, 所述第三数据集为与所述网络端口 关联的风险数据的集 合; 将所述第二数据集和所述第三数据集关联, 生成第四数据集; 利用所述第四数据集对所述网络端口进行风险测试, 并利用风险测试的结果确定所述 网络端口 的风险等级, 将所述网络端口分为所述第二类数据和所述第三类数据。 3.根据权利要求1所述的方法, 其特征在于, 采用所述第 一数据集中的样本数据对预设 模型进行训练, 包括: 将所述样本数据输入到所述预设模型的隐藏层, 得到所述隐藏层的第一输出 结果; 将所述第一输出结果输入到所述预设模型的可见层, 得到所述可见层的第二输出结 果, 其中, 所述第二输出 结果作为下一所述隐藏层的输入; 利用所述第 一输出结果更新所述样本数据的隐藏偏差值, 利用所述第 二输出结果更新 所述样本数据的可见偏差值, 利用所述第一输出结果和所述第二输出结果更新所述样本数 据的权重。 4.根据权利要求3所述的方法, 其特征在于, 采用所述第 一数据集中的样本数据对预设 模型进行训练, 生成风险评估 模型, 包括: 根据所述样本数据的风险等级确定所述样本数据的标签; 根据所述标签, 更新后的所述 隐藏偏差值, 所述可见偏差值以及所述权重确定目标函 数; 对所述目标函数进行求解, 得到所述预设模型的第三输出结果, 根据所述第三输出结 果创建所述 风险评估 模型。 5.根据权利要求1所述的方法, 其特征在于, 采用所述第 一数据集中的样本数据对预设 模型进行训练, 生成风险评估 模型之后, 所述方法还 包括: 确定测试数据集, 将所述测试数据集中的各个数据输入到所述风险评估模型, 得到第 四输出结果; 根据所述第四输出 结果确定所述 风险评估 模型的误差值; 根据所述 误差值对所述 风险评估 模型进行优化。 6.根据权利要求1所述的方法, 其特 征在于, 采集第一类数据, 包括: 采集所述网络端口 的风险数据; 采集与所述网络端口关联的软件资源及硬件资源, 采集与所述软件资源关联的漏洞信 息, 以及采集与所述硬件资源关联的漏洞 信息;权 利 要 求 书 1/2 页 2 CN 115277205 A 2对所述软件资源及所述硬件资源进行漏洞 扫描, 采集扫描后的结果。 7.一种端口 的风险识别方法, 其特 征在于, 包括: 采集目标端口 的风险数据; 依据所述 风险数据确定所述目标端口 的特征数据; 采用风险评估模型对所述目标端口的特征数据进行分析, 得到所述目标端口的风险级 别, 其中, 所述 风险评估 模型为采用权利要求1至 6中任意一项所述的方法训练得到的。 8.一种模型训练装置, 其特 征在于, 包括: 采集模块, 用于采集第一类数据, 其中, 所述第 一类数据包括网络端口及与所述网络端 口关联的数据; 分类模块, 用于对所述第一类数据进行分类, 得到第二类数据和第三类数据, 其中, 所 述第二类数据和所述第三类数据的风险等级是不同的; 提取模块, 用于对所述第 二类数据和第三类数据进行特征提取, 得到第 一数据集, 并采 用所述第一数据集中的样本数据对预设模型进行训练, 生成风险评估 模型。 9.一种非易失性存储介质, 其特征在于, 所述非易失性存储介质包括存储的程序, 其 中, 在所述程序运行时控制所述 非易失性存储介质所在设备执行权利要求 1至6中任意一项 所述的模型训练方法。 10.一种处理器, 其特征在于, 所述处理器用于运行存储在存储器中的程序, 其中, 所述 程序运行时执 行权利要求1至 6任意一项所述的模型训练方法。权 利 要 求 书 2/2 页 3 CN 115277205 A 3

PDF文档 专利 模型训练方法及装置、端口的风险识别方法

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法及装置、端口的风险识别方法 第 1 页 专利 模型训练方法及装置、端口的风险识别方法 第 2 页 专利 模型训练方法及装置、端口的风险识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:28:04上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。