金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111637868.9 (22)申请日 2021.12.2 9 (71)申请人 联想 (北京) 有限公司 地址 100085 北京市海淀区上地西路6号2 幢2层201- H2-6 (72)发明人 陆明 王友焱  (74)专利代理 机构 北京乐知新创知识产权代理 事务所(普通 合伙) 11734 专利代理师 王曌寅 (51)Int.Cl. G06F 11/30(2006.01) G06F 30/20(2020.01) G06F 111/04(2020.01) (54)发明名称 一种服务器故障确定方法、 装置、 设备及可 读存储介质 (57)摘要 本申请公开了一种服务器故障确定方法、 装 置、 设备及可读存储介质, 方法包括: 获取待巡检 服务器的巡检周期及集群中各服务器的参数; 建 立有约束条件的优化模型, 约束条件包括待巡检 服务器的负载的迁移约束条件和待巡检服务器 的巡检约束条件, 以使得集群负载波动最小, 和/ 或待巡检服务器巡检整体耗时更短; 根据待巡检 服务器的巡检周期、 集群中各服务器的参数及优 化模型确定待巡检服务器的巡检参数, 巡检参数 包括待巡检服务器的巡检顺序及待巡检服务器 上的负载的迁移顺序和迁移所进入的服务器; 按 照巡检参数对待巡检服务器进行故障检测。 通过 实施本申请, 可以实现巡检参数的自动化设置, 且按照该巡检参数巡检时, 不会造成集群负载太 大的波动。 权利要求书2页 说明书9页 附图2页 CN 114490245 A 2022.05.13 CN 114490245 A 1.一种服 务器故障确定方法, 包括: 获取待巡检服 务器的巡检周期及集群中各服 务器的参数; 建立有约束条件的优化模型, 约束条件包括所述待巡检服务器的负载的迁移约束条件 和所述待巡检服务器的巡检约束 条件, 以使得集群负载波动最小, 和/或所述待巡检服务器 巡检整体耗时更短; 根据所述待巡检服务器的巡检周期、 集群中各服务器的参数及所述优化模型确定所述 待巡检服务器的巡检参数, 所述巡检参数包括所述待巡检服务器的巡检顺序及所述待巡检 服务器上的负载的迁移顺序和迁移所进入的服 务器; 按照所述巡检参数对所述待巡检服 务器进行故障检测。 2.根据权利要求1所述的服 务器故障确定方法, 获取待巡检服 务器的巡检周期, 包括: 获取待巡检服 务器的巡检批次; 根据所述巡检批次在批次与巡检周期的映射表中查找到所述待巡检服务器的巡检周 期。 3.根据权利要求2所述的服 务器故障确定方法, 所述巡检批次的划分步骤 包括: 获取集群中各服 务器的应用数据、 设备 数据及监控数据; 根据所述应用数据、 设备 数据及监控数据对所述 服务器进行分批, 得到多个巡检批次。 4.根据权利要求1所述的服务器故障确定方法, 集群中各服务器的参数至少包括: 应用 数据、 设备 数据及监控数据; 所述根据 所述待巡检服务器的巡检周期、 集群中各服务器的参数及所述优化模型确定 所述待巡检服 务器的巡检参数, 包括: 根据所述待巡检服务器的巡检周期、 所述应用数据、 所述设备数据、 所述监控数据对所 述优化模型进行求 解, 得到所述待巡检服 务器的巡检参数。 5.根据权利要求2所述的服 务器故障确定方法, 还 包括: 获取预设时长内待巡检服 务器故障检测时产生的异常的种类、 异常的发生频率; 根据所述异常的种类和异常的发生频率对所述待巡检服 务器的巡检周期进行 更新。 6.根据权利要求1所述的服 务器故障确定方法, 还 包括: 标记所述巡检周期内无法完成巡检的目标服 务器; 设置所述目标服 务器为下一个巡检周期内优先巡检的服 务器。 7.根据权利要求6所述的服 务器故障确定方法, 还 包括: 记录待巡检服 务器故障检测过程中的执 行条件; 根据所述执 行条件对所述待巡检服 务器的巡检约束条件进行 更新。 8.一种服 务器故障确定装置, 包括: 第一获取 单元, 用于获取待巡检服 务器的巡检周期及集群中各服 务器的参数; 建立单元, 用于建立有约束条件的优化模型, 约束条件包括所述待巡检服务器的负载 的迁移约束 条件和所述待巡检服务器的巡检约束 条件, 以使得集群负载波动最小, 和/或所 述待巡检服 务器巡检整体耗时更短; 确定单元, 用于根据所述待巡检服务器的巡检周期、 集群中各服务器的参数及所述优 化模型确定所述待巡检服务器的巡检参数, 所述巡检参数包括所述待巡检服务器的巡检顺 序及所述待巡检服 务器上的负载的迁移顺序和迁移所进入的服 务器;权 利 要 求 书 1/2 页 2 CN 114490245 A 2检测单元, 用于按照所述巡检参数对所述待巡检服 务器进行故障检测。 9.一种电子设备, 包括: 至少一个处理器; 以及与所述至少一个处理器通信连接的存储器; 其中, 所述存储器存 储有可被所述至少一个处理器执行 的指令, 所述指令被所述至少一个处理器执行, 以使所 述至少一个处 理器执行如权利要求1 ‑7任意一项所述的服 务器故障确定方法。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机指令, 所述计算 机指令用于使计算机执 行如权利要求1 ‑7任意一项所述的服 务器故障确定方法。权 利 要 求 书 2/2 页 3 CN 114490245 A 3

.PDF文档 专利 一种服务器故障确定方法、装置、设备及可读存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种服务器故障确定方法、装置、设备及可读存储介质 第 1 页 专利 一种服务器故障确定方法、装置、设备及可读存储介质 第 2 页 专利 一种服务器故障确定方法、装置、设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:20:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。