金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111265938.2 (22)申请日 2021.10.28 (71)申请人 博锐尚格科技股份有限公司 地址 100044 北京市西城区德胜门外大街 11号5幢221室 (72)发明人 李昕  (74)专利代理 机构 北京劲创知识产权代理事务 所(普通合伙) 11589 代理人 王闯 (51)Int.Cl. G06F 30/27(2020.01) G06F 17/18(2006.01) G06K 9/62(2022.01) (54)发明名称 一种热力站历史能耗数据异常值处理方法 及装置 (57)摘要 本发明公开了一种热力站历史能耗数据异 常值处理方法及装置。 该方法包括: 获取热力站 历史能耗数据, 所述历史能耗数据包括一定时间 段内历史能耗与平均温度的对应关系; 基于经验 值去除所述历史能耗数据中热力站未开启和热 力站异常开启的异常数据; 基于数据统计确定历 史能耗数据的正常数据分布范围, 去除所述正常 数据分布范围之外的异常数据; 基于聚类算法对 上述处理之后的历史能耗数据进行聚类 分析, 去 除经聚类分析获得的异常数据。 可见, 本发明利 用基于经验值、 基于数据统计和聚类算法, 一步 步地去除热力站历史能耗中的数据异常值, 克服 了现有技术中仅基于经验值或基于数据统计无 法完全去除数据异常值的缺陷, 为后续建模提供 干净的数据。 权利要求书2页 说明书7页 附图6页 CN 114239375 A 2022.03.25 CN 114239375 A 1.一种热力站历史能耗数据异常值处 理方法, 其特 征在于, 包括: 获取热力站历史能耗数据, 所述历史能耗数据包括一定时间段内历史能耗与平均温度 的对应关系; 基于经验值去除所述历史能耗数据中热力站未开启和热力站 异常开启的异常数据; 基于数据统计确定历史能耗数据的正常数据分布范围, 去除所述正常数据分布范围之 外的异常数据; 基于聚类算法对上述处理之后的历史能耗数据进行聚类分析, 去除经聚类分析获得的 异常数据。 2.根据权利要求1所述的方法, 其特征在于, 所述基于经验值去除所述历史能耗数据中 热力站未开启和热力站 异常开启的异常数据, 包括: 去除历史能耗数据中日能耗小于第一预设阈值的异常数据; 去除历史能耗数据中日能耗大于第一预设阈值且平均温度大于第二预设阈值的异常 数据。 3.根据权利要求2所述的方法, 其特征在于, 所述第 一预设阈值为300千 瓦时, 所述第二 预设阈值 为12摄氏度。 4.根据权利要求1所述的方法, 其特征在于, 所述基于数据统计确定历史能耗数据的正 常数据分布范围, 去除所述 正常数据分布范围之外的异常数据, 包括: 对基于经验值去除数据异常值的历史能耗数据计算均值和标准差; 根据所述历史能耗数据的均值和标准差确定历史能耗数据的正常数据分布范围, 去除 所述正常数据分布范围之外的异常数据。 5.根据权利要求4所述的方法, 其特征在于, 所述根据所述历史能耗数据的均值和标准 差确定历史能耗数据的正常数据分布范围, 去除所述正常数据分布范围之外的异常数据, 包括: 针对所述历史能耗数据的各个平均温度对应的历史能耗, 确定各个平均温度对应的历 史能耗的均值+预设个数 的历史能耗的标准差以及历史能耗的均值 ‑预设个数 的历史能耗 的标准差为历史能耗数据的正常数据分布范围, 去除所述正常数据分布范围之外的异常数 据。 6.根据权利要求1所述的方法, 其特 征在于, 所述聚类算法为OPTICS聚类算法。 7.根据权利要求6所述的方法, 其特征在于, 所述基于聚类算法对上述处理之后的历史 能耗数据进行聚类分析, 去除经聚类分析获得的异常数据, 包括: 以上述处理之后的历史能耗数据为样本集, 确定邻域半径和给定点在邻域半径内成为 核心对象的最小邻域 点数; 通过OPTICS聚类算法处 理后输出 具有可达距离信息的样本点 排序数据集; 对上述样本点 排序数据集进行聚类分析, 去除经聚类分析获得的异常数据。 8.一种热力站历史能耗数据异常值处 理装置, 其特 征在于, 包括: 历史能耗数据获取单元, 用于获取热力站历史能耗数据, 所述历史能耗数据包括一定 时间段内历史能耗与平均温度的对应关系; 基于经验值的异常数据去除单元, 用于基于经验值去除所述历史能耗数据中热力站未 开启和热力站 异常开启的异常数据;权 利 要 求 书 1/2 页 2 CN 114239375 A 2基于数据统计的异常数据去除单元, 用于基于数据统计确定历史能耗数据的正常数据 分布范围, 去除所述 正常数据分布范围之外的异常数据; 基于聚类算法的异常数据去除单元, 用于基于聚类算法对上述处理之后的历史能耗数 据进行聚类分析, 去除经聚类分析获得的异常数据。 9.一种电子设备, 其特 征在于, 该电子设备包括: 处理器; 以及, 被安排成存储计算机可执行指令的存储器, 所述可执行指令在被执行时使所述处理器 执行根据权利要求1 ‑7中任一项所述的方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储一个或多个 程序, 所述 一个或多个程序当被处 理器执行时, 实现权利要求1 ‑7中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114239375 A 3

.PDF文档 专利 一种热力站历史能耗数据异常值处理方法及装置

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种热力站历史能耗数据异常值处理方法及装置 第 1 页 专利 一种热力站历史能耗数据异常值处理方法及装置 第 2 页 专利 一种热力站历史能耗数据异常值处理方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:43:12上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。