金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211225416.4 (22)申请日 2022.10.09 (71)申请人 贵州电网有限责任公司 地址 550000 贵州省贵阳市南明区滨河路 17号 (72)发明人 王皓然 刘俊荣 魏力鹏 班秋成  周泽元 陶佳冶 付鋆 吕嵘晶  李荣宇  (74)专利代理 机构 安徽华晟智恒知识产权代理 事务所(普通 合伙) 34193 专利代理师 崔镱泷 (51)Int.Cl. G06K 9/62(2022.01) G06Q 50/06(2012.01) (54)发明名称 一种基于海量电力数据的云计算方法、 系统 (57)摘要 本申请提供一种基于海量电力数据的云计 算方法、 系统, 由于初始聚类中心的选取对聚类 效果影响十分明显, 随机选取初始聚类中心缺乏 科学性, 当初始的聚类中心点选择为同一类时, 聚类效果不理想。 因此, 通过对电力数据集进行 处理, 利用电力数据集 内每个电力数据对象的 分布特征, 从中确定出 个初始聚类中心, 能够 考虑到电力数据集 的分布情况, 提升初始聚类 中心选取的合理性, 能够有效提升聚类效果。 而 通过计算每个电力数据对象到聚类中心的距离, 进行聚类, 不断迭代, 直到满足结束条件, 完成聚 类。 由此可以实现对 海量电力数据的挖掘分类 。 权利要求书3页 说明书10页 附图2页 CN 115545107 A 2022.12.30 CN 115545107 A 1.一种基于海量电力数据的云计算方法, 其特 征在于, 包括: S1: 获取待 处理的电力数据集X, 处理为n ×m的矩阵形式, 其 中, 电力数据 集X具有n个电 力数据对象, 每 个电力数据对象具有m个属性, n>1, m>1; S2: 基于所述电力数据集X内每个电力数据对象的分布特征, 确定出K个初始聚类中心, K>1; S3: 计算第l次所述电力数据集X中每个电力数据对象xi与第k个聚类中心 之间的距离 得到第l次的计算结果, i∈[1, n], k∈[1, K]; S4: 基于第l次的计算结果, 计算第l+1次的聚类中心的位置, 并判断是否满足结束条 件, 其中, 结束条件为: 第l+1次所有 聚类中心的位置与第l次所有 聚类中心的位置相同, 且 满足预设收敛极限; S5: 若满足结束条件, 则结束计算, 以基于第l次的计算结果划分的K个簇作为结果输 出, 得到划分的K个分类{S1, S2, ..., Sk}; S6: 若不满足结束条件, 跳转到步骤S3进行下一次计算, 直到满足结束条件得到K个分 类{S1, S2, ..., Sk}输出, 实现对 海量电力数据的分类。 2.根据权利要求1所述的基于海量电力数据的云计算方法, 其特征在于, S2中基于所述 电力数据集X内每 个电力数据对象的分布特 征, 确定出 K个初始聚类中心, 包括: 基于所述电力数据集X, 确定出相应的聚类中心个数 K; 基于所述电力数据集X, 确定出每 个电力数据对象xi中每个属性的权值; 基于每个电力数据对象xi中每个属性的权值, 计算电力数据对象xi与电力数据对象xp 的距离, 以确定出所述电力数据集X中每个电力数据对象xi的相对赋值距离, 其中, 电力数 据对象xi的相对赋值距离表示电力数据对象xi与所述电力数据集X中其他电力数据对象之 间的最大距离; 基于每个电力数据对象xi的相对赋值距离, 确定出每个电力数据对象xi对应的局部密 度; 基于每个电力数据对象xi的相对赋值距离和 局部密度, 确定出 K个初始聚类中心。 3.根据权利要求2所述的基于海量电力数据的云计算方法, 其特征在于, 基于所述电力 数据集X, 确定出每 个电力数据对象xi中每个属性的权值, 包括: 针对所述电力数据集X中每 个电力数据对象xi, 进行如下处 理: 确定电力数据对象xi中第j个属性的香农熵Hij为: 其中, m为电力数据对象xi的属性维度总数, xij表示电力数据对象xi的第j个属性, j∈ [1, m]; 针对电力数据对象xi中每个属性, 进行以下处 理: 基于电力数据对象xi中第j个属性的香农 熵Hij, 按照以下 公式计算电力数据对象xi中第 j个属性的权值 wij: 权 利 要 求 书 1/3 页 2 CN 115545107 A 2据此计算出 所述电力数据集X中每 个电力数据对象xi的每个属性xij的权值wij。 4.根据权利要求3所述的基于海量电力数据的云计算方法, 其特征在于, 基于每个电力 数据对象xi中每个属性的权值, 计算电力数据对象xi与电力数据对象xp的距离, 以确定出所 述电力数据集X中每 个电力数据对象xi的相对赋值距离, 包括: 针对所述电力数据集X中每 个电力数据对象xi, 进行如下处 理: 利用以下公式计算电力数据对象xi与电力数据对象xp的距离: 其中, dw(xi, xp)表示电力数据对象xi与电力数据对象xp的距离, σ 为常数, 用于调节随电 力数据对象距聚类中心的距离变化时的密度; 基于以下公式确定出电力数据对象xi对应的相对赋值距离 δi: δi=max dw(xi, X), 其中, δi表示电力数据对 象xi对应的相对赋值距离, dw(xi, X)表示电力数据对象xi与所 述电力数据集X中每 个电力数据对象的距离, 共计n个距离; 据此计算出所述电力数据集X中每个电力数据对象xi的相对赋值距离δi, 共计n个相对 赋值距离 。 5.根据权利要求4所述的基于海量电力数据的云计算方法, 其特征在于, 基于每个电力 数据对象xi的相对赋值距离, 确定出每 个电力数据对象xi对应的局部密度, 包括: 基于每个电力数据对象xi的相对赋值距离, 计算出截断距离; 基于每个电力数据对象xi与所述电力数据集X中所有电力数据对象的距离, 以及所述截 断距离, 确定出每 个电力数据对象xi对应的局部密度。 6.根据权利要求5所述的基于海量电力数据的云计算方法, 其特征在于, 基于每个电力 数据对象xi的相对赋值距离, 计算出截断距离, 包括: 基于每个电力数据对象xi的相对赋值距离, 利用以下 公式计算所述电力数据集X中所有 电力数据对象的均值距离 μ: 基于均值距离 μ和每 个电力数据对象xi对应的相对赋值距离 δi, 计算截断距离: 其中, dc表示截断距离 。 7.根据权利要求6所述的基于海量电力数据的云计算方法, 其特征在于, 基于每个电力 数据对象xi与所述电力数据集X中所有电力数据对象的距离, 以及所述截断距离, 确定出每 个电力数据对象xi对应的局部密度, 包括: 针对所述电力数据集X中每 个电力数据对象xi, 采用以下公式进行计算: 其中, ρi表示电力数据对象xi对应的局部密度, 共计算出n个局部密度。权 利 要 求 书 2/3 页 3 CN 115545107 A 3

PDF文档 专利 一种基于海量电力数据的云计算方法、系统

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于海量电力数据的云计算方法、系统 第 1 页 专利 一种基于海量电力数据的云计算方法、系统 第 2 页 专利 一种基于海量电力数据的云计算方法、系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:59:07上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。