金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111104941.6 (22)申请日 2021.09.2 2 (71)申请人 国网河北省电力有限公司 地址 050021 河北省石家庄市裕华区富强 大街32号 申请人 国电南瑞南京控制系统有限公司   国家电网有限公司 (72)发明人 杨立波 马斌 王亚军 孔祥玉  徐俊杰 周超 袁健 王硕  (74)专利代理 机构 天津盛理知识产权代理有限 公司 12209 代理人 董一宁 (51)Int.Cl. G06F 30/27(2020.01) G06F 16/25(2019.01)G06F 119/02(2020.01) (54)发明名称 一种多源气象数据融合与预处 理方法 (57)摘要 本发明涉及一种多源气象数据融合与预处 理方法, 基于三层次融合结构, 具体包括数据层、 特征层和决策层, 逐层提取特定的有用的信息, 具体步骤为: (1)对不良数据进行检测, 找出含有 可疑数据的量测点, 辨识出全部不良数据; (2)气 象数据清洗与还原, 删除重复信息, 纠正错误信 息; (3)气象数据还原, 采用修复算法; (4)对气象 数据的修复精度进行验证计算。 本方法基于现有 气象监测站 群网系统, 提出规范化数据库建模 方 案; 在此基础上, 形成新能源场站气象数据规范, 构建新能源场站气象监测数据特征库通过ET L技 术, 将多源气象数据统一提取到数据库中, 以实 现多源数据融合, 并通过有效的数据清洗以提高 数据质量, 使新能源功率预测结果更加精确。 权利要求书2页 说明书16页 附图2页 CN 114004137 A 2022.02.01 CN 114004137 A 1.一种多源气象数据融合与 预处理方法, 其特征在于: 基于三层次融合结构, 具体包括 数据层、 特 征层和决策层, 逐层提取 特定的有用的信息, 具体步骤为: (1)对不良数据进行检测, 找出含有可疑数据的量测点, 辨识出全部不良数据; (2)气象数据清洗与还原, 删除重复信息, 纠正 错误信息, 并还原数据一 致性; (3)气象数据还原, 采用修复算法; (4)对气象数据的修复精度进行验证 计算。 2.根据权利要求1所述的多源气象数据融合与预处理方法, 其特征在于: 数据层的数据 融合方法采用聚类分析法, 特征层的数据融合方法采用卡尔曼滤波法, 决策层的数据融合 方法采用贝叶斯估计法。 3.根据权利要求1所述的多源气象数据融合与预处理方法, 其特征在于: 所述步骤(3) 采用的修复算法, 具体包括: ①气象要素 数据相似性 修复; ②气象要素 数据的空间修复和时间修复 ③气象要素 数据混合 修复。 4.根据权利要求3所述的多源气象数据融合与预处理方法, 其特征在于: 所述 ①气象要 素数据相似性修复, 是通过构建气象相似性网络时计算节点的气象要 素时间序列之 间的相 似性得到的节点之间的相似性 来修复缺失数据, 用下面的公式表示: 其中, XS(i,j)为气象观测站点i在时间序列上第j个时间缺失值的估值, 这里使用的估 值方法为相似性修复; Si,p为气象观测站点i与站点p的之间的相似性; XS(p,j)为气象观测 站点p在时间序列上第 j个时间的实际值; Ω为给定的气象观测站 点范围, 选择除了站 点i以 外的全部站点, 或只选择与站点 i相似性比较高的部分站点。 5.根据权利要求3所述的多源气象数据融合与预处理方法, 其特征在于: 所述 ②气象要 素数据的空间修复和时间修复, 是整合空间修复和时间修复的时空修复约减法把时间作为 一个单独的维, 不考虑空间上的其它气象站点, 对每个气象要 素时间序列进行时间修复, 得 到缺失数据的第一次修复值, 这样得到用时间修复值修复完整的所有气象站 点的气象要 素 时间序列, 再对每个缺失数据考虑空间上其它站点同一时间的气象要素观测 值, 使用包含 第一次修复值的空间修复方法进行二次修复, 这样在第二次修复时, 每个缺失值都可以使 用所有空间距离近的站点观测值参与修复, 而不用剔除空间距离近却同样缺失的站点, 减 小误差; 根据目前的站 点数量和分布的实际情况, 对气象要 素观测时间序列修复时, 先使用 空间修复方法对缺 失数据进行修复, 得到第一次修复值, 再对每个缺失数据考虑时间修复, 使用包含第一次修复值的时间修复方法对缺失数据进行二次修复。 6.根据权利要求3所述的多源气象数据融合与预处理方法, 其特征在于: 所述 ③气象要 素数据混合修复, 是综合考虑时间修复、 空间修复和相似性修复以提高缺失数据修复的精 确度, 用混合 修复拟合方程计算, 公式表示: X(i,j)=aXD(i,j)+bXT(i,j)+cXS(i,j)+d    (39)权 利 要 求 书 1/2 页 2 CN 114004137 A 2其中, X(i,j)为气象观测站点i在时间j的估值; XD(i,j)为气象观测 站点i在时间j的空 间估值, 空间修复方法使用反距离加权法XT(i,j)为气象观测站点i在时间j的时间估值; XS (i,j)为气象观测站点i在时间j 的相似性估值; a、 b和c分别为空间、 时间和相似性估值系 数; d为常数项。 7.根据权利要求6所述的多源气象数据融合与预处理方法, 其特征在于: 气象要素数据 混合修复需要确定混合修复拟合方程的系数, 用气象观测站 点的实际值、 空间修复估值、 相 似性修复估值和时间修复估值进 行多元线性回归分析, 使用最小二乘法求解方程的最佳拟 合系数。 8.根据权利要求1所述的多源气象数据融合与预处理方法, 其特征在于: 所述步骤(4) 数据的修复精度进行验证计算的方法是, 从数据源中选取一个完整的数据集, 或者将数据 源中包含的缺失数据的行和列都删除, 人为的得到完整的数据集, 然后采用Holdout验证的 方法来验证修复方法的修复精确度, Holdout验证方法把数据集分为两个子集, 先选择一些子集做分析, 其余的子集用来对 已选择子集的分析 结果进行验证, 用来做分析的子集 为训练集, 用来验证的子集 为验证集, 把一组气象观测站点的某个气象要素时间序列组成一个数据集, 选定一个缺失率, 对 数据集中的数据随机标记缺失, 然后使用未缺失的数据来修复缺失的数据, 最后通过计算 缺失气象站 点气象要 素的实际测量值与估算值的误差来评估修复方法的精确度, 采用平均 绝对误差和均方根误差来衡量修复方法的精确度, 平均绝对误差和均方根误差的表达式分 别为公式: 其中, Xoi为第i个观测站点的实际测量值, Xei为第i个站点的修复估算值, n为用于参与 验证的观测站点的数量; 这两个值越接近0, 修复的精确度就越高, 平均误差反映总体估计误差的大小; 平均绝 对误差反 映样本数据估值的总体误差, 能够评估估算值可能的误差范围: 均方根误差能够 反映利用观测数据的估算灵敏度和极值效应。权 利 要 求 书 2/2 页 3 CN 114004137 A 3

.PDF文档 专利 一种多源气象数据融合与预处理方法

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种多源气象数据融合与预处理方法 第 1 页 专利 一种多源气象数据融合与预处理方法 第 2 页 专利 一种多源气象数据融合与预处理方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:42:32上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。