(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111104941.6
(22)申请日 2021.09.2 2
(71)申请人 国网河北省电力有限公司
地址 050021 河北省石家庄市裕华区富强
大街32号
申请人 国电南瑞南京控制系统有限公司
国家电网有限公司
(72)发明人 杨立波 马斌 王亚军 孔祥玉
徐俊杰 周超 袁健 王硕
(74)专利代理 机构 天津盛理知识产权代理有限
公司 12209
代理人 董一宁
(51)Int.Cl.
G06F 30/27(2020.01)
G06F 16/25(2019.01)G06F 119/02(2020.01)
(54)发明名称
一种多源气象数据融合与预处 理方法
(57)摘要
本发明涉及一种多源气象数据融合与预处
理方法, 基于三层次融合结构, 具体包括数据层、
特征层和决策层, 逐层提取特定的有用的信息,
具体步骤为: (1)对不良数据进行检测, 找出含有
可疑数据的量测点, 辨识出全部不良数据; (2)气
象数据清洗与还原, 删除重复信息, 纠正错误信
息; (3)气象数据还原, 采用修复算法; (4)对气象
数据的修复精度进行验证计算。 本方法基于现有
气象监测站 群网系统, 提出规范化数据库建模 方
案; 在此基础上, 形成新能源场站气象数据规范,
构建新能源场站气象监测数据特征库通过ET L技
术, 将多源气象数据统一提取到数据库中, 以实
现多源数据融合, 并通过有效的数据清洗以提高
数据质量, 使新能源功率预测结果更加精确。
权利要求书2页 说明书16页 附图2页
CN 114004137 A
2022.02.01
CN 114004137 A
1.一种多源气象数据融合与 预处理方法, 其特征在于: 基于三层次融合结构, 具体包括
数据层、 特 征层和决策层, 逐层提取 特定的有用的信息, 具体步骤为:
(1)对不良数据进行检测, 找出含有可疑数据的量测点, 辨识出全部不良数据;
(2)气象数据清洗与还原, 删除重复信息, 纠正 错误信息, 并还原数据一 致性;
(3)气象数据还原, 采用修复算法;
(4)对气象数据的修复精度进行验证 计算。
2.根据权利要求1所述的多源气象数据融合与预处理方法, 其特征在于: 数据层的数据
融合方法采用聚类分析法, 特征层的数据融合方法采用卡尔曼滤波法, 决策层的数据融合
方法采用贝叶斯估计法。
3.根据权利要求1所述的多源气象数据融合与预处理方法, 其特征在于: 所述步骤(3)
采用的修复算法, 具体包括:
①气象要素 数据相似性 修复;
②气象要素 数据的空间修复和时间修复
③气象要素 数据混合 修复。
4.根据权利要求3所述的多源气象数据融合与预处理方法, 其特征在于: 所述 ①气象要
素数据相似性修复, 是通过构建气象相似性网络时计算节点的气象要 素时间序列之 间的相
似性得到的节点之间的相似性 来修复缺失数据, 用下面的公式表示:
其中, XS(i,j)为气象观测站点i在时间序列上第j个时间缺失值的估值, 这里使用的估
值方法为相似性修复; Si,p为气象观测站点i与站点p的之间的相似性; XS(p,j)为气象观测
站点p在时间序列上第 j个时间的实际值; Ω为给定的气象观测站 点范围, 选择除了站 点i以
外的全部站点, 或只选择与站点 i相似性比较高的部分站点。
5.根据权利要求3所述的多源气象数据融合与预处理方法, 其特征在于: 所述 ②气象要
素数据的空间修复和时间修复, 是整合空间修复和时间修复的时空修复约减法把时间作为
一个单独的维, 不考虑空间上的其它气象站点, 对每个气象要 素时间序列进行时间修复, 得
到缺失数据的第一次修复值, 这样得到用时间修复值修复完整的所有气象站 点的气象要 素
时间序列, 再对每个缺失数据考虑空间上其它站点同一时间的气象要素观测 值, 使用包含
第一次修复值的空间修复方法进行二次修复, 这样在第二次修复时, 每个缺失值都可以使
用所有空间距离近的站点观测值参与修复, 而不用剔除空间距离近却同样缺失的站点, 减
小误差; 根据目前的站 点数量和分布的实际情况, 对气象要 素观测时间序列修复时, 先使用
空间修复方法对缺 失数据进行修复, 得到第一次修复值, 再对每个缺失数据考虑时间修复,
使用包含第一次修复值的时间修复方法对缺失数据进行二次修复。
6.根据权利要求3所述的多源气象数据融合与预处理方法, 其特征在于: 所述 ③气象要
素数据混合修复, 是综合考虑时间修复、 空间修复和相似性修复以提高缺失数据修复的精
确度, 用混合 修复拟合方程计算, 公式表示:
X(i,j)=aXD(i,j)+bXT(i,j)+cXS(i,j)+d (39)权 利 要 求 书 1/2 页
2
CN 114004137 A
2其中, X(i,j)为气象观测站点i在时间j的估值; XD(i,j)为气象观测 站点i在时间j的空
间估值, 空间修复方法使用反距离加权法XT(i,j)为气象观测站点i在时间j的时间估值; XS
(i,j)为气象观测站点i在时间j 的相似性估值; a、 b和c分别为空间、 时间和相似性估值系
数; d为常数项。
7.根据权利要求6所述的多源气象数据融合与预处理方法, 其特征在于: 气象要素数据
混合修复需要确定混合修复拟合方程的系数, 用气象观测站 点的实际值、 空间修复估值、 相
似性修复估值和时间修复估值进 行多元线性回归分析, 使用最小二乘法求解方程的最佳拟
合系数。
8.根据权利要求1所述的多源气象数据融合与预处理方法, 其特征在于: 所述步骤(4)
数据的修复精度进行验证计算的方法是, 从数据源中选取一个完整的数据集, 或者将数据
源中包含的缺失数据的行和列都删除, 人为的得到完整的数据集, 然后采用Holdout验证的
方法来验证修复方法的修复精确度,
Holdout验证方法把数据集分为两个子集, 先选择一些子集做分析, 其余的子集用来对
已选择子集的分析 结果进行验证, 用来做分析的子集 为训练集, 用来验证的子集 为验证集,
把一组气象观测站点的某个气象要素时间序列组成一个数据集, 选定一个缺失率, 对
数据集中的数据随机标记缺失, 然后使用未缺失的数据来修复缺失的数据, 最后通过计算
缺失气象站 点气象要 素的实际测量值与估算值的误差来评估修复方法的精确度, 采用平均
绝对误差和均方根误差来衡量修复方法的精确度, 平均绝对误差和均方根误差的表达式分
别为公式:
其中, Xoi为第i个观测站点的实际测量值, Xei为第i个站点的修复估算值, n为用于参与
验证的观测站点的数量;
这两个值越接近0, 修复的精确度就越高, 平均误差反映总体估计误差的大小; 平均绝
对误差反 映样本数据估值的总体误差, 能够评估估算值可能的误差范围: 均方根误差能够
反映利用观测数据的估算灵敏度和极值效应。权 利 要 求 书 2/2 页
3
CN 114004137 A
3
专利 一种多源气象数据融合与预处理方法
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 21:42:32上传分享