金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211303472.5 (22)申请日 2022.10.24 (71)申请人 广东电网有限责任公司 地址 510062 广东省广州市越秀区东 风东 路757号 (72)发明人 冯歆尧 梁盈威 范仲恺 王金贺  朱泰鹏 苏华权 潘定  (74)专利代理 机构 广州市华学知识产权代理有 限公司 4 4245 专利代理师 郑秋松 (51)Int.Cl. G06F 16/28(2019.01) G06F 16/25(2019.01) G06F 16/22(2019.01) G06F 40/30(2020.01)G06N 5/02(2006.01) G06Q 50/06(2012.01) (54)发明名称 一种基于本体的电网数据集市自动数据加 载方法 (57)摘要 本发明公开了一种基于本体的电网数据集 市自动数据加载方法, 该方法包括下述步骤: 基 于DV建模 方法构建电网数据仓库; 建立DV不一致 数据检测和修复数据集; 检测中心点及其附属 表, 验证数据依 赖关系及其成立模式; 检测、 计算 数据语义置信度并确定修复值; 构建电网数据集 市; 建立临时维度表、 修复不一致数据并加载维 度表数据; 建立临时事实表、 修复不一致数据并 加载事实表数据。 本发明利用本体知识库、 函数 依赖关系和数据语义置信度计算方法, 在不变更 电网DV数据仓库的情况下, 检测和修复不一致数 据, 实现DV不一致数据的有效管理, 最终达到高 质量地自动加载电网数据集市的目标。 权利要求书4页 说明书16页 附图6页 CN 115544181 A 2022.12.30 CN 115544181 A 1.一种基于 本体的电网数据集市自动数据加载 方法, 其特 征在于, 包括下述 步骤: 构建电网DV数据仓库, 采用中心点、 链接、 附属三类表分别保存电网业务实体、 关系及 其属性数据, 作为 来源表; 构建电网本体知识库, 对多个同类附属表设定标 杆附属表和次要附属表; 构建函数依赖表、 数据语义置信度计算表和函数依赖修复表; 对函数依赖表中选定中心点的若干函数依赖表达式, 查找中心点及其标杆附属表, 对 标杆附属表检测函数依赖的成立模式, 将不符合函数依赖的数据字段输出到数据语义置信 度计算表; 对函数依赖表中选定中心点的函数依赖表达式, 查找对应次要附属表, 对次要附属表 检测函数依赖的成立模式, 将不符合 函数依赖的数据字段输出到数据语义置信度计算表; 对数据语义置信度计算表中的记录检测函数依赖的成立模式, 计算数据语义置信度计 算表中的数据置信度, 并确定修复值, 存 入函数依赖修复表; 基于多维模型构建电网数据集市作为目标表, 多维模型包括事实表和维度表; 对多维模型的维度表加载 数据, 对多维模型的事实表加载 数据。 2.根据权利要求1所述的基于本体的电网数据集市 自动数据加载方法, 其特征在于, 构 建函数依赖表, 具体表示 为: FD‑List(FD_id, T_id, FD ‑Left, FD‑Right, Co nf‑FD) 其中, FD_id表示函数依赖表达式的标识, T_id表示函数依赖所属的中心点表或链接表 标识, FD‑Left表示函数依赖表达式的左部名, FD ‑Right表示函数依赖表达式的右部名, Conf‑FD表示函数依赖的数据置信度; 构建数据语义置信度计算表, 具体表示 为: DS‑Conf(DS_id, FD_id, Sat_id, Bus_key, DTS, FD ‑L, FD‑R, Conf‑L, Conf‑R, Repair) 其中, DS_id表示该表顺序主键, FD_id表示函数依赖表达式的标识, Sat_id表示附属表 标识, Bus_key表示业务键, DTS表示时间戳, FD ‑L表示函数依赖表达式左部值, FD ‑R表示函 数依赖表达式右部值, Conf ‑L表示函数依赖表达式左部的数据置信度, Conf ‑R表示函数依 赖表达式右部的数据置信度, Repair 表示修复值; 构建函数依赖修复表, 具体表示 为: FD‑Repair(RP_id, FD_id, Sat_id, Bus_key, DTS, FD ‑L, FD‑R, Repair), 其中, RP_id表示 该表顺序主键, FD_id表示函数依赖表达式的标识, Sat _id表示附属表标识, Bus_key表示业 务键, DTS表 示时间戳, FD ‑L表示函数依赖表达式左部值, FD ‑R表示函数依赖表达式右部值, Repair表示函数依赖表达式的修复值。 3.根据权利要求1所述的基于本体的电网数据集市 自动数据加载方法, 其特征在于, 对 函数依赖表中选定中心点的若干函数依赖表达式, 查找对应的中心点及其附属表, 对标杆 附属表检测函数依赖的成立模式, 将不符合函数依赖的数据字段输出到数据语义置信度计 算表, 具体步骤 包括: 获取同类附属表; 以标杆附属表为主, 基于电网本体知识库对次要附属表中的字段名进行匹配; 根据字段名匹配结果, 针对附属 表中函数依赖表达 式左部和函数依赖表达 式右部对应 的字段值, 检测全部数据记录是否满足函数依赖表达式;权 利 要 求 书 1/4 页 2 CN 115544181 A 2基于电网本体知识库将标杆附属 表中的最新修改数据判定为满足函数依赖表达 式, 不 输出到数据语义置信度计算表, 将标杆附属表中不符合函数依赖的数据字段输出到数据语 义置信度计算表。 4.根据权利要求1所述的基于本体的电网数据集市 自动数据加载方法, 其特征在于, 对 标杆附属表检测函数依赖的成立模式, 对于存在成立模式值数据的处 理步骤包括: 如果存在一个函数依赖表达式左部值拥有相同函数依赖表达式右部值的记录数量大 于不相同函数依赖表达式右部值的记录数量, 则将该相同函数依赖表达式右部值作为成立 模式值; 将不相同函数依赖表达 式右部值的记录输出到函数依赖修复表, 更新当前函数依赖修 复表对应标识; 对于不存在成立模式值数据的处 理步骤包括: 将全部不符合函数依赖的数据记录, 输出到数据语义置信度计算表, 更新数据语义置 信度计算表对应标识。 5.根据权利要求1所述的基于本体的电网数据集市 自动数据加载方法, 其特征在于, 所 述对函数依赖表中选定中心点的函数依赖表达式, 查找对应次要附属表, 对次要附属表检 测函数依赖的成立模式, 将不符合函数依赖的数据字段输出到数据语义置信度计算表, 具 体步骤包括: 将次要附属表某业务键值与时间戳记录的函数依赖表达式左部值和函数依赖表达式 右部值与标杆附属表中相应记录且符合函数依赖的对应字段值进 行比较, 若在函数依赖表 达式左部值和函数依赖表达式右部值字段上, 次要附属表与标杆附属表的字段值 都是一致 的, 则判定次要附属表 记录符合 函数依赖; 对次要附属 表检测函数依赖的成立模式, 基于电网本体知识库将次要附属 表中的最新 修改数据判定为满足函数依赖表达式, 不输出到数据语义置信度计算表, 将次要附属表中 不符合当前函数依赖的数据记录 输出至数据语义置信度计算表。 6.根据权利要求5所述的基于本体的电网数据集市 自动数据加载方法, 其特征在于, 将 次要附属表某业务键值与时间戳记录的函数依赖表达式左部值和 函数依赖表达式右部值 与标杆附属表中相应记录且符合 函数依赖的对应字段值进行比较; 若在函数依赖表达式左部值字段上, 次要附属表与标杆附属表的字段值是一致的, 但 在函数依赖表达式右部值字段上, 次要附属表与标杆附属表的字段值不一致, 则将标杆附 属表的函数依赖表达式右部字段值作为成立模式值, 并输出到函数依赖修复表, 更新函数 依赖修复表对应标识; 若在函数依赖表达式左部值字段上, 次要附属表与标杆附属表的字段值不一致, 则该 记录输出到数据语义置信度计算表。 7.根据权利要求1所述的基于本体的电网数据集市 自动数据加载方法, 其特征在于, 计 算数据语义置信度计算表中的数据置信度, 并确定修复值, 具体步骤 包括: 利用本体知识库分别确定函数依赖左部、 函数依赖右部的证据属性, 按数据语义置信 度计算表中的附属表标识, 以及函数依赖表达式左部和函数依赖表达式右部的字段名, 在 电网本体知识库中分别查找标杆附属表或次要附属表左部和右部的决定属性, 作为贝叶斯 网络的父节点,权 利 要 求 书 2/4 页 3 CN 115544181 A 3

PDF文档 专利 一种基于本体的电网数据集市自动数据加载方法

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于本体的电网数据集市自动数据加载方法 第 1 页 专利 一种基于本体的电网数据集市自动数据加载方法 第 2 页 专利 一种基于本体的电网数据集市自动数据加载方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:59:01上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。