金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211253685.1 (22)申请日 2022.10.13 (71)申请人 广东电网有限责任公司 地址 510062 广东省广州市越秀区东 风东 路757号 (72)发明人 彭泽武 冯歆尧 梁子键 陈禹旭  谢瀚阳 梁盈威 苏华权 朱泰鹏  潘定  (74)专利代理 机构 广州市华学知识产权代理有 限公司 4 4245 专利代理师 郑秋松 (51)Int.Cl. G06F 16/28(2019.01) G06F 16/22(2019.01) G06N 7/00(2006.01)G06Q 50/06(2012.01) (54)发明名称 一种基于电网DV数据仓库 的自动生成多维 模型方法 (57)摘要 本发明公开了一种基于电网DV数据仓库 的 自动生成多维模型方法, 该方法包括下述步骤: 构建电网DV数据仓库, 电网DV数据仓库模型包括 DV数据仓库模型和多维模型, DV数据仓库模型包 括中心点表、 链接表、 附属表三种类型表, 多维模 型由事实表和维度表及其层次结构组成; 通过遍 历链接表相关中心点表, 生 成事实表属性和维度 表属性及其 关系; 结合链接表中业务实体间的函 数依赖, 利用附属表数据验证业务实体中属性间 的依赖关系, 抽取实体中隐含的函数依赖关系; 利用函数依赖关系, 基于多维模 型候选表构造和 优化多维模型候选; 遍历多维模型候选表, 输出 多维模型。 本发明能够在数据和模式两个层面, 利用数据语义置信度方法, 借助电网模型的命名 规则等特点, 约 简和生成多维模型, 最终高效、 高 质量地生成DV数据仓库的多维模型。 权利要求书3页 说明书15页 附图7页 CN 115544178 A 2022.12.30 CN 115544178 A 1.一种基于电网DV数据仓库的自动生成多维模型 方法, 其特 征在于, 包括下述 步骤: 构建电网DV数据仓库, 采用中心点表、 链接表、 附属表分别存储电网业务实体、 关系及 其属性数据; 建立函数依赖候选表、 多维模型候选表和附属表数据语义置信度计算表; 选取电网DV数据仓库中的链接表, 遍历链接表相关中心点, 查找事实表属性和维度表 属性及其函数依赖 关系, 并将属性标识及其函数依赖关系分别存入多维模 型候选表和函数 依赖候选表; 选取电网DV数据仓库中的中心点附属表, 在附属 表数据语义置信度计算表存入附属表 数据, 并按规则生成附属表的全部函数依赖候选表达式, 利用附属表数据计算每个函数依 赖候选的置信度; 对附属表数据语义置信度计算表中的数据构建贝叶斯网络结构, 得到节点间的依赖关 系, 检测附属表数据语义置信度计算表数据对函数依赖候选的成立模式, 对函数依赖候选 表中附属表的函数依赖候选, 基于附属表数据语义置信度计算表逐条记录计算其数据置信 度; 基于多维模型候选表构造和优化多维模型候选; 遍历多维模型候选表, 输出多维模型。 2.根据权利要求1所述的基于电网DV数据仓库的自动生成多维模型方法, 其特征在于, 函数依赖候选表表示为: Cand ‑FD(FD_id, T_id, FD_Le ft, FD_Right, Conf ‑FD), 其中, FD_id 表示函数依赖表达式的标识, T_id表 示函数依赖所属的表标识, FD_Left表 示函数依赖表达 式的左部, FD_Right 表示函数依赖表达式的右部, Co nf‑FD表示函数依赖的数据置信度; 多维模型候选表表示为: Cand ‑MD(MD_id, T_id, Attr, P ‑node), 其中, MD_id表示多维模 型的标识, T_id表示事实表或维度表标识, Attr表示属性标识, P ‑node表示Attr的父节点属 性标识; 附属表数据语义置信度计算表表示为: Conf ‑DS(ST_id, Attr1,…, Attrn, Conf‑ST, Incon), 其中ST_id是附属表主键, Attri表示附属表的第i个属性, Conf ‑ST表示该记录对某 函数依赖的数据置信度, I ncon表示该记录与某函数依赖不 一致标志。 3.根据权利要求2所述的基于电网DV数据仓库的自动生成多维模型方法, 其特征在于, 将链接表中包含的中心 点之间的函数依赖 关系及其候选置信度, 按照函数依赖候选表达式 标识、 所属表标识以及表达式序对<业务键i, 业务键j>和超过数据语义置信度阈值的数据 置信度分别写入函数依赖候选表的标识FD_id、 函数依赖所属的表标识T_id、 函数依赖表达 式的左部FD_Left、 函数依赖表达式的右部FD_Right和函数依赖的数据置信度Co nf‑FD。 4.根据权利要求1所述的基于电网DV数据仓库的自动生成多维模型方法, 其特征在于, 选取电网DV数据仓库中的链接表, 遍历链接表相关中心点, 查找事实表属 性和维度表属性 及其函数依赖 关系, 并将属性标识及其函数依赖关系分别存入多维模型候选表和函数依赖 候选表, 具体步骤 包括: 将链接表 节点及其附属表属性存 入多维模型候选表; 将链接表 节点与其附属表属性的函数依赖关系存 入函数依赖候选表; 若判定DV模型中该链接表有连接中心点还未遍历, 则遍历链接表相关的中心点节点; 将中心点 业务键存入多维模型候选表;权 利 要 求 书 1/3 页 2 CN 115544178 A 2将链接表与该业 务键的函数依赖关系存 入函数依赖候选表; 若判定当前中心点尚未遍历, 则进入遍历中心点的所有附属; 直至遍历当前链接表所有中心点, 以及遍历 DV模型中所有链接表。 5.根据权利要求1所述的基于电网DV数据仓库的自动生成多维模型方法, 其特征在于, 对附属表数据语义置信度计算表中的数据构建贝叶斯网络结构, 得到节点间的依赖关系, 具体步骤 包括: 将数据语义置信度计算表的每个属性作为一个节点, 计算节点之间的信 息增益得到节 点间的相关性, 计算每个节点值域的大小, 值域大的作为父节点, 排序后获得贝叶斯网络结 构, 得到节点间的依赖关系。 6.根据权利要求1所述的基于电网DV数据仓库的自动生成多维模型方法, 其特征在于, 检测附属表数据语义置信度计算表数据对函数依赖候选的成立模式, 具体步骤 包括: 对函数依赖候选表中该附属 表的一个函数依赖候选, 若在附属 表数据语义置信度计算 表中的对应两个属 性上, 存在满足其函数依赖候选表达式的记录, 则函数依赖候选表达式 的左部值与函数依赖候选表达式的右部值的记录组成当前函数依赖的成立模式; 对数据语义置信度计算表中符合成立模式的记录, 设置并更新相应标志。 7.根据权利要求1所述的基于电网DV数据仓库的自动生成多维模型方法, 其特征在于, 对函数依赖候选表中附属表的函数依赖候选, 基于附属表数据语义置信度计算表逐条记录 计算其数据置信度, 具体步骤 包括: 根据贝叶斯网络 中节点和父节点关系, 计算各属性实例值a出现的次数, 计算出条件概 率: 计算附属表数据语义置信度计算表中每个记录的各个属性实例值a的数据置信度, 具 体表示为: 进行归一 化处理, 表示为: 计算附属表数据语义置信度计算表记录的数据置信度, 并写入附属 表数据语义置信度 计算表对应的属性, 直至全部记录计算完成, 数据置信度的计算公式具体表示 为: Conf‑ST=min(Conf_Attri'(a), a∈FD_left ∪FD_right) 其中, Conf ‑ST表示附属表数据语义置信度计算表中记录对某函数依赖的数据置信度, FD_left表示函数依赖表达式的左部, FD_Right 表示函数依赖表达式的右部 。 8.根据权利要求1所述的基于电网DV数据仓库的自动生成多维模型方法, 其特征在于, 在附属表数据语义置信度计算表设置标志, 所述标志用于标记数据记录与函数依赖是否一 致; 对附属表数据语义置信度计算表中符合成立模式的记录, 将对应标志设置为标记值;权 利 要 求 书 2/3 页 3 CN 115544178 A 3

PDF文档 专利 一种基于电网DV数据仓库的自动生成多维模型方法

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于电网DV数据仓库的自动生成多维模型方法 第 1 页 专利 一种基于电网DV数据仓库的自动生成多维模型方法 第 2 页 专利 一种基于电网DV数据仓库的自动生成多维模型方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:59:04上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。