(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211273644.9
(22)申请日 2022.10.08
(71)申请人 国网江苏省电力有限公司营销服 务
中心
地址 210019 江苏省南京市 建邺区奥体大
街9号
(72)发明人 康雨萌 钱旭盛 俞阳 何玮
李雅超
(74)专利代理 机构 北京智绘未来专利代理事务
所(普通合伙) 11689
专利代理师 王萍
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 40/30(2020.01)
G06Q 50/06(2012.01)
(54)发明名称
一种基于深度序列模型的电力营销知识补
全方法及系统
(57)摘要
一种基于深度序列模型的电力营销知识补
全方法及系统, 从原始知识图谱中获取三元组作
为训练语料; 采用图向量嵌入技术, 获取三元组
的低维向量表征; 利用知识图谱中三元组特性,
设置序列长度为3来构建语义单元; 添加实体关
系, 用于三元组预测。 本发明意图预测出三元组
中缺失的部分, 对知识图谱进行补全, 提升图谱
可用性以及模型能力。
权利要求书2页 说明书7页 附图2页
CN 115510246 A
2022.12.23
CN 115510246 A
1.一种基于深度 序列模型的电力营销知识补全方法, 其特 征在于, 包括以下步骤:
步骤1, 获取原 始电力知识图谱中的三元组作为训练材 料;
步骤2, 采用图向量嵌入方法, 获取三元组的低维向量表征;
步骤3, 利用知识图谱中三元组的特性, 将序列长度设置为3, 构建语义单 元;
步骤4, 添加实体关系预测用于三元组预测, 来强化下游任务的表征能力, 提升模型整
体能力。
2.根据权利要求1所述的一种基于深度序列模型的电力营销知识补全方法, 其特征在
于:
步骤1中, 营销知识三元组的抽取包括结构化数据抽取和非结构化数据抽取; 所述结构
化数据抽取为定义电力营销知识图谱schema模型结构, 按照schema的格式, 通过图数据库
执行脚本把电力营销的关系型数据转为图数据; 所述 非结构化数据抽取经过编 码层进行编
码, 提取出头实体, 再对头实体编码并 复用文本编码, 重复该操作, 同时预测尾实体与关系。
3.根据权利要求1所述的一种基于深度序列模型的电力营销知识补全方法, 其特征在
于:
步骤1中, 头实体、 尾实体以及关系的预测采用半指针半标注方法。
4.根据权利要求1所述的一种基于深度序列模型的电力营销知识补全方法, 其特征在
于:
步骤2通过图向量嵌入方法对整个电力营销知识图谱进行低维向量表示, 即通过一个
向量表示整个图; 具体地, 步骤2包括:
步骤2.1, 采样并重新标记电力营销知识图谱中的所有子图, 子图是出现在营销知识图
谱中所选的图谱节点周围的一组节点, 在本实施方法中以周围节点深度为3去框定子图范
围;
步骤2.2: 训练上 下文预测模型, 通过最大化输入图子图的概 率的方法进行训练;
上下文预测模型的优化目标对数似然函数定义 为:
其中, ωt‑c,...,ωt+c表示当前词ωt的前后各c个词语; 最终, 可以得到输入图的独 热编
码一维向量表示;
步骤2.3: 模型训练完成后, 提供图的ID得到该图的独热编码向量, 隐藏层就是嵌入结
果。
5.根据权利要求1所述的一种基于深度序列模型的电力营销知识补全方法, 其特征在
于:
步骤4中, 对于知识图谱KG={E,R,T}, 实体三元组(h,r,t)∈T; hs、 ts是通过知识表示学
习模型训练得到的头尾实体结构表示向量, hd、 td为头尾实体描述文本的表示; 则该模型损
失函数可以定义 为:
E=Es+α Ed
其中, Es是基于实体三元组结构通过知识表示模型的损失函数, 而Ed为基于描述文本的
损失函数, 超参数α用来衡量描述文本的信息损失; 其中Ed可以不同的方式进行定义, 为了
保障Es和Ed的学习过程保证同步, 对文本信息损失函数Ed的定义如下:权 利 要 求 书 1/2 页
2
CN 115510246 A
2Ed=fr(hs,td)+fr(hd,ts)+fr(hd,td)
其中:
fr(hs,td), fr(hd,ts)分别表示在头尾实体向量表示中, 分别使用一个文本描述向量来
替换原有的结构表 示向量, fr(hd,td)为将两个实体表 示结构向量都替换为 实体描述文本向
量; 通过将两种实体向量表示在同一向量空间中的计算, 进而使得这两种类型 的实体向量
表示相互影响。
6.一种基于深度序列模型的 电力营销知识补全系统, 运行根据权利要求1 ‑5所述的一
种基于深度序列模型 的电力营销知识补全方法, 包括原始知识图谱获取模块、 三元组低 维
向量表征模块、 语义单 元构建模块、 三元组预测模块; 其特 征在于:
原始知识图谱获取模块对电力营销结构化数据和非结构化数据进行抽取, 获得原始电
力营销知识图谱中的三元组;
三元组低维向量表征模块通过一个向量表示整个图, 图向量嵌入方法借鉴词向量嵌入
的思想使用上 下文预测网络进行训练, 从而获得独热编码低维向量表示;
语义单元构建模块将知识图谱中的三元组按照实体、 属性、 关系等特性进行实 际值的
映射;
三元组映射模块将部分三元组有缺失的部分基于向量投影模型进行实体预测。 通过最
小化目标损失函数, 完成电力营销知识图谱的知识补全。
7.一种终端, 包括处 理器及存 储介质; 其特 征在于:
所述存储介质用于存 储指令;
所述处理器用于根据 所述指令进行操作以执行根据权利要求1 ‑5任一项所述方法的步
骤。
8.计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执行时
实现权利要求1 ‑5任一项所述方法的步骤。权 利 要 求 书 2/2 页
3
CN 115510246 A
3
专利 一种基于深度序列模型的电力营销知识补全方法及系统
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:59:07上传分享