金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210911109.5 (22)申请日 2022.07.29 (71)申请人 苏州思萃人工智能研究所有限公司 地址 215000 江苏省苏州市相城区高铁新 城青龙港路6 0号苏州港口大厦10层 (72)发明人 宋彦 田元贺 李世鹏  (74)专利代理 机构 深圳市智享知识产权代理有 限公司 4 4361 专利代理师 罗芬梅 (51)Int.Cl. G06F 40/30(2020.01) G06F 16/35(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种关系抽取方法、 计算机设备可读存储介 质及程序 产品 (57)摘要 本发明涉及自然语 言处理技术领域, 特别涉 及一种文本中实体 之间关系抽取方法, 包括以下 步骤: 获取输入文本, 并对输入文本进行编码, 输 出输入文本中每个实体的隐向量; 对隐向量通过 预设的第一算法进行计算, 得到第一实体向量表 征与第二实体向量表征; 将第一实体向量表征与 第二实体向量表征进行处理, 得到第一语义增强 表征与第二语义增强表征; 将第一语义增强表征 与第二语义增强表征经过预设的第二算法计算 得到中间向量; 将中间向量进行转换处理, 得到 预测的文本实体 之间的关系类型。 本发明提供的 方法提高了模型对实体关系预测的准确度。 权利要求书2页 说明书7页 附图4页 CN 115270812 A 2022.11.01 CN 115270812 A 1.一种文本中实体之间关系抽取 方法, 其特 征在于: 包括以下步骤: 获取输入文本, 并对所述输入文本进行编码, 得到所述输入文本中每 个实体的隐向量; 对所述隐向量通过预设的第 一算法进行计算, 得到第 一实体向量表征与第 二实体向量 表征; 将所述第一实体向量表征与第 二实体向量表征进行处理, 得到第 一语义增强表征与第 二语义增强表征; 将所述第一语义增强表征与第二语义增强表征经过预设的第二算法计算得到中间向 量; 将所述中间向量进行转换处 理, 得到预测的文本实体之间的关系类型。 2.如权利要求1所述的方法, 其特征在于: 得到所述第 一语义增强表征与第 二语义增强 表征包括以下步骤: 根据预设的预训练词向量库找出 所述输入文本中每 个实体的一个或多个近似实体; 将所述近似实体根据预设的第三算法计算得到所述输入文本中实体的所述第一语义 增强表征与第二语义增强表征。 3.如权利要求1所述的方法, 其特征在于: 将所述第 一语义增强表征与第 二语义增强表 征经过预设的第二 算法计算得到中间向量包括以下步骤: 将所述第一实体向量表征与所述第一语义增强表征串联, 得到第一增强向量表征; 将所述第二实体向量表征与所述第二语义增强表征串联, 得到第二增强向量表征; 将所述第一增强向量表征与第二增强向量表征串联, 得到所述中间向量。 4.如权利要求2所述的方法, 其特征在于: 将所述近似实体根据 预设的第 三算法计算得 到所述输入文本中实体的所述第一语义增强表征与第二语义增强表征: 将所述近似实体通过 预设的词向量矩阵映射 为词向量; 通过第一实体向量表征 (或第二实体向量表征) 与当前实体的一个或多个所述近似实 体的所述词向量计算每 个所述近似实体所占的权 重; 根据所述权重与所述词向量计算得到所述词向量的第 一语义增强表征 (或第 二语义增 强表征) 。 5.如权利要求1所述的方法, 其特 征在于: 所述第一 算法为Max  Pooling算法。 6.如权利要求1所述的方法, 其特征在于: 将所述中间向量进行转换处理得到预测的文 本实体之间的关系类型包 含以下步骤: 将所述中间向量经过预设的全连接层后, 送入预设的SoftMax分类器进行分类, 得到所 述预测的关系类型。 7.如权利要求 4所述的方法, 其特 征在于: 所述权 重通过如下公式计算: 式中,p表示权重, hE表示第一 (或第二) 实体向量表征, e表示词向量, i=1或2,m表示某个 实体的近似实体的个数, 。 8.一种计算机设备, 其特征在于: 包括处理器、 存储器以及存储在所述存储器上的计算权 利 要 求 书 1/2 页 2 CN 115270812 A 2机程序, 所述处 理器执行所述计算机程序以实现如权利要求1所述方法的步骤。 9.一种可读存储介质, 其上存储有计算机程序指令, 其特征在于: 所述计算机程序指令 被执行时实现如权利要求1所述方法的步骤。 10.一种程序产品, 包括计算机程序指令, 其特征在于: 所述计算机程序指令被执行时 实现如权利要求1所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 115270812 A 3

PDF文档 专利 一种关系抽取方法、计算机设备可读存储介质及程序产品

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种关系抽取方法、计算机设备可读存储介质及程序产品 第 1 页 专利 一种关系抽取方法、计算机设备可读存储介质及程序产品 第 2 页 专利 一种关系抽取方法、计算机设备可读存储介质及程序产品 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:25上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。