金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210887052.X (22)申请日 2022.07.26 (71)申请人 珠海格力电器股份有限公司 地址 519000 广东省珠海市前山金鸡西路 申请人 珠海联云科技有限公司 (72)发明人 田地 赵化臣  (74)专利代理 机构 北京聿宏知识产权代理有限 公司 11372 专利代理师 钟日红 陈超德 (51)Int.Cl. G06F 16/242(2019.01) G06F 16/25(2019.01) G06F 16/28(2019.01) (54)发明名称 一种数据库处理方法、 系统、 电子设备及存 储介质 (57)摘要 本申请提出一种数据库处理方法、 系统、 电 子设备及存储介质, 属于大数据查询领域, 方法 包括: 接收结构化查询语言SQL并获取所述SQL的 数据库列表和数据信息; 判断所述SQL是否存在 跨数据库操作情况; 若所述SQL存在跨数据库操 作, 基于所述SQL的数据库列表选择ETL工具, 基 于所述SQL的数据信息选择执行引擎; 用所选择 的ETL工具将所述SQL翻译为对应所述执行引擎 的执行计划; 基于所述执行计划执行任务并反馈 执行情况。 系统包括: SQL接收模块、 跨库判断模 块、 跨库选 择模块、 SQL翻译模块、 执行反馈模块。 本申请将各种数据处理工作仅通过标准SQL查询 语句完成对任务执行的解析, 屏蔽底层执行引擎 的差异。 权利要求书1页 说明书8页 附图3页 CN 115292348 A 2022.11.04 CN 115292348 A 1.一种数据库处 理方法, 其特 征在于, 包括如下步骤: 接收结构化 查询语言SQ L并获取所述SQL的数据库 列表和数据信息; 判断所述SQ L是否存在跨数据库操作情况; 若所述SQL存在跨数据库操作, 基于所述SQL的数据库列表选择ETL工具, 基于所述SQL 的数据信息 选择执行引擎; 采用所选择的ETL工具将所述SQ L翻译为对应所述执 行引擎的执 行计划; 基于所述执 行计划执 行任务并反馈执 行情况。 2.根据权利要求1所述的数据库处理方法, 其特征在于, 所述数据信 息包括数据源和数 据目的的种类中的至少一种。 3.根据权利要求1所述的数据库处理方法, 其特征在于, 所述判断所述SQL是否存在跨 数据库操作情况包括: 获取所述SQL的类型, 若所述SQ L的类型为插 入, 判断所述SQ L是否存在跨数据库插 入。 4.根据权利要求1所述的数据库处理方法, 其特征在于, 所述基于所述SQL的数据信息 选择执行引擎的步骤包括: 判断当前资源是否充足; 若当前资源充足, 则根据第一规则选择 执行引擎; 否则, 根据第二 规则选择 执行引擎。 5.根据权利要求4所述的数据库处理方法, 其特征在于, 所述第 一规则为历史成功率最 高或者历史执 行速度最快; 所述第二 规则为相应资源占用最少规则。 6.根据权利要求1所述的数据库处理方法, 其特征在于, 还包括: 若所述SQL不存在跨数 据库查询, 将所述SQ L翻译为符合对应数据库语法的SQ L。 7.根据权利要求1所述的数据库处理方法, 其特征在于, 在所述基于所述执行计划执行 任务并反馈执行情况之后, 还包括如下步骤: 记录所述SQL执行情况和所述SQL涉及的数据 库表的血缘关系。 8.一种数据库处理系统, 其特征在于, 包括: SQL接收模块、 跨库判断模块、 跨库选择模 块、 SQL翻译模块、 执 行反馈模块; 所述SQL接收模块、 跨库判断模块、 跨库选择模块、 SQL翻译模块、 执行反馈模块依次顺 序相连接; 所述SQL接收模块用于接收结构化查询语言SQL并获取所述SQL的数据库列表和数据信 息; 所述跨库判断模块用于判断所述SQ L是否存在跨数据库操作情况; 所述跨库选择模块用于若所述SQL存在跨数据库操作, 基于所述SQL的数据库列表选择 ETL工具, 基于所述SQ L的数据信息 选择执行引擎; 所述SQL翻译模块用于采用所选择的ETL工具将所述SQL翻 译为对应所述执行引擎的执 行计划; 所述执行反馈模块用于基于所述执 行计划执 行任务并反馈执 行情况。 9.一种电子设备, 其特征在于, 包括: 一个或多个处理器, 以及存储器, 所述存储器存储 指令, 当所述指令被所述一个或多个处理器执行时, 使得所述一个或多个处理器执行上述 权利要求1~7中任意 一项所述的数据库处 理方法。 10.一种存储介质, 其特征在于, 其存储有可执行指令, 所述指令当被执行时使得机器 执行上述权利要求1~7中任意 一项所述的数据库处 理方法。权 利 要 求 书 1/1 页 2 CN 115292348 A 2一种数据库处理 方法、 系统、 电子 设备及存储介质 技术领域 [0001]本申请属于大数据查询领域, 具体涉及一种数据库处理方法、 系统、 电子设备及存 储介质。 背景技术 [0002]在当前数据爆发增长的时代, 怎样合理利用大数据变得至关重要。 于是, 越来越多 的数据存 储方案和数据查询引擎便因此而生, 以应对各种不同场景 下的数据使用需求。 [0003]数据仓库工作, 也就是将各种各样来源的数据统一组织和使用的工作。 数据仓库 工作大部分都属于ETL工作, 即对数据的抽取、 清洗转换及存储。 在同一数据库内部通常都 是直接使用SQL来进 行数据仓库工作的, 可是对于某些跨数据库的数据仓库工作, 通常无法 使用SQL, 而要使用某些工具如Kettle、 Sqoop等。 这些工具不能使用SQL, 用法都要单独学 习, 具有较高的使用成本 。 [0004]现有技术中, 通过输入数据库信息, 提交SQL查询语句, 校验白名单, 返回结果集。 该方案可以不使用堡垒机, 统一校验白名单来提交SQL查询语句。 但是该方案 没有涉及到多 种执行方案的自动选择, 缺少数据 链路监控, 也不涉及到数据血缘追踪, 所以无法适应大数 据场景的数据仓库工作。 [0005]现有技术中存在的问题如下: 在跨数据库类型的ETL工作中, 无法使用SQL来进行 数据处理的工作; 在数据处理中, 很多情况下不同的工具能达到相同的效果, 而开 发人员一 般是选择自己最熟悉的方式, 这有 可能导致资源使用的不均衡; 不同的数据库、 数据工具有 不同的入口, 这对元 数据的管理和作业的统计和资源的管控都会造成困难。 发明内容 [0006]基于以上技术问题, 本申请提出一种数据库处理方法、 系统、 电子设备及存储介 质。 [0007]第一方面, 本申请提出一种数据库处 理方法, 包括如下步骤: [0008]接收结构化 查询语言SQ L并获取所述SQL的数据库 列表和数据信息; [0009]判断所述SQ L是否存在跨数据库操作情况; [0010]若所述SQL存在跨数据库操作, 基于所述SQL的数据库列表选择ETL工具, 基于所述 SQL的数据信息 选择执行引擎; [0011]采用所选择的ETL工具将所述SQ L翻译为对应所述执 行引擎的执 行计划; [0012]基于所述执 行计划执 行任务并反馈执 行情况。 [0013]所述数据信息包括数据源和数据目的 的种类中的至少一种。 [0014]所述判断所述SQ L是否存在跨数据库操作情况包括: [0015]获取所述SQL的类型, 若所述SQ L的类型为插 入, 判断是否存在跨数据库插 入。 [0016]所述基于所述SQL的数据信息选择执行引擎的步骤包括: 判断当前资源是否充足; 若当前资源充足, 则根据第一 规则选择 执行引擎; 否则, 根据第二 规则选择 执行引擎。说 明 书 1/8 页 3 CN 115292348 A 3

PDF文档 专利 一种数据库处理方法、系统、电子设备及存储介质

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据库处理方法、系统、电子设备及存储介质 第 1 页 专利 一种数据库处理方法、系统、电子设备及存储介质 第 2 页 专利 一种数据库处理方法、系统、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 01:01:58上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。