(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211199214.7 (22)申请日 2022.09.29 (71)申请人 浪潮软件集团有限公司 地址 250100 山东省济南市高新区科航路 2877号 (72)发明人 邹彤 赵阳 任鲲鹏 陈原野  (74)专利代理 机构 济南信达专利事务所有限公 司 37100 专利代理师 冯春连 (51)Int.Cl. G06F 9/50(2006.01) G06F 16/242(2019.01) (54)发明名称 一种分布式数据库应用负载画像方法及系 统 (57)摘要 本发明公开一种分布式数据库应用负载画 像方法及系统, 涉及数据库运维技术领域, 其实 现内容包括: 获取并存储分布式数据库中的运行 数据, 根据不同执行SQL语句类型的数目和执行 次数对应用进行动态分类; 针对某个应用, 分析 用户查询的当前时间段和上个时间段环比的语 句增量和数据增量情况, 同时, 根据该应用的执 行信息判断SQL语句健康 状况, 根据SQL语句的健 康状况及在应用中的重要程度判断该应用的健 康状况; 根据应用分类结果、 语句增量和数据增 量情况、 SQL语句在应用中的重要 程度, 量化查询 应用和SQL语句的各种详细信息; 根据量化结果, 展示应用概况、 应用细 节和SQL语句细节。 本发明 可以建立数据库应用画像并监控 数据库, 保证数 据库的健康运行。 权利要求书3页 说明书7页 附图1页 CN 115495245 A 2022.12.20 CN 115495245 A 1.一种分布式数据库应用负载画像方法, 其特 征在于,包括如下步骤: 获取并存储分布式数据库中的运行数据, 所述运行数据包括监控指标、 数据库日志、 应 用信息; 基于获取的运行数据, 根据不同执行SQL语句类型的数目和执行次数对应用进行动态 分类; 随后, 针对某个应用, 分析用户查询的当前时间段和上个时间段环比的语句增量和数 据增量情况, 同时, 根据该应用的执行信息判断SQL语句健康状况, 显示出潜在的不健康SQL 语句, 并根据SQ L语句的健康状况及 在应用中的重要程度判断该应用的健康状况; 根据应用分类结果、 语句增量和数据增量情况、 SQL语句在应用中的重要程度, 量化查 询应用和SQ L语句的各种详细信息; 根据量化结果, 展示应用概况、 应用细节和 SQL语句细节, 其中, 应用概况包括当前监控 的应用信息, 应用细节包括当前某一应用的具体信息, SQ L语句细节包括SQ L的统计信息 。 2.根据权利要求1所述的一种分布式数据库应用负载画像方法, 其特征在于, 所述执行 SQL语句类型包括增、 删、 改、 查; 所述语句增量为应用针对某些特殊场景季度性触发某些查询服务, 导致查询数量变化 或查询种类 变化, 语句增量具体通过SQ L语句的新增数量 来体现; 所述数据增量为应用访问的表数据增量变化, 数据增量具体通过SQL语句执行次数的 变化来体现。 3.根据权利要求2所述的一种分布式数据库应用负载画像方法, 其特征在于, 应用的执 行信息包括执 行时间偏差、 执 行行数偏差、 执 行延时占比、 重试次数, 其中, (a)执行时间偏差指SQL语句每次物理计划的实际执行时间和 SQL语句平均执行时间的 差值, 判断执行时间偏差是否正常的操作如下: 首先计算同一条SQL语句执行物理计划的平 均执行时间mean和标准差str, 由此得到置信区间(mean ‑n*str,mean+n*str), n取 1、 2、 3, 随 后, 查看差值是否在置信区间内, 若在, 则认为执行时间偏差正常, 否则认为执行时间偏差 异常; (b)执行行数偏差指执行SQL语句的物理计划算子实际返回行数和逻辑计划算子预估 行数的差值, 判断执行行数偏差是否正常的操作如下: 取执行行数偏 差的绝对值的倒数, 对 比该倒数与设定参数限值, 若 该倒数大于 设定参数限值, 则认为执行行数偏 差正常, 否则认 为执行行数偏差异常; (c)执行延时占比指contention时间与整体SQL语句执行 时间的比值, 判断执行延时占 比是否正常的操作如下: 对比执行延时占比与设定时间阈值, 若执行延时占比小于设定时 间阈值, 则认为执 行延时占比正常, 否则认为执 行延时占比异常; (d)重试次数指同一SQL语句在应用中的retry次数, 判断重试次数是否正常的操作如 下: 设定阈值, 对比同一SQL语句的retry次数是否超 过设定的阈值, 若未超 过, 则认为该SQL 语句执行重试的次数正常, 否则认为该SQ L语句执行重试的次数异常; 根据SQL语句的执行次数、 平均执行时间、 总执行时间、 平均网络花费时间、 总网络花费 时间、 平均CPU执 行时间、 总CPU执 行时间判定SQ L语句在应用中的重要程度; 根据该应用的执行时间偏差、 执行行数偏差、 执行延时占比、 重试次数判断SQL语句健 康状况, 显示出SQL语句的不健康原因, 并根据SQL语句的不健康原因、 及SQL语句在应用中权 利 要 求 书 1/3 页 2 CN 115495245 A 2的重要程度判断该应用的健康状况。 4.根据权利要求3所述的一种分布式数据库应用负载画像方法, 其特征在于, 量化查询 应用和SQ L语句的各种详细信息包括: 应用总数量、 应用列表、 应用健康状况、 应用类型, 应用的持续时间、 分析时间, SQL语句的执行次数、 平均执行时间、 总执行时间、 平均网络花费时间、 总网络花费时 间、 平均CPU执 行时间、 总CPU执 行时间。 5.根据权利要求4所述的一种分布式数据库应用负载画像方法, 其特征在于, 当前监控 的应用信息包括应用名称、 持续时间、 健康状况、 SQ L总数量、 分析时间、 SQ L类型分布; 当前某一应用的具体信息指的是 该应用的所有SQ L语句执行信息; SQL的统计信息包括SQL语句的健康状况、 执行成功率、 总执行次数、 总执行时间、 平均 执行时间、 平均CPU时间、 平均网络花费时间、 平均服 务延迟。 6.一种分布式数据库应用负载画像系统, 其特 征在于,包括: 自治数据仓库, 用于收集和存储分布式数据库中的运行数据, 所述运行数据包括监控 指标、 数据库日志、 应用信息; 应用分类模块, 用于从 自治数据仓库实时获取运行数据, 并根据不同执行SQL语句类型 的数目和执 行次数对应用进行动态分类; 增量变化模块, 用于从自治数据仓库实时获取运行数据, 并针对某个应用分析用户查 询的当前时间段和上个时间段环比的语句增量和数据增量情况; 语句分析模块, 用于从自治数据仓库实时获取运行数据, 根据该应用的执行信息判断 SQL语句健康状况, 显示出潜在的不健康SQL语句, 并根据SQL语句的健康状况及在应用中的 重要程度判断该应用的健康状况; 定量总结模块, 根据应用分类结果、 语句增量和数据增量情况、 SQL语句在应用中的重 要程度, 量 化查询应用和SQ L语句的各种详细信息, 并发送至展示模块; 展示模块, 用于展示应用概况、 应用细节和 SQL语句细节, 其中, 应用概况包括当前监控 的应用信息, 应用细节包括当前某一应用的具体信息, SQ L语句细节包括SQ L的统计信息 。 7.根据权利要求6所述的一种分布式数据库应用负载画像系统, 其特征在于, 所述执行 SQL语句类型包括增、 删、 改、 查; 所述语句增量为应用针对某些特殊场景季度性触发某些查询服务, 导致查询数量变化 或查询种类 变化, 语句增量具体通过SQ L语句的新增数量 来体现; 所述数据增量为应用访问的表数据增量变化, 数据增量具体通过SQL语句执行次数的 变化来体现。 8.根据权利要求7所述的一种分布式数据库应用负载画像系统, 其特征在于, 应用的执 行信息包括执 行时间偏差、 执 行行数偏差、 执 行延时占比、 重试次数, 其中, (a)执行时间偏差指SQL语句每次物理计划的实际执行时间和 SQL语句平均执行时间的 差值, 判断执行时间偏差是否正常的操作如下: 首先计算同一条SQL语句执行物理计划的平 均执行时间mean和标准差str, 由此得到置信区间(mean ‑n*str,mean+n*str), n取 1、 2、 3, 随 后, 查看差值是否在置信区间内, 若在, 则认为执行时间偏差正常, 否则认为执行时间偏差 异常;权 利 要 求 书 2/3 页 3 CN 115495245 A 3

.PDF文档 专利 一种分布式数据库应用负载画像方法及系统

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种分布式数据库应用负载画像方法及系统 第 1 页 专利 一种分布式数据库应用负载画像方法及系统 第 2 页 专利 一种分布式数据库应用负载画像方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:07:47上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。