(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211199214.7
(22)申请日 2022.09.29
(71)申请人 浪潮软件集团有限公司
地址 250100 山东省济南市高新区科航路
2877号
(72)发明人 邹彤 赵阳 任鲲鹏 陈原野
(74)专利代理 机构 济南信达专利事务所有限公
司 37100
专利代理师 冯春连
(51)Int.Cl.
G06F 9/50(2006.01)
G06F 16/242(2019.01)
(54)发明名称
一种分布式数据库应用负载画像方法及系
统
(57)摘要
本发明公开一种分布式数据库应用负载画
像方法及系统, 涉及数据库运维技术领域, 其实
现内容包括: 获取并存储分布式数据库中的运行
数据, 根据不同执行SQL语句类型的数目和执行
次数对应用进行动态分类; 针对某个应用, 分析
用户查询的当前时间段和上个时间段环比的语
句增量和数据增量情况, 同时, 根据该应用的执
行信息判断SQL语句健康 状况, 根据SQL语句的健
康状况及在应用中的重要程度判断该应用的健
康状况; 根据应用分类结果、 语句增量和数据增
量情况、 SQL语句在应用中的重要 程度, 量化查询
应用和SQL语句的各种详细信息; 根据量化结果,
展示应用概况、 应用细 节和SQL语句细节。 本发明
可以建立数据库应用画像并监控 数据库, 保证数
据库的健康运行。
权利要求书3页 说明书7页 附图1页
CN 115495245 A
2022.12.20
CN 115495245 A
1.一种分布式数据库应用负载画像方法, 其特 征在于,包括如下步骤:
获取并存储分布式数据库中的运行数据, 所述运行数据包括监控指标、 数据库日志、 应
用信息;
基于获取的运行数据, 根据不同执行SQL语句类型的数目和执行次数对应用进行动态
分类;
随后, 针对某个应用, 分析用户查询的当前时间段和上个时间段环比的语句增量和数
据增量情况, 同时, 根据该应用的执行信息判断SQL语句健康状况, 显示出潜在的不健康SQL
语句, 并根据SQ L语句的健康状况及 在应用中的重要程度判断该应用的健康状况;
根据应用分类结果、 语句增量和数据增量情况、 SQL语句在应用中的重要程度, 量化查
询应用和SQ L语句的各种详细信息;
根据量化结果, 展示应用概况、 应用细节和 SQL语句细节, 其中, 应用概况包括当前监控
的应用信息, 应用细节包括当前某一应用的具体信息, SQ L语句细节包括SQ L的统计信息 。
2.根据权利要求1所述的一种分布式数据库应用负载画像方法, 其特征在于, 所述执行
SQL语句类型包括增、 删、 改、 查;
所述语句增量为应用针对某些特殊场景季度性触发某些查询服务, 导致查询数量变化
或查询种类 变化, 语句增量具体通过SQ L语句的新增数量 来体现;
所述数据增量为应用访问的表数据增量变化, 数据增量具体通过SQL语句执行次数的
变化来体现。
3.根据权利要求2所述的一种分布式数据库应用负载画像方法, 其特征在于, 应用的执
行信息包括执 行时间偏差、 执 行行数偏差、 执 行延时占比、 重试次数, 其中,
(a)执行时间偏差指SQL语句每次物理计划的实际执行时间和 SQL语句平均执行时间的
差值, 判断执行时间偏差是否正常的操作如下: 首先计算同一条SQL语句执行物理计划的平
均执行时间mean和标准差str, 由此得到置信区间(mean ‑n*str,mean+n*str), n取 1、 2、 3, 随
后, 查看差值是否在置信区间内, 若在, 则认为执行时间偏差正常, 否则认为执行时间偏差
异常;
(b)执行行数偏差指执行SQL语句的物理计划算子实际返回行数和逻辑计划算子预估
行数的差值, 判断执行行数偏差是否正常的操作如下: 取执行行数偏 差的绝对值的倒数, 对
比该倒数与设定参数限值, 若 该倒数大于 设定参数限值, 则认为执行行数偏 差正常, 否则认
为执行行数偏差异常;
(c)执行延时占比指contention时间与整体SQL语句执行 时间的比值, 判断执行延时占
比是否正常的操作如下: 对比执行延时占比与设定时间阈值, 若执行延时占比小于设定时
间阈值, 则认为执 行延时占比正常, 否则认为执 行延时占比异常;
(d)重试次数指同一SQL语句在应用中的retry次数, 判断重试次数是否正常的操作如
下: 设定阈值, 对比同一SQL语句的retry次数是否超 过设定的阈值, 若未超 过, 则认为该SQL
语句执行重试的次数正常, 否则认为该SQ L语句执行重试的次数异常;
根据SQL语句的执行次数、 平均执行时间、 总执行时间、 平均网络花费时间、 总网络花费
时间、 平均CPU执 行时间、 总CPU执 行时间判定SQ L语句在应用中的重要程度;
根据该应用的执行时间偏差、 执行行数偏差、 执行延时占比、 重试次数判断SQL语句健
康状况, 显示出SQL语句的不健康原因, 并根据SQL语句的不健康原因、 及SQL语句在应用中权 利 要 求 书 1/3 页
2
CN 115495245 A
2的重要程度判断该应用的健康状况。
4.根据权利要求3所述的一种分布式数据库应用负载画像方法, 其特征在于, 量化查询
应用和SQ L语句的各种详细信息包括:
应用总数量、 应用列表、 应用健康状况、 应用类型,
应用的持续时间、 分析时间,
SQL语句的执行次数、 平均执行时间、 总执行时间、 平均网络花费时间、 总网络花费时
间、 平均CPU执 行时间、 总CPU执 行时间。
5.根据权利要求4所述的一种分布式数据库应用负载画像方法, 其特征在于, 当前监控
的应用信息包括应用名称、 持续时间、 健康状况、 SQ L总数量、 分析时间、 SQ L类型分布;
当前某一应用的具体信息指的是 该应用的所有SQ L语句执行信息;
SQL的统计信息包括SQL语句的健康状况、 执行成功率、 总执行次数、 总执行时间、 平均
执行时间、 平均CPU时间、 平均网络花费时间、 平均服 务延迟。
6.一种分布式数据库应用负载画像系统, 其特 征在于,包括:
自治数据仓库, 用于收集和存储分布式数据库中的运行数据, 所述运行数据包括监控
指标、 数据库日志、 应用信息;
应用分类模块, 用于从 自治数据仓库实时获取运行数据, 并根据不同执行SQL语句类型
的数目和执 行次数对应用进行动态分类;
增量变化模块, 用于从自治数据仓库实时获取运行数据, 并针对某个应用分析用户查
询的当前时间段和上个时间段环比的语句增量和数据增量情况;
语句分析模块, 用于从自治数据仓库实时获取运行数据, 根据该应用的执行信息判断
SQL语句健康状况, 显示出潜在的不健康SQL语句, 并根据SQL语句的健康状况及在应用中的
重要程度判断该应用的健康状况;
定量总结模块, 根据应用分类结果、 语句增量和数据增量情况、 SQL语句在应用中的重
要程度, 量 化查询应用和SQ L语句的各种详细信息, 并发送至展示模块;
展示模块, 用于展示应用概况、 应用细节和 SQL语句细节, 其中, 应用概况包括当前监控
的应用信息, 应用细节包括当前某一应用的具体信息, SQ L语句细节包括SQ L的统计信息 。
7.根据权利要求6所述的一种分布式数据库应用负载画像系统, 其特征在于, 所述执行
SQL语句类型包括增、 删、 改、 查;
所述语句增量为应用针对某些特殊场景季度性触发某些查询服务, 导致查询数量变化
或查询种类 变化, 语句增量具体通过SQ L语句的新增数量 来体现;
所述数据增量为应用访问的表数据增量变化, 数据增量具体通过SQL语句执行次数的
变化来体现。
8.根据权利要求7所述的一种分布式数据库应用负载画像系统, 其特征在于, 应用的执
行信息包括执 行时间偏差、 执 行行数偏差、 执 行延时占比、 重试次数, 其中,
(a)执行时间偏差指SQL语句每次物理计划的实际执行时间和 SQL语句平均执行时间的
差值, 判断执行时间偏差是否正常的操作如下: 首先计算同一条SQL语句执行物理计划的平
均执行时间mean和标准差str, 由此得到置信区间(mean ‑n*str,mean+n*str), n取 1、 2、 3, 随
后, 查看差值是否在置信区间内, 若在, 则认为执行时间偏差正常, 否则认为执行时间偏差
异常;权 利 要 求 书 2/3 页
3
CN 115495245 A
3
专利 一种分布式数据库应用负载画像方法及系统
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 13:07:47上传分享