(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202211063127.9
(22)申请日 2022.08.31
(65)同一申请的已公布的文献号
申请公布号 CN 115145734 A
(43)申请公布日 2022.10.04
(73)专利权人 北京睿企信息科技有限公司
地址 100013 北京市东城区和平里 北街6号
6号楼一层101室
专利权人 日照睿安信息科技有限公司
(72)发明人 赵洲洋 于伟 靳雯 石江枫
王全修
(74)专利代理 机构 北京锺维联合知识产权代理
有限公司 1 1579
专利代理师 安娜(51)Int.Cl.
G06F 9/50(2006.01)
(56)对比文件
CN 110806930 A,2020.02.18
CN 111324471 A,2020.0 6.23
CN 111367642 A,2020.07.0 3
US 11196641 B1,2021.12.07
US 2018181390 A1,2018.0 6.28
审查员 孟子山
(54)发明名称
一种分配GPU的数据处 理系统
(57)摘要
本发明提供了一种分配GPU的数据处理系
统, 通过获取微服务信息集, 其中包括微服务所
需占用GPU存储空间的最小 值以及所需要占用的
CPU存储空间的最小值, 获取到目标GPU列表, 目
标GPU剩余存储空间大于微服务所需占用GPU存
储空间的最小 值, 并且目标GP U所在处理器的CP U
剩余存储空间大于微服务所需占用CPU存储空间
的最小值, 获取目标GP U的调度优先级指数列表,
并选择调度优先级指数列表中最大值对应的GP U
作为将要 运行微服务的GPU, 在获取目标GPU调度
优先级指数列表过程中, 因此, 保证了微服务的
运算速度, 提高了微服务的运行效率, 节省了时
间资源。
权利要求书2页 说明书5页 附图1页
CN 115145734 B
2022.11.25
CN 115145734 B
1.一种分配GPU的数据处理系统, 其特征在于, 所述系统包括: 数据库、 处理器和存储有
计算机程序的存储器, 其中, 所述数据库包括: 初始GPU列表G={G1,……, Gi,……, Gn}, Gi=
(Gi
0, Xi, Ci, Li) , Gi
0为第i个初始GPU的ID, Xi为Gi
0对应的第一空间的大小, Ci为Gi
0对应的第
二空间的大小, Li为Gi
0对应的利用率, i的取值为1到n, n为GPU的数量, 所述第一空间为GPU
的存储空间, 所述第二空间为CPU的存储空间, 当所述计算机程序被处理器执行时, 实现以
下步骤:
S100、 获取目标微服务信息集F0= (X0
min, C0
min) , 其中, F0为目标微服务ID, X0
min为F0对应
的所需要占用第一空间的最小值, C0
min为F0对应的所需要占用第二空间的最小值;
S200、 基于Xi与X0
min, 获取中间GPU列表G ʹ={Gʹ1,……, Gʹe,……, Gʹh}, Gʹe= (Gʹe
0, Xʹe, C
ʹe, Lʹe) , Gʹe
0为第e个中间GPU的ID, X ʹe为Gʹe
0对应的第一空间的大小, C ʹe为Gʹe
0对应的第二
空间的大小, L ʹe为Gʹe
0对应的利用值, e的取值为1到h, h为中间GPU的数量, 所述中间GPU为
满足Xʹe>X0
min条件的初始GPU;
S300、 基于C ʹe与C0
min, 获取目标 GPU列表A={A1,……, Ar,……, As}, Ar= (Ar
0, Xr, Cr, Lr) , Ar
0
为为第r个目标GPU的ID, Xr为Ar
0对应的第一空间的大小, Cr为Ar
0对应的第二 空间的大小, Lr
为Ar
0对应的利用值, r的取值为1到s, s为目标GPU的数量, 所述目标GPU为满足Cr>C0
min条件
的中间GPU;
S400、 根据A和微服务信息集, 获取GUP调度优先级列表R= (R1,……, Rr,……Rs) , Rr为第r
个GPU对应的调度优先级, Rr符合如下 条件:
;
其中, E0
r为Ar的平均利用值, X ʹr为第r个关键第一空间值, C ʹr为第r个关键第二空间值,
X0
max为F0对应的所需要占用第一空间的最大值, C0
max为F0对应的所需要占用第二空间的最
大值, w1为第一权 重, w2为第二权 重, w3为第三权 重;
S500、 遍历R, 从R中获取最大值Rmax对应的目标GPU作为 运行F0的关键GPU。
2.根据权利要求1所述的系统, 其特 征在于, 在S40 0中还包括如下步骤:
S401、 获取Ar对应的目标第一空间值列表X0= (X0
1,……, X0
r,……, X0
s) , X0
r符合如下条
件:
;
其中, Xrg为Ar在预设时间段T0中第g个时间节点第一空间的大小, g的取值为1到z, z为预
设时间段T0中时间节点的数量;
S402、 根据微 服务信息集, 获取 F0对应的对应的所需要占用第一空间的最大值X0
max;
S403、 将X0和X0
max进行对比, 获取关键第一空间值列表X ʹ= (Xʹ1,……, Xʹr,……, Xʹs) , X
ʹr为第r个关键第一空间值, X ʹr=min (X0, X0
max) ;
S404、 获取Ar对应的目标第二空间值列表C0= (C0
1,……, C0
r,……, C0
s) , C0
r符合如下条
件:权 利 要 求 书 1/2 页
2
CN 115145734 B
2;
其中, Crx为Ar在预设时间段T0中第x个时间节点的第二空间的大小, x的取值范 围为1到
q, q为预设时间段T0中时间节点的数量;
S405、 根据微 服务信息集, 获取 F0对应的所需要占用第二空间的最大值C0
max;
S406、 将C0和C0
max进行对比, 获取关键第二空间值列表C ʹ= (Cʹ1,……, Cʹr,……, Cʹs) , C
ʹr为第r个关键第二空间值, C ʹr=min (C0, C0
max) ;
S407、 获取GUP调度优先级指数Lr。
3.根据权利要求1所述的系统, 其特 征在于, w1+w2+w3 =1。
4.根据权利要求3所述的系统, 其特 征在于, w1>w2>w3 。
5.根据权利要求2所述的系统, 其特 征在于, z符合如下 条件:
z=T0/t;
其中, t为第一预设查询时间阈值。
6.根据权利要求2所述的系统, 其特 征在于, q符合如下 条件:
q=T0/tʹ;
其中, t'为第二预设查询时间阈值。
7.根据权利要求6所述的系统, 其特 征在于, t=t ʹ。
8.根据权利要求1所述的系统, 其特 征在于, 在S40 0中, E0
r符合如下 条件:
;
其中, Erg为Ar在预设时间段T0中第g个时间节点的利用值。权 利 要 求 书 2/2 页
3
CN 115145734 B
3
专利 一种分配GPU的数据处理系统
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 13:07:50上传分享