(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211063127.9 (22)申请日 2022.08.31 (65)同一申请的已公布的文献号 申请公布号 CN 115145734 A (43)申请公布日 2022.10.04 (73)专利权人 北京睿企信息科技有限公司 地址 100013 北京市东城区和平里 北街6号 6号楼一层101室 专利权人 日照睿安信息科技有限公司 (72)发明人 赵洲洋 于伟 靳雯 石江枫  王全修  (74)专利代理 机构 北京锺维联合知识产权代理 有限公司 1 1579 专利代理师 安娜(51)Int.Cl. G06F 9/50(2006.01) (56)对比文件 CN 110806930 A,2020.02.18 CN 111324471 A,2020.0 6.23 CN 111367642 A,2020.07.0 3 US 11196641 B1,2021.12.07 US 2018181390 A1,2018.0 6.28 审查员 孟子山 (54)发明名称 一种分配GPU的数据处 理系统 (57)摘要 本发明提供了一种分配GPU的数据处理系 统, 通过获取微服务信息集, 其中包括微服务所 需占用GPU存储空间的最小 值以及所需要占用的 CPU存储空间的最小值, 获取到目标GPU列表, 目 标GPU剩余存储空间大于微服务所需占用GPU存 储空间的最小 值, 并且目标GP U所在处理器的CP U 剩余存储空间大于微服务所需占用CPU存储空间 的最小值, 获取目标GP U的调度优先级指数列表, 并选择调度优先级指数列表中最大值对应的GP U 作为将要 运行微服务的GPU, 在获取目标GPU调度 优先级指数列表过程中, 因此, 保证了微服务的 运算速度, 提高了微服务的运行效率, 节省了时 间资源。 权利要求书2页 说明书5页 附图1页 CN 115145734 B 2022.11.25 CN 115145734 B 1.一种分配GPU的数据处理系统, 其特征在于, 所述系统包括: 数据库、 处理器和存储有 计算机程序的存储器, 其中, 所述数据库包括: 初始GPU列表G={G1,……, Gi,……, Gn}, Gi= (Gi 0, Xi, Ci, Li) , Gi 0为第i个初始GPU的ID, Xi为Gi 0对应的第一空间的大小, Ci为Gi 0对应的第 二空间的大小, Li为Gi 0对应的利用率, i的取值为1到n, n为GPU的数量, 所述第一空间为GPU 的存储空间, 所述第二空间为CPU的存储空间, 当所述计算机程序被处理器执行时, 实现以 下步骤: S100、 获取目标微服务信息集F0= (X0 min, C0 min) , 其中, F0为目标微服务ID, X0 min为F0对应 的所需要占用第一空间的最小值, C0 min为F0对应的所需要占用第二空间的最小值; S200、 基于Xi与X0 min, 获取中间GPU列表G ʹ={Gʹ1,……, Gʹe,……, Gʹh}, Gʹe= (Gʹe 0, Xʹe, C ʹe, Lʹe) , Gʹe 0为第e个中间GPU的ID, X ʹe为Gʹe 0对应的第一空间的大小, C ʹe为Gʹe 0对应的第二 空间的大小, L ʹe为Gʹe 0对应的利用值, e的取值为1到h, h为中间GPU的数量, 所述中间GPU为 满足Xʹe>X0 min条件的初始GPU; S300、 基于C ʹe与C0 min, 获取目标 GPU列表A={A1,……, Ar,……, As}, Ar= (Ar 0, Xr, Cr, Lr) , Ar 0 为为第r个目标GPU的ID, Xr为Ar 0对应的第一空间的大小, Cr为Ar 0对应的第二 空间的大小, Lr 为Ar 0对应的利用值, r的取值为1到s, s为目标GPU的数量, 所述目标GPU为满足Cr>C0 min条件 的中间GPU; S400、 根据A和微服务信息集, 获取GUP调度优先级列表R= (R1,……, Rr,……Rs) , Rr为第r 个GPU对应的调度优先级, Rr符合如下 条件: ; 其中, E0 r为Ar的平均利用值, X ʹr为第r个关键第一空间值, C ʹr为第r个关键第二空间值, X0 max为F0对应的所需要占用第一空间的最大值, C0 max为F0对应的所需要占用第二空间的最 大值, w1为第一权 重, w2为第二权 重, w3为第三权 重; S500、 遍历R, 从R中获取最大值Rmax对应的目标GPU作为 运行F0的关键GPU。 2.根据权利要求1所述的系统, 其特 征在于, 在S40 0中还包括如下步骤: S401、 获取Ar对应的目标第一空间值列表X0= (X0 1,……, X0 r,……, X0 s) , X0 r符合如下条 件: ; 其中, Xrg为Ar在预设时间段T0中第g个时间节点第一空间的大小, g的取值为1到z, z为预 设时间段T0中时间节点的数量; S402、 根据微 服务信息集, 获取 F0对应的对应的所需要占用第一空间的最大值X0 max; S403、 将X0和X0 max进行对比, 获取关键第一空间值列表X ʹ= (Xʹ1,……, Xʹr,……, Xʹs) , X ʹr为第r个关键第一空间值, X ʹr=min (X0, X0 max) ; S404、 获取Ar对应的目标第二空间值列表C0= (C0 1,……, C0 r,……, C0 s) , C0 r符合如下条 件:权 利 要 求 书 1/2 页 2 CN 115145734 B 2; 其中, Crx为Ar在预设时间段T0中第x个时间节点的第二空间的大小, x的取值范 围为1到 q, q为预设时间段T0中时间节点的数量; S405、 根据微 服务信息集, 获取 F0对应的所需要占用第二空间的最大值C0 max; S406、 将C0和C0 max进行对比, 获取关键第二空间值列表C ʹ= (Cʹ1,……, Cʹr,……, Cʹs) , C ʹr为第r个关键第二空间值, C ʹr=min (C0, C0 max) ; S407、 获取GUP调度优先级指数Lr。 3.根据权利要求1所述的系统, 其特 征在于, w1+w2+w3 =1。 4.根据权利要求3所述的系统, 其特 征在于, w1>w2>w3 。 5.根据权利要求2所述的系统, 其特 征在于, z符合如下 条件: z=T0/t; 其中, t为第一预设查询时间阈值。 6.根据权利要求2所述的系统, 其特 征在于, q符合如下 条件: q=T0/tʹ; 其中, t'为第二预设查询时间阈值。 7.根据权利要求6所述的系统, 其特 征在于, t=t ʹ。 8.根据权利要求1所述的系统, 其特 征在于, 在S40 0中, E0 r符合如下 条件: ; 其中, Erg为Ar在预设时间段T0中第g个时间节点的利用值。权 利 要 求 书 2/2 页 3 CN 115145734 B 3

.PDF文档 专利 一种分配GPU的数据处理系统

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种分配GPU的数据处理系统 第 1 页 专利 一种分配GPU的数据处理系统 第 2 页 专利 一种分配GPU的数据处理系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:07:50上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。