(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211013408.3 (22)申请日 2022.08.23 (65)同一申请的已公布的文献号 申请公布号 CN 115080253 A (43)申请公布日 2022.09.20 (73)专利权人 小米汽车 科技有限公司 地址 100176 北京市北京经济技 术开发区 科创十街15号院5号楼6层618室 (72)发明人 刘国明 刘俊涛  (74)专利代理 机构 北京法胜知识产权代理有限 公司 11922 专利代理师 石茵汀 (51)Int.Cl. G06F 9/50(2006.01) G06F 9/48(2006.01)(56)对比文件 CN 103226495 A,2013.07.31 CN 103842955 A,2014.0 6.04 CN 107562532 A,2018.01.09 CN 114780240 A,202 2.07.22 US 2020326982 A1,2020.10.15 审查员 邱爽 (54)发明名称 GPU任务的分配方法、 装置、 电子设备和存储 介质 (57)摘要 本公开提出一种GPU任务的分配方法、 装置、 电子设备和存储介质, 涉及计算机领域, 该方法 包括: 确定待分配的第一任务对应的第一周期长 度, 以及单位周期内的第一GP U利用率曲线; 获取 周期长度与第一周期长度相同的目标任务集合, 以及目标任务集合中每个第二任务在单位周期 内的第二GP U利用率曲线; 根据第一 GPU利用率曲 线和每个第二GPU利用率曲线, 计算每个第二任 务对应的第三GPU利用率曲线; 根据各个第二任 务对应的第三GPU利用率曲线, 从各个第二任务 中选取满足预设条件的目标任务; 将第一任务分 配至目标任务当前所在的GPU中。 由此, 使得当前 分配的任务和目标任务共享一个GPU, 从而在不 影响GPU稳定工作的前提下, 降低GPU的使用量, 降低了企业的运营成本 。 权利要求书3页 说明书12页 附图4页 CN 115080253 B 2022.11.22 CN 115080253 B 1.一种GPU任务的分配方法, 其特 征在于, 包括: 确定待分配的第一任务对应的第一周期长度, 以及单位周期内的第一GPU利用率曲线; 获取周期长度与所述第 一周期长度相同的目标任务集合, 以及所述目标任务集合中每 个第二任务在单位周期内的第二GPU利用率曲线, 所述目标任务集合中包含的每个第二任 务的周期长度均 与所述第一周期长度相同; 根据所述第一GPU利用率曲线和每个所述第二GPU利用率曲线, 计算每个所述第二任务 对应的第三GPU利用率曲线; 根据各个所述第二任务对应的第三GPU利用率曲线, 从各个所述第二任务中选取满足 预设条件的目标任务, 所述目标任务用于和所述第一任务部署在同一个GPU中; 将所述第一任务分配至所述目标任务当前 所在的GPU中; 所述获取所述目标任务集合中每个第二任务在单位周期内的第二GPU利用率曲线, 包 括: 将所述目标任务集合中各第二任务对应的GPU利用率曲线与所述第一GPU利用率曲线进 行时间对齐, 获取 所述每个第二任务在单位周期内的第二GPU利用率曲线; 所述根据各个所述第二任务对应的第三GPU利用率曲线, 从各个所述第二任务中选取 满足预设条件的目标任务, 包括: 根据每个所述第二任务对应的第三GPU利用率曲线中各个时刻的GPU利用率, 确定每个 所述第二任务在所述各个时刻中的最大GPU利用率, 以及每个所述第二任务对应的平均GPU 利用率; 在任一第二任务对应的所述最大GPU利用率小于预设阈值, 且所述任一第二任务对应 的平均GPU利用率为各个所述第二任务对应的平均GPU利用率中的最高值的情况下, 确定所 述任一第二任务 为所述目标任务。 2.根据权利要求1所述的方法, 其特征在于, 所述确定待分配的第 一任务对应的第 一周 期长度, 以及单位周期内的第一GPU利用率曲线, 包括: 对所述第一任务关联的GPU利用率曲线进行解析, 以确定所述第一任务对应的第一周 期长度及所述第一GPU利用率曲线。 3.如权利要求2所述的方法, 其特征在于, 在所述确定待分配的第 一任务对应的第 一周 期长度, 以及单位周期内的第一GPU利用率曲线之后, 还 包括: 根据所述第一周期长度, 从各个候选任务 集合中确定出目标任务 集合; 将所述第一任务的标识与所述第一GPU利用率曲线关联存 入所述目标任务 集合。 4.根据权利要求3所述的方法, 其特征在于, 所述根据所述第一周期长度, 从各个候选 任务集合中确定出目标任务 集合, 包括: 响应于各个候选任务 集合对应的周期长度均 与所述第一周期长度不同, 将对应周期长度 大于所述第 一周期长度、 且与 所述第一周期长度间的差值最小的任一 候选任务 集合, 确定为目标任务 集合。 5.根据权利要求1所述的方法, 其特 征在于, 还 包括: 响应于未获取到所述目标任务 集合, 将所述第一任务分配在未部署任务的GPU中; 创建与所述第一周期长度对应的候选任务集合, 其中, 所述候选任务集合中包含所述 第一任务及所述第一GPU利用率曲线。 6.一种GPU任务的分配装置, 其特 征在于, 包括:权 利 要 求 书 1/3 页 2 CN 115080253 B 2确定模块, 用于确定待分配的第一任务对应的第一周期长度, 以及单位周期内的第一 GPU利用率曲线; 获取模块, 用于获取周期长度与所述第一周期长度相同的目标任务集合, 以及所述目 标任务集合中每个第二任务在单位周期内的第二GPU利用率 曲线, 所述 目标任务集合中包 含的每个第二任务的周期长度均 与所述第一周期长度相同; 计算模块, 用于根据所述第一GPU利用率曲线和每个所述第二GPU利用率曲线, 计算每 个所述第二任务对应的第三GPU利用率曲线; 选取模块, 用于根据各个所述第二任务对应的第三GPU利用率曲线, 从各个所述第二任 务中选取满足预设条件的目标任务, 所述 目标任务用于和所述第一任务部署在同一个GPU 中; 第一分配模块, 用于将所述第一任务分配至所述目标任务当前 所在的GPU中; 所述获取所述目标任务集合中每个第二任务在单位周期内的第二GPU利用率曲线, 包 括: 将所述目标任务集合中各第二任务对应的GPU利用率曲线与所述第一GPU利用率曲线进 行时间对齐, 获取 所述每个第二任务在单位周期内的第二GPU利用率曲线; 所述选取模块, 具体用于: 根据每个所述第二任务对应的第三GPU利用率曲线中各个时刻的GPU利用率, 确定每个 所述第二任务在所述各个时刻中的最大GPU利用率, 以及每个所述第二任务对应的平均GPU 利用率; 在任一第二任务对应的所述最大GPU利用率小于预设阈值, 且所述任一第二任务对应 的平均GPU利用率为各个所述第二任务对应的平均GPU利用率中的最高值的情况下, 确定所 述任一第二任务 为所述目标任务。 7.根据权利要求6所述的装置, 其特 征在于, 所述确定模块, 具体用于: 对所述第一任务关联的GPU利用率曲线进行解析, 以确定所述第一任务对应的第一周 期长度及所述第一GPU利用率曲线。 8.如权利要求7 所述的装置, 其特 征在于, 所述确定模块, 还 包括: 确定单元, 用于根据所述第一周期长度, 从各个候选任务 集合中确定出目标任务 集合; 存储单元, 用于将所述第一任务的标识与所述第一GPU利用率曲线关联存入所述目标 任务集合。 9.根据权利要求8所述的装置, 其特 征在于, 所述确定单 元, 具体用于: 响应于各个候选任务 集合对应的周期长度均 与所述第一周期长度不同, 将对应周期长度 大于所述第 一周期长度、 且与 所述第一周期长度间的差值最小的任一 候选任务 集合, 确定为目标任务 集合。 10.根据权利要求6所述的装置, 其特 征在于, 还 包括: 第二分配模块, 用于响应于未获取到所述目标任务集合, 将所述第一任务分配在未部 署任务的GPU中; 创建模块, 用于创建与所述第 一周期长度对应的候选任务集合, 其中, 所述候选任务集 合中包含所述第一任务及所述第一GPU利用率曲线。 11.一种电子设备, 其特 征在于, 包括: 至少一个处 理器; 以及权 利 要 求 书 2/3 页 3 CN 115080253 B 3

.PDF文档 专利 GPU任务的分配方法、装置、电子设备和存储介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 GPU任务的分配方法、装置、电子设备和存储介质 第 1 页 专利 GPU任务的分配方法、装置、电子设备和存储介质 第 2 页 专利 GPU任务的分配方法、装置、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:06:54上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。