专利一种基于云边端协同的深度学习模型推理加速方法 -在线下载 -pdf文件-720life.cn

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210961978.9 (22)申请日 2022.08.11 (65)同一申请的已公布的文献号申请公布号 CN 115034390 A (43)申请公布日 2022.09.09 (73)专利权人南京邮电大学地址 210003 江苏省南京市鼓楼区新模范马路66号 (72)发明人郭永安　周金粮　王宇翱　钱琪杰　孙洪波　 (74)专利代理机构南京经纬专利商标代理有限公司 32200 专利代理师朱小兵 (51)Int.Cl. G06N 3/08(2006.01)G06N 3/04(2006.01) G06F 9/50(2006.01) H04L 67/10(2022.01) (56)对比文件 CN 114153572 A,202 2.03.08 审查员叶旭庆 (54)发明名称一种基于云边端协同的深度学习模型推理加速方法 (57)摘要本发明公开了一种基于云边端协同的深度学习模型推理加速方法，具体涉及一种深度学习模型分层卸载方法。该方法通过对整个深度学习模型推理过程中的计算时延、数据传输时延、数据传播时延和模型分层卸载策略生成时延进行理论建模，并以计算任务响应时延最小为优化目标，决定最优深度学习模型的分层卸载策略。相较于以物理端为主导和以云计算中心为主导的深度学习模型执行框架，本方法通过将边缘计算范式和云计算结合起来，并将深度学习模型分层卸载至不同的边缘计算节点，在满足计算精度的前提下，实现计算任务响应时延最小化。权利要求书3页说明书8页附图2页 CN 115034390 B 2022.11.18 CN 115034390 B 1.一种基于云边端协同的深度学习模型推理加速方法，所述云边端协同是指云服务器、与云服务器通信的至少两个边缘计算节点，以及至少一个物理终端，物理终端与边缘计算节点的通信距离小于边缘计算节点与云服务器的距离，其特征在于，所述方法包括如下步骤：步骤S1、物理终端将图像数据预处理为分辨率相同、数据量相等的图像特征数据 D1，输入划分好的待卸载深度学习模型的各个 DNN层，即，将上一层输出作为下一层的输入，最终得到图像特征数据；步骤S2、进行离线学习阶段：基于各个边缘计算节点计算资源预设负载情况，以各个边缘计算节点上待卸载深度学习模型各个处理图像特征数据的过程为输入、已知的图像特征数据通过各个边缘计算节点上待卸载深度学习模型的各个对应的计算时延为输出，构建并训练获得分层计算时延预测模型 CT；同时基于云服务器计算资源预设负载情况，以云服务器上待卸载深度学习模型各个处理图像特征数据 Dz的过程为输入、已知的云服务器上待卸载深度学习模型各个处理图像特征数据 Dz对应的计算时延为输出，构建并训练获得云服务器计算时延预测模型CTc；步骤S3、根据各个边缘计算节点的实际计算资源负载情况，由物理终端的计算任务所对应的边缘计算节点应用分层计算时延预测模型CT，以待卸载深度学习模型各个处理图像特征数据的过程为输入、获得图像特征数据通过各个边缘计算节点上待卸载深度学习模型各个对应的计算时延为输出的理论分层计算时延；步骤S4、基于已知的边缘计算节点局域网网络带宽情况 r、以及各个边缘计算节点之间的物理距离l，计算经过当前边缘计算节点传输图像特征数据到其他边缘计算节点所需的数据传输时延 T和传播时延 S；同时基于已知的云服务器网络带宽情况 rc、以及计算任务的边缘计算节点与云服务器之间的物理距离 lc，计算经过计算任务的边缘计算节点传输图像特征数据D1到云服务器所需的数据传输时延 Tc和传播时延 SC；步骤S5、以步骤S3获得的各个边缘计算节点理论分层计算时延、以及步骤S4获得的数据传输时延 T和传播时延 S为输入，以所对应的响应时延为输出，构建深度学习模型分层卸载模型如下式：并以响应时延 TIME最小为优化目标,获得响应时延最小的深度学习模型分层卸载模型，其中 t为边缘计算节点从收到物理终端发送的计算任务到生成深度学习模型分层卸载模型的时间；步骤S6、根据步骤S2获得的云服务器计算时延预测模型CTc，以及云服务器的实际计算资源负载情况，应用分层计算时延预测模型 CTc，以待卸载深度学习模型各个处理图像权　利　要　求　书 1/3 页 2 CN 115034390 B 2特征数据的过程为输入、获得图像特征数据通过云服务器上待卸载深度学习模型的各个对应的计算时延为输出的理论分层计算时延，之后按如下公式：，计算单独使用云服务器处理计算任务所产生的理论计算时延，其中为将D1 通过DNN1产生的计算时延，之后按如下公式计算单独使用云服务器时处理图像特征数据 Dz 的响应时延 TIMEc：；步骤S7、动态比较单独使用云服务器时的响应时延 TIMEc与深度学习模型分层卸载模型响应时延最小的大小，若小于TIMEc，则以响应时延最小对应的深度学习模型分层卸载模型为分层卸载策略，完成待计算数据以最小化响应时延为目标的卸载计算；否则以响应时延 TIMEc对应的单独使用云服务器处理待计算数据为最终分层卸载策略，完成待计算数据以最小化响应时延的卸载计算；步骤S8、基于步骤S7获得的分层卸载策略，各执行分层卸载策略的边缘计算节点收集计算任务时的计算负载情况和实际计算时延，之后返回步骤S2。 2.根据权利要求1所述的一种基于云边端协同的深度学习模型推理加速方法，其特征在于，已划分好的待卸载深度学习模型的各个 DNN层按如下方法获得:将待卸载深度学习模型的隐藏层、输入层以及输出层的所包含的神经元，以各单独成列的神经元为划分为 n列，获得单独成列的神经元列，之后获得， n为正整数。 3.根据权利要求2所述的一种基于云边端协同的深度学习模型推理加速方法，其特征在于，步骤S1具体为：基于已分割好的待卸载深度学习模型的各个以各个边缘计算节点上待卸载深度学习模型各个处理图像特征数据的过程为输入、图像特征数据通过各个边缘计算节点上待卸载深度学习模型的各个对应的计算时延为输出，分别构建各个边缘计算节点分层计算时延模型如下式：；其中，为计算资源负载情况预设CPU负载、为计算资源负载情况预设GPU负载、为计算资源负载情况预设缓存负载。 4.根据权利要求3所述的一种基于云边端协同的深度学习模型推理加速方法，其特征在于，步骤S3中，基于已知的边缘计算节点局域网网络带宽情况 r，各个边缘计算节点之间的物理距离 l，按如下公式：权　利　要　求　书 2/3 页 3 CN 115034390 B 3

专利 一种基于云边端协同的深度学习模型推理加速方法

专利一种基于云边端协同的深度学习模型推理加速方法