(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202211171216.5
(22)申请日 2022.09.26
(65)同一申请的已公布的文献号
申请公布号 CN 115291949 A
(43)申请公布日 2022.11.04
(73)专利权人 中国人民解 放军国防科技大 学
地址 410073 湖南省长 沙市开福区德雅路
109号
(72)发明人 龚艳琼 刘必慰 赵玉新 黄东昌
郭阳 江豪龙 赖雯 王洁
杨益斌
(74)专利代理 机构 长沙国科天河知识产权代理
有限公司 432 25
专利代理师 唐品利
(51)Int.Cl.
G06F 9/30(2006.01)
G06F 30/23(2020.01)
G06F 30/28(2020.01)
G06F 113/08(2020.01)
G06F 119/14(2020.01)(56)对比文件
CN 102842 222 A,2012.12.26
CN 102930730 A,2013.02.13
CN 112098273 A,2020.12.18
CN 112842312 A,2021.0 5.28
CN 105264779 A,2016.01.20
CN 111797045 A,2020.10.20
CN 104639310 A,2015.0 5.20
WO 2021245101 A1,2021.12.09
US 201420 0833 A1,2014.07.17
WO 2022046761 A1,202 2.03.03
JP 201813 6255 A,2018.08.3 0
US 2020362839 A1,2020.1 1.19
CN 113935258 A,202 2.01.14
CN 112818494 A,2021.0 5.18
CN 1787376 A,20 06.06.14
CN 115049529 A,2022.09.13 (续)
审查员 余祖澔
(54)发明名称
一种面向计算流体力学的加速计算装置和
加速计算方法
(57)摘要
本申请涉及计算流体力学和计算机技术领
域的一种面向计算流体力学的加速计算装置和
加速计算方法。 所述加速计算装置包括: 若干个
专用的差分运算单元, 用于执行根据待解决的流
体力学问题采用指令集设计的程序, 完成流场中
节点差分运算; 差分运算单元包括多个传输通
道, 传输通道用于将所有差分运算单元组合在一
起, 并行完成流场中所有节点差分运算。 该装置
硬件结构简单, 差分运算单元间设置数据传输通
道进行差分计算, 减少了数据通过全局存储器传
输带来的大量延时, 同时去除数据存储器很大程
度上减少计算资源的使用, 还具有灵活可编程的优点。
[转续页]
权利要求书2页 说明书9页 附图5页
CN 115291949 B
2022.12.20
CN 115291949 B
(56)对比文件
刘胜等.一种自主设计的面向E级高性能计
算的异构融合加速 器. 《计算机 研究与发展》.2021,全 文.
陶小涵等.基 于SW26010处理器的FT程序的
性能优化. 《计算机科 学》 .2019,全 文.2/2 页
2[接上页]
CN 115291949 B1.一种面向计算流体力学的加速计算装置, 其特征在于, 所述加速计算装置包括: 若干
个专用的差分运算单元, 用于执行根据待解决的流体力学问题采用指令集设计的程序, 完
成流场中节点差分运 算;
所述差分运算单元包括多个传输通道, 所述传输通道用于将相邻的所述差分运算单元
组合在一 起, 并行完成流场中所有节点差分运 算;
所述差分运 算单元还包括多个通用寄存器, 用于存放寄存器数据;
所述差分运算单元包括的传输通道的数量为4个, 所述传输通道是通过在所述差分运
算单元中配置通讯 寄存器得到的;
四个所述通讯寄存器位于所述差分运算单元的四个边缘; 四个所述通讯寄存器与同一
个内部通用寄存器相连; 相邻所述差分运算单元通过离它最近的所述通讯寄存器进入传输
通道进行 数据通信。
2.根据权利要求1所述的加速计算装置, 其特 征在于, 所述差分运 算单元还包括:
指令控制器, 用于控制所需执 行指令的地址;
指令存储器, 用于存 储所需执 行的指令;
算术逻辑运算单元, 用于对操作数进行逻辑 运算。
3.根据权利要求2所述的加速计算装置, 其特征在于, 所述指令控制器包括: 一个自加
一的加法器和一个二选一的多路选择器。
4.根据权利要求2所述的加速计算装置, 其特征在于, 所述差分运算单元执行一条指令
包含取址、 译码、 执 行和写回 四个时钟周期;
在取址阶段, 根据指令控制器的值从指令存 储器中读取一条指令, 并送入指令寄存器;
在译码阶段, 对送入指令寄存器的指令进行译码, 根据操作码从指令中提取对应的操
作数, 并将提取的两个操作数放入两个临时寄存器中;
在执行阶段, 根据操作码在算术逻辑运算单元中对两个临时寄存器及进行运算, 将运
算结果存入第三个临时寄存器, 根据指令功 能和运算结果设置标志寄存器的值; 所述标志
寄存器的值用于指令控制器判断下一条指令是顺序执 行还是跳转执 行;
在写回阶段, 根据操作码以及所述运算结果进行判断是否需要修改通用寄存器的值,
如果需要修改, 则将第三个临时寄存器的值存 入通用寄存器对应位置 。
5.根据权利要求2所述的加速计算装置, 其特征在于, 所述差分运算单元中通用寄存器
的数量为60个, 通用寄存器的宽度均为64bit。
6.根据权利要求1所述的加速计算装置, 其特征在于, 所述差分运算单元采用的指令集
是根据计算 流体力学算法的特性设置的;
所述差分运算单元采用的指令集为16bit RISC指令集编码格式, 其中指令为: 操作码长
度为4bit, 有两个长度均为6bit的操作数。
7.根据权利要求6所述的加速计算装置, 其特征在于, 所述指令集根据操作 数的不同分
为三种类型, 包括: 寄存器 类型、 立即数类型和混合类型。
8.根据权利要求6所述的加速计算装置, 其特征在于, 根据指令的功能对所述指令集进
行分类, 所述指令集包括: 控制类指令、 运 算类指令以及数据搬移类指令;
其中: 所述控制类指令包括: 空指令、 停止指令、 分支跳转指令; 所述运算类指令包括:
定点立即数相加指令、 定点立即数相减指令、 定点比较指令、 立即数跳转指令、 浮点寄存器权 利 要 求 书 1/2 页
2
CN 115291949 B
3
专利 一种面向计算流体力学的加速计算装置和加速计算方法
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 12:56:58上传分享