新型架构组

异构融合计算

异构融合计算

本小组致力于为新兴应用快速迭代背景下的通用处理器平台赋能。

如果你对高性能计算、加速器设计、数据流感兴趣,希望本页面能耗为你提供你想了解的内容

🔎 观察

随着互联网、大数据和人工智能的高速发展,系统对算力的需求急剧增加,传统CPU计算能力明显无法满足当前需求。各种定制化的加速器、GPGPU纷纷涌现,在通用CPU的管理下为计算系统提供大量算力支持。在百家争鸣的异构系统黄金时代,我们希望可以贡献绵薄之力。

  • CPU和硬件加速器之间存在较高的交互延迟,通信开销大从而很难进行较细粒度的协同计算
  • 种类繁多的领域专用处理器都需要CPU调度管理,不易于软件编程
  • 不同的加速器之间容易存在许多类似的计算部件,都集成在系统中是一种资源的浪费
  • 现有加速器只有在任务粒度较大时才会获取到性能收益

🤔 思考

  • 把定制硬件放到CPU附近,降低通信延迟,但不能影响到CPU的运行
  • 需要统一的指令集系统,数量不能太多,最好能集成不同加速器时不需要修改CPU前端
  • 加速器模块功能变简单减少重复,如果第一点延迟问题可以解决,就可以快速调度不同小模块进行配合完成复杂任务
  • 解决延迟问题可以使小粒度任务加速器设计成为可能

我们的方案:

一个紧耦合的加速器设计框架,实现了CPU在统一指令集系统下管理加速器,并且二者独立运行的同时可以极低延迟交互,使得CPU细粒度卸载小规模、低延迟任务成为可能。

⛳️ 进展

加速器设计软硬件平台,

  • 硬件设计可以将CPU和加速器烧录在FPGA上或编译成软件模拟器进行模拟
  • linux操作系统可以运行在我们的硬件平台上,并对加速器进行管理

已有加速器族:

  • 无损压缩加速器
  • 键值存储加速器
  • 卷积加速器
  • 图像信号处理加速器
  • 卷积加速模块(重新优化数据流映射、缓存设计等,进行中……)

⭐️已发表论文

TCADer: A Tightly Coupled Accelerator Design framework for heterogeneous system with hardware/software co-design

指导教师

负责人

参与人

发布于