近期,MILab在全人体正电子断层成像(Total-body Positron Emission Tomograph, TB-PET)图像重建领域取得进展,相关论文 " Load Balancing for Multi-GPU Total-Body PET Image Reconstruction " 被放射学和核医学领域3D图像重建顶会Fully3D接收为Oral Presentation。
为了在临床应用可接受时间范围内高效完成TB-PET图像重建,采用多GPU加速计算是必不可少的。然而,由于不同符合事件(coincidence events)所需的计算时间差异较大,如何合理地将计算任务分配给各GPU仍面临挑战。具体而言,部分响应线(LOR)与PET扫描仪视野(FOV)之间具有较长的交线长度,这在前向和后向投影中都会引入较高的计算开销;而另一些LOR的交线较短,相应计算量也显著较小。优化负载均衡不仅可以减少GPU空闲时间和计算资源浪费,还能提升系统整体吞吐效率。
本研究重点分析了在多GPU TB-PET图像重建过程中,灵敏度图像计算(sensitivity image calculation)和迭代过程(iterative process)两个阶段中面临的负载不均衡问题,并提出相应的优化策略。在灵敏度图像计算阶段,我们提出了一种基于方位角的LOR分配方法,以实现GPU之间负载的均衡,并获得近似线性的加速比。在迭代重建阶段,我们采用PD/IS (projection division / image synchronization) 并行框架,并具体分析了静态和动态的符合事件分配方法,得出了静态策略的计算效率优于动态策略的结论,这是因为动态策略会涉及更多的数据拆分、合并操作,从而串行瓶颈更严重。并且,我们发现迭代重建阶段可获得的加速比依赖于符合事件的数量,这意味着对于动态重建,可以把多个时间帧的数据调度到多块GPU上并行地重建多帧图像,从而充分利用硬件资源。这些创新有效缓解了关键瓶颈问题,推动了TB-PET图像重建效率的提升。

图1 LOR与符合事件分配方法示意图:(a)基于方位角的 LOR 分配方法;(b)符合事件分配方法,上半部分为静态分配策略,下半部分为动态分配策略。

图2 灵敏度图像计算阶段的并行效率

图3 迭代重建阶段的并行效率
该论文第一作者为MILab博士生王曌,谢肇恒研究员和任秋实教授为本文的通讯作者。其他合作者还包括MILab博士生赵鑫和董正坤。该研究得到了国家自然科学基金等项目的经费支持。
文章链接:TBD
0 评论