GROMACS是使用最广泛的HPC应用程序之一,已通过GROMACS 2020发行版进行了重大升级。新版本包括NVIDIA与核心GROMACS开发人员之间的长期合作所带来的令人兴奋的新性能改进。
 
作为用于生物分子系统的模拟软件包,GROMACS使用牛顿运动方程来演化粒子。力决定运动:例如,两个带正电的离子互相排斥。计算力是模拟中最昂贵的部分,因为所有成对的粒子都可能相互作用,并且模拟涉及许多粒子。
 
GROMACS提供的功能可解决各种不同类型的力计算问题。对于大多数模拟,三个最重要的类(就计算费用而言)是:
 
非结合的短程力:某个截止范围内的粒子被视为直接相互作用。
粒子网格Ewald(PME)远程力:对于较大距离,可通过使用傅里叶变换在傅里叶空间中执行计算的方案对力进行建模。这比直接计算真实空间中的所有交互便宜得多。
键合的短程力:由于粒子之间键的特定行为,例如两个共价键合的原子被拉伸时的谐波电位,因此也需要。
在以前的GROMACS版本中,这些力等级已经支持GPU加速。最新增加的是2019系列中的GPU粘合力,这是NVIDIA与核心GROMACS开发人员之前的合作开发的。
 
但是,仍然存在问题。在现代GPU上,力的计算变得如此之快,以至于模拟的其他部分在计算费用方面变得非常重要,尤其是当您要在单个模拟中使用多个GPU时。
 
这篇文章介绍了2020版本中解决此问题的新性能功能。对于许多典型的仿真,整个时间步现在可以在GPU上运行,避免了CPU和PCIe瓶颈。 GPU之间的通信操作现在可以直接在GPU内存空间之间进行操作。这项工作的结果证明了巨大的性能改进。