开启非共线磁性模拟的高能时代:OpenMX 数值原子轨道 DFT 软件的 GPU 加速深度解析
本文深度剖析了基于数值原子轨道(NAOs)的 DFT 开源软件 OpenMX 在 GPU 架构(NVIDIA H100)下的最新加速成果。通过结合 cuBLAS、cuSOLVER 和 OpenACC,该工作攻克了共线与非共线磁性计算在百原子级体系下的 generalized eigenvalue 问题瓶颈,实现了显著的速度跨越。
本文深度剖析了基于数值原子轨道(NAOs)的 DFT 开源软件 OpenMX 在 GPU 架构(NVIDIA H100)下的最新加速成果。通过结合 cuBLAS、cuSOLVER 和 OpenACC,该工作攻克了共线与非共线磁性计算在百原子级体系下的 generalized eigenvalue 问题瓶颈,实现了显著的速度跨越。