开启非共线磁性模拟的高能时代:OpenMX 数值原子轨道 DFT 软件的 GPU 加速深度解析
本文深度剖析了基于数值原子轨道(NAOs)的 DFT 开源软件 OpenMX 在 GPU 架构(NVIDIA H100)下的最新加速成果。通过结合 cuBLAS、cuSOLVER 和 OpenACC,该工作攻克了共线与非共线磁性计算在百原子级体系下的 generalized eigenvalue 问题瓶颈,实现了显著的速度跨越。
本文深度剖析了基于数值原子轨道(NAOs)的 DFT 开源软件 OpenMX 在 GPU 架构(NVIDIA H100)下的最新加速成果。通过结合 cuBLAS、cuSOLVER 和 OpenACC,该工作攻克了共线与非共线磁性计算在百原子级体系下的 generalized eigenvalue 问题瓶颈,实现了显著的速度跨越。
本文深度解析了一种用于大规模物质点法(MPM)模拟的统一稀疏背景网格计算框架。该框架将稀疏网格构建抽象为通用的活跃节点索引问题,并针对CPU设计了基于并行扫描的架构,针对GPU设计了基于哈希表的架构,在强稀疏体系(如山体滑坡与雪崩)中实现了算力和内存开销1-2个数量级的重大突破。
本文深度解析了基于 TeraChem 的 GPU 加速实时 Tamm-Dancoff 近似(RT-TDA)方法,探讨其如何通过线性化传播克服标准 RT-TDDFT 的动力学失谐问题,并实现大规模分子的高效模拟。