开启非共线磁性模拟的高能时代:OpenMX 数值原子轨道 DFT 软件的 GPU 加速深度解析
本文深度剖析了基于数值原子轨道(NAOs)的 DFT 开源软件 OpenMX 在 GPU 架构(NVIDIA H100)下的最新加速成果。通过结合 cuBLAS、cuSOLVER 和 OpenACC,该工作攻克了共线与非共线磁性计算在百原子级体系下的 generalized eigenvalue 问题瓶颈,实现了显著的速度跨越。
本文深度剖析了基于数值原子轨道(NAOs)的 DFT 开源软件 OpenMX 在 GPU 架构(NVIDIA H100)下的最新加速成果。通过结合 cuBLAS、cuSOLVER 和 OpenACC,该工作攻克了共线与非共线磁性计算在百原子级体系下的 generalized eigenvalue 问题瓶颈,实现了显著的速度跨越。
本文深度解析 KerneLDI 框架,该框架通过块过滤表示和自定义 GPU 算子,解决了密度泛函理论中 EXC 积分在高效计算与动态稀疏性之间的矛盾,实现最高 10 倍的性能提升。
本文深入探讨了由 Federico Rossi 等人提出的 Convex DFT (CVX-DFT) 框架。该方法通过强制轨道优化的凸性,从根本上解决了传统 TDDFT 在圆锥交叉附近的拓扑崩溃问题,为高精度非绝热分子动力学铺平了道路。
本文深度解析了利用反铁磁邻近效应调控 Kitaev 磁体(如 α-RuCl3)磁学性质的理论框架,探讨了交错磁场诱导的 Majorana 费米面、向列相及斯格明子晶体等新奇量子物态。