冲向热力学极限:周期性CCSD凝聚能与带隙的高密度布里渊区抽样深度解析
本文深度解析了基于 PySCF 开发的高性能分布式内存周期性 Coupled-Cluster(CCSD)算法,探讨了如何通过高达 6³ 的布里渊区抽样结合外推技术,首次在热力学极限下精确评估八种典型半导体和绝缘体的凝聚能与带隙。
本文深度解析了基于 PySCF 开发的高性能分布式内存周期性 Coupled-Cluster(CCSD)算法,探讨了如何通过高达 6³ 的布里渊区抽样结合外推技术,首次在热力学极限下精确评估八种典型半导体和绝缘体的凝聚能与带隙。
本文深度剖析了基于数值原子轨道(NAOs)的 DFT 开源软件 OpenMX 在 GPU 架构(NVIDIA H100)下的最新加速成果。通过结合 cuBLAS、cuSOLVER 和 OpenACC,该工作攻克了共线与非共线磁性计算在百原子级体系下的 generalized eigenvalue 问题瓶颈,实现了显著的速度跨越。
本文深度剖析了基于 Julia 语言开发的下一代外卡尺度(Exascale)多GPU加速高阶间断 Galerkin(DGSEM)流体力学框架 MARUT。重点解析其在热化学非平衡、有限速率化学反应、全GPU常驻自适应网格细化(AMR)以及异构可扩展性上的核心理论、算法实现与量子化学动力学尺度级联的科学意义。
本文深度解析了一种用于大规模物质点法(MPM)模拟的统一稀疏背景网格计算框架。该框架将稀疏网格构建抽象为通用的活跃节点索引问题,并针对CPU设计了基于并行扫描的架构,针对GPU设计了基于哈希表的架构,在强稀疏体系(如山体滑坡与雪崩)中实现了算力和内存开销1-2个数量级的重大突破。