迈向百亿亿次计算:GPU加速高阶CFD框架MARUT深度解析与热化学非平衡态流体模拟实践
本文深度解析基于Julia语言开发的、面向下一代百亿亿次超算的多GPU高阶CFD框架MARUT。该框架完美集成了不连续伽辽金谱元素法(DGSEM)、完全GPU驻留的自适应网格细化(AMR)以及复杂的五组分/十一组分热化学非平衡化学动力学模型,实现了零主机-设备数据传输瓶颈的高效流体动力学模拟。
本文深度解析基于Julia语言开发的、面向下一代百亿亿次超算的多GPU高阶CFD框架MARUT。该框架完美集成了不连续伽辽金谱元素法(DGSEM)、完全GPU驻留的自适应网格细化(AMR)以及复杂的五组分/十一组分热化学非平衡化学动力学模型,实现了零主机-设备数据传输瓶颈的高效流体动力学模拟。
本文对基于颜色梯度格子玻尔兹曼方法(LBM)在弯曲固体边界上实现润湿边界条件的最新研究进行深度解析,结合 JAX 异构计算框架探讨高性能复现、理论推导及局限性评论。
本文深度解析了 SLIM 模型如何通过优化内存布局、矩阵无关求解器及多 GPU 并行策略,将不连续伽辽金方法在大规模海洋模拟中的计算性能提升至全新高度,实现单卡对比 CPU 千核级别的性能飞跃。
本文深度解析了由 Johns Hopkins 与 NVIDIA 合作开发的 GPU 原生 sharp-interface IBM 求解器,揭示了其在 10 亿级网格下实现 42 倍能效提升及复杂生物飞行模拟的核心技术路线。
AeTHERON 是一种新型异质图算子网络,通过直接镜像浸入边界法(IBM)的数学结构,实现了对复杂流固耦合动力学的高效代理建模与外推预测。
本文深度解析了 Imperial College London 团队提出的 Quantum Neural Physics 框架,该框架通过将有限差分算子映射为量子卷积核,并结合 HQC-CNNMG 混合多重网格算法,实现了对大规模 PDE 系统的高效模拟与指数级存储压缩。
本文深度解析了针对原行星盘流体不稳定性(SI)的首次系统性多代码比较研究,涵盖了从Lagrangian粒子到压强项缺失尘埃流体的多种数值模型及性能基准。