Paper Notes
首页 标签 列表

高性能计算

  • 统一稀疏架构:破解大规模物质点法(MPM)模拟中的网格计算瓶颈

    2026-06-14

    本文深度解析了一种全新的统一稀疏背景网格架构,该架构通过将稀疏网格构建转化为通用活动节点索引问题,为 CPU 和 GPU 平台分别设计了高性能硬件特定算法,实现了大变形物理模拟中1到2个数量级的速度提升和内存节省。

    • #物质点法 (MPM)
    • #稀疏网格
    • #高性能计算
    • #GPU加速
    • #计算物理
  • LLM 时代的高性能计算重构:基于 FESOM2 海洋模型(Fortran 至 C++/Kokkos)的异构移植范式及量子化学软件现代化启示录

    2026-06-13

    本文深度解析了使用大语言模型(LLM)智能体将复杂气候/海洋模型 FESOM2 从 74,000 行 Fortran 移植至现代 performance-portable C++/Kokkos 异构并行架构的成功实践,并系统探讨了该范式对量子化学高性能计算软件重构的深远启示。

    • #大语言模型
    • #高性能计算
    • #Kokkos
    • #GPU 移植
    • #量子化学
    • #FESOM2
    • #软件重构
  • 跨越单卡显存墙:多GPU分布式大规模张量网络收缩的高效并轨规划与性能极限解析

    2026-06-02

    本文深入剖析基于多GPU平台的高效分布式张量网络收缩理论与软硬件协同优化技术。通过面向GEMM的维度重排算法与基于动态规划的通信感知分布式规划器,突破传统切片技术的指数级计算开销与单卡显存壁垒。

    • #张量网络
    • #多GPU并行
    • #cuTENSORMp
    • #量子计算模拟
    • #高性能计算
  • 量子多体理论的新范式:图卡特蒙特卡洛(diagMC)在正电子-分子相互作用中的全阶解析

    2026-06-02

    本文深度解析了利用图卡特蒙特卡洛(diagMC)方法计算正电子-分子关联势(自能)的突破性工作,重点探讨其如何攻克虚拟正电子素(Ps)形成的非微扰物理难题,并在内存消耗上实现3-4个数量级的骤降。

    • #量子多体理论
    • #图卡特蒙特卡洛
    • #正电子物理
    • #自能计算
    • #Bethe-Salpeter方程
    • #高性能计算
  • 超越张量网络:核心优化轨道 (COO) 与稀疏 CI 的深度融合,攻克多中心强关联体系

    2026-05-26

    本文深度剖析核心优化轨道 (COO) 技术。通过在极小的 TrimCI 核心波函数上交替进行轨道旋转与重新对角化,COO 将大比例动力学关联直接吸收到单粒子基组中,在铁硫簇体系上实现比 DMRG 高出 10-100 倍的参数压缩率。

    • #强关联系统
    • #配置相互作用 (CI)
    • #轨道优化
    • #密度矩阵重正化群 (DMRG)
    • #高性能计算
    • #量子化学
  • 深度解析 SLIM:基于不连续伽辽金(DG)方法的高效多 GPU 海洋模型实现

    2026-05-24

    本文深度解析了 SLIM 模型如何通过优化内存布局、矩阵无关求解器及多 GPU 并行策略,将不连续伽辽金方法在大规模海洋模拟中的计算性能提升至全新高度,实现单卡对比 CPU 千核级别的性能飞跃。

    • #计算流体力学
    • #GPU加速
    • #不连续伽辽金方法
    • #高性能计算
    • #海洋模型
    • #并行计算
  • 重访 NEGF 中的 Dyson 与 Keldysh 递归方法:基于领域分解的并行化革新与 LibNEGF.jl 实践

    2026-05-22

    本文深度解析了通过领域分解与 Schur 补理论重构递归格林函数(RGF)方法的最新进展,重点介绍了支持任意 block n-diagonal 体系的并行 DDRGF 算法及其在 LibNEGF.jl 中的高效实现。

    • #量子输运
    • #NEGF
    • #RGF算法
    • #并行计算
    • #Julia语言
    • #高性能计算
  • FusionRCG:深度优化 GPU 内存层级,攻克量子化学递归计算图的“存储墙”

    2026-05-16

    本文深度解析 FusionRCG 框架如何通过协同优化计算图结构、代数降维与自适应内存映射,解决 HGP 算法在 GPU 上的寄存器压力瓶颈,实现电子排斥积分计算的突破性加速。

    • #量子化学
    • #GPU加速
    • #电子排斥积分
    • #计算图优化
    • #高性能计算
    • #FusionRCG
  • 深度解析:通过缓存局部性优化在集成显卡(iGPU)上加速态矢量量子模拟 —— 一项跨架构评估研究

    2026-05-15

    本文深度解析了如何通过状态分块与缓存局部性优化,在消费级笔记本的集成显卡上实现高效的态矢量量子模拟,解决了量子模拟中的内存带宽瓶颈问题。

    • #量子模拟
    • #集成显卡
    • #缓存优化
    • #高性能计算
    • #Rust
    • #量子相干估计算法
  • 鲁棒矩阵无关 Newton-Krylov 求解器:自动微分技术如何颠覆非线性 PDE 模拟

    2026-05-14

    本文深入探讨了如何利用前向模式自动微分(AD)替代传统有限差分(FD)来计算 Jacobian-vector 产品,从而在矩阵无关 Newton-Krylov 求解器中实现极高的数值鲁棒性与跨量级的性能提升。

    • #JFNK
    • #自动微分
    • #非线性PDE
    • #高性能计算
    • #数值分析
    • #JAX
  • FusionRCG:通过编排递归计算图攻克量子化学积分的“存储墙”

    2026-05-14

    本文深度解析 FusionRCG 框架,该框架通过协同优化递归计算图(RCG)结构与 GPU 存储映射,有效解决了 HGP 算法在 GPU 上的寄存器溢出难题,实现了 SCF 计算的显著加速。

    • #量子化学
    • #GPU加速
    • #电子排斥积分
    • #存储层次结构
    • #高性能计算
    • #HGP算法
  • 量子化学加速新境界:KerneLDI 块结构矩阵乘法深度解析

    2026-05-14

    本文深度解析 KerneLDI 框架,通过协同设计数据布局、屏蔽逻辑与计算算子,利用块结构矩阵乘法(BSMM)攻克量子化学局部驱动积分的效率瓶颈,实现 EXC 计算 10 倍加速。

    • #量子化学
    • #GPU加速
    • #密度泛函理论
    • #矩阵乘法
    • #高性能计算
  • foap4:融合 OpenACC、MPI 与 p4est 的高性能自适应网格细化(AMR)框架深度解析

    2026-05-12

    本文深度解析 foap4 框架的设计与实现,探讨如何在 Fortran 环境下通过 OpenACC 指令集与 p4est 库协同,解决 GPU 上自适应网格细化(AMR)的性能瓶颈。

    • #高性能计算
    • #自适应网格细化
    • #OpenACC
    • #GPU加速
    • #Fortran
    • #p4est
  • 大规模并行性能可移植的 Particle-in-Cell 方案对比:面向静电动力学等离子体模拟的深度解析

    2026-05-08

    本文深度解析了基于 IPPL 框架的多种泊松求解器在异构超算架构上的性能表现,探讨了 FFT、PCG、FEM 及 PIF 方案在处理静电 Vlasov-Poisson 系统时的优劣与扩展性。

    • #等离子体物理
    • #Particle-in-Cell
    • #高性能计算
    • #GPU加速
    • #性能可移植性
    • #数值求解器
  • 极端尺度下的流固耦合:基于 GPU 加速的锐界面浸没边界法(IBM)深度解析

    2026-05-07

    本文深度解析了由 Johns Hopkins 与 NVIDIA 合作开发的 GPU 原生 sharp-interface IBM 求解器,揭示了其在 10 亿级网格下实现 42 倍能效提升及复杂生物飞行模拟的核心技术路线。

    • #计算流体力学
    • #流固耦合
    • #GPU加速
    • #浸没边界法
    • #高性能计算
    • #生物飞行
  • CDFCI 深度解析:基于坐标下降法的高性能大规模全构型相互作用软件

    2026-05-07

    本文深度解析了由复旦大学和杜克大学团队开发的 CDFCI 软件包,探讨其如何通过将特征值问题转化为优化问题,利用坐标下降法在多核架构上实现高效的 FCI 级计算。

    • #量子化学
    • #全构型相互作用
    • #高性能计算
    • #坐标下降法
    • #电子结构理论
  • 深度基准测试:用于无相位辅助场量子蒙特卡罗的量子变分试探波函数——QC-AFQMC 路线图深度解析

    2026-05-05

    本文深度解析了由伯克利实验室、哥伦比亚大学及NVIDIA等团队发表的最新成果,通过大规模GPU加速模拟,系统性地评估了多种量子电路Ansatz作为ph-AFQMC试探波函数的性能表现。

    • #量子化学
    • #ph-AFQMC
    • #变分量子本征求解器 (VQE)
    • #强关联体系
    • #CUDA-Q
    • #高性能计算
  • 突破12,000原子壁垒:多相量子-经典超算协同实现的蛋白质-配体量子化学模拟深度解析

    2026-05-04

    本文深度解析了Merz团队发表的里程碑式工作:通过量子嵌入与多相量子-经典(HQC)超算流程,成功模拟了超过12,000个原子的蛋白质复合物,将量子计算在化学领域的应用推向了空前的实用化尺度。

    • #量子化学
    • #量子计算
    • #蛋白质-配体相互作用
    • #高性能计算
    • #量子嵌入理论
  • 迈向十万电子体系的化学精度:PAW-FE 方法在 GPU 架构下的性能飞跃与深度技术解析

    2026-05-01

    本文深度解析了 PAW-FE 方法如何通过 GPU 架构优化、R-ChFSI 算法以及混合精度通信,将化学精度的 DFT 计算扩展至 130,000 电子规模。

    • #密度泛函理论
    • #有限元方法
    • #GPU加速
    • #PAW方法
    • #高性能计算
    • #量子化学
  • Clifft 深度解析:将量子纠错模拟的指数级代价从比特数转向动态活跃空间

    2026-05-01

    本文深度解析了 Unitary Foundation 开发的 Clifft 模拟器,探讨其如何通过框架分解状态表示法实现近 Clifford 电路的快速精确模拟,并首次完成了魔态培养全流程的数百亿次采样。

    • #量子计算
    • #量子纠错
    • #电路模拟
    • #Clifford+T
    • #容错量子计算
    • #高性能计算
  • 张量网络代理模型:深层变分量子算法的大规模经典模拟新范式

    2026-04-23

    本文深度解析 Watanabe 等人提出的二维张量网络代理模型方案,探讨其如何突破经典模拟限制,实现对 127 位重六角晶格深层 QAOA 电路的高精度模拟与参数优化。

    • #张量网络
    • #QAOA
    • #量子电路模拟
    • #参数浓缩
    • #参数优化
    • #高性能计算
  • 突破算力瓶颈:基于缓存分块、Boost 加速与门融合优化的超大规模量子线路模拟深度解析

    2026-04-15

    本文深度解析了由台湾大学与成功大学团队提出的量子模拟优化框架,该工作通过 Merge Booster 和 Diagonal Detector 算法,在 64 片 NVIDIA H100 GPU 集群上实现了对 38 比特量子线路的高效模拟,最高加速比达 160 倍。

    • #量子线路模拟
    • #高性能计算
    • #GPU加速
    • #量子算法优化
    • #DGX-H100
    • #算力调度
  • SMC-AI:在 AI 加速器上实现四万亿原子规模的蒙特卡洛模拟深度解析

    2026-04-10

    本文深度解析了 SMC-AI 框架,该框架通过针对 AI 加速器(如 NPU 和 GPU)的算法重构,成功将蒙特卡洛模拟扩展至 4 万亿原子规模,刷新了 ML 辅助原子模拟的世界纪录。

    • #蒙特卡洛模拟
    • #AI加速器
    • #高性能计算
    • #机器学习势函数
    • #原子尺度模拟
    • #昇腾NPU
  • 突破模拟极限:NVIDIA 统一路径变分与非简并分批采样技术,实现量子张量网络 10^8 倍加速

    2026-04-09

    本文深度解析 NVIDIA 团队通过统一路径变分 (UPV) 与非简并分批采样 (NBS) 技术,将量子张量网络噪声模拟速度提升至最高 1 亿倍的突破性工作,为量子化学与纠错研究提供强力支持。

    • #量子计算
    • #张量网络
    • #GPU加速
    • #量子轨迹法
    • #cuQuantum
    • #高性能计算
  • 深度解析:面向自适应资源、工作负载与任务管理的混合量子-HPC中间件系统

    2026-04-07

    本篇博客深度解析了Pilot-Quantum和Q-Dreamer,一个旨在连接量子计算与高性能计算(HPC)的创新中间件系统,为量子化学研究提供了前所未有的资源管理和工作负载优化能力。我们探讨了其架构、核心算法、性能表现及对复杂量子化学问题的深远影响。

    • #量子计算
    • #高性能计算
    • #中间件
    • #量子化学
    • #资源管理
    • #调度优化
  • 深度解析 GPU 加速量子线路模拟:经验后端选择、门融合与自适应精度技术

    2026-04-07

    本文深度解析了一种新型 GPU 加速量子模拟框架,该框架通过经验后端选择、DAG 门融合及自适应精度技术,在 A100 GPU 上实现了相较于传统 CPU 模拟最高 146 倍的加速,为 NISQ 时代的算法验证提供了高效工具。

    • #量子计算
    • #GPU加速
    • #量子化学模拟
    • #门融合
    • #高性能计算
  • 利用等距张量超收缩提升辅助场量子蒙特卡罗的效率:深度解析 ITHC-AFQMC

    2026-04-02

    本文深度解析了一种结合等距张量超收缩(ITHC)技术的新型 AFQMC 方法,探讨其如何通过在扩展空间对角化二体相互作用,显著降低计算复杂度并实现高效的 GPU 加速。

    • #量子蒙特卡罗
    • #AFQMC
    • #张量超收缩
    • #等距张量
    • #电子结构理论
    • #高性能计算
  • MATLAB 多 GPU 并行 FFT 加速大规模相场晶体 (PFC) 模拟:从理论基础到工程实现深度解析

    2026-04-01

    本文深度解析了一种在 MATLAB 环境下实现的双重多 GPU 并行策略,专门用于解决大规模相场晶体 (PFC) 模拟中的内存瓶颈与计算效率问题,实现了相比百核 CPU 高达 60 倍的加速。

    • #MATLAB
    • #GPU计算
    • #相场晶体
    • #快速傅里叶变换
    • #高性能计算
    • #材料科学
  • 桥接 AI 算力与量子化学:基于 INT8 精细模拟的 Ab Initio 电子结构计算加速方案深度解析

    2026-04-01

    本文深度探讨了如何利用现代 GPU 的 AI 加速单元(INT8 Tensor Cores)通过 Ozaki 精度模拟技术加速传统双精度 FP64 的量子化学负载,并在 MuST 软件包中实现了显著的性能提升。

    • #第一性原理计算
    • #GPU加速
    • #INT8量化模拟
    • #Ozaki算法
    • #MuST软件
    • #高性能计算
  • GPU 加速的极小辅助基 TDDFT:迈向三千原子体系的激发态第一性原理计算

    2026-03-31

    本文深入解析由周泽浩、孙其明、高毅勤等学者开发的 GPU 加速 TDDFT-risp 方法,该技术通过极小辅助基与交换空间截断,实现了在单块 A100 上对 3000 原子规模体系的激发态精准计算。

    • #TDDFT
    • #GPU4PySCF
    • #激发态
    • #大体系模拟
    • #高性能计算
    • #计算化学
  • 量子模拟架构的现代化:将 Julia-ITensors 深度集成至 XACC/TNQVM 框架解析

    2026-03-31

    本文深度解析了由橡树岭国家实验室(ORNL)开发的 JuliaITensorTNQVM 互操作层,探讨了如何通过 C-ABI 技术将高性能 Julia 张量网络库集成至 C++ 量子计算框架中,并验证了其在 QAOA 和 Haar 随机态模拟中的表现。

    • #张量网络
    • #量子电路模拟
    • #JuliaITensors
    • #XACC
    • #高性能计算
  • 迈向超大规模超快动力学模拟:ABACUS 软件包中基于数值原子轨道(NAO)的实时 TDDFT 异构并行实现深度解析

    2026-03-24

    本文深度解析了北京大学等团队在 ABACUS 中实现的统一异构 RT-TDDFT 框架。通过三层抽象结构与针对数值原子轨道的 GPU 核函数优化,该工作实现了高达 12 倍的算子加速,为探索大体系非平衡态电子动力学奠定了高性能计算基础。

    • #RT-TDDFT
    • #ABACUS
    • #GPU加速
    • #数值原子轨道
    • #量子化学
    • #高性能计算
  • 深度解析神经网络变分蒙特卡洛(NNVMC):从计算负荷特性到软硬件协同设计

    2026-03-24

    本文深度剖析了 NNVMC 在现代 GPU 上的计算瓶颈,揭示了拉普拉斯算子计算与内存墙之间的矛盾,并为量子化学模拟的硬件加速提供了战略性建议。

    • #NNVMC
    • #量子化学
    • #GPU加速
    • #算力瓶颈
    • #AI for Science
    • #高性能计算
  • 深度解析:面向下一代GPU的超高效耦合簇(CCSD)Python框架——CuPy与PyTorch在Hopper架构上的性能对决

    2026-03-24

    本文深度探讨了如何在NVIDIA Hopper和Grace Hopper架构上通过改进批处理算法,利用CuPy和PyTorch显著提升CCSD计算效率,最高实现10倍加速,为大规模量子化学计算提供了新的技术范式。

    • #耦合簇理论
    • #GPU加速
    • #Hopper架构
    • #PyBEST
    • #张量收缩
    • #量子化学
    • #高性能计算
  • 量子优越性的移动边界:张量网络视角的深度解构与反思

    2026-03-20

    本文深度综述了 IBM、D-Wave 和 Google 近年来的量子优越性实验,重点解析了张量网络(TN)方法如何通过算法创新在经典硬件上复现量子硬件的结果,并探讨了量子与经典计算竞争的未来趋势。

    • #张量网络
    • #量子优越性
    • #量子模拟
    • #经典模拟
    • #多体物理
    • #高性能计算
  • 融合计算新纪元:HPC、机器学习与量子计算协同驱动的下一代药物研发深度解析

    2026-03-20

    本文深度解析 Qubit Pharmaceuticals 与索邦大学最新提出的三位一体收敛框架,探讨如何通过高性能计算、基础机器学习模型与量子算法的协同,突破经典分子模拟的精度与效率瓶颈。

    • #量子化学
    • #药物研发
    • #机器学习势能面
    • #高性能计算
    • #分子动力学
  • 量子计算与AI的融合前夜:深度解析下一代药物研发的“协同范式”

    2026-03-18

    本文深度解析 Qubit Pharmaceuticals 团队提出的 HPC、机器学习与量子计算三位一体协同方案,探讨如何利用量子模拟器与基础模型突破经典算力极限,实现化学精度的药物模拟。

    • #量子化学
    • #变分量子本征求解器
    • #机器学习势能面
    • #高性能计算
    • #药物设计
    • #DBBSC
  • 彻底解决蜂窝晶格 Hubbard 模型的量子临界性:超大规模 PQMC 与子矩阵更新算法深度解析

    2026-03-18

    本文深度解析了发表于 arXiv:2602.03656 的突破性工作,该研究通过创新的子矩阵更新算法实现了万量级位点的 PQMC 模拟,最终解决了蜂窝晶格 Hubbard 模型量子临界指数长期存在的争议。

    • #量子蒙特卡洛
    • #Hubbard模型
    • #量子相变
    • #凝聚态物理
    • #高性能计算
  • 基于 GEMM 的非均匀网格 Poisson 直解法:高性能计算视角下的流体与量子化学计算加速

    2026-03-11

    深度解析 Costa 等人提出的基于 GEMM 的 3D Poisson 直接求解器,该方法通过张量分解与特征值分解,巧妙解决了非均匀网格下 FFT 的局限性,在现代 GPU 架构上实现了极高的并行效率。

    • #高性能计算
    • #流体动力学
    • #GPU加速
    • #数值计算
    • #线性代数
    • #量子化学
  • 并行 iQCC 赋能 200 量子比特级量子化学模拟:在钌催化剂体系超越经典基准

    2026-03-10

    本文深度解析了一种并行化、GPU 加速的迭代量子比特耦合簇(iQCC)方法,该方法成功突破了 200 量子比特规模的经典模拟瓶颈,在钌催化剂体系中展现了超越 DMRG 的精度,重新定义了量子计算在化学领域的实用化边界。

    • #量子化学
    • #iQCC
    • #GPU加速
    • #钌催化剂
    • #高性能计算
    • #量子优越性
  • 量子动力学模拟的GPU加速新范式:深度解析paces协同演化子空间方法

    2026-03-09

    本文深度解析 paces 方法:一种基于 GPU 并行化的协同演化子空间算法,旨在突破量子动力学模拟中的指数级维度灾难,并与矩阵乘积态 (MPS) 进行性能对标。

    • #量子动力学
    • #GPU加速
    • #协同演化子空间
    • #Holstein模型
    • #计算化学
    • #高性能计算
  • ByteQC:ByteDance 开源的高性能 GPU 加速大尺度量子化学计算软件包深度解析

    2026-03-07

    ByteQC 是由字节跳动研究团队开发的开源量子化学软件包,通过创新的 GPU 算法设计(如 Warp Specialization 和无转置张量缩并)及 SIE 嵌入方法,将 CCSD(T) 等高精度计算推向了万级轨道的超大规模体系。

    • #量子化学
    • #GPU加速
    • #ByteQC
    • #CCSD(T)
    • #密度矩阵嵌入理论
    • #高性能计算
  • 尘埃流体动力学与行星起源:流体不稳定性(SI)模拟代码的大规模深度基准测试

    2026-03-07

    本文深度解析了针对原行星盘流体不稳定性(SI)的首次系统性多代码比较研究,涵盖了从Lagrangian粒子到压强项缺失尘埃流体的多种数值模型及性能基准。

    • #流体不稳定性
    • #行星形成
    • #高性能计算
    • #计算流体力学
    • #数值基准测试
  • 量子化学高性能计算前沿:循环群对称张量收缩的自动不可约表示变换技术深度解析

    2026-03-05

    本文深度解析了一种名为“不可约表示对齐(Irreducible Representation Alignment)”的新颖算法,该方法能将复杂的块稀疏对称张量收缩全自动转化为高效的稠密张量操作,显著提升量子化学计算在大规模并行环境下的性能。

    • #量子化学
    • #张量收缩
    • #张量网络
    • #高性能计算
    • #循环群对称性
    • #Symtensor
  • 量子化学代码自动化的新里程碑:深入解析 tenpi 分布式张量编程框架

    2026-03-04

    本文深度解析了最新的 tenpi 框架,该框架通过图论衍生与自动化编译技术,攻克了高阶耦合集群(CC)理论在数千个 GPU 上的分布式扩展难题,实现了高达 1200 个 GPU 的卓越弱缩放性能。

    • #耦合集群理论
    • #GPU加速计算
    • #张量网络
    • #代码生成器
    • #高性能计算
    • #量子化学
  • 深度解析 WARPAX:利用 JAX 与自动微分攻克曲率驱动时空的观测者鲁棒性能量条件验证

    2026-03-04

    本文深度解析了 WARPAX 工具包,探讨其如何通过 JAX 自动微分和梯度优化,替代传统离散采样法,实现对曲率驱动时空能量条件的观测者鲁棒性验证。

    • #广义相对论
    • #自动微分
    • #JAX
    • #曲率驱动
    • #能量条件
    • #高性能计算
  • 张量网络方法突破十亿格点:超级莫尔激子光谱的深度解析

    2026-03-03

    本文深度解析了发表于 arXiv:2603.02011 的突破性工作,该研究利用张量网络技术成功在包含超过 10 亿个格点的超级莫尔系统中直接计算了激子光谱。

    • #张量网络
    • #莫尔激子
    • #Bethe-Salpeter方程
    • #量子多体计算
    • #超级莫尔系统
    • #高性能计算
  • 混合随机-确定性算法:攻克多参考扰动理论 (MRPT2) 的计算巅峰

    2026-03-02

    本文深度解析了一种结合确定性计算与随机采样的混合算法,旨在解决大规模多参考扰动理论(MRPT2)中的计算瓶颈,特别是在处理金属二聚体如 Cr2 等极具挑战性的体系时的卓越表现。

    • #量子化学
    • #多参考扰动理论
    • #蒙特卡洛
    • #MRPT2
    • #高性能计算
    • #Quantum Package
  • 极速 3D 多孔介质生成:GPU 加速的列表索引显式步进 LIETS-QSGS 算法深度解析

    2026-02-28

    本文深度解析了一种名为 LIETS-QSGS 的新型算法,该算法通过列表索引显式时间步进技术,将 3D 多孔介质的生成效率提升了数个数量级,使其在消费级 GPU 上仅需 24 秒即可完成 400³ 规模的重构。

    • #数字岩心
    • #GPU加速
    • #QSGS算法
    • #多孔介质重构
    • #高性能计算
    • #Python
  • 突破量子多体计算瓶颈:Quantics Tensor Train 的自适应补丁化(Adaptive Patching)技术深度解析

    2026-02-27

    本文深度解析了一种革命性的自适应补丁化(Adaptive Patching)方案,通过分治策略显著降低了 QTT 在处理强局部化函数时的计算复杂度和内存消耗,为解决 Bethe-Salpeter 方程等大规模量子力学问题开辟了新路径。

    • #量子多体物理
    • #张量网络
    • #Quantics Tensor Train
    • #Bethe-Salpeter 方程
    • #高性能计算
    • #Julia
  • 深度解析 ipie:迈向超大规模 CPU/GPU 混合架构 AFQMC 计算新纪元

    2026-02-24

    本文深度评述了 ipie 软件包的最新进展,重点分析其在多 Slater 行列式支持、分布式 GPU 算力扩展以及有限温度、声子耦合等前沿物理问题上的技术创新与性能突破。

    • #量子化学
    • #AFQMC
    • #GPU加速
    • #高性能计算
    • #ipie
    • #多尺度建模
  • 耦合簇Green's Function:过去、现在与未来——深度解析

    2026-02-21

    本文深度解析了耦合簇Green's Function (CCGF) 方法的演变,从理论基础到可扩展实现与未来应用,为量子化学研究人员提供了全面视角。

    • #耦合簇
    • #Green'sFunction
    • #量子化学
    • #高性能计算
    • #电子结构
    • #GFCCLib
  • 有限温度耦合簇理论 (FT-CCSD) 的高效实现与原型系统应用:从理论构筑到高性能模拟的深度解析

    2026-02-21

    本文深入解析了 Alec F. White 与 Garnet Kin-Lic Chan 关于有限温度耦合簇 (FT-CCSD) 的里程碑工作,涵盖虚时积分算法、响应属性计算、Hubbard 模型及从头算体系的全面应用与性能瓶颈分析。

    • #耦合簇理论
    • #有限温度
    • #FT-CCSD
    • #量子化学
    • #电子结构
    • #高性能计算

© 2026 Paper Notes.