Paper Notes
首页 标签 列表

GPU加速

  • 单节点十亿级自旋演化模拟:SpinX 框架深度解析与三维磁霍普夫子湮灭通道的发现

    2026-06-14

    本文深度解析基于 JAX 构建的 GPU 原生原子级自旋动力学框架 SpinX,探讨其多通道张量卷积、混合精度算法,以及其在百万级原子晶格上揭示磁霍普夫子“侧向破裂”与“轴向塌缩”双通道湮灭物理机制的突破性成果。

    • #自旋动力学
    • #磁霍普夫子
    • #JAX
    • #GPU加速
    • #过渡态搜索
    • #过渡路径方法
  • 统一稀疏架构:破解大规模物质点法(MPM)模拟中的网格计算瓶颈

    2026-06-14

    本文深度解析了一种全新的统一稀疏背景网格架构,该架构通过将稀疏网格构建转化为通用活动节点索引问题,为 CPU 和 GPU 平台分别设计了高性能硬件特定算法,实现了大变形物理模拟中1到2个数量级的速度提升和内存节省。

    • #物质点法 (MPM)
    • #稀疏网格
    • #高性能计算
    • #GPU加速
    • #计算物理
  • ARCHÊ:基于自洽场无轨道密度泛函理论(OFDFT)的高效温稠密物质状态方程模拟平台

    2026-06-13

    本文对新型无轨道分子动力学(OFMD)开源代码 ARCHÊ 进行深度技术拆解,系统剖析其基于自洽场(SCF)的密度求解框架、两种原创的收敛加速算法以及相比于传统 Kohn-Sham DFT 在温稠密物质模拟中的显著性能优势。

    • #无轨道密度泛函理论
    • #温稠密物质
    • #自洽场方法
    • #分子动力学
    • #GPU加速
    • #状态方程
  • 迈向百亿亿次计算:GPU加速高阶CFD框架MARUT深度解析与热化学非平衡态流体模拟实践

    2026-06-08

    本文深度解析基于Julia语言开发的、面向下一代百亿亿次超算的多GPU高阶CFD框架MARUT。该框架完美集成了不连续伽辽金谱元素法(DGSEM)、完全GPU驻留的自适应网格细化(AMR)以及复杂的五组分/十一组分热化学非平衡化学动力学模型,实现了零主机-设备数据传输瓶颈的高效流体动力学模拟。

    • #计算流体力学
    • #GPU加速
    • #自适应网格细化
    • #热化学非平衡态
    • #Julia语言
    • #百亿亿次计算
  • 破除 3000 倍量子霸权幻觉:利用 U(1) × SU(2) 非阿贝尔对称性与 GPU 动力学张量网络将 1D 费米-哈巴德经典模拟推向极限

    2026-06-04

    本文深度解析了 Roman Rausch 等人的最新突破:通过融合 U(1) × SU(2) 强对称性与 PyTorch GPU 加速技术,将 1D 费米-哈巴德模型的 TDVP 经典模拟截断键合维度推至 62,000 这一史无前例的极限,成功纠正了先前 Q-CTRL 声称的 3000 倍量子优势,并完成了量子芯片无法企及的 t=7 高纠缠非平衡态演化动力学精确模拟。

    • #强关联体系
    • #费米-哈巴德模型
    • #张量网络
    • #时间相关变分原理
    • #非阿贝尔对称性
    • #GPU加速
    • #量子模拟验证
  • 深度解析 SLIM:基于不连续伽辽金(DG)方法的高效多 GPU 海洋模型实现

    2026-05-24

    本文深度解析了 SLIM 模型如何通过优化内存布局、矩阵无关求解器及多 GPU 并行策略,将不连续伽辽金方法在大规模海洋模拟中的计算性能提升至全新高度,实现单卡对比 CPU 千核级别的性能飞跃。

    • #计算流体力学
    • #GPU加速
    • #不连续伽辽金方法
    • #高性能计算
    • #海洋模型
    • #并行计算
  • 超声波全场波形拟合:跨越介质色散限制的晶体织构确定新范式

    2026-05-24

    本文深度解析了一种利用超声测角术与全场波形拟合确定晶体织构的方法,通过Hashin-Shtrikman界限与GPU加速优化,实现了不依赖介质色散特性的高精度织构反演。

    • #超声波表征
    • #晶体织构
    • #弹性均匀化
    • #GPU加速
    • #反演算法
    • #非破坏性检测
  • 突破薛定谔方程维数灾难:基于 JAX 与 GPU 加速的张量积求解器深度实战

    2026-05-21

    本文深度解析刘鑫宇与张祥雄教授的最新研究成果,介绍一种基于 GPU 加速、利用张量积结构实现 $O(N^{1+1/d})$ 复杂度的薛定谔算符求解器,支持在单卡上处理 10 亿自由度的 3D 问题及 9 维多体模拟。

    • #量子化学
    • #GPU加速
    • #薛定谔方程
    • #张量积方法
    • #JAX
    • #哈密顿模拟
  • Polfed.jl:量子多体系统能谱中心特征对计算的革命性突破

    2026-05-17

    深入解析 Polfed.jl 软件包:通过多项式过滤精确对角化算法,在大幅降低显存占用的同时,利用 GPU 加速实现对大规模量子多体系统能谱中心特征对的高效提取。

    • #量子多体物理
    • #精确对角化
    • #Julia语言
    • #GPU加速
    • #Lanczos算法
    • #多体局域化
  • FusionRCG:深度优化 GPU 内存层级,攻克量子化学递归计算图的“存储墙”

    2026-05-16

    本文深度解析 FusionRCG 框架如何通过协同优化计算图结构、代数降维与自适应内存映射,解决 HGP 算法在 GPU 上的寄存器压力瓶颈,实现电子排斥积分计算的突破性加速。

    • #量子化学
    • #GPU加速
    • #电子排斥积分
    • #计算图优化
    • #高性能计算
    • #FusionRCG
  • 突破量子化学计算瓶颈:KerneLDI 块结构矩阵乘法加速局域驱动积分深度解析

    2026-05-16

    本文深度解析 KerneLDI 框架,该框架通过块过滤表示和自定义 GPU 算子,解决了密度泛函理论中 EXC 积分在高效计算与动态稀疏性之间的矛盾,实现最高 10 倍的性能提升。

    • #DFT
    • #GPU加速
    • #张量核心
    • #量子化学
    • #矩阵乘法
    • #KerneLDI
  • 使用Polfed.jl加速量子多体系统的本征对计算:深度解析

    2026-05-14

    Polfed.jl是一个用Julia编写的开源软件包,通过多项式滤波精确对角化(POLFED)算法,高效计算量子多体哈密顿量的中谱本征对,从而克服了传统方法的内存限制,并支持GPU加速。

    • #量子多体物理
    • #本征对计算
    • #Julia
    • #GPU加速
    • #稀疏矩阵
  • FusionRCG:通过编排递归计算图攻克量子化学积分的“存储墙”

    2026-05-14

    本文深度解析 FusionRCG 框架,该框架通过协同优化递归计算图(RCG)结构与 GPU 存储映射,有效解决了 HGP 算法在 GPU 上的寄存器溢出难题,实现了 SCF 计算的显著加速。

    • #量子化学
    • #GPU加速
    • #电子排斥积分
    • #存储层次结构
    • #高性能计算
    • #HGP算法
  • 量子化学加速新境界:KerneLDI 块结构矩阵乘法深度解析

    2026-05-14

    本文深度解析 KerneLDI 框架,通过协同设计数据布局、屏蔽逻辑与计算算子,利用块结构矩阵乘法(BSMM)攻克量子化学局部驱动积分的效率瓶颈,实现 EXC 计算 10 倍加速。

    • #量子化学
    • #GPU加速
    • #密度泛函理论
    • #矩阵乘法
    • #高性能计算
  • foap4:融合 OpenACC、MPI 与 p4est 的高性能自适应网格细化(AMR)框架深度解析

    2026-05-12

    本文深度解析 foap4 框架的设计与实现,探讨如何在 Fortran 环境下通过 OpenACC 指令集与 p4est 库协同,解决 GPU 上自适应网格细化(AMR)的性能瓶颈。

    • #高性能计算
    • #自适应网格细化
    • #OpenACC
    • #GPU加速
    • #Fortran
    • #p4est
  • 大规模并行性能可移植的 Particle-in-Cell 方案对比:面向静电动力学等离子体模拟的深度解析

    2026-05-08

    本文深度解析了基于 IPPL 框架的多种泊松求解器在异构超算架构上的性能表现,探讨了 FFT、PCG、FEM 及 PIF 方案在处理静电 Vlasov-Poisson 系统时的优劣与扩展性。

    • #等离子体物理
    • #Particle-in-Cell
    • #高性能计算
    • #GPU加速
    • #性能可移植性
    • #数值求解器
  • 极端尺度下的流固耦合:基于 GPU 加速的锐界面浸没边界法(IBM)深度解析

    2026-05-07

    本文深度解析了由 Johns Hopkins 与 NVIDIA 合作开发的 GPU 原生 sharp-interface IBM 求解器,揭示了其在 10 亿级网格下实现 42 倍能效提升及复杂生物飞行模拟的核心技术路线。

    • #计算流体力学
    • #流固耦合
    • #GPU加速
    • #浸没边界法
    • #高性能计算
    • #生物飞行
  • 迈向十万电子体系的化学精度:PAW-FE 方法在 GPU 架构下的性能飞跃与深度技术解析

    2026-05-01

    本文深度解析了 PAW-FE 方法如何通过 GPU 架构优化、R-ChFSI 算法以及混合精度通信,将化学精度的 DFT 计算扩展至 130,000 电子规模。

    • #密度泛函理论
    • #有限元方法
    • #GPU加速
    • #PAW方法
    • #高性能计算
    • #量子化学
  • 超声速湍流中的能谱与能流标度律:基于高保真直接数值模拟(DNS)的深度解析

    2026-04-30

    本文深度解析了由Harshit Tiwari等学者发表的关于超声速湍流的研究,通过1024^3高分辨率DNS揭示了能量从螺线模态向压缩模态跨尺度传输的物理本质。

    • #流体力学
    • #直接数值模拟
    • #超声速湍流
    • #GPU加速
    • #计算物理
    • #标度律
  • 击碎“量子优越性”幻觉:基于 MPO 迭代抵消与“解交换”启发式的峰值量子线路高效模拟深度解析

    2026-04-24

    本文深度解析 IBM Quantum 团队发表的最新成果,通过一种名为“解交换”的贪婪启发式算法,成功在单块 GPU 上仅用 1 小时便复现了此前声称具有量子优越性的 56 比特峰值量子线路,揭示了镜像线路结构的本质漏洞。

    • #量子计算
    • #张量网络
    • #矩阵乘积算符
    • #量子优越性
    • #经典模拟
    • #GPU加速
  • GreenPeas:利用即时编译解码超图解锁自适应量子纠错

    2026-04-21

    本文深度解析 GreenPeas 工具链,它通过 GPU 加速的即时编译(JIT)技术,解决了自适应量子纠错电路中解码超图编译的性能瓶颈,实现了超过 10 倍的加速。

    • #量子纠错
    • #GPU加速
    • #即时编译
    • #自适应电路
    • #量子计算架构
  • 广义各向异性弹性的超声表征:基于最优零阶弹性边界与波形拟合的GPU加速反演法深度解析

    2026-04-18

    本文深度解析了一种利用浸入式超声角谱测定广义各向异性材料弹性常数的新方法,该方法结合了Hashin-Shtrikman零阶边界约束与GPU加速的波形拟合技术。

    • #弹性力学
    • #超声波检测
    • #GPU加速
    • #材料表征
    • #数值优化
    • #各向异性
  • 迈向大规模量子分子生成:GPU加速张量网络模拟的深度解析

    2026-04-16

    本文深度解析了 SQMG 框架,探讨其如何通过“原子不复用、键复用”架构与 GPU 加速张量网络模拟,将量子分子生成的规模扩展至 40 个重原子,突破了传统状态向量模拟的内存瓶颈。

    • #量子计算
    • #分子设计
    • #张量网络
    • #CUDA-Q
    • #GPU加速
    • #变分量子电路
  • 突破算力瓶颈:基于缓存分块、Boost 加速与门融合优化的超大规模量子线路模拟深度解析

    2026-04-15

    本文深度解析了由台湾大学与成功大学团队提出的量子模拟优化框架,该工作通过 Merge Booster 和 Diagonal Detector 算法,在 64 片 NVIDIA H100 GPU 集群上实现了对 38 比特量子线路的高效模拟,最高加速比达 160 倍。

    • #量子线路模拟
    • #高性能计算
    • #GPU加速
    • #量子算法优化
    • #DGX-H100
    • #算力调度
  • 突破模拟极限:NVIDIA 统一路径变分与非简并分批采样技术,实现量子张量网络 10^8 倍加速

    2026-04-09

    本文深度解析 NVIDIA 团队通过统一路径变分 (UPV) 与非简并分批采样 (NBS) 技术,将量子张量网络噪声模拟速度提升至最高 1 亿倍的突破性工作,为量子化学与纠错研究提供强力支持。

    • #量子计算
    • #张量网络
    • #GPU加速
    • #量子轨迹法
    • #cuQuantum
    • #高性能计算
  • gyaradax:深度解析基于 JAX 的可微局部回旋动力学仿真框架

    2026-04-09

    本文深度解析了 gyaradax——一个仅用 3000 行 JAX 代码实现的高性能、可微局部回旋动力学求解器,探讨其在 GPU 加速、自动微分及 AI 辅助开发方面的突破。

    • #回旋动力学
    • #JAX
    • #自动微分
    • #等离子体物理
    • #GPU加速
    • #AI-Agent
  • 深度解析 GPU 加速量子线路模拟:经验后端选择、门融合与自适应精度技术

    2026-04-07

    本文深度解析了一种新型 GPU 加速量子模拟框架,该框架通过经验后端选择、DAG 门融合及自适应精度技术,在 A100 GPU 上实现了相较于传统 CPU 模拟最高 146 倍的加速,为 NISQ 时代的算法验证提供了高效工具。

    • #量子计算
    • #GPU加速
    • #量子化学模拟
    • #门融合
    • #高性能计算
  • 自适应张量网络模拟:基于熵反馈 PID 控制与 GPU 加速 SVD 的深度解析

    2026-04-07

    本文深度解析了一种创新的自适应张量网络模拟框架,该框架通过 PID 控制算法动态管理键维数 χ,结合 GPU 加速的 SVD 计算,在保持高精度的同时显著提升了量子多体系统模拟的效率与自动化程度。

    • #张量网络
    • #DMRG
    • #量子多体计算
    • #PID控制
    • #GPU加速
    • #矩阵乘积态
  • Tsim:基于 ZX 演算与稳定子秩分解的 GPU 加速通用量子纠错模拟器深度解析

    2026-04-02

    Tsim 是由 QuEra 开发的高性能、通用量子电路模拟器,通过结合 ZX 演算简化与稳定子秩分解,在保持 Stim API 兼容性的同时,实现了对非克利福德门的快速模拟与 GPU 加速。

    • #量子纠错
    • #ZX-Calculus
    • #GPU加速
    • #稳定子秩分解
    • #量子电路模拟
  • 深度解析 Hyperion:利用 GPU 加速与 SV-MPS 混合策略突破量子化学模拟极限

    2026-04-01

    本文深度解析了 Hyperion 量子模拟器如何通过创新的 SV-MPS 划分策略和定制化 GPU 内核,在 16 张 H100 GPU 上实现 36-40 量子位的强相干化学系统高精度模拟。

    • #量子计算
    • #量子化学
    • #GPU加速
    • #ADAPT-VQE
    • #张量网络
    • #Hyperion
  • 桥接 AI 算力与量子化学:基于 INT8 精细模拟的 Ab Initio 电子结构计算加速方案深度解析

    2026-04-01

    本文深度探讨了如何利用现代 GPU 的 AI 加速单元(INT8 Tensor Cores)通过 Ozaki 精度模拟技术加速传统双精度 FP64 的量子化学负载,并在 MuST 软件包中实现了显著的性能提升。

    • #第一性原理计算
    • #GPU加速
    • #INT8量化模拟
    • #Ozaki算法
    • #MuST软件
    • #高性能计算
  • 纳米光子学逆向设计中的内存革命:基于 FDTDX 的低精度与时间子采样场优化深度解析

    2026-03-27

    本文深度解析了 Mahlau 等人提出的通过减少位宽表示(如 FP8)和时间步子采样来优化 FDTD 时间反转梯度计算内存效率的方法,实现了在不损失优化精度的前提下 64 倍的内存节省。

    • #FDTD
    • #逆向设计
    • #GPU加速
    • #低精度计算
    • #纳米光子学
  • GPU 加速 PySCF 多尺度高斯-平面波 (FFTDF) 算法:开启大规模量子化学模拟的新纪元

    2026-03-26

    本文深度解析了 PySCF 最新推出的 GPU 加速多尺度高斯-平面波 (FFTDF) 算法实现,探讨其如何在 H100 GPU 上实现 25 倍加速,并达到 FP64 峰值性能的 80%。

    • #PySCF
    • #GPU加速
    • #密度泛函理论
    • #多尺度网格
    • #FFTDF
    • #计算化学
  • soliton_solver:基于 GPU 加速的二维非线性场论拓扑孤子通用求解器深度解析

    2026-03-26

    本文深度解析了开源软件包 soliton_solver,探讨其如何利用 Numba CUDA 实现跨学科的二维非线性场论数值模拟,通过理论不可知架构与 Arrested Newton Flow 算法解决复杂物理体系的能量极小化问题。

    • #拓扑孤子
    • #GPU加速
    • #非线性场论
    • #数值模拟
    • #Numba CUDA
    • #凝聚态物理
  • 迈向超大规模超快动力学模拟:ABACUS 软件包中基于数值原子轨道(NAO)的实时 TDDFT 异构并行实现深度解析

    2026-03-24

    本文深度解析了北京大学等团队在 ABACUS 中实现的统一异构 RT-TDDFT 框架。通过三层抽象结构与针对数值原子轨道的 GPU 核函数优化,该工作实现了高达 12 倍的算子加速,为探索大体系非平衡态电子动力学奠定了高性能计算基础。

    • #RT-TDDFT
    • #ABACUS
    • #GPU加速
    • #数值原子轨道
    • #量子化学
    • #高性能计算
  • 深度解析神经网络变分蒙特卡洛(NNVMC):从计算负荷特性到软硬件协同设计

    2026-03-24

    本文深度剖析了 NNVMC 在现代 GPU 上的计算瓶颈,揭示了拉普拉斯算子计算与内存墙之间的矛盾,并为量子化学模拟的硬件加速提供了战略性建议。

    • #NNVMC
    • #量子化学
    • #GPU加速
    • #算力瓶颈
    • #AI for Science
    • #高性能计算
  • 深度解析:面向下一代GPU的超高效耦合簇(CCSD)Python框架——CuPy与PyTorch在Hopper架构上的性能对决

    2026-03-24

    本文深度探讨了如何在NVIDIA Hopper和Grace Hopper架构上通过改进批处理算法,利用CuPy和PyTorch显著提升CCSD计算效率,最高实现10倍加速,为大规模量子化学计算提供了新的技术范式。

    • #耦合簇理论
    • #GPU加速
    • #Hopper架构
    • #PyBEST
    • #张量收缩
    • #量子化学
    • #高性能计算
  • QuaSARQ:利用 GPU 并行前缀和算法突破量子稳定器电路模拟瓶颈

    2026-03-21

    本文深度解析 Leiden 大学开发的 QuaSARQ 框架,探讨其如何通过重构高斯消元为并行前缀和操作,实现 105 倍的 Clifford 电路模拟加速。

    • #量子计算
    • #GPU加速
    • #稳定器电路
    • #CUDA
    • #量子模拟
  • 量子化学计算的大规模飞跃:多 GPU 加速 MBE(3)-OSV-MP2 方法深度解析

    2026-03-17

    本文深度解析香港大学杨钧教授团队开发的多 GPU 并行 MBE(3)-OSV-MP2 算法,该方法实现了 O(N^1.9) 的优异标度,并在 24 块 GPU 上展现出极高的计算效率。

    • #量子化学
    • #GPU加速
    • #MP2理论
    • #多体展开
    • #计算化学
  • PySCF 十年征程:开源量子化学框架的深度解析与未来展望

    2026-03-17

    本文深度解析 PySCF 项目十年来的技术演进,涵盖从周期性体系计算到 GPU 加速及自动微分的核心进展,是量子化学科研人员的必备指南。

    • #PySCF
    • #量子化学
    • #开源软件
    • #电子结构理论
    • #GPU加速
    • #自动微分
  • 基于 GEMM 的非均匀网格 Poisson 直解法:高性能计算视角下的流体与量子化学计算加速

    2026-03-11

    深度解析 Costa 等人提出的基于 GEMM 的 3D Poisson 直接求解器,该方法通过张量分解与特征值分解,巧妙解决了非均匀网格下 FFT 的局限性,在现代 GPU 架构上实现了极高的并行效率。

    • #高性能计算
    • #流体动力学
    • #GPU加速
    • #数值计算
    • #线性代数
    • #量子化学
  • 并行 iQCC 赋能 200 量子比特级量子化学模拟:在钌催化剂体系超越经典基准

    2026-03-10

    本文深度解析了一种并行化、GPU 加速的迭代量子比特耦合簇(iQCC)方法,该方法成功突破了 200 量子比特规模的经典模拟瓶颈,在钌催化剂体系中展现了超越 DMRG 的精度,重新定义了量子计算在化学领域的实用化边界。

    • #量子化学
    • #iQCC
    • #GPU加速
    • #钌催化剂
    • #高性能计算
    • #量子优越性
  • 深度解析:面向先进封装设计的全尺度 GPU 加速瞬态电磁-热-力耦合仿真

    2026-03-10

    本文深度解析了一种新型 GPU 加速的瞬态电磁-热-力(EM-Thermal-Mechanical)全耦合仿真方案,旨在解决 2.5D/3D 高密度封装设计中瞬态信号引发的局部热冲击与应力集中问题。

    • #先进封装
    • #GPU加速
    • #多物理场耦合
    • #瞬态分析
    • #计算物理
    • #异构集成
  • 量子动力学模拟的GPU加速新范式:深度解析paces协同演化子空间方法

    2026-03-09

    本文深度解析 paces 方法:一种基于 GPU 并行化的协同演化子空间算法,旨在突破量子动力学模拟中的指数级维度灾难,并与矩阵乘积态 (MPS) 进行性能对标。

    • #量子动力学
    • #GPU加速
    • #协同演化子空间
    • #Holstein模型
    • #计算化学
    • #高性能计算
  • ByteQC:ByteDance 开源的高性能 GPU 加速大尺度量子化学计算软件包深度解析

    2026-03-07

    ByteQC 是由字节跳动研究团队开发的开源量子化学软件包,通过创新的 GPU 算法设计(如 Warp Specialization 和无转置张量缩并)及 SIE 嵌入方法,将 CCSD(T) 等高精度计算推向了万级轨道的超大规模体系。

    • #量子化学
    • #GPU加速
    • #ByteQC
    • #CCSD(T)
    • #密度矩阵嵌入理论
    • #高性能计算
  • 深入 mumax+ 磁子学:实现从相干到耗散耦合的多模腔磁子学仿真架构解析

    2026-03-05

    本文深度解析了针对 mumax+ 框架开发的双层腔磁子学扩展,该工具实现了对磁子-光子强耦合、多模杂化及非相干耗散过程的高效仿真。

    • #微磁学模拟
    • #磁子学
    • #mumax+
    • #GPU加速
    • #量子信息
  • 突破显存瓶颈:基于 Triton 门融合的量子机器学习高效经典仿真深度解析

    2026-03-04

    本文深度解析了 Yoshiaki Kawase 提出的门融合技术,该技术通过优化 Triton 核函数,在 GPU 上实现了 QML 训练 20-30 倍的吞吐量提升,为深层量子线路的大规模模拟提供了可能。

    • #量子机器学习
    • #GPU加速
    • #Triton
    • #变分量子算法
    • #量子化学
    • #算子融合
  • 极速 3D 多孔介质生成:GPU 加速的列表索引显式步进 LIETS-QSGS 算法深度解析

    2026-02-28

    本文深度解析了一种名为 LIETS-QSGS 的新型算法,该算法通过列表索引显式时间步进技术,将 3D 多孔介质的生成效率提升了数个数量级,使其在消费级 GPU 上仅需 24 秒即可完成 400³ 规模的重构。

    • #数字岩心
    • #GPU加速
    • #QSGS算法
    • #多孔介质重构
    • #高性能计算
    • #Python
  • 破局维数灾难:深度学习规模的精确离散随机模拟与梯度优化深度解析

    2026-02-27

    本文深度解析了发表在《Science》级别期刊潜力的突破性工作:通过解耦前向模拟与反向传播,利用Gumbel-Softmax直通估计器实现了20万参数规模的精确化学主方程梯度优化。

    • #随机过程
    • #吉莱斯皮算法
    • #自动微分
    • #计算生物学
    • #GPU加速
    • #机器学习
  • 深度解析 ipie:迈向超大规模 CPU/GPU 混合架构 AFQMC 计算新纪元

    2026-02-24

    本文深度评述了 ipie 软件包的最新进展,重点分析其在多 Slater 行列式支持、分布式 GPU 算力扩展以及有限温度、声子耦合等前沿物理问题上的技术创新与性能突破。

    • #量子化学
    • #AFQMC
    • #GPU加速
    • #高性能计算
    • #ipie
    • #多尺度建模
  • 深度解析 Meta-Learning + GPU 加速:开启量子多体问题模拟的新纪元

    2026-02-19

    本文深度解析了如何利用 LSTM 元学习框架与 NVIDIA CUDA-Q 平台结合,通过 GPU 加速大幅提升变分量子特征值求解器 (VQE) 的收敛速度与精度,解决量子化学与物理模拟中的关键瓶颈。

    • #VQE
    • #Meta-Learning
    • #CUDA-Q
    • #量子化学
    • #GPU加速
    • #深度学习
  • 基于有效哈密顿量虚时演化的非马尔可夫路径积分高效模拟:EH-TEMPO 算法深度解析

    2026-02-18

    本文深度解析了由北京师范大学任佳骏课题组提出的 EH-TEMPO 算法,该方法通过将 Feynman-Vernon 影响泛函重构为有效哈密顿量的虚时演化,显著降低了多态系统模拟的计算复杂度,并在 GPU 上实现了高达 17.5 倍的加速。

    • #量子动力学
    • #张量网络
    • #非马尔可夫过程
    • #路径积分
    • #EH-TEMPO
    • #GPU加速

© 2026 Paper Notes.