来源论文: https://arxiv.org/abs/2605.02606v1 生成时间: May 09, 2026 18:06

NESSi 2.0：从亚飞秒到皮秒，跨时标量子多体动力学模拟的新纪元

0. 执行摘要

在现代凝聚态物理与量子化学领域，研究物质在强场驱动下的非平衡动力学（如超快激光诱导的相变、非平衡超导等）已成为核心前沿。非平衡格林函数（NEGF）理论，特别是基于卡达诺夫-贝姆方程（Kadanoff-Baym Equations, KBE）的模拟，提供了描述量子多体系统实时演化的最完备框架。然而，KBE 的传统数值解法面临严峻的算力挑战：计算量随时间步数 $N_t$ 呈 $O(N_t^3)$ 增长，内存消耗呈 $O(N_t^2)$ 增长，这极大地限制了模拟的物理时长。

NESSi 2.0（Non-Equilibrium Systems Simulation package version 2.0）的发布标志着这一瓶颈的重大突破。该版本通过引入**内存截断（Memory Truncation）技术，将长程演化的计算复杂度降低至 $O(N_t N_c^2)$，内存降低至 $O(N_c^2)$（其中 $N_c$ 为截断深度）。同时，软件新增了非平衡稳态（NESS）**的直接求解模块，允许研究者避开漫长的实时演化，直接获取传输特性。本文将从理论基础、算法实现、基准测试及复现指南四个维度，深度拆解这一强大的开源工具包。

1. 核心科学问题，理论基础，技术难点与方法细节

1.1 核心科学问题：多体动力学的“时延效应”

在多体系统中，格林函数 $G(t, t')$ 描述了在 $t'$ 时刻产生的激发演化到 $t$ 时刻的概率幅。由于粒子间的碰撞与相互作用，系统在当前时刻的行为强烈依赖于其过去所有时刻的状态。这种“记忆效应”在数学上表现为 KBE 方程中的卷积积分：

$$ [i\partial_t - \epsilon(t)] G(t, t') - [\Sigma * G](t, t') = \delta_C(t, t') $$

其中 $\Sigma * G$ 代表自能 $\Sigma$ 与格林函数在 Keldysh 轮廓上的卷积。随着演化时间增加，积分区间线性增大，导致每增加一个时间步，计算成本就会以前一步的平方量级增加，这种立方的复杂度增长（$N_t^3$）使得模拟皮秒级（$10^{-12}$ s）的动力学过程在普通集群上几乎是不可能的。

1.2 理论基础：Keldysh 形式论与内存截断

内存截断的物理依据： 在具有耗散或显著散射的多体系统中，相互作用产生的相关性通常会随时间差 $|t - t'|$ 指数级衰减。这意味着，很久以前发生的物理事件对当前时刻的影响微乎其微。NESSi 2.0 利用这一特性，引入了截断参数 $t_c$。当 $|t - t'| > t_c$ 时，令自能 $\Sigma(t, t') \approx 0$。

理论公式演变： 传统的全卷积积分为：

$$ I(t) = \int_0^t dt' \Sigma^R(t, t') G^<(t', t'') $$

引入内存截断后，积分范围被限制在固定的窗口内：

$$ I(t) \approx \int_{t-t_c}^t dt' \Sigma^R(t, t') G^<(t', t'') $$

这使得算法在每一个新的时间步上执行的运算量保持恒定。为了实现这一点，NESSi 2.0 设计了专门的滑动窗口数据结构 herm_matrix_moving，利用循环指针技术在不复制大矩阵的情况下实现窗口的物理步进。

1.3 非平衡稳态 (NESS) 的频率域求解

在诸如量子点传输、恒定电压偏置下的导线等物理场景中，系统最终会进入一个时间平移对称（Time-translational Invariant）的状态，此时所有相关函数仅依赖于时间差 $\tau = t - t'$。NESSi 2.0 的另一大核心创新是直接在频率域求解戴森方程：

$$ G^R(\omega) = [\omega + i0^+ - \epsilon - \Sigma^R(\omega)]^{-1} $$

通过快速傅里叶变换（FFT），NESS 模块可以极高效地计算谱函数 $A(\omega)$ 和分布函数 $F(\omega)$，这为研究近平衡态和缓慢演化的“准稳态”（Prethermal states）提供了全新的工具。

1.4 技术难点：稳定性的维持

内存截断虽好，但并非简单地强行归零。在数值实现中，最大的难点在于如何保证截断后的积分方案依然满足守恒律（如粒子数守恒）。NESSi 2.0 采用了高阶格雷戈里（Gregory）积分规则和向后差分公式（BDF），确保了在步长 $h$ 较小的情况下，截断误差能够被严格控制。此外，针对 $G^R$ 组件的演化，软件引入了共轭方程离散化技术，解决了长时间演化中可能出现的数值不稳定性。

2. 关键 benchmark 体系，计算所得数据与性能分析

2.1 哈伯德模型（Hubbard Model）的相互作用猝灭

为了验证内存截断的有效性，NESSi 2.0 选取了典型的哈伯德模型在 Bethe 晶格上的动力学作为基准。研究场景为相互作用猝灭（Interaction Quench）：系统初始处于无相互作用的平衡态（$U=0$），在 $t=0$ 时突然开启相互作用 $U$。

性能数据对比：

全内存模拟（NESSi 1.0）： 当模拟时间达到 $N_t = 30000$ 步时，所需内存高达 14 GB。计算时间随步数增加呈非线性暴涨。
截断内存模拟（NESSi 2.0）： 采用截断深度 $t_c = 24$（对应 $N_c = 600$ 步），在同样的 MacBook M2 处理器上，内存消耗仅为 130 MB，且计算时间随步数呈严格线性增长。
精度： 如图 4 所示，当 $t_c$ 达到 24 时，动量分布函数 $\rho_k(t)$ 的演化曲线与全内存参考解几乎完全重合，误差控制在 $10^{-5}$ 量级以下。

2.2 安德森杂质模型（AIM）的稳态传输

在 NESS 模块的测试中，软件模拟了一个连接在两个金属电极之间的量子点系统。通过施加偏置电压 $V$，研究其稳态电流。

关键物理发现：

谱函数展宽： 随着相互作用 $U$ 增加，谱函数 $A(\omega)$ 的中心峰出现显著展宽。这一结果与之前的实时演化极限一致，但计算速度提升了 2-3 个数量级。
分布函数： NESS 模拟清晰地展示了非热分布。在偏置电压窗口内，分布函数 $F(\omega)$ 表现出明显的阶梯状结构，体现了左右电极化学势的竞争。

2.3 收敛性测试：$h^2$ 缩放律

NESSi 2.0 对时间步长 $h$ 进行了严格的误差分析。数据表明，无论是稳态求解还是实时截断模拟，其误差均遵循 $O(h^2)$ 的缩放规律（由梯形法则积分决定）。这证明了代码实现的数学严谨性，用户可以通过外推法进一步提高计算精度。

3. 代码实现细节，复现指南与软件包资源

3.1 核心类结构设计

NESSi 2.0 使用 C++11 标准编写，其核心架构分为三个层次：

容器层： herm_matrix_moving 类。这是 2.0 版本的核心，它通过一个环形缓冲区管理时间片。当时间前进时，代码只需移动指针 head = (head + 1) % N_c，避免了耗时的 $O(N_c^2)$ 数据搬运。
算子层： cntr::dyson_timestep。该函数封装了单步推进的逻辑，内部自动处理自能的卷积积分。它接受 function_moving（代表单时间参数函数，如哈密顿量）作为输入。
稳态层： herm_matrix_ness 类。使用 fft_array 存储数据，支持在时间域和频率域之间无缝切换。

3.2 编译与环境配置

复现 NESSi 2.0 的计算结果，建议使用以下环境配置：

编译器： GCC 7.0+ 或 Clang 6.0+（需支持 C++11）。
核心依赖：
- cmake (>= 3.1)
- Eigen3 (矩阵运算核心)
- FFTW3 (NESS 模块必备)
- HDF5 (高维数据存储必备)
- MPI/OpenMP (可选，用于大规模并行)

编译命令示例：

mkdir build && cd build
cmake -Dness=ON -Dhdf5=ON -Dmp=ON ..
make -j4

其中 -Dness=ON 开关是开启 2.0 稳态功能的关键。

3.3 开源资源与复现指南

GitHub 仓库： https://github.com/nessi-cntr/nessi
官方文档： https://nessi.readthedocs.io/
复现步骤：
1. 进入 examples/programs/ 目录。
2. 运行 trunc_bethe_start.cpp 生成初始几步的格林函数（全内存模式）。
3. 运行 trunc_bethe.cpp，加载 HDF5 初始文件，启动截断内存的长程演化。
4. 使用 utils/demo_trunc_bethe.ipynb 进行后处理，绘制物理图表。

4. 关键引用文献与局限性评论

4.1 关键引用文献

Kadanoff & Baym (1962)： 奠定了 KBE 方程的基础理论。
Schüler et al. (2020)： NESSi 1.0 的原始文献，定义了核心数据结构。
Stahl et al. (2022)： 首次系统性论证了自能截断在 DMFT 框架下的可行性，是 NESSi 2.0 内存算法的物理原型。
Aoki et al. (2014)： 关于非平衡 DMFT 的综述，是使用本软件包的必读理论背景。

4.2 局限性评论

尽管 NESSi 2.0 极大地扩展了模拟能力，但在以下场景中仍存在局限性：

慢衰减自能： 如果系统的自能项衰减极慢（如在接近二级相变点或具有长程纠缠的非遍历系统中），强行截断会导致物理图像的完全错误。用户必须预先通过短时间全模拟来验证自能的衰减速度。
强耦合极限： 目前版本的 NESSi 主要集成了弱耦合摄动理论（如 GW, 2nd Born）。对于强耦合近藤效应（Kondo Effect）等问题，仍需配合更复杂的杂质求解器（如 QMC），而这些求解器与内存截断接口的兼容性尚在开发中。
算力上限： 虽然线性增长优于立方增长，但由于格林函数是多指标矩阵（带轨道、自旋索引），当轨道数超过 10 时，单个时间步的算力消耗依然巨大。

5. 补充：量子化学与材料模拟中的实际应用建议

5.1 如何选择最佳的截断时长 $t_c$？

在实际科研中，建议采用“两步验证法”：

第一步：固定一个较小的时间窗口进行全模拟，观察自能 $\Sigma(t, 0)$ 衰减到其最大值的 1% 以下所需的时间 $\tau_{decay}$。
第二步：设置 $t_c \approx 1.5 \times \tau_{decay}$。如果模拟出的密度矩阵 $\rho(t)$ 在长程演化中保持稳定且不出现违反物理规律的震荡，则认为该截断有效。

5.2 稳态初始化实时演化（Hybrid Strategy）

NESSi 2.0 允许一个极具吸引力的工作流：先通过 NESS 模块快速算出一个稳态解，然后将其作为实时演化的初值。这种方法规避了传统模拟中需要通过长时间演化来“泵浦”出稳态的尴尬，这对于研究稳态之后的相干声子激发等过程具有革命性意义。

5.3 展望：量子计算与 NESSi 的结合

随着量子硬件的发展，未来自能的评价可能会由量子线路完成。NESSi 2.0 的模块化设计使得它非常适合作为“经典-量子杂化算法”中的经典驱动框架，由经典计算机处理 KBE 的演化积分，而由量子处理器计算瞬时自能项。

通过 NESSi 2.0，研究者终于拥有了一个能够跨越多个数量级时标的多体动力学模拟平台。它不仅是一个代码库，更是非平衡多体物理方法论的一次进化。