变分蒙特卡洛中的力与压力方差消减技术：从 nodal 奇异性到 IBP 变换的深度解析

来源论文: https://arxiv.org/abs/2603.14521v1 生成时间: Mar 21, 2026 03:06

0. 执行摘要

在第一性原理量子多体计算中，精确计算原子力和应力张量是研究系统平衡几何、振动特性以及分子动力学（MD）的核心。然而，在变分蒙特卡洛（VMC）框架下，直接对能量期望值进行微分得到的力估值器（Estimators）通常伴随着巨大的统计涨落。这种涨落主要源于两个方面：一是电子-原子核碰撞处的势能奇异性（导致 Hellmann-Feynman 项方差发散），二是电子波函数节点（Nodes）处的波函数导数奇异性（导致 Pulay 项方差发散）。

近日，来自 EPFL、SISSA 和 Grenoble Alpes 大学的一组研究人员（David Linteau, Saverio Moroni, Giuseppe Carleo, Markus Holzmann）在 arXiv 上发表了题为《Variance reduction for forces and pressure in variational Monte Carlo》的论文。该工作提出了一系列简单且极具实操性的策略，旨在不显著增加计算成本的前提下，将 VMC 估值器的方差降低数个数量级。核心贡献包括：

Metropolis 接受率技巧：利用 Rao-Blackwell 定理，将 Pulay 项在节点处的幂律发散方差软化为对数发散。
正则化方案：引入带控制偏置的平滑切断函数，进一步消除离群值。
分部积分（IBP）法：针对周期性系统导出了紧凑的、方差显著降低的 Hellmann-Feynman 力估值器，解决了库仑势奇异性带来的发散问题。
Stein 控制变量框架：将上述方法推广至二体关联函数 $g(r)$ 等观测量的计算中。

本博客将对该论文的理论细节、技术实现及 Benchmark 结果进行深度技术解析。

1. 核心科学问题，理论基础，技术难点，方法细节

1.1 核心问题：为什么 VMC 的力这么“吵”？

在 Born-Oppenheimer 近似下，系统的能量 $E(\mathbf{R})$ 是参数（原子核位置 $\mathbf{R}$）的函数。力定义为 $\mathbf{F}(\mathbf{R}) = -\nabla_{\mathbf{R}}E(\mathbf{R})$。在 VMC 中，能量期望值定义为：

$$ E = \frac{\langle \Psi | H | \Psi \rangle}{\langle \Psi | \Psi \rangle} $$

对其求导得到两项贡献：

$$ \frac{\partial E}{\partial p} = \underbrace{\frac{\langle \Psi | \partial_p H | \Psi \rangle}{\langle \Psi | \Psi \rangle}}_{\text{Hellmann-Feynman (HF) term}} + \underbrace{2 \text{Re} \frac{\langle \Psi | H - E | \partial_p \Psi \rangle}{\langle \Psi | \Psi \rangle}}_{\text{Pulay term}} $$

技术难点 1：HF 项的库仑奇异性 当电子 $i$ 接近原子核 $I$ 时，势能梯度 $\nabla_{\mathbf{R}_I} V_{en} \sim \mathbf{x}/|x|^3$（其中 $\mathbf{x} = \mathbf{r}_i - \mathbf{R}_I$）。虽然力的期望值（一阶矩）是有限的，但其方差（二阶矩）涉及 $1/x^4$ 的积分，在三维空间中 $4\pi \int x^2 (1/x^4) dx$ 在原点处呈 $1/x$ 发散。这意味着标准蒙特卡洛采样无法给出收敛的误差估计。

技术难点 2：Pulay 项的节点奇异性 Pulay 项涉及 $\partial_p \log \Psi$。对于费米子系统，波函数 $\Psi$ 存在节点表面（Node surface）。在节点附近 $\Psi \sim \xi$（$\xi$ 为到节点的距离），因此 $\nabla \Psi / \Psi \sim 1/\xi$。局部能量 $E_L$ 在节点处通常也以 $1/\xi$ 比例发散。其积项的平方（方差贡献）比例为 $1/\xi^4$。由于采样概率密度 $\pi \propto |\Psi|^2 \sim \xi^2$，最终方差积分 $\int \xi^2 (1/\xi^4) d\xi$ 呈 $1/\xi$ 发散。

1.2 方法细节 A：Pulay 项的方差消减策略

1.2.1 协方差形式 (Covariance Form)

论文首先指出，Pulay 项可以重写为协方差形式：

$$ \frac{\partial E}{\partial p} = 2 \text{Re} \text{Cov}(E_L, \partial_p \log \Psi^*) $$

在计算压力时，引入扩张算子 (Dilation Operator) $\mathcal{D} = \mathbf{r}\cdot\nabla_{\mathbf{r}} + \mathbf{R}\cdot\nabla_{\mathbf{R}} + L\cdot\nabla_L$。通过减去其平均值，可以消除与系统规模 $N$ 成正比的常数偏移，从而显著降低方差。

1.2.2 接受率技巧 (Acceptance Trick)

这是本文的“点睛之笔”。作者通过 Rao-Blackwell 定理，利用 Metropolis-Hastings 步中的接受概率 $a(\mathbf{r}_i \to \mathbf{r}_f)$ 构建条件估值器：

$$ \tilde{O}(\mathbf{r}_i, \mathbf{r}_f) = a O(\mathbf{r}_f) + (1-a) O(\mathbf{r}_i) $$

作者证明了在节点附近，接受概率 $a \sim \min(1, \xi_f^2/\xi_i^2)$。这种加权平均效应有效地抑制了当 $\mathbf{r}$ 极其靠近节点时的极端波动，将方差的发散级数从幂律软化为对数级 $\log(1/\epsilon)$。该方法几乎零成本，仅需在 Markov 链移动步中多存储一个量。

1.2.3 正则化与偏置消除

为了彻底消除对数发散，作者引入了平滑切断函数 $\chi_\epsilon(\xi)$。为了控制由于切断引入的系统偏置（Bias），论文推导了高阶偏置消除条件。通过选择特定的多项式形式作为 $\chi$，可以使偏置降低至 $O(\epsilon^{m+2})$ 量级，确保在统计误差范围内偏置可忽略。

1.3 方法细节 B：HF 项的分部积分（IBP）变换

针对 HF 项的库仑发散，作者提出了一种两步变换：

IBP1：将梯度算子从势能核转移到电子密度上。利用波函数的 cusp 条件，证明变换后的估值器在 $x\to 0$ 时仅以 $1/x$ 发散（原为 $1/x^2$）。
IBP2：利用“梯度到拉普拉斯”恒等式 $2\partial_{x_\alpha} v(x) = \nabla^2 [x_\alpha v(x)] - \dots$，将发散项进一步转化为涉及 $\nabla \log |\Psi|$ 的非奇异项。作者导出了适用于周期性边界条件（PBC）的紧凑表达式，解决了 Ewald 求和中的短程奇异性问题。

2. 关键 benchmark 体系，计算所得数据，性能数据

2.1 体系描述：高压金属氢

作者选择了极其具有挑战性的高压金属氢系统进行测试：

规模：$N = 128$ 个氢原子。
密度：$r_s = 1.19$ (对应压力约 $650 \text{ GPa}$)。
波函数：使用基于神经网络量子态（NQS）的波函数（基于之前该团队在 Nature 上发表的工作）。NQS 能够提供极其精确的基态描述，但其对参数的依赖更为复杂，对力计算的稳定性要求极高。

2.2 压力计算结果 (Pulay Pressure)

在压力计算中，Pulay 项的方差消减效果令人震惊（见论文图 1）：

默认估值器：直方图分布极广，存在大量离群值。
协方差修正 (Cov)：方差直接降低了约 130,000 倍 ($5$ 个数量级)。
Cov + 接受率技巧 (acc)：在 Cov 基础上进一步降低方差约 1.25 倍。
Cov + acc + 正则化 (reg)：在 $\epsilon = 0.05 a_0$ 时，方差再次降低 1.5 倍。
一致性检查：通过对能量-体积曲线进行多项式拟合求导（Finite Difference），得到的压力为 $640.8(9) \text{ GPa}$。而本文提出的直接估值器计算值为 $639.9(4) \text{ GPa}$，二者在误差范围内完美符合，验证了直接计算力的准确性。

2.3 原子力计算结果 (HF Force)

对于 HF 力（见论文图 3）：

IBP1 变换：方差相比默认方法降低了 249 倍。
IBP2 变换（本文核心推荐）：方差降低了 1286 倍。
加上接受率技巧：在 IBP2 基础上，离群值数量进一步减少，总方差消减因子达到 1295 倍。
物理意义：这意味着在相同的统计精度下，使用 IBP2 变换可以将所需的采样样本数减少 1000 倍以上，这对于实时 MD 模拟是决定性的。

2.4 分子动力学应用 (VMC-driven MD)

作者利用优化后的力进行了 8 步 damped velocity Verlet MD 模拟（见论文图 5）：

能量演化：随着核坐标的弛豫，每原子能量下降了约 $5 \text{ mHa}$。
力的大小：力模量 $|F_i|$ 系统性下降，表明体系正在趋向平衡几何。
效率：利用迁移学习（Transfer Learning），每步 MD 的 VMC 优化仅需数轮迭代即可收敛，证明了该方法在实际动力学研究中的可行性。

3. 代码实现细节，复现指南，开源软件包

3.1 技术栈推荐

该研究主要基于神经网络量子态（NQS），目前 NQS 的主流开源框架是 NetKet。虽然论文未直接给出 Repo 链接，但考虑到 Giuseppe Carleo 是 NetKet 的核心开发者，复现该工作的最佳路径如下：

框架选择：NetKet (Python/JAX)。
关键组件实现：
- Local Energy (EL)：标准实现。
- Quantum Force：即 $\nabla_{\mathbf{r}} \log \Psi$。在 JAX 下通过 jax.grad 自动微分获得。
- Acceptance Trick：需要在 netket.vqs.MCState 的样本生产循环中注入逻辑。在 _get_samples 过程中记录 accepted 状态和 proposal 分布。

3.2 算法伪代码实现思路

# 伪代码：带接受率技巧的 Pulay 估值器
def pulay_estimator_with_acc(model, params, r_old, r_new, accepted, el_old, el_new):
    # 计算接受概率 a
    log_psi_old = model.apply(params, r_old)
    log_psi_new = model.apply(params, r_new)
    # 假设对称提议分布
    a = min(1, exp(2 * (log_psi_new - log_psi_old)))
    
    # 观测量 O = (EL - E_mean) * grad_p(log_psi)
    O_old = (el_old - E_avg) * grad_p_log_psi(r_old)
    O_new = (el_new - E_avg) * grad_p_log_psi(r_new)
    
    # Rao-Blackwellized 估计
    return a * O_new + (1 - a) * O_old

3.3 复现难点：周期性系统的 IBP2

对于周期性系统，实现 IBP2 需要处理 Ewald 求和的导数。论文附录 B 和 D 提供了详尽的数学推导。在代码中，需要特别注意 Q-function 的定义，其包含了对晶格向量 $\mathbf{T}$ 的求和。建议利用 JAX 的 vmap 和 psum 功能加速这一部分的短程相互作用计算。

4. 关键引用文献与局限性评论

4.1 关键引用

Assaraf & Caffarel (1999, 2003): 方差消减技术的先驱工作，提出了零方差原则。本文的 IBP 方案是其在周期性系统中的重要扩展。
Ceperley, Chester & Kalos (1977): 最早提到接受率技巧的论文，但本文首次对其进行了近节点缩放分析。
Qian et al. (2024): 最近关于周期性系统力计算的另一项工作。本文在 Figure 3 中与之对比，展示了更好的性能。

4.2 局限性评论

尽管该工作非常出色，但仍存在以下潜在局限：

偏置与方差的权衡 (Bias-Variance Trade-off)：正则化参数 $\epsilon$ 的选择仍具有一定的经验性。虽然作者提出了基于偏置量级评估的选择准则，但在完全自动化的流程中（如长期 MD）可能需要动态调整。
高阶导数开销：IBP2 变换涉及二阶导数信息（拉普拉斯项），虽然通过数学恒等式避免了直接计算全 Hessian，但在复杂泛函或超大体系下，其计算 Overhead 仍需进一步量化评估。
多组分复杂性：对于含有多种化学元素的系统，电子-原子核 cusp 条件各异，IBP 算子的参数（如 ZI）需要小心处理。

5. 其他补充：从力到结构观测量 $g(r)$

本文的一个重要科学洞察是：方差消减不仅仅适用于力，它是一种普适的 Stein 控制变量框架。

5.1 二体关联函数 $g(r)$ 的平滑化

传统的 $g(r)$ 计算依靠 Histogram Binning，这在样本较少时非常“吵”。作者利用散度定理，将 $\delta$ 函数（表示壳层）转化为体积积分（表示球体），并引入由波函数导数驱动的漂移项（Drift term）：

$$ g(r) \propto \left\langle \theta(r - r_{ij}) \left( \frac{2}{r_{ij}} + \hat{r}_{ij} \cdot (\mathbf{F}_i - \mathbf{F}_j) \right) \right\rangle $$

其中 $\mathbf{F}_i = \nabla_i \log \Psi$ 是量子力（Quantum Force）。

5.2 性能对比 (Figure 6)

论文图 6 显示，在仅有 8192 个样本的极端情况下：

Binning 方法：$g(r)$ 曲线剧烈抖动，几乎无法识别特征峰。
IBP 方法：给出了极其平滑、稳定的信号，且由于采用了体积平均，信噪比随半径 $r$ 增加而进一步提升。

这种方法的推广意味着我们可以用极少的 QMC 采样获得高质量的结构观测量，这对于研究高压下的相变、液态金属结构具有巨大的工程价值。

5.3 结语

David Linteau 等人的这项工作为变分蒙特卡洛走向“实用化”扫清了一个重大障碍。通过将古老的统计物理技巧（Rao-Blackwell）与现代的数学变换（IBP/Stein）相结合，力与压力的计算不再是 VMC 的软肋。随着神经网络量子态在凝聚态物理和量子化学中的普及，这些策略必将成为标准代码库中的必备组件。