来源论文: https://arxiv.org/abs/2602.12993v1 生成时间: Feb 21, 2026 08:13

执行摘要

在现代量子化学的版图里，解决电子强相关（Strong Correlation）问题始终是皇冠上的明珠。传统的全构型相互作用（FCI）受困于“指数墙”，而神经量子态（Neural Quantum States, NQS）凭借神经网络强大的函数拟合能力，为波函数的紧凑表示提供了前所未有的希望。然而，长期以来，NQS 的能量评估几乎完全依赖于变分蒙特卡洛（VMC）。虽然 VMC 在自旋链等结构化体系中表现优异，但在面对分子体系的电子哈密顿量时，却饱受概率分布极度尖锐、随机梯度噪声剧烈以及样本收敛速度极慢的困扰。

由 Marco Julian Solanki、Lexin Ding 和 Markus Reiher 教授（ETH Zürich）最近发表的论文《Neural Quantum States Based on Selected Configurations》针对这一痛点，提出并系统评估了基于选择构型的神经量子态（NQS-SC）方法。该研究通过将 NQS 框架与传统选择构型相互作用（SCI）的思想相结合，利用神经网络预测的概率振幅来确定变分空间，从而彻底绕过了 VMC 的随机性难题。实验证明，在处理 Stretched $N_2$ 等强静态相关体系时，NQS-SC 的精度和稳定性远超 NQS-VMC，甚至能以不到 1% 的构型占比达到化学精度。这一工作不仅重新定义了 NQS 的能量评估标准，也为未来构建混合静态-动态相关处理方法奠定了理论基石。

1. 核心科学问题，理论基础，技术难点与方法细节

1.1 核心科学问题：为何 VMC 不再是分子体系的最优解？

在电子结构计算中，我们的目标是找到哈密顿算子 $\hat{H}$ 的基态。NQS 方案将波函数 $\Psi(\mathbf{n})$ 参数化为神经网络 $\Psi_\theta(\mathbf{n})$。传统上，我们通过变分原理最小化能量期望值：

$$E_\theta = \frac{\langle \Psi_\theta | \hat{H} | \Psi_\theta \rangle}{\langle \Psi_\theta | \Psi_\theta \rangle}$$

在 VMC 框架下，这一积分被转化为构型空间 $\mathcal{B}$ 上的加权和，并通过马尔可夫链蒙特卡洛（MCMC）或自回归采样（Autoregressive Sampling）进行估算。然而，分子波函数的概率分布通常呈现“长尾”特征：极少数构型占据了绝大部分权重。VMC 在这种情况下会面临极高的拒绝率，或者需要数以百万计的样本才能捕捉到贡献微弱但至关重要的动态相关部分。此外，VMC 的随机梯度噪声会导致优化过程在接近收敛时发生震荡，难以达到化学精度（1 kcal/mol）。

1.2 技术难点：NQS-SC 的崛起与构型选择策略

NQS-SC 的核心理念是：与其随机采样，不如“按需选择”。受选择构型相互作用（SCI）方法的启发，NQS-SC 并不依赖采样质量，而是直接在由神经网络识别出的最重要的构型子集 $\mathcal{S}_{select}$ 上构建波函数。其技术挑战在于：

如何高效选择构型？ 不同于传统 SCI 使用扰动理论作为筛选标准，NQS-SC 直接利用 NQS 预测的概率振幅 $|\Psi_\theta(\mathbf{n})|$ 进行排序选择。这种方法能更好地利用神经网络捕获的非线性相关。
如何保证变分性？ NQS-SC 初始定义的能量形式是非变分的。论文通过引入“对称评估（Symmetric Evaluation）” $E^{SC-SYM}$ 和“精确对角化（SCI）” $E^{SCI}$ 两种方式，确保了计算结果遵循变分原理，从而能够与 VMC 进行公平对比。

1.3 核心架构：神经回流（Neural Backflow, NBF）

为了使 NQS 具备描述费米子波函数符号结构的能力，本文采用了神经回流（NBF）架构。其数学基础是将单 Slater 行列式中的轨道系数矩阵 $\mathbf{C}$ 改造为依赖于构型 $\mathbf{n}$ 的回流矩阵 $\mathbf{C}(\mathbf{n})$：

$$\Psi^{NBF}(\mathbf{n}) = \det \mathbf{C}^{(\mathbf{n})}(\mathbf{n})$$

这种设计巧妙地将行列式的交换对称性（反号特性）与神经网络的灵活性结合起来。具体实现中，构型向量 $\mathbf{n}$ 通过多层前馈神经网络，最终输出 $D$ 个矩阵的线性组合。这种多决定子（Multi-determinant）式的回流结构极大增强了其表达静态相关的能力。

1.4 NQS-SC 算法流程

初始化： 从 Hartree-Fock (HF) 决定子出发，构建初始构型集 $\mathcal{S}_{select}$。
空间扩展： 利用哈密顿算子 $\hat{H}$ 将当前集合扩展到 $\mathcal{S}_{extend} = \hat{H}\mathcal{S}_{select}$，并结合神经网络的预测挑选出振幅最大的 $n_{select}$ 个新构型。
参数更新： 在选定的构型空间内最小化局部能量 $E^{loc}$。由于 $\mathcal{S}_{select}$ 是确定的，梯度的计算是确定性的且无噪声。
迭代收敛： 重复扩展与优化过程，直至能量达到预设阈值。

2. 关键 Benchmark 体系，计算所得数据与性能表现

作者选取了两个具有代表性的体系来对比 NBF-VMC 与 NBF-SC：具有极强静态相关的拉伸氮分子（Stretched $N_2$）和具有显著动态相关的分层水分（$H_2O$）。

2.1 拉伸 $N_2$ (Bond length = 2.25 Å, STO-3G)

这是一个经典的强相关测试体系。实验发现：

构型捕获能力： NBF-SC 仅需 $2^7 = 128$ 个选择构型就能精准识别出前 20 个主导构型，并完美契合 FCI 的概率振幅分布。相比之下，NBF-VMC 在样本量达到 $2^{12}$ 时仍无法准确描述排名 21 至 44 的构型权重。
能量精度： NBF-SC 在 $n_{select}=2^6$ 时即降至化学精度以下。最令人震惊的是，当 $n_{select}=2^9$ 时，通过精确对角化得到的 $E^{SCI}$ 误差竟然直接降至 $5 \times 10^{-11}$ Ha。这意味着 NQS 已经成功搜索到了构型空间中的关键部分，只是系数预测尚欠火候，而 SCI 步骤修正了这一缺陷。
收敛稳定性： VMC 的能量曲线呈现出明显的随机震荡，而 SC 曲线则随 $n_{select}$ 的增加表现出稳健的系统改进性（Systematic Improvability）。

2.2 水分子 ($H_2O$, 6-31G)

水分子体系由于基组较大且含有更复杂的动态相关，对采样提出了更高要求：

VMC 的溃败： 在此体系中，NBF-VMC 表现极差。即使样本量 $n_{sample}$ 增加到 $2^{17}$（约 13 万个采样），能量误差仍高达数百 mHa，远未达到化学精度。外推结果显示，VMC 若想达标，所需的样本量将与整个希尔伯特空间（165 万）处于同一数量级，这完全失去了压缩表示的意义。
SC 的优越性： 虽然描述动态相关需要更多的选择构型，但 NBF-SC 在 $n_{select}=2^{11}$ 时成功突破了化学精度阈值。此时，构型占比仅为总空间的 0.124%。这证明了“基于振幅的选择”在处理长尾分布时比“基于密度的采样”高效得多。

2.3 跨体系汇总（Table 1 核心数据）

分子	基组	希尔伯特空间维度	达标所需 $n_{select}$	构型占比
$N_2$ (eq)	STO-3G	14,400	$2^7$	0.889%
$N_2$ (str)	STO-3G	14,400	$2^6$	0.444%
$LiCl$	STO-3G	1,002,001	$2^7$	0.013%
$H_2O$	6-31G	1,656,369	$2^{11}$	0.124%
$C_2H_4$	STO-3G	9,018,009	$2^{13}$	0.091%

数据清楚地表明，体系越大，NQS-SC 的优势越明显，其所需的构型占比随空间维度增加而急剧下降。

3. 代码实现细节、复现指南与工具链

3.1 核心软件包框架

该研究主要基于 Python 生态系统构建，充分利用了 JAX 的自动微分能力和高性能计算特性：

NetKet (v3.0+): 论文的核心训练框架。NetKet 是目前 NQS 领域的工业级标准，提供了丰富的算符定义、变分优化器和采样器接口。作者在 NetKet 基础上定制了 SC 能量评估模块。
JAX & Flax: 用于构建神经回流（NBF）模型。JAX 提供的 vmap 和 jit 功能是处理数千个行列式计算的关键。Flax 负责管理神经网络的层级结构。
PySCF: 负责所有的前期量子化学计算，包括获取单电子/双电子积分、Hartree-Fock 轨道生成以及作为基准的 FCI 计算。同时也用于生成实验所需的对称性轨道。
PyCI: 一个由 Reiher 组开发的 Pythonic 库，专门用于执行大空间下的行列式 CI 计算，在本文中用于执行 $E^{SCI}$ 的精确对角化。

3.2 复现指南建议

环境配置： 建议使用 CUDA 支持的 JAX 环境。由于行列式计算涉及大量小矩阵运算，显存带宽是主要瓶颈。
轨道选择： 本文指出轨道排序（Orbital Ordering）对 NQS 的学习效率有影响。在复现水分子实验时，务必使用 MP2 自然轨道或进行能级局部化处理。
SC 训练超参数：
- $n_{expand}$：通常设置为与 $n_{select}$ 相当的大小。过小会导致搜索空间受限，过大会增加哈密顿算符作用的内存开销。
- 学习率：NBF 架构对学习率较为敏感，推荐使用带有 Warmup 的 Adam 优化器。
硬件要求： 处理 $H_2O$ (6-311G) 等体系时，NetKet 的显存占用会随构型数激增。建议配备至少 80GB 显存的 NVIDIA A100/H100 显卡。

3.3 开源资源链接

4. 关键引用文献与局限性评论

4.1 关键引用文献

Carleo & Troyer (Science 2017): NQS 的开山之作，奠定了利用 RBM 描述量子多体问题的基础。
Luo & Clark (PRL 2019): 首次提出神经回流（NBF）架构，解决了费米子符号问题的一种优雅路径。
Li et al. (JCTC 2023): NQS-SC 方法的原始提案。本文在其基础上进行了深度基准测试与变分性改进。
Huron et al. (J. Chem. Phys. 1973): 经典 CIPSI 方法的来源，为现代选择 CI 提供了理论框架。

4.2 工作局限性评论

尽管 NQS-SC 展现了碾压 VMC 的态势，但它并非“银弹”：

动态相关的挑战： 论文坦言，无论是 SC 还是 VMC，在面对大基组下的动态相关时都显得吃力。这意味着 NQS 目前还不能完全替代耦合簇（CCSD(T)）。NQS-SC 本质上更像是一个高度非线性的、基于神经网络加速的 CASCI 方法。
非变分风险： 默认的 $E^{SC}$ 估算是不满足变分原理的。虽然论文提供了 $E^{SC-SYM}$ 方案，但该方案涉及双重求和，计算成本随 $n_{select}$ 平方增长，这在大规模计算中可能成为瓶颈。
内存墙： 目前的实现受限于 NetKet 的能量评估算符，在处理上亿维度的希尔伯特空间时，显存溢出（OOM）问题依然严重。如何实现分布式构型存储和评估是未来的技术挑战。
对初始轨道的依赖： NQS 仍然需要在特定的轨道基组下运行。如果轨道质量极差（如未收敛的 HF），NQS 需要花费极长的时间来修正轨道旋转。未来是否能实现真正的“全电子回流”（基组无关）值得期待。

5. 补充：量子化学计算的范式转移与未来展望

5.1 从“采样”到“搜索”的哲学转变

NQS-SC 的成功实际上反映了计算物理中一个深层次的逻辑转向：在高度非均匀的概率空间中，随机采样是极其低效的。电子哈密顿量的相互作用具有明确的稀疏性特征（即一、二体相互作用），这决定了只有相互“连接”的构型才可能有大的叠加权重。NQS-SC 结合了神经网络的全局趋势预测能力和 CI 的局部稀疏搜索能力，这种“神经网络引导的搜索”比单纯的蒙特卡洛采样更符合量子化学的物理直觉。

5.2 混合方法：NQS-PT 与 NQS-CC 的可能性

论文在结论中提到了一个极具启发性的方向：利用 NQS-SC 捕捉体系的主导（静态）相关，然后在其上构建多构型微扰理论（如 NEVPT2 或 CASPT2）。

NQS-PT： NQS-SC 可以作为一个极其紧凑的参考态（Reference State），取代传统的 CASSCF，从而在不需要天文数字级行列式的情况下，通过微扰修正动态相关。
嵌入式 NQS： 将 NQS 局限在特定的活性空间（Active Space）内，与外部的密度泛函理论（DFT）或耦合簇（CC）环境进行嵌入。这将使 NQS 能够应用于蛋白质、催化剂中心等大尺度体系。

5.3 对制药与材料科学的意义

对于诸如金属有机催化剂、光合作用反应中心以及超导材料，传统的单参考态方法（如常规 DFT 或 CCSD）往往会给出错误的物理图像。NQS-SC 提供了一种在可控计算成本下达到 FCI 精度路径。虽然目前还处于研究初期，但随着显卡算力的爆发和自回归模型架构的迭代，我们有望在未来 5-10 年内看到基于 NQS 的高精度势能面（PES）在分子动力学中的广泛应用。

5.4 总结

Solanki 和 Reiher 的这项工作有力地回击了“NQS 仅适用于格子模型”的质疑。通过将 SC 引入 NQS 流程，他们证明了神经网络在处理分子电子相关问题上的真实潜力。NQS-SC 不仅是一个更快的能量评估工具，它更是一种更聪明的理解分子复杂性的方式。对于任何追求电子结构计算极限的研究者来说，这篇论文及其背后的技术范式，都是不容错过的必读篇章。