来源论文: https://arxiv.org/abs/2606.00924v1 生成时间: Jun 07, 2026 05:42

局部性启发的层级回流波函数：攻克强关联费米子多体计算瓶颈的新范式

0. 执行摘要

在凝聚态物理与量子化学的交界处，强关联费米子系统的精确模拟一直被视为“圣杯”式的难题。由于费米子反对称性带来的指数级希尔伯特空间膨胀，以及量子蒙特卡洛（QMC）中臭名昭著的“符号问题”，寻找既能系统性改进、又具有高度可解释性和计算高效性的费米子变分波函数，是数十年来理论学界不懈追求的目标。

近期，一项发表于预印本平台（arXiv:2606.00924v1）的杰出工作——《Locality-Induced Hierarchical Backflow Wavefunctions for Correlated Fermions》（作者：周宇同、周正威、刘文渊等）为这一难题提供了一条极其优雅且物理图像清晰的解决路径。该工作指明，局部性（Locality）是系统性组织费米子回流（Backflow）相关性的天然原理。基于此，作者提出了一类新型变分费米子态——层级回流（Hierarchical Backflow, HB）波函数。

HB波函数的表达能力由一个物理意义明确的路径深度 $K$ 严格控制：

当 $K = 0$ 时，该波函数自然退化为无回流相关的 Hartree-Fock（HF）平均场态。
随着 $K$ 的系统性增加，波函数通过局域跃迁的迭代，自动且系统地融入更长程的多体关联。
在最具有挑战性的二维 Fermi-Hubbard 模型中，即使在极浅的非平凡深度 $K = 1$ 下，HB波函数在半满（Half-filling）状态下便能将相对能量误差控制在 0.5% 左右（系统尺寸跨越 $4 \times 4$ 至 $10 \times 10$）。
在 $n_h = 0.125$ 的空穴掺杂区域，该方法不仅能高效扩展到 $12 \times 16$ 和 $16 \times 16$ 等极具挑战性的大尺寸系统，更在 $K=2$ 时清晰地刻画出理论界广泛关注的**条纹相（Stripe Phase）**结构。
进一步地，HB架构提供了一种天然的局部-非局部物理分解（RHB）。这一设计不仅完美对接了现代神经网络量子态（NQS），还通过两阶段优化策略，克服了传统全局神经网络波函数参数冗余、容易陷入局部极小以及缺乏物理可解释性的硬伤。

本博客将对该项工作进行全方位的深度技术剖析，涵盖其理论根基、数学推导、核心算法细节、基准测试数据、代码复现思路以及该方法的局限性与未来展望。

1. 核心科学问题、理论基础、技术难点与方法细节

1.1 核心科学问题：多体关联与回流波函数的困境

量子多体系统（尤其是强关联费米子系统，如高温超导体、Mott绝缘体等）的本质困难在于强关联效应。在平均场理论（如 Hartree-Fock 逼近）中，单粒子轨道相互独立，忽略了瞬时多体库仑关联。为了引入关联，Jastrow-Slater 波函数通过在 Slater 行列式前乘上一个正定的 Jastrow 因子来调节振幅：

$$W_{\text{Jastrow}}(s) = e^{J(s)} \det(\Psi_{\text{HF}})$$

然而，Jastrow 因子无法改变 Slater 行列式本身的节点结构（Node Structure），而费米子的符号结构（Sign Structure）正是决定强关联物理的关键。1956年，Feynman 和 Cohen 为了描述液氦-3中的多体激发，引入了回流（Backflow, BF）波函数的概念。回流波函数的核心思想是让单粒子轨道本身依赖于所有其他粒子的空间配置 $s$：

$$\Psi_{mi} = \psi_m(i, \bar{s})$$

其中 $\bar{s}$ 代表除第 $i$ 个粒子之外的背景配置。通过让单粒子轨道具有“配置依赖性”，Slater 行列式内部的节点结构得以动态改变，极大地增强了变分态的表达能力。

然而，传统的回流波函数面临着巨大的技术难点：

黑箱参数化与不可解释性：现代方法（如 Neural Network Backflow, NNB）通常使用多层感知机（MLP）等全局神经网络来黑箱式地生成 $\psi_m(i, ar{s})$。这使得变分参数失去了清晰的物理图像，难以针对特定物理系统进行定制和物理解读。
系统性改进困难：在全局神经网络架构下，我们很难通过简单地增加某个物理控制参数来系统地、渐进地逼近精确解。
计算与优化瓶颈：由于全局依赖性，变分参数的数目随着系统尺寸急剧膨胀，这导致在变分蒙特卡洛（VMC）优化中，参数更新极易陷入亚稳态，且梯度计算开销巨大。

1.2 理论基础：从单粒子有效哈密顿量出发的启发式推导

本项工作最亮眼的理论贡献之一，在于通过严格的变分条件，启发式地推导出了回流关联的“局部跃迁”本质。作者考虑了一个标准的费米子 Hubbard 哈密顿量：

$$H = \sum_{\langle ij \rangle} t_{ij}c^{\dagger}_i c_j + \sum_{\langle ik \rangle} U_{ik} n_i n_k$$

设 $M$ 电子系统的波函数为 $|\Phi\rangle = \sum_s W(s)|s\rangle$。利用行列式展开定理，将波函数振幅 $W(s) = \det(\Psi)$ 沿第 $i$ 列展开：

$$W(s) = \sum_m \psi_m(i, \bar{s}) C_m(i, \bar{s})$$

其中 $C_m(i, \bar{s})$ 为矩阵 $\Psi$ 的 $(m, i)$-余子式（Cofactor）。将回流轨道值 $\psi_m(i, \bar{s})$ 视为变分参数，由变分极值条件 $\delta E = 0$（即 $\langle \frac{\delta \Phi}{\delta \psi} | H - E | \Phi \rangle = 0$）经过精细代数推导（详见论文补充材料第二部分），可导出如下单粒子有效特征值问题：

$$\sum_j [H^{\text{eff}}_m(\bar{s})]_{ij} \psi_m(j, \bar{s}) = E_m(ar{s}) \psi_m(i, \bar{s})$$

这里的有效哈密顿量矩阵元形式极其独特：

$$[H^{\text{eff}}_m(\bar{s})]_{ij} = \frac{1}{\gamma_m(i, \bar{s})} \frac{C_m(j, \bar{s})}{C_m(i, \bar{s})} \left( t_{ij}\eta^h_{ij}(ar{s}) + \delta_{ij} \sum_k U_{jk}\eta^I_{jk}(ar{s}) \right)$$

此公式物理内涵极深：

$\eta^h_{ij}(ar{s})$ 和 $\eta^I_{jk}(ar{s})$ 分别是保证跃迁和相互作用符合泡利不相容原理的配置约束因子。
余子式之比 $\frac{C_m(j, \bar{s})}{C_m(i, \bar{s})}$：由于余子式本质上代表了将第 $m$ 个轨道上的电子置于相应位置时的波函数振幅，这一比值实际上刻画了电子从位置 $i$ 虚拟跃迁到位置 $j$ 时，其余 $M-1$ 个背景电子提供的非局域量子干涉背景。这正是回流非局域关联的物理根源！

1.3 技术突破：局部核逼近与层级路径展开

虽然有效哈密顿量理论上是精确的，但由于余子式之比依赖于所有其他粒子的全局配置，直接求解这一非线性非局域本征方程在计算上是不可行的。为了破局，作者提出了一个极具智慧的物理近似——局部核逼近（Local Kernel Approximation）。

作者指出，既然物理哈密顿量是局域的（仅包含最近邻跃迁 $t_{ij}$ 和相互作用 $U_{jk}$），那么有效哈密顿量的主导项应该也由局域物理主宰。因此，可将非局域的 $[H^{\text{eff}}_m(\bar{s})]_{ij}$ 逼近为仅依赖于位置 $i, j$ 及其局部占有数 $s_i, s_j$ 的局域跃迁算符（即局部核）：

$$[H^{\text{eff}}_m(\bar{s})]_{ij} \approx H^{\text{loc}}_m(i, s_i; j, s_j)$$

既然有效本征方程的单步作用对应于局部跃迁，那么通过迭代作用此局部算符（类似于求解矩阵最大本征值的幂指数法），背景粒子的信息就会一步一步地以局域传播的形式累积，自然地涌现出非局域的多体回流关联。这直接导出了层级回流（HB）波函数的核心参数化公式——路径深度为 $K$ 的路径展开：

$$\psi^{\text{HB}}_m(i, \bar{s}) = \sum_{i_1, \dots, i_K} \prod_{l=1}^K f^{[l]}_m(i_{l-1}, s_{i_{l-1}}; i_l, s_{i_l})$$

其中 $i_0 \equiv i$。在这个公式中，每一项 $f^{[l]}_m$ 都是一个变分张量（变分参数），其物理意义是刻画在第 $l$ 步路径中，参考位点 $i_{l-1}$ 上的轨道如何受到邻近位点 $i_l$ 的占有数 $s_{i_l}$ 的调制。

为了直观理解这一设计的精妙，我们剖析其层级结构：

$K = 0$（零阶）： $$\psi^{\text{HB}}_m(i, \bar{s})\vert_{K=0} = \psi^{\text{HF}}_m(i)$$ 轨道与任何背景配置无关，退化为无关联的 Hartree-Fock 平均场态。
$K = 1$（一阶局域跃迁）： $$\psi^{\text{HB}}_m(i, \bar{s})\vert_{K=1} = \sum_{j \in \text{neighbors}(i)} f^{[1]}_m(i, s_i; j, s_j)$$ 位点 $i$ 处的轨道值开始受到其直接最近邻位点 $j$ 占有数 $s_j$ 的调制（如图 1(b) 所示）。
$K = 2$（二阶局域跃迁）： $$\psi^{\text{HB}}_m(i, \bar{s})\vert_{K=2} = \sum_{j \in \text{neighbors}(i)} \sum_{p \in \text{neighbors}(j)} f^{[1]}_m(i, s_i; j, s_j) f^{[2]}_m(j, s_j; p, s_p)$$ 关联范围通过中间介导位点 $j$ 进一步延展至次邻近或更远位点 $p$（如图 1(c) 所示）。

关键洞察：尽管对每一个特定的轨道 $\psi^{\text{HB}}_m(i, \bar{s})$ 而言，它仅仅显式地包含了以 $i$ 为起点的长度为 $K$ 的局域路径和局部占有数，但是Slater 行列式算符在求和与求行列式值时，将所有这些局域轨道进行了强烈的全局纠缠耦合（如图 1(d) 所示）。这使得极小路径深度 $K$ 就能产生极强、极复杂的全局多体关联！

1.4 残差层级回流（RHB）：局部-非局部物理分解

为了将HB波函数与基于机器学习的神经网络量子态（NQS）有机结合，作者设计了一种名为**残差层级回流（Residual Hierarchical Backflow, RHB）**的混合波函数。其物理思想极为深刻：利用物理学界熟知的局域关联（由 HB 承载）作为波函数的物理骨架（Backbone），而让表达能力强大的通用函数逼近器（如前馈神经网络 FNN）去捕捉剩余的、平滑的弱非局域长程关联。具体公式为：

$$\Psi^{[\alpha]}_{mi} = \psi^{\text{HB}}_m(i, \bar{s}) Q^{[\alpha]}_m(\bar{s})$$

其中 $Q^{[\alpha]}_m(\bar{s})$ 是由 FNN 参数化的非局域因子，$\alpha$ 标记不同的 Slater 行列式以实现多行列式构建。这种“物理骨架 + 神经网络残差修正”的设计，不仅大幅降低了对神经网络本身规模和深度的依赖，更在优化动力学上带来了质的飞跃（参见下文优化细节分析）。

2. 关键 Benchmark 体系、计算所得数据与性能分析

为了检验HB和RHB波函数的实际表现，作者在强关联电子学界的终极测试场——二维 Fermi-Hubbard 模型上进行了极其严苛的基准测试（U = 2, 4, 6, 8 且在周期性边界条件 PBC 下进行）。

2.1 半满（Half-filling）状态下的惊人精度

在半满状态下（此时无符号问题，可获得极高精度的变分或辅助场量子蒙特卡洛 AFQMC 基准数据），HB波函数的收敛表现极其震撼。论文中给出的相对能量误差数据如表 I 所示（对比基准为无偏的辅助场量子蒙特卡洛 AFQMC 数据）：

表 I：半满 PBC 下 HB ($K = 1$) 波函数的相对能量误差

晶格尺寸	$U = 2$	$U = 4$	$U = 6$	$U = 8$
$4 \times 4$	0.15%	0.29%	0.17%	0.32%
$6 \times 6$	0.09%	0.23%	0.42%	0.44%
$8 \times 8$	0.09%	0.24%	0.51%	0.64%
$10 \times 10$	0.12%	0.31%	0.46%	0.53%

分析与解读：

仅用最浅的非平凡深度 $K = 1$，在所有的强弱相互作用区域（$U=2$ 到 $U=8$），HB波函数的相对能量误差全部低于 0.65%，平均误差在 0.3% 左右！
这说明由局部性组织的层级路径展开，以极低的变分深度就捕捉到了绝大部分主导的多体相互作用能。
进一步增加深度到 $K = 2$，能量还会得到系统性的进一步压低（见表 II 所示的每位点绝对能量值对比）。

表 II：半满下每位点能量绝对值比较（$K=0, 1, 2$ vs QMC）

尺寸与方法	$U = 2$	$U = 4$	$U = 6$	$U = 8$
$4 \times 4$
- HB $K=1$	-1.1248	-0.8486	-0.6577	-0.5281
- HB $K=2$	—	—	—	-0.5291
- QMC	-1.1265(4)	-0.8510(4)	-0.6588(4)	-0.5298(1)
$8 \times 8$
- HB $K=0$ (HF)	—	—	—	-0.4743
- HB $K=1$	-1.1626	-0.8581	-0.6554	-0.5229
- HB $K=2$	—	—	—	-0.5245
- QMC	-1.1636(0)	-0.8601(6)	-0.6587(5)	-0.5262(5)

除了能量，物理关联函数也得到了完美的刻画。图 2(c) 给出了 $10 \times 10$ 晶格上交错自旋关联函数 $C(r) = (-1)^{x+y}\langle \mathbf{S}(0,0) \cdot \mathbf{S}(x,y) \rangle$ 的行为。在 $K=1$ 时，HB波函数计算得到的自旋关联与热力学极限（TDL）下的无偏蒙特卡洛精确值符合得极好，完美展现了在 $U=6$ 附近磁矩达到最大，以及在 $U=6, 8$ 强相互作用下经典的、符合物理预期的长程反铁磁（AFM）序。

2.2 极具挑战性的空穴掺杂区域（$n_h = 0.125$）与条纹相的刻画

当系统引入掺杂（空穴浓度 $n_h = 0.125$）时，由于严重的符号问题，精确数值模拟变得极其困难。在这里，作者展现了本方法的强大外推能力。

大尺寸晶格能效对比（$16 \times 16$ 晶格， $U=8$）

HB $K=0$ (HF): 能量为 $-0.5889$
HB $K=1$: 能量迅速压低至 $-0.7510$
HB $K=2$: 能量进一步降至 $-0.7526$
RHB (HB $K=2$ + FNN): 达到了惊人的 $-0.7543(2)$！
对比高精度变分 AFQMC (Sorella 等人): 基准结果为 $-0.7544$。两者相差仅为 0.0001！这意味着 RHB 以极少的自由度，彻底达到了目前国际最顶尖的多体计算方案的精确度。

更具说服力的是，在 $12 \times 16$ 和 $16 \times 16$ 的超大格点系统上，HB ($K=2$) 成功捕捉到了自旋和电荷的条纹相（Stripe Phase）空间分布（如图 3 所示）。其电荷调制波长为经典的 $\lambda = 8$，与先前的张量网络及无偏数值结论完全一致，有力地证明了HB轨道能够高保真地刻画强关联体系中微妙的竞争相。

2.3 与传统神经网络波函数（NNB, HFDS）的横向测评

作者在 $4 \times L$（$L=4, 8, 12, 16$）的长条几何晶格上，将本工作与著名的**神经网络回流波函数（NNB）以及隐费米子行列式态（HFDS）**进行了直接对决（表 IV）：

表 IV：$n_h = 0.125, U = 8$ 下不同方法每位点能量对比

尺寸	HB $K = 1$	HB $K = 2$	RHB	HFDS	NNB
$4 \times 4$	-0.7370	-0.7385	-0.7410	-0.7409	-0.730
$4 \times 8$	-0.7599	-0.7617	-0.7641	-0.7633	-0.755
$4 \times 12$	-0.7598	-0.7613	-0.7630	—	-0.746
$4 \times 16$	-0.7585	-0.7597	-0.7611	-0.7530	-0.746

核心结论：

HB $K=1$ 全面超越 NNB：即便不借助任何外部神经网络（纯 HB $K=1$），其能量在所有尺寸下均明显低于 NNB。这表明全局全连接网络在泛化和表达强关联波函数节点时存在效率低下的问题，而物理启发式的局域路径在捕获符号结构上具有天然优势。
RHB 在大尺寸下显著优于 HFDS：随着系统尺寸 $L$ 的增加（如 $4 \times 16$ ），基于全局隐藏状态构建的 HFDS 其变分能力开始遇到瓶颈（能量为 $-0.7530$），而 RHB（能量为 $-0.7611$）依然能够保持极佳的变分精度，这进一步彰显了局部-非局部物理分解在应对大尺度外推时的卓越稳定性。

3. 代码实现细节、复现指南与开源工具链推荐

要实现并复现本项工作，变分蒙特卡洛（VMC）与随机重构（Stochastic Reconfiguration, SR）算法是其技术核心。以下是基于研究论文所描述算法的复现指南与架构设计。

3.1 变分蒙特卡洛（VMC）循环框架

VMC 的核心是通过 Markov 链蒙特卡洛（MCMC，通常采用 Metropolis-Hastings 算法）对费米子在实空间的配置 $|s\rangle$ 进行采样，采样概率权重为 $P(s) = \frac{|W(s)|^2}{\sum_{s'} |W(s')|^2}$。对于给定的配置 $s$，我们需要高效计算波函数振幅及其对参数的导数。

核心计算图：

HB 轨道生成：根据公式（5），通过预先定义的晶格邻接表，递归求解深度为 $K$ 的局域路径和。在代码实现中，可以将其写为高效的张量乘法或通过编译优化（如 JAX 中的 jax.lax.scan）进行回路展开。
行列式与余子式计算：利用标准的 LU 分解计算 $W(s) = \det(\Psi^{\text{HB}})$，其计算复杂度为 $O(M^3)$。为了加速参数梯度计算，可以使用余子式矩阵 $C = \det(\Psi) \cdot (\Psi^{-1})^T$，一次性获得所有元素的导数。

3.2 矩阵免显式构建的随机重构（Matrix-free SR）算法

随机重构（SR）方法相当于在参数空间进行自然梯度下降（Natural Gradient Descent）。我们需要求解如下线性方程组以获取参数更新方向 $\dot{x}$：

$$\sum_q S_{pq} \dot{x}_q = g_p$$

其中 $g_p$ 为常规能量梯度，$S_{pq} = \langle O_p O_q \rangle - \langle O_p \rangle \langle O_q \rangle$ 为参数空间的随机重度度规矩阵（Fubini-Study metric tensor），$O_p(s) = \frac{1}{W(s)} \frac{\partial W(s)}{\partial x_p}$ 为对数导数算符。

技术关键：Matrix-free 共轭梯度（CG）求解

如果系统参数总量为 $N_{\text{param}}$，显式构建大小为 $N_{\text{param}} \times N_{\text{param}}$ 的 $S$ 矩阵并求解将带来 $O(N_{\text{param}}^3)$ 的巨大算力与内存瓶颈。为此，论文中采用了一种极其高效的免矩阵显式构建方案（Matrix-free CG），该方案仅需通过蒙特卡洛样本的方差公式计算 $S$ 矩阵与任意方向向量 $\dot{x}$ 的乘积 $y = S \dot{x}$：

$$y_p = y^{(1)}_p - y^{(2)}_p$$$$y^{(1)}_p = \frac{1}{N_{\text{MC}}} \sum_s O_p(s) \left[ \sum_q O_q(s) \dot{x}_q \right]$$$$y^{(2)}_p = \langle O_p(s) \rangle \sum_q \langle O_q(s) \rangle \dot{x}_q$$

通过首先计算内积 $A(s) = \sum_q O_q(s) \dot{x}_q$（复杂度为 $O(N_{\text{param}} \cdot N_{\text{MC}})$），再计算 $y^{(1)}_p = \frac{1}{N_{\text{MC}}} \sum_s O_p(s) A(s)$，成功将算法的单步复杂度压低到了 线性度 $O(N_{\text{param}})$！这一优化是 HB 波函数能轻易扩展到万级参数、大尺寸系统的关键所在。

3.3 极其关键的“两阶段优化（Two-Stage Optimization）”协议

在复现残差层级回流波函数（RHB）时，如果直接从 Hartree-Fock 态出发，对 HB 和神经网络参数进行直接联合优化（Naive Optimization），系统会因为巨大的非线性相互纠缠而迅速陷入局域极小（如图 7(b) 中轻绿色曲线所示，能量收敛于 $-0.742$ 附近，效果极差）。

为了解决这个痛点，作者提出了一个极具指导意义的两阶段优化策略：

第一阶段（骨架预热）：屏蔽神经网络部分（即将 $Q_m(\bar{s})$ 设为恒等常数），仅对局域 HB 骨架参数进行优化。因为 HB 参数物理物理图景集中、能量面光滑，算法能在极短步数内（通常几百步，如图 7(b) 中蓝色曲线前段）迅速收敛到物理上非常优越的基态轨道空间，提供极佳的节点结构。
第二阶段（联合微调）：放开神经网络部分，将 $Q_m(\bar{s})$ 接入优化环路，对 HB 骨架与非局域神经网络残差进行联合优化。此时，波函数会从第一阶段奠定的优秀物理盆地出发，平滑且极快地下降到近乎精确的真实基态能量（图 7(b) 中粉紫色虚线所示）。

这一两阶段协议是成功训练混合量子态的“黄金法则”，强烈建议所有研究人员在复现时予以采用。

3.4 推荐开源工具链与技术选型

要高效复现这一工作，强烈推荐使用基于 Python - JAX 的现代科学计算和神经网络量子态生态系统：

JAX (google/jax)：提供即时编译（JIT）、自动微分（Autodiff）以及强大的自动并行化（vmap, pmap），这对于在 GPU 上并行处理数千个 MCMC 马尔可夫链至关重要。
NetKet (netket/netket)：这是目前国际上最成熟的、基于 JAX 构建的机器学习量子态（NQS）开源平台。它自带了高度优化的 VMC 采样器、自适应自旋变换算符、各种典型的哈密顿量定义（包括 Hubbard 模型），以及全套的随机重构（SR）优化器。研究人员只需在 NetKet 中自定义一个 HB 或 RHB 的 Flax 神经网络模型，即可无缝调用其底层的 VMC-SR 优化管道。
FermiNet / LapNet 相关实现开源仓库（如 DeepMind 的 google-deepmind/ferminet）：虽然 FermiNet 针对的是实空间连续分子系统，但其多行列式构造和 MCMC 参数配置具有极高的参考价值。

4. 关键引用文献与该工作局限性的客观批判

4.1 关键历史文献脉络

Feynman & Cohen (1956) [Phys. Rev. 102, 1189]：首次提出回流关联（Backflow correlation）的概念，奠定了这一理论分支的基石。
Di Luo & Bryan Clark (2019) [Phys. Rev. Lett. 122, 226401]：将现代神经网络（Neural Network Backflow, NNB）引入回流波函数参数化中，开启了机器学习回流态的新纪元。
Javier Robledo Moreno et al. (2022) [PNAS 119, e2122059119]：提出了隐费米子行列式态（HFDS），展示了如何通过将费米子投影到更大维度的辅助空间来改变节点结构，是近几年性能极强的费米子波函数方案。
Sandro Sorella (2023) [Phys. Rev. B 107, 115133]：提供了变分蒙特卡洛在二维 Hubbard 模型上的高精度参考，该工作中的很多基准对比数据和变分策略为本文奠定了基础。

4.2 本文工作局限性与潜在缺陷的深度批判

尽管本工作在构思之优雅和数值精度之高上堪称典范，但站在严谨的学术和实际产业化应用的视角，该方案仍存在一些无法回避的局限性：

局限性一：路径膨胀带来的“维度灾难”（Path Explosion）

在公式（5）中，HB波函数的表达能力依赖于路径深度 $K$。在一维晶格或配位数极低的格子中，$K$ 能够轻易推到很大。但在实际的复杂高维晶格（如三维简立方、金刚石结构）或考虑次邻近相互作用的格子中，其局部配位数 $z$ 会显著增大。由于路径求和的项数随着 $K$ 呈 指数级增长（$z^K$ 级），当 $K > 3$ 时，直接求和的代数开销将彻底淹没计算资源。因此，如何在保持局域性的同时，进行智能的“路径剪枝（Path Pruning）”或者采用类似于张量积的重整化群方式来截断路径，是该方法向更复杂晶格拓扑迁移时必须解决的短板。

局限性二：从“离散晶格”向“连续实空间分子系统”转化的巨大鸿沟

量子化学家和分子制药专家往往更关心真实三维物理空间中的连续化学系统（如多核过渡金属催化中心）。在连续实空间中，我们无法再依赖明确定义的“离散格点”以及“邻接表”来构建路径求和。如果要在分子体系中复现层级回流的思想，必须使用离散化的局域分子轨道（LMO）作为“虚拟格点”，或者引入基于实空间连续距离衰减的局域核函数。这一转化在数学上极具挑战性，目前尚未看到明确可行的通用推导。

局限性三：激发态的模拟难题

基于变分蒙特卡洛（VMC）的方法天生对基态（Ground State）非常友好，但要计算强关联费米子系统的激发态（Excited States，如光电子能谱、单粒子准粒子激发等），依然面临巨大的理论困难。目前层级回流波函数主要针对基态设计，如何无缝推广到非正交的多激发态变分空间，仍然是一个完全开放的科学问题。

5. 补充探讨：参数复杂度对比、物理图像映射与未来展望

为了给读者提供更全面的技术视角，本节将通过定量的参数复杂度分析与深度的物理图景剖析，进一步揭示层级回流（HB）和残差层级回流（RHB）的颠覆性价值。

5.1 变分参数复杂度的定量对比（Parameter Scaling Analysis）

在传统的全局神经网络波函数（例如标准的 NNB 或经典的隐费米子网络）中，为了构建每一个配置相关的 Slater 行列式，神经网络必须为每一个电子输出一个包含所有空间坐标依赖的单粒子轨道向量（如图 5 左侧所示）。对于拥有 $N$ 个格点、$M$ 个费米子的系统，单个行列式所需的输出维度为 $M \times N$：

全局网络参数缩放：由于在典型的掺杂系统中 $M \propto N$（例如 $M = \frac{7}{8}N$），神经网络的输出层参数量将以 $O(N^2)$ 的平方律方式发生恶性膨胀！这就意味着网络最后一层全连接层的权重数目为 $O(N_{\text{neuron}} \cdot N^2)$。当系统尺寸 $N$ 扩展到上百个格点时，神经网络最后一层的变分参数将突破百万甚至千万级，导致优化在数值上面临“梯度弥散”或“梯度爆炸”的深渊。
残差层级回流（RHB）的参数缩放（如图 5 右侧所示）：在 RHB 架构中，复杂的非平滑局域空间关联完全由 HB 物理骨架承担。神经网络不需要为每个轨道输出长达 $N$ 的向量，而仅需为每一个电子和每一个行列式输出一个一维的、非局域的标量标定因子 $Q_m(\bar{s})$。其对应的参数量直接降为：
$$\text{Output Dimension} = M \propto N$$
这使得神经网络部分所需的变分参数目缩放直接被压低到了 $O(N_{\text{neuron}} \cdot N)$ 的线性级！总参数量（HB骨架参数 + 神经网络参数）最终满足：
$$\text{Total Parameters} \sim O(N_{\text{neuron}}N) + O(N^2)$$
这一显著的降维打击，正是 RHB 波函数能够毫无压力地在 CPU 集群上直接扩展到 $16 \times 16$ 这种以往神经网络量子态根本不敢触碰的超大尺寸系统的核心秘诀。

5.2 物理图景映射：局域路径展开与高阶虚拟跃迁微扰理论

为什么形式如此简单的局域路径展开（公式 5）能拥有如此强大的强关联表达能力？我们可以将其与凝聚态理论中经典的**高阶微扰论（High-order Perturbation Theory）**建立深度的理论映射。

在强关联极限下（$U \gg t$），Hubbard 模型的低能有效物理可以由 $t/U$ 的高阶微扰展开（即有效自旋超交换作用，Exchange Interaction）来描述。一个电子在背景中进行一次物理上的“虚拟跃迁”再回到原位，其振幅和有效自旋翻转相互作用直接正比于跃迁路经的代数乘积。每一次虚拟跃迁都涉及到邻近格点上电子的占有状态（即排斥或吸引）。

仔细对照可以发现，HB波函数的路径展开深度 $K$，在物理上恰好对应了微扰论中的微扰阶数（即最大允许的虚拟跃迁步数）！

$K=1$ 自然融入了最近邻局域相互作用产生的单步纠缠调制；
$K=2$ 融入了二阶虚拟跃迁（涵盖了超交换作用 $J \sim t^2/U$ 的物理机制）；
随着 $K$ 的增加，高阶的多体关联项被以“路径代数和”的形式，在 orbital 级别优雅地自动合成。

这种与微扰物理图景的一一对应关系，赋予了HB波函数无与伦比的物理可解释性，这与传统的“黑箱”深度学习网络有着云泥之别。

5.3 展望：量子化学与凝聚态计算的未来演进

层级回流波函数的提出，标志着“变分多体量子计算”的研究范式正在发生一次重大转型：从早期的“暴力增加神经网络深度和黑箱拟合能力”，逐步回归到“由系统本身的局域物理原理去诱导、构建网络架构”的正确轨道上。

未来的研究方向极有可能沿着两条主要路径演进：

局域路径网络重整化：利用张量网络（MPS/PEPS）的重整化技术对 HB 的高阶路径求和进行无损压缩，实现在高维空间下对大深度 $K$ 的高效逼近。
原子轨道基组下的量化回流：将离散的路径展开转化为局域高斯轨道（GTO）或 Wannier 轨道之间的跳跃，开发出真正适用于实空间 ab-initio 分子计算的量子化学新一代高精度波函数工具，为攻克过渡金属催化反应、多自由度化学键断裂等世界级难题提供强有力的理论武器。