来源论文: https://arxiv.org/abs/2604.21978v1 生成时间: Apr 27, 2026 10:33

超越变分偏置：利用 Transformer 回流波函数解析哈伯德模型中的纠缠序

0. 执行摘要

在强关联电子系统的研究中，二维哈伯德模型（Hubbard Model）因其展现出与高温铜氧化物超导体相似的丰富物理现象（如反铁磁性、电荷受调制的条纹序、非传统配对等）而处于理论研究的核心地位。然而，由于该模型在有限掺杂下的基态存在多种相互竞争且能量极度接近的“纠缠序”（Intertwined Orders），传统的计算方法往往会得出截然不同的物理结论，这种现象被称为“变分偏置”（Variational Bias）。

本文解析的最新研究成果展示了如何通过先进的神经网络量子态（NQS）——特别是基于 Transformer 架构的回流波函数（Backflow Wavefunctions），来识别并系统地消除这种偏置。研究表明，尽管不同的波函数初态（如 Slater 行列式、空穴-粒子变换后的行列式以及 Pfaffian 形式）在优化初期会收敛到完全不同的物理相，但通过对称性还原（Symmetry Restoration）和方差削减（Variance Reduction），它们最终都能收敛到同一个物理图像：超导序（Superconducting Order）与条纹序（Stripe Order）的共存态。这一进展不仅为哈伯德模型的基态争议提供了新证据，也为变分量子蒙特卡洛（VMC）方法设定了新的精度基准。

1. 核心科学问题，理论基础，技术难点与方法细节

1.1 核心科学问题：变分偏置的本质

变分方法的基本原理是寻找使哈密顿量期望值 $E = \langle \Psi | \hat{H} | \Psi \rangle / \langle \Psi | \Psi \rangle$ 最小化的参数化波函数 $\Psi$。在简单的系统中，能量最低通常意味着更接近真实的基态。然而，在二维 $t-t'$ 哈伯德模型中，条纹相（Stripe phase）和超导相（Superconducting phase）之间的能差极小（通常在 $10^{-3} t$ 量级）。在这种情况下，波函数的数学结构（即 Ansatz）本身会引入一种隐形的物理偏向。例如，传统的 Slater 行列式结构更容易捕捉磁性关联，而忽略配对关联；而某些特殊的变换则可能反之。如果优化过程在局部极小值处停滞，或者波函数表达力不足，研究者可能会误以为得到了某种单一序的基态，而实际上这只是 Ansatz 带来的偏置效应。

1.2 理论基础：$t-t'$ 哈伯德模型

研究聚焦于具有周期性边界条件（PBC）的 $8 \times 8$ 正方形格点上的 $t-t'$ 哈伯德模型，其哈密顿量定义为：

$$\hat{H} = - \sum_{r,r',\sigma} t_{rr'} (\hat{c}_{r\sigma}^\dagger \hat{c}_{r'\sigma} + h.c.) + U \sum_{r} \hat{n}_{r\uparrow} \hat{n}_{r\downarrow}$$

其中，$t$ 表示最近邻跳跃，$t' = -0.2$ 表示次近邻跳跃，$U = 8$ 是现场库仑排斥能。系统处于 $1/8$ 掺杂状态（即 $\delta = 1 - n = 1/8$），这是实验和数值模拟中条纹序与超导竞争最激烈的区域。

1.3 技术难点：如何构建无偏且高精度的波函数？

传统的变分波函数（如 Jastrow-Slater 或变分蒙特卡洛中常用的平均场初态）往往需要人工预设某种对称性破缺。对于神经网络量子态（NQS）而言，虽然其表达力更强，但仍面临以下挑战：

费米子反对称性约束：神经网络必须严格遵守泡利不相容原理。
多尺度关联的捕捉：条纹序涉及长程电荷密度调制，而超导涉及精细的电子配对，两者在数学表达上要求迥异。
训练的收敛性：在没有平均场预训练（Mean-field pretraining）的情况下，如何确保随机初始化的参数能搜索到全局最优解？

1.4 方法细节：Transformer 回流波函数架构

本文采用了一种基于 Transformer 架构的回流波函数。其核心逻辑如下：

1.4.1 Transformer 编码器（Backflow Transformation）

物理配置 $s = (s_1, \dots, s_N)$ 被映射到嵌入向量序列，通过多层（$n_l = 4$）具有多头注意力机制（$h = 12$）的 Transformer 层处理。Transformer 的自注意力机制（Self-attention）天然适合描述格点间的远程关联。它输出一组依赖于配置的轨道系数向量 $y_i$。

1.4.2 费米子输出层（Antisymmetrization Schemes）

为了测试偏置，研究者考虑了三种不同的反对称化输出方案：

Determinant (Det)：将 Transformer 输出映射到单粒子轨道 $\Phi_{i\sigma\alpha}$，构建标准的 Slater 行列式 $\det[\mathbf{n} \star \Phi]$。这种构造在平均场水平上倾向于描述磁性序。
Particle-Hole Determinant (Det-PH)：通过空穴-粒子变换 $c_{\downarrow} \to c^\dagger_{\downarrow}$，将超导序映射为行列式可以表达的旋转对称性破缺。这在架构上“偏爱”超导。
Pfaffian (Pf)：构建一个反对称矩阵的 Pfaffian 值 $\text{Pf}[\mathbf{n} \star \phi \mathbf{A} \phi^T \star \mathbf{n}]$。Pfaffian 是行列式的推广，理论上可以同时容纳磁性和配对涨落。

1.4.3 量子数投影（Symmetry Restoration）

这是消除偏置的关键。通过对平移群 $T$ 和点群 $C_4$ 旋转对称性进行投影：

$$\Psi_\lambda(\mathbf{s}) = \frac{1}{|G|} \sum_{g \in G} \chi_\lambda^*(g) \xi_{g^{-1}}(\mathbf{s}) \Psi_\theta(g^{-1} \mathbf{s})$$

即使波函数原本在采样层面表现出某种特定的序，投影过程也会强制恢复物理系统的真实对称性，并在此过程中降低变分能量和方差。

2. 关键 Benchmark 体系，计算所得数据与性能数据

2.1 体系设定

格点规模：$8 \times 8$（64 个位点）。
相互作用强度：$U/t = 8.0$（强关联区域）。
参数：$t'/t = -0.2$，掺杂 $\delta = 0.125$。
边界条件：周期性边界条件（PBC）。

2.2 能量精度对比（Table I 分析）

研究结果显示，Transformer-based NQS 在该体系上取得了目前已知的最佳变分能量：

Ansatz	对称性投影	能量/位点 ($E/N$)	方差/位点	相对误差 (vs Extr.)
之前的最佳结果 [21]	-	-0.7447	-	0.012
Det (本研究)	无	-0.74512(1)	0.037	0.012
Det (本研究)	T+R (全对称)	-0.74993(1)	0.019	0.0056
Det-PH (本研究)	T+R (全对称)	-0.75026(1)	0.017	0.005
Pfaffian (本研究)	T+R (全对称)	-0.75058(1)	0.016	0.0045
零方差外推	-	-0.7540(4)	0	0

关键观察点：

仅使用简单的 Determinant NQS 在不加对称性投影时，其能量就已经优于之前的文献记录。
全对称的 Pfaffian NQS 达到了 $-0.75058$ 的极高精度，相比之前文献提升了约 3 倍的精度等级。

2.3 序参数的演化（Figure 2 与 Figure 3）

研究通过 $d$-wave 配对序参数 $\Delta_{SC}$ 和条纹磁序参数 $M^2_{str}$ 来定量评估物理状态：

偏置的表现：在没有对称性投影的情况下，Det 倾向于高条纹序（$M^2_{str} \approx 0.030$）和极低超导序；而 Det-PH 则表现出极强的超导关联（$\Delta_{SC} \approx 0.032$）和极弱的条纹序。
收敛过程：随着对称性还原（从 No Symmetry 到 T，再到 T+R），三种 Ansatz 的能量都在下降，更重要的是，它们的序参数开始向中间值靠拢。在图 2 中可以看到明显的“汇聚点”。
结论数据：最终确定的序参数区间为：
- 超导序：$0.0177(1) \le \Delta_{SC} \le 0.0254(2)$
- 条纹序：$0.0247(1) \le M^2_{str} \le 0.0272(1)$ 这有力地证明了该模型基态中两种序是共存的。

2.4 关联函数 (Figure 4 & 5)

电荷密度：在全投影后，三种方法得到的电荷密度分布趋于均匀，但在二体关联函数中仍隐藏着长程调制。
自旋关联：$C_S(r)$ 展示了典型的长波调制，削弱了反铁磁序，证实了条纹相的存在。
s-wave 对比 (Figure 5)：在吸引力哈伯德模型（$U=-8$）的 Benchmark 中，Det NQS 严重低估配对关联，而引入平移对称性投影后立刻与 DQMC 精确解重合，再次强调了对称性的重要性。

3. 代码实现细节，复现指南与软件包

3.1 软件框架

该工作主要基于 NetKet 框架进行开发，这是一个基于 Python/JAX 的开源软件包，专门用于神经网络量子态的研究。其高效的 JAX 后端允许在 GPU 上进行大规模并行采样和自动微分。

3.2 架构参数复现

Transformer 结构：
- 层数 ($n_l$): 4
- 注意力头数 ($h$): 12
- 嵌入维度 ($d$): 72
- 注意力机制：Factored Attention (一种分解式的注意力机制，用于处理 2D 空间位置，减少内存消耗)。
优化算法：
- 随机重构法（Stochastic Reconfiguration, SR）：这等价于量子自然梯度下降，是保证 NQS 收敛的关键。使用了线性代数优化技巧（linear algebra trick）处理大规模参数矩阵。
- 采样数：$M = 2^{13} = 8192$ 每个迭代步。
- 学习率：起始 $\eta = 0.03$，随后进行退火（Annealing）。

3.3 复现步骤建议

初始化：不要使用任何平均场轨道初始化 Transformer 权重，使用随机初始化以测试其寻找全局最小值的自发能力。
多阶段优化：
- 第一阶段：无对称性投影，运行 $4 \times 10^4$ 步，让网络学习基本的物理关联。
- 第二阶段：引入平移对称性投影 ($T$)，运行 $2 \times 10^3$ 步。此阶段能量会显著下降。
- 第三阶段：引入旋转对称性投影 ($T+R$)，运行 $10^2$ 步进行微调。
监控指标：实时监控能量方差（Variance）。如果方差随步数持续下降，说明波函数正在变得更加接近本征态。

3.4 开源 Repo 链接

NetKet 官方库: https://github.com/netket/netket
相关 Transformer NQS 实现参考: 可以在 NetKet 的模型库或相关的 GitHub 组织如 vqs-hubbard 中寻找特定于哈伯德模型的回流波函数实现。

4. 关键引用文献与局限性评论

4.1 关键引用文献

LeBlanc et al. (2015) [3]: 哈伯德模型数值方法的里程碑式综述，确立了 $U=8$ 参数下的基本争议点。
Qin et al. (2020) [6]: 证明了在纯哈伯德模型中，超导序在热力学极限下可能消失，引发了关于 $t'$ 作用的讨论。
Viteritti et al. (2023) [30, 31]: 早期关于 Transformer 在量子自旋系统应用的成果。
Zheng et al. (2017) [12]: 使用 DMRG 确认了条纹序在掺杂哈伯德模型中的主导地位。

4.2 局限性评论

尽管本文通过 Transformer NQS 取得了卓越的精度，但仍存在以下局限：

系统规模限制：目前的研究集中在 $8 \times 8$ 格点。虽然这对于 NQS 已属不易，但对于彻底解决热力学极限下的超导争论，仍需扩展到更长的柱状几何（如 $L_x=16$ 或更大）或利用 iPEPS 等方法进行交叉验证。
计算成本：Pfaffian 架构相比 Determinant 具有更高的时间复杂度（$O(N^3)$ vs $O(N^2)$ 每次更新后的增量计算），且引入全对称投影后，采样的计算开销呈倍数增长，这限制了其向超大系统的扩展。
准简并态的物理稳定性：虽然 NQS 展示了汇聚，但在实际计算中，如何从数值上区分“真正的共存”与“极度接近的态叠加产生的平均效应”仍然是一个微妙的理论问题。此外，零方差外推的可靠性依赖于外推点的分布，在极强关联区可能存在非线性波动。

5. 补充：物理深度探讨与技术细节扩展

5.1 条纹序与超导的纠缠物理

为什么这两者会纠缠在一起？从物理直觉上讲，条纹序（空穴的局部聚集）会降低系统的动能，但会破坏全局的反铁磁背景。而超导配对则倾向于利用交换相互作用。研究揭示，在 $t'=-0.2$ 的作用下，电子的有效费米面发生了扭曲，这种扭曲恰好调节了配对关联和条纹关联的强度，使它们在能量谱上几乎重合。本文的 NQS 结果支持了“超导是在条纹背景上产生的，而不是条纹的替代者”这一现代观点。

5.2 关于空穴-粒子（PH）变换的数学细节

在 Det-PH 方案中，通过以下变换：

$$\hat{c}_{r\uparrow} \to \hat{c}_{r\uparrow}, \quad \hat{c}_{r\downarrow} \to \hat{c}_{r\downarrow}^\dagger$$

哈密顿量被重写。这一变换的妙处在于，它将 BCS 超导态（在原表象中是复杂的双粒子配对态）映射为了一个非相互作用的费米子真空态（在变换后的表象中是简单的行列式）。通过让 Transformer 回流作用在这个变换后的基础上，我们赋予了神经网络一种“先验”，使其能更高效地表达超导波动。然而，正如文中所证，这种先验如果不加对称性修正，会演变成偏置。

5.3 变分量子蒙特卡洛（VMC）的未来

本文的方法论展示了变分法的一个重要范式转变：不再试图设计一个“正确”的初态，而是设计一个足够强大且能系统改进的“搜索器”。通过追踪关联函数随方差削减的演化路径，我们获得的信息远比单一的能量数字更丰富。这种“演化追踪”的方法将成为未来数值强关联物理的标准流程。

5.4 硬件与训练 Tips

对于希望复现此工作的同仁：

显存优化：$8 \times 8$ 系统下的全对称投影会生成大量的中间配置。建议使用 vmap 或 pmap 在多张 GPU 上分散采样压力。
数值稳定性：在计算 Pfaffian 时，矩阵的条件数可能会变差，建议在某些层使用双精度浮点数（float64）以避免梯度爆炸。
SR 的秩削减：在参数过多的情况下，SR 的 Fisher 信息矩阵求逆是不稳定的，建议使用共轭梯度法（CG）配合合适的预处理（Preconditioner）。