来源论文: https://arxiv.org/abs/2606.05850v2 生成时间: Jun 13, 2026 15:58

走向稳定与高精度的电子动力学模拟：基于神经网络的时变变分蒙特卡洛（NB-tVMC）方法深度解析

0. 执行摘要

实时电子动力学（Real-time Electron Dynamics）是现代物理与化学的核心前沿课题，它支配着分子和纳米材料在强场激发下的超快电荷迁移、多光子共振、光电离及非平衡态能量耗散。然而，传统的电子动力学模拟方法长期面临“精度与效率”的双重困境。时变密度泛函理论（TDDFT）受限于近似的交换相关泛函和绝热近似，在描述长程电荷转移、双重激发及强驱动电荷动力学时频频失效；而高精度的含时波函数方法（如实时含时组态相互作用 RT-TDCI、含时耦合簇 RT-TDCC）其计算复杂度随体系大小和基组规模呈指数或高阶多项式级增长，无法应用于中大型分子体系。

近年兴起的深度神经网络（NN）波函数（如 FermiNet、PaulNet 等）凭借变分蒙特卡洛（VMC）框架，在基态和低激发态的静态计算中取得了前所未有的精度。然而，将神经网络波函数推广到实时动力学演化却面临着致命的数值稳定性瓶颈：在全参数空间中直接应用时变变分蒙特卡洛（tVMC）会因为随机噪声累积、量子几何张量（QGT）极其严重的病态（Ill-conditioned）特性以及复数域激活函数的奇异性，导致时间演化轨迹在极短时间内崩溃。

针对这一痛点，来自 ByteDance Seed 与北京大学的联合研究团队（Weizhong Fu, Zhe Li, Yubing Qian, Ruichen Li, Weiluo Ren, Ji Chen）提出了一种**基于神经网络基组的时变变分蒙特卡洛（Neural Basis Time-Dependent Variational Monte Carlo, NB-tVMC）**框架。该框架的核心思想是两阶段策略：首先利用多状态变分蒙特卡洛（NES-VMC）在 $t=0$ 时刻联合训练多个低能态，构建一个高度紧凑且定制化的“神经网络多体流形”；随后在实时演化阶段，冻结非线性深层网络，仅将时间演化限制在由该神经网络基（Neural Basis）张成的紧凑线性子空间内。这一方法不仅彻底解决了全参数演化的数值不稳定问题，还在强激光场驱动下的氢原子、拉伸氢分子、氦原子和铍原子的偶极响应和动态极化率计算中，展现出了超越传统大基组 FCI 和 TDDFT 的标杆级（Benchmark-quality）精度。

本博客将对这一突破性工作进行全方位、深度的学术级拆解，从数学物理基础、技术瓶颈根源、NB-tVMC 算法细节、关键基准测试到代码复现指南及未来展望，为量子化学与凝聚态物理领域的科研工作者提供一份详尽的技术指南。

1. 核心科学问题、理论基础、技术难点与方法细节

1.1 核心科学问题：电子动力学的精度-效率困境与神经网络演化瓶颈

微观粒子（特别是电子）在外部电场 $\mathbf{E}(t)$ 作用下的超快动力学过程（通常处于阿秒 $10^{-18} \text{ s}$ 到飞秒 $10^{-15} \text{ s}$ 尺度）由随时间变化的薛定谔方程（Time-Dependent Schrödinger Equation, TDSE）控制：

$$i \frac{\partial}{\partial t}|\Psi(t)\rangle = \hat{H}(t)|\Psi(t)\rangle$$

其中，$\hat{H}(t) = \hat{H}_0 - \hat{\bm{\mu}} \cdot \mathbf{E}(t)$ 为偶极近似下的含时哈密顿量，$\hat{\bm{\mu}} = -\sum_i \mathbf{r}_i$ 是体系的总偶极矩算符。

在传统方法中：

TDDFT 的实际应用极度依赖于交换相关泛函的绝热近似（Adiabatic Approximation），这使得它无法正确描述激发态特征明显的双重激发过程，并且在面临强场电离和长程电荷转移时会产生严重的人为偏差（Artifacts）。
实时波函数方法（RT-FCI, RT-CCSD） 虽然在数学上是系统可改进的（Systematically Improvable），但它们受限于一单粒子基组（Basis Set）的“指数墙”限制。特别是在处理强场激发的连续态和里德堡态时，需要引入极其庞大的弥散基组（Diffuse Functions），这使得计算迅速变得无法承受。

神经网络波函数通过使用高维非线性映射来隐式捕捉多体电子关联，从而摆脱了单粒子轨道乘积线性组合的传统范式。然而，当我们试图用参数化波函数 $|\Psi(\bm{\theta}(t))\rangle$（其中 $\bm{\theta}(t)$ 为神经网络的权值和偏置，呈时变特性）来模拟 TDSE 时，其参数更新必须依赖时变变分原理（tVMC）。这一步成了通往高精度电子动力学道路上的致命“绊脚石”。

1.2 理论基础：时变变分原理与 Dirac-Frenkel 投影

为了将无限维希尔伯特空间中的含时薛定谔方程投影到参数有限的变分流形 $\mathcal{M} = \{|\Psi(\bm{\theta})\rangle \}$ 上，我们需要定义变分残差，并通过特定的变分原理使其最小化。对于一个参数为 $\bm{\theta} = \{\theta_1, \theta_2, \dots, \theta_{N_p}\}$ 的变分态 $|\Psi(\bm{\theta})\rangle$，其正切空间（Tangent Space）由对数导数算符张成：

$$O_i(\mathbf{x}) \equiv \frac{\partial}{\partial \theta_i} \ln \Psi(\mathbf{x}; \bm{\theta})$$

在物理图像上，为了保证状态波函数的相位和模长变化在射影希尔伯特空间中是唯一的，我们通常引入投影算符 $\mathbb{Q}_\Psi$，将正切矢量正交投影到与当前状态 $|\Psi\rangle$ 垂直的子空间中：

$$\mathbb{Q}_\Psi |\partial_{\theta_i} \Psi\rangle = (|O_i\rangle - \langle O_i \rangle)|\Psi\rangle$$

含时投影的核心是定义复数残差（Projected Residual）：

$$\mathcal{R}_i(\dot{\bm{\theta}}) \equiv \frac{\langle \mathbb{Q}_\Psi \partial_{\theta_i} \Psi | \hat{H} - i\partial_t | \Psi \rangle}{\langle \Psi | \Psi \rangle} = F_i - i \sum_j S_{ij} \dot{\theta}_j$$

其中，$\mathbf{S}$ 称为**量子几何张量（Quantum Geometric Tensor, QGT）**或变分度规（Variational Metric），其矩阵元定义为：

$$S_{ij} = \langle O_i^* O_j \rangle - \langle O_i^* \rangle \langle O_j \rangle$$

$\mathbf{F}$ 则是变分“力”矢量（Force Vector），由对数导数与局部能量（Local Energy, $E_L(\mathbf{x}) = \frac{\hat{H}\Psi(\mathbf{x})}{\Psi(\mathbf{x})}$）的协方差决定：

$$F_i = \langle O_i^* E_L \rangle - \langle O_i^* \rangle \langle E_L \rangle$$

不同的时变变分原理要求残差的不同部分消失：

McLachlan 变分原理：要求最小化波函数演化速度的残差，等价于 $\text{Im} \mathcal{R}_i = 0$。对于实变参数，这给出：
$$\sum_j \text{Re}[S_{ij}] \dot{\theta}_j = \text{Re}[-i F_i]$$
时变变分原理（TDVP）：要求作用量（Action）在变分路径上平稳，等价于 $\text{Re} \mathcal{R}_i = 0$：
$$\sum_j \text{Im}[S_{ij}] \dot{\theta}_j = \text{Im}[-i F_i]$$
Dirac-Frenkel 变分原理（DFP）：若参数 $\bm{\theta}$ 为复数，且波函数对参数是全纯的（Holomorphic），则要求整个复数残差 $\mathcal{R}_i = 0$，得到复数线性方程组：
$$\sum_j S_{ij} \dot{\theta}_j = -i F_i$$

在变分蒙特卡洛中，度规 $\mathbf{S}$ 和力 $\mathbf{F}$ 都是通过随机抽样估算的。对于一个深层神经网络，其参数量 $N_p$ 动辄达到数十万到数百万，要在如此庞大的参数空间中精确评估 $\mathbf{S}$ 矩阵是极难实现的。

1.3 技术难点：全参数含时神经网络演化的数值灾难根源

为什么直接对神经网络波函数（例如 FermiNet）的所有参数应用 DFP 或 McLachlan 演化会彻底崩溃？论文作者在 Supplementary Note 3 中进行了深入剖析，主要根源有三点：

QGT 矩阵 $\mathbf{S}$ 的严重病态与秩亏（Rank Deficiency）：深度神经网络具有极高的表达冗余性。这导致在正切空间中，许多网络参数的导数方向高度共线，使得 QGT 矩阵存在大量极其接近于 0 的特征值。在含时变分演化中，我们需要求解 $\dot{\bm{\theta}} = -i \mathbf{S}^{-1} \mathbf{F}$。由于 $\mathbf{S}$ 极度病态，微小的蒙特卡洛抽样噪声在乘以 $\mathbf{S}^{-1}$ 后会被灾难性地放大，导致参数更新量 $\dot{\bm{\theta}}$ 出现天文数字般的暴涨，使数值积分瞬间发散。
复参数复数域解析性（Holomorphicity）的丧失与极点问题：为了描述复数波函数的相位演化，神经网络波函数的参数必须推广到复数域。对于基于 FermiNet 的架构，其内部广泛采用双曲正切（$\tanh$）作为非线性激活函数。在实数域内，$\tanh(x)$ 是极其平滑且有界的。但一旦参数 $\bm{\theta}$ 进入复数平面，$\tanh(z)$ 在复平面上会产生无数的孤立极点（Poles，位于 $z = i\pi(k+1/2)$）。当神经网络的所有参数都在复数平面内自由演化时，深层网络的参数很容易在随机噪声驱动下接近这些极点，导致波函数局部幅值和对数导数发生爆发式增长，进而引发无可挽回的数值溢出。
辛结构（Symplectic Structure）的破坏：对于非全纯参数化网络，若采用 McLachlan 变分原理，它并不像 TDVP 那样天然具有哈密顿系统的辛结构。这意味着在长期的数值演化中，由于随机噪声的积累，体系的能量守恒性会迅速崩溃，产生不可控的“数值加热”现象。

1.4 方法细节：神经网络基组时变变分蒙特卡洛（NB-tVMC）

为了绕过全参数演化的数值泥潭，同时保留神经网络卓越的多体关联表达能力，本文创新性地提出了 NB-tVMC 架构。其核心策略是将时间演化限制在由预训练得到的、性质极佳的神经网络基组所张成的定制化紧凑多体流形上。整个方法分为两个主要阶段（图 1）：

[第一阶段：NES-VMC 联合预训练] (t = 0)
      │
      ▼ 构建联合状态，优化所有层参数以拟合基态及多个低能激发态
[神经网络基组生成] ─── 提取最后一层隐藏层的输出，定义为定域多体基组 χ^α_μj
      │
      ▼ 冻结深层网络参数（非线性层）
[第二阶段：线性系数含时传播] (t > 0)
      │
      ▼ 仅将最后一层线性混合矩阵 ̃θ^kα_iμ(t) 设为时变复数变分参数
[使用 DFP/McLachlan 进行 tVMC 演化] ─── 求解超紧凑、极其稳定的线性方程组

1.4.1 第一阶段：多状态联合预训练（NES-VMC）

在 $t=0$ 时刻，我们首先要构建一个能够同时描述体系基态和低能激发态的多体流形。我们采用神经网络激发态变分蒙特卡洛（Neural Excited States VMC, NES-VMC）方法。这里，设计一个共享前向非线性网络参数的 FermiNet 结构：

$$\Psi_m = \sum_{k=1}^{N_{\text{det}}} \det[\phi^{k\uparrow, m}_{ij}] \det[\phi^{k\downarrow, m}_{ij}]$$

其中 $m$ 索引不同的目标状态（包含基态和多个低能激发态）。多状态联合训练的损失函数中引入了惩罚项（Spin penalty 和状态正交性约束），迫使网络通过深层的非线性层 $\mathbf{h}^L$ 学习到能够同时表征这几个状态的核心物理特征：

$$\chi^{\alpha}_{\mu j} = h^{L\alpha}_{\mu}(\mathbf{r}^{\alpha}_j; \{\mathbf{r}^{\alpha}_{/j}\}; \{\mathbf{r}^{\bar{\alpha}}\})$$

这些 $\chi^{\alpha}_{\mu j}$ 就是我们高度定制化的**“神经网络多体基组（Neural Basis）”**。与传统化学中固定单粒子轨道（如 HF 轨道、GTO 基组）不同，$\chi^{\alpha}_{\mu j}$ 是全电子协同坐标的复杂非线性函数，它在进入最后一层线性混合之前，就已经在深层网络中隐式地高效编码了强烈的多体电子相关和瞬时涨落。

1.4.2 第二阶段：冻结非线性基组，定义定制流形

一旦 NES-VMC 预训练收敛，我们立即**“冻结”**该多层神经网络中所有的非线性映射参数（即深层的权重和偏置参数全部锁定，不再随时间改变）。此时，时变的波函数 $|\Psi(t)\rangle$ 仅由最后一层线性混合层的复系数 $\tilde{\theta}^{k\alpha}_{i\mu}(t)$ 决定。其轨道表示简化为：

$$\phi^{k\alpha}_{ij}(t) = \sum_{\mu} \tilde{\theta}^{k\alpha}_{i\mu}(t) \chi^\alpha_{\mu j}$$

由于 $\chi^\alpha_{\mu j}$ 已经锁定，这些时变的参数 $\tilde{\theta}^{k\alpha}_{i\mu}(t)$ 是典型的复线性变分参数。其对应的正切空间维度急剧缩减：原本全参数网络有数十万个参数，而现在仅仅剩下 $N_det \times N_{elec} \times N_{basis}$ 个线性参数（通常在数十到数百的数量级）。

1.4.3 第三阶段：线性系数的实时演化（Time Propagation）

在仅有最后一层线性参数 $\tilde{\theta}(t)$ 时变的情况下，复数 QGT 矩阵 $\mathbf{S}$ 的维度也从数十万阶骤降到数百阶。此时计算 $\mathbf{S}$ 不仅耗时极短，而且其病态特征大大减弱。通过蒙特卡洛方法，我们可以非常精确地采样估算这个小规模的 $\mathbf{S}$ 和 $\mathbf{F}$。利用 DFP 变分方程：

$$\sum_j S_{ij} \dot{\theta}_j = -i F_i$$

由于维度极小，我们可以使用强大的**奇异值分解（SVD）伪逆（Moore-Penrose Pseudoinverse）**方法来高稳定性地求解变分速度 $\dot{\bm{\theta}}$。接着，使用二阶 Heun 预估-校正算法（Predictor-Corrector Scheme）进行时间步长为 $\Delta t$ 的步进演化：

$$\bm{\theta}^{(p)} = \bm{\theta}^{(n)} + \Delta t \dot{\bm{\theta}}^{(n)}$$$$\bm{\theta}^{(n+1)} = \bm{\theta}^{(n)} + \frac{\Delta t}{2} \left( \dot{\bm{\theta}}^{(n)} + \dot{\bm{\theta}}^{(p)} \right)$$

这种演化既保留了深度网络对强电荷关联的极佳描述能力，又确保了长效的辛对称性和数值极点免疫性。

1.4.4 数学等价性证明：基于 Cauchy-Binet 定理的线性子空间剖析

为什么冻结神经网络基组在数学上具有坚实的合理性？作者在 Supplementary Note 2 中给出了极其优美的数学论证：

设体系在任意时刻 $t$ 的自旋通道单粒子轨道矩阵为 $\mathbf{\Phi}^{\alpha}(t) \in \mathbb{C}^{N_\alpha \times N_\alpha}$，神经网络基特征矩阵为 $\mathbf{X}^\alpha \in \mathbb{R}^{M \times N_\alpha}$（其中 $M$ 是最后一层隐藏层的特征维度，即神经基函数个数，$N_\alpha$ 是自旋 $\alpha$ 的电子数）。两者之间的线性混合由系数矩阵 $\tilde{\bm{\theta}}^{k\alpha}(t) \in \mathbb{C}^{N_\alpha \times M}$ 控制：

$$\mathbf{\Phi}^{k\alpha}(t) = \tilde{\bm{\theta}}^{k\alpha}(t) \mathbf{X}^\alpha$$

根据多线性代数中的 Cauchy-Binet 公式，该单粒子轨道矩阵的行列式可以展开为：

$$\det(\mathbf{\Phi}^{k\alpha}(t)) = \sum_{\substack{I \subset \{1,\dots,M\} \\ |I|=N_\alpha}} \det\left(\tilde{\bm{\theta}}^{k\alpha}_{:,I}(t)\right) \det\left((\mathbf{X}^\alpha)_{I,:}\right)$$

这个公式揭示了一个惊人的物理本质：在自旋通道内，仅演化最后一层线性系数 $\tilde{\bm{\theta}}(t)$，在数学上完全等价于仅对一组由固定多体确定子基 $\det\left((\mathbf{X}^\alpha)_{I,:}\right)$ 张成的多体线性希尔伯特子空间进行变分配置相互作用（CI）演化！

因此，NB-tVMC 本质上是在一个通过非线性深度学习定制的、物理图像极佳的**超紧凑多体主动空间（Active Space）**内进行精确的含时 CI。它既有传统 CI 方法绝无数值发散、严格遵循哈密顿动力学流形的优点，又通过深度神经网络彻底免去了传统 CI 庞大的一单粒子基组构造，从而在极小的基组维度下达成了惊人的物理精度。

2. 关键 Benchmark 体系、计算所得数据与性能分析

为了全面检验 NB-tVMC 的精度、通用性与长效稳定性，论文研究了三个极具代表性的体系：激光场驱动下的氢原子、具有强关联和离域化特征的拉伸氢分子（$H_2$），以及氦（He）与铍（Be）原子的动态极化率。下面我们对这三个测试的物理背景、定量数据与方法对比进行深度复盘。

2.1 氢原子在强激光场下的偶极响应

物理背景与挑战

虽然氢原子只有一个电子，但当它受到强激光脉冲作用时，电子会被瞬间激发到高能里德堡态（Rydberg States）甚至发生光电离进入连续态（Scattering/Continuum States）。要准确模拟这一过程，传统的量子化学高阶基组（如 Dunning 的相关一致基组）必须增加极大量的弥散函数。这为检验变分方法对高能态和连续态的捕获能力提供了完美的标准战场。

模拟设置

激光脉冲：采用正弦平方包络脉冲：
$$\mathbf{E}(t) = E_{\text{max}} \left[ \sin^2\left(\frac{\pi t}{3T}\right) \cos(\omega t) + \frac{\pi}{3\omega T} \sin\left(\frac{2\pi t}{3T}\right) \sin(\omega t) \right] \hat{\mathbf{z}}$$
其中 $E_{\text{max}} = 0.029 \text{ a.u.}$，$\omega = 0.057 \text{ a.u.}$，脉冲持续时间为 3 个周期（$3T$）。这个场强足够诱导出明显的非线性极化和高阶响应。
基准对照：含时精确解由完全收敛的 Sturmians（斯图姆）基组 提供。另外对比了由有限解析束缚态组成的基组、传统 Gaussian 基组（cc-pVQZ 和带有弥散函数的 aug-cc-pVQZ）下的精确含时配置相互作用（FCI）演化结果。

关键数据与图像分析

图 2 的偶极矩时变轨迹 $d_z(t)$ 显示了极具启发性的物理结论：

束缚态极限的失效：仅用解析束缚本征态（Bound States Limit）计算的轨迹在第二个周期之后与 Sturmian 精确基准产生明显偏离（图 2a 浅红线），这证实了高能连续态分量的确参与了强场响应。
传统基组的外推困境：采用 cc-pVQZ 基组的 FCI 计算结果表现极差，只有加入大量弥散轨道的 aug-cc-pVQZ 才能勉强贴合基准（图 2b 蓝线）。
NB-tVMC 的优异表现：
- NB-tVMC（仅预训练基态）*：均方根误差（RMSE）仅为 $1.10 \times 10^{-3} \text{ a.u.}$，表现已经超越了 aug-cc-pVQZ 基组下的 FCI。
- NB-tVMC（联合训练基态+低激发态）：表现极其惊艳，其时变偶极矩与 Sturmian 精确基准几乎完美重合，RMSE 降至惊人的 $0.82 \times 10^{-3} \text{ a.u.}$（表 1）。

计算方法	偶极矩时变轨迹 RMSE (a.u.)	物理描述完整度
FCI (cc-pVQZ)	较大偏差	严重缺乏弥散/连续态表征
FCI (aug-cc-pVQZ)	$1.25 \times 10^{-3}$	通过庞大高阶基组硬性逼近
*NB-tVMC (单基态训练)**	$1.10 \times 10^{-3}$	神经网络自适应产生了一定弥散特征
NB-tVMC (多状态联合训练)	$0.82 \times 10^{-3}$	完美捕获高能和连续态物理，兼具极高精度

这一结果有力地证明：即使联合训练中只显式包含了几个低能本征态，深度神经网络优化出的定制多体基组 $\chi$ 也蕴含了极强的外推灵活性，能够自发重构出动力学演化中急需的高能连续态和离域化特征。

2.2 拉伸氢分子（$H_2$）的强场动力学与电子云离域化

物理背景与强关联挑战

当 $H_2$ 分子被拉伸到平衡键长的两倍（$2R_{eq} = 2.8 \text{ a.u.}$）时，体系的静态关联（Static Correlation）会极大地增强，导致单行列式波函数（如 Hartree-Fock）彻底失效。此时，分子极易受外场作用发生多光子共振和早期电离，形成空间上高度分散且离域的电子云。这成了检验含时多体关联计算方法最硬核的“试金石”。

模拟设置

激光脉冲：强梯形脉冲：
$$\mathbf{E}(t) = -E_{\text{max}} \sin(\omega t) \hat{\mathbf{z}} \times f(t)$$
其中 $E_{\text{max}} = 0.07 \text{ a.u.}$（电场强度非常高），$\omega = 0.1 \text{ a.u.}$。包络函数 $f(t)$ 在第一个周期线性爬升，中间保持 1 个周期，最后一个周期线性衰减。
对比方法：前人使用神经网络尝试的工作 S+C+BF (Nys et al.)、FASTNet (Hou et al.)，以及标准的含时大基组 FCI 和基于实空间网格的精确 TDDFT。

关键数据与物理机制解密

前人方案的系统性低估：如图 3a 所示，S+C+BF 和 FASTNet 方法（红、紫虚线）计算出的偶极矩峰值出现极其严重的系统性低估。这是因为全参数变分演化在强场下发生了隐性数值衰减或不稳定性，网络无法有效展开电子云以适应强极化环境。
NB-tVMC 展现标杆级精度：相较之下，NB-tVMC（橙色实线）计算得到的偶极矩随时间的剧烈摆动与大基组 FCI（aug-cc-pVTZ）及实空间网格 TDDFT 精确解高度重合。即使在激光场强达到峰值的极高激发区域（$t=50\sim 80 \text{ a.u.}$），偶极矩的波峰和波谷也得到了完美复现。
多体波包离域化的直观视觉证据：图 3c 给出了 $t=67 \text{ a.u.}$ 时刻 $y\text{-}z$ 平面（$x=0$）上的归一化电子密度分布对比：
- FCI (cc-pVTZ)：电子云高度局限在原子核附近，丢失了强场诱导出的“电离波包”分量。
- FCI (aug-cc-pVTZ)：由于引入了弥散函数，展示了微弱的离域电子外溢。
- TDDFT (实空间网格)：作为无基组限制的网格基准，清晰展示了在原子核外围形成的、范围极其开阔的 delocalized wave packet（离域波包）。
- NB-tVMC* (单基态训练)：仅能捕获微弱的离域波包。
- NB-tVMC (多状态联合训练)：近乎完美地重现了与实空间网格 TDDFT 一致的、大范围外溢的强场极化电子云分布！

这再次印证：多状态预训练在定制流形中写入了本质的激发态物理特征。在无需人工费时费力拼凑弥散基组的前提下，深度学习的多体基组自发具备了完美的实空间极化和外溢描述能力。

2.3 氦（He）与铍（Be）原子的动态极化率 $\alpha(\omega)$ 提取

物理背景

动态极化率 $\alpha(\omega)$ 是表征物质光响应的核心本征物理量。根据经典的单粒子响应理论，要精确提取 $\alpha(\omega)$，方法必须同时对体系的基态能量、各个激发态能量以及它们之间的**过渡偶极矩（Transition Dipole Moments）**进行完美描述：

$$\alpha(\omega) = 2 \sum_{n \neq 0} \frac{(E_n - E_0)|\langle 0 | \hat{\mu}_z | n \rangle|^2}{(E_n - E_0)^2 - \omega^2}$$

模拟与数据拟合方法

驱动外场：施加极微弱的单色摆动场 $\mathbf{E}(t) = E_{\text{max}} \sin(\omega t) \hat{\mathbf{z}}$（保证体系处于严格的线性响应区），对 He 原子取 $E_{\text{max}} = 0.035 \text{ a.u.}$，对 Be 原子取 $E_{\text{max}} = 0.01 \text{ a.u.}$。为了平滑启动，外场在第一个光学周期内进行线性包络爬升。
拟合策略：在度过启动期后，由于体系处于稳定受迫振动状态，其偶极矩响应表现为完美的单频正弦波：
$$\mu_z(t) = \mu_z(0) + \alpha(\omega) E_{\text{max}} \sin(\omega t)$$
我们通过对 NB-tVMC 产生的偶极时变曲线进行极高精度的最小二乘拟合，即可提取出该频率下对应的 $\alpha(\omega)$ 数值（图 4a 和 Supplementary Figure 6）。

模拟结果展示与对比

图 4b 展示了在不同驱动频率下，NB-tVMC 提取的动态极化率（黄色叉号）与基于高精度多体微扰理论（Perturbation Theory）的文献标准曲线（蓝线）的完美吻合。这不仅验证了 NB-tVMC 在强非线性驱动下的稳定性，更证明了该方法在弱场线性响应区，也具有精准捕捉多体本征谱和过渡偶极矩算符矩阵元的超凡精度。

3. 代码实现细节、复现指南与开源生态

为使量子化学和计算物理研究人员能够顺利复现和使用 NB-tVMC，本节将系统梳理该算法的底层实现逻辑、核心方程求解器的选择，以及相关的软件依赖。

3.1 核心算法实现步骤

一个完整的 NB-tVMC 执行流程可以拆解为如下三步伪代码逻辑：

# 算法伪代码：NB-tVMC 实时演化核心循环
import jax.numpy as jnp
from jax import grad, vmap

# Step 1: 加载已经冻结了非线性层（W_nonlinear, b_nonlinear）的预训练网络
def evaluate_neural_basis(x):
    # 提取最后一层隐藏层的激活值，作为固定的多体基组
    return extract_last_hidden_features(x, W_nonlinear, b_nonlinear)

# Step 2: 定义实时的波函数和局部能量估计
def log_psi(x, theta_linear):
    # theta_linear 为含时的最后一层线性系数矩阵，形状为 (N_det, N_elec, N_basis)
    basis_val = evaluate_neural_basis(x)
    orbitals = jnp.einsum("k i u, u j -> k i j", theta_linear, basis_val)
    return compute_slater_determinant_log(orbitals)

# Step 3: 含时演化核心循环 (Heun Integrator)
theta = initial_theta_from_nes_vmc
for step in range(total_steps):
    # A. 蒙特卡洛抽样得到当前的电子坐标集 X ~ |Psi(theta)|^2
    samples = run_mcmc_sampler(log_psi, theta, num_samples=81920)
    
    # B. 评估对数导数 O_i 和局部能量 E_L
    O_i = vmap(grad(log_psi, argnums=1))(samples, theta) # 形状: (batch, num_params)
    E_L = evaluate_local_energy(samples, theta)
    
    # C. 计算 QGT 矩阵 S 和力矢量 F
    S = compute_qgt(O_i) # S_ij = cov(O_i, O_j)
    F = compute_force(O_i, E_L) # F_i = cov(O_i, E_L)
    
    # D. 使用 SVD 伪逆求解 DFP 速度方程 S * theta_dot = -i * F
    theta_dot_n = solve_dfp_equation_via_svd(S, F, rcond=1e-4)
    
    # E. Heun 预估-校正步进
    theta_predict = theta + dt * theta_dot_n
    # 重新在 theta_predict 下抽样并计算 theta_dot_p...
    theta_dot_p = evaluate_theta_dot(samples_new, theta_predict)
    theta = theta + 0.5 * dt * (theta_dot_n + theta_dot_p)

3.2 线性求解器的抉择：为什么 Cholesky 会崩溃而 SVD 胜出？

在求解方程 $\mathbf{S} \dot{\bm{\theta}} = -i \mathbf{F}$ 时，选择何种矩阵分解算法对动力学轨迹的稳定性有决定性影响。这也是 NB-tVMC 能够长效演化数十万步而不崩溃的技术秘密所在。

在 Supplementary Note 2 和 Supplementary Figure 1 中，作者对比了两种最主流的对称正定矩阵求解器：

Cholesky 分解：在理论上，如果 $\mathbf{S}$ 严格正定，Cholesky 分解是最快速的。然而，在 VMC 运行过程中，由于统计抽样噪声的存在，估计出的 $\mathbf{S}$ 难免存在微小的负特征值或极接近 0 的特征值。这会导致 Cholesky 分解瞬间失败。即使强行加上对角正则化（Shift 参数），Cholesky 得到的解也会在统计噪声干扰下产生剧烈的数值抖动，导致偶极矩轨迹随时间发生不可控的发散（图 5/Supplementary Figure 1 蓝线）。
基于 SVD 的 Moore-Penrose 伪逆求解器：通过设置一个极其平滑且物理合理的特征值截断阈值（如 rcond = 1e-4），SVD 能够彻底滤除由于抽样噪声和冗余参数引起的微小特征值（Noise-dominated eigenvalues），从而保证了求得的速度项 $\dot{\bm{\theta}}$ 的物理合理性与数值极致平滑（图 5 橙线）。

3.3 软件依赖与开源生态链推荐

本项目深度嵌入了现代化的高性能 JAX 科学计算生态。欲复现该工作，建议使用如下开源工具链：

PySCF 软件包 [https://github.com/pyscf/pyscf]：作为传统量子化学计算的核心引擎，PySCF 在本项目中负责两项关键任务：（1）生成用于 NES-VMC 预训练的单粒子初始轨道与哈密顿量矩阵元；（2）作为大基组实时 FCI（RT-FCI）计算的基准平台。
FermiNet (DeepMind) [https://github.com/google-deepmind/ferminet]：这是整个工作波函数架构（ANSATZ）的基石。NB-tVMC 继承了 FermiNet 卓越的自旋轨道行列式构造和多电子关联表示层。通过对其进行改造，可以非常容易地冻结除最后一层外的所有权重，并引入复数参数支持。
Octopus 软件包 [https://octopus-code.org/]：本项目中用于拉伸氢分子强场动力学对比的、高精度实空间三维网格实时含时密度泛函理论（RT-TDDFT）计算，全部在 Octopus 平台中完成，是检验非平衡波包外溢的核心基准。

4. 关键引用文献与局限性批判

4.1 关键引用文献深度解析

Pfau et al., Phys. Rev. Research 2, 033429 (2020) [文献 16]:
- 贡献：奠定了 ab-initio 深度神经网络波函数（FermiNet）在变分蒙特卡洛中的统治地位。NB-tVMC 正是在 FermiNet 架构基础上，实现了神经网络基组的提取和冻结。
Nys et al., Nature Communications 15, 9404 (2024) [文献 32]:
- 贡献：率先尝试将含时变分蒙特卡洛（tVMC）引入真实分子的电子动力学模拟。该文采用的是 Slater-Jastrow-Backflow 参数化形式。但在更为强大和复杂的深度神经网络波函数下，全参数演化由于前述数值不稳定问题未获成功。这直接激发了 NB-tVMC 两阶段“冻结非线性层”思想的诞生。
Hou et al., arXiv:2511.12983 (2025) [文献 33]:
- 贡献：提出了 FASTNet 全局时空优化框架。虽然尝试绕过 tVMC 的传统积分，但在面对强激光场驱动的复杂多体响应时，其表现出的精度和稳定性仍不尽人意，这进一步凸显了 NB-tVMC 算法的优越性。

4.2 本文方法的局限性与改进空间

尽管 NB-tVMC 取得了令人瞩目的突破，但作为一个全新的理论框架，它在面临更为复杂的实际化学反应和极端物理条件时，依然存在以下不容忽视的局限：

1. 静态多体基组的“硬上限”与离子化极限

NB-tVMC 的核心优势在于将演化限制在由 $t=0$ 时刻 NES-VMC 预训练好的多体流形中。然而，这是一个静态的、不再调整的流形。在超强激光场照射下，如果体系发生了极其剧烈的、不可逆的多重电离（Multiple Ionization），或者分子结构发生了剧烈解离，那么在 $t=0$ 时刻提取的低能神经网络基组将很难包含这些极高能量的、全新演化出的散射态和碎裂碎片态。此时，体系真实的含时波函数会“逸出”我们预设的定制化流形，导致模拟精度出现系统性下滑。

2. NES-VMC 联合预训练的高额计算成本

为了构建高质量的神经网络多体基，NB-tVMC 必须在 $t=0$ 时刻联合训练基态以及多个激发态。在电子数较多、能级极其密集的复杂过渡金属化合物中，NES-VMC 联合训练多个状态的变分收敛极度困难，且计算耗时呈爆炸式增长。这在很大程度上限制了 NB-tVMC 向大型、重元素体系的快速推广。

3. 统计噪声对长期积分的累积侵蚀

由于 $\mathbf{S}$ 和 $\mathbf{F}$ 的获取始终依赖蒙特卡洛随机抽样，尽管引入了 SVD 伪逆，长期的时间积分演化依然会累积统计漂移噪声（Random Walk Drift）。为了抑制这种噪声，NB-tVMC 必须采用远大于静态 VMC 的 Batch Size（例如拉伸 $H_2$ 体系采用了高达 327,680 的超大批次），这给 GPU 显存和并行计算带来了极大的硬件压力。

5. 展望与深度补充：未来研究方向

NB-tVMC 的诞生为我们打开了利用神经网络探索超快多体非平衡物理的新大门。为了克服上述局限并拓宽其应用范畴，以下几个研究方向将是未来五年内该领域最激动人心的突破口：

5.1 动态自适应多体基组（Adaptive Neural Basis）

为了解决静态流形的“离子化极限”问题，未来的一个关键改进是引入主动学习（Active Learning）或自适应流形重构机制。当监测到含时演化波函数接近流形边界（例如，通过评估哈密顿量残差 $\langle \hat{H}^2 \rangle - \langle \hat{H} \rangle^2$ 的异常增大）时，算法应暂停时间演化，自动触发一轮小规模的深度网络参数微调（Fine-tuning），动态调整并“拓宽”非线性神经网络基组 $\chi$ 的覆盖范围，从而实现真正的、全实空间无障碍的极端含时模拟。

5.2 复数吸收势（CAP）在神经网络 VMC 中的深度融合

在强场物理中，复数吸收势（Complex Absorbing Potential, CAP）是模拟电离波包彻底飞散、防止虚假边界反射的黄金法则：

$$\hat{H} \to \hat{H} - i\eta \hat{W}_{\text{absorb}}$$

传统的实数域 VMC 无法直接处理非厄米（Non-Hermitian）哈密顿量。如果能将 CAP 成功引入神经网络 VMC 的对数能量评估和局部力场中，NB-tVMC 将能够以极高精度模拟真实的、连续的、不可逆的光电离谱，这对于精确模拟超快阿秒光电离延迟、高次谐波产生（HHG）等前沿实验具有无可估量的价值。

5.3 超越 Born-Oppenheimer 近似：多物理场耦合与核-电子联合动力学

当前的 NB-tVMC 默认基于 Born-Oppenheimer 夹紧核近似，仅模拟电子的运动。然而，在诸多光化学反应过程（如非辐射跃迁、锥形交叉等）中，核运动与电子动力学是强耦合的。利用近期提出的多粒子神经网络波函数架构（如支持原子核与穆子动力学联合求解的结构 [文献 50, 51]），我们可以将 NB-tVMC 推广到非绝热核-电子联合含时演化。这将在多体量子层面上，为我们提供一幅无需任何经验参数、完全基于第一性原理的分子光化学反应实时“电影图景”。

总结

神经网络基组时变变分蒙特卡洛（NB-tVMC）通过极具智慧的“两阶段”和“ Cauchy-Binet 多体线性子空间”设计，既继承了深度神经网络无可比拟的多体关联表达力，又重拾了含时配置相互作用（CI）演化牢不可破的数值稳定性。这一突破性成果不仅成功攻克了神经网络波函数含时演化长达数年的不稳定性难题，更为阿秒科学、多光子物理、非平衡超导和分子器件超快控制等前沿科学领域，注入了一股强有力的全新计算动能。