超越经典极限：神经网络量子态在非稳定态原子核系统中的基准测试与深度解析

来源论文: https://arxiv.org/abs/2603.28646v1 生成时间: Mar 31, 2026 03:49

执行摘要

近年来，随着量子信息和机器学习的交叉融合，神经网络量子态（NQS）已成为解决多体量子问题的重要工具。尤其是在处理传统方法难以企及的体积律纠缠态时，NQS展现出独特的优势。然而，NQS的表征能力究竟受哪些物理性质的限制，仍是一个悬而未决的核心问题。本研究通过构建介重原子核基态的NQS表征，深入探索了NQS在量子态复杂性，特别是“非稳定性”（non-stabilizerness，或称量子魔法）方面的性能。研究团队利用为核物理应用量身定制的二阶量子化NQS框架，并采用原型NQS模型——受限玻尔兹曼机（RBM），在活化轨道空间中进行了计算。核心发现是，在固定配置数下，具有较高非稳定性的量子态更难学习，这表现为NQS表征的准确性降低。这一结果强有力地表明，非稳定性是RBM在纠缠态体系中压缩和表征效率的关键制约因素，为未来开发更复杂的网络架构提供了重要方向，以期更好地驾驭真实世界的量子复杂性。

1. 核心科学问题，理论基础，技术难点与方法细节

1.1 核心科学问题

量子多体问题是物理学中的一个核心挑战，其复杂性随着系统粒子数的增加呈指数级增长，使得精确求解变得极其困难。传统的经典计算方法，如张量网络态（Tensor Network States）虽然在一定程度上缓解了这一问题，但对于真正复杂的量子态——尤其是那些具有“体积律纠缠”（volume-law entanglement）和“非稳定性”（non-stabilizerness）的态——仍然力不从心。非稳定性是真正量子复杂性的一个标志，它描述了量子态与所谓的“稳定态”（stabilizer states）之间的距离。稳定态可以通过多项式经典资源制备，即使它们高度纠缠，也不被认为是真正的复杂态。

近年来，神经网络量子态（NQS）作为一种新兴的经典计算工具，被证明能够有效地表征多体量子态，甚至能够捕获体积律纠缠。然而，NQS的表征能力上限究竟由哪些物理性质决定，以及它在何种程度上能够捕获量子态的内在复杂性，仍然是一个开放且亟待解决的问题。具体而言，以往的研究多集中于纠缠或经典信息方面，而NQS在面对非稳定性时的表现尚不清晰。

本文的核心科学问题在于：神经网络量子态（NQS）能否有效表征具有显著纠缠和非稳定性的原子核基态？NQS的表征能力是否与目标量子态的量子复杂性，特别是其非稳定性，存在直接关联？

原子核系统被选作理想的实验平台，原因在于强核力非微扰特性以及质子-中子两种费米子共存，使得这些系统展现出极高的复杂性。核基态通常表现出体积律纠缠熵，以及显著的多体质子-中子纠缠和非稳定性，为研究NQS在复杂量子系统中的性能提供了得天独厚的条件。

1.2 理论基础

量子复杂性理论：
- 纠缠（Entanglement）： 是量子复杂性的一个方面，导致表示量子态所需信息的指数增长，是许多经典多体方法（如张量网络技术）的瓶颈。然而，纠缠并非真正复杂性的充分条件，因为一些高度纠缠的稳定态可以通过多项式经典资源制备。
- 非稳定性（Non-stabilizerness / 量子魔法，Quantum Magic）： 被认为是产生真正量子复杂性的必要成分，它导致非结构化的纠缠模式和正确的多体纠缠特征，进而导致量子态表示的指数级扩展。最近开发的非稳定性度量方法，如稳定态Rényi熵（Stabilizer Rényi Entropies, SREs），使得对各种量子多体系统中的非稳定性进行量化成为可能。本文主要关注二阶Rényi熵 $M_2(\Psi) = -\log_2 \left( \frac{\sum_P |\langle \Psi | P | \Psi \rangle |^4}{2^N} \right)$，它衡量了量子态在Pauli算符基下的分布与稳定态的规律分布之间的偏差，并与量子态到最近稳定态的距离有关。
神经网络量子态（NQS）： 是一种利用深度学习模型参数化量子态的方法，通过训练神经网络来逼近量子态的波函数。NQS模型的一个吸引人之处在于它们能有效地捕获体积律纠缠。
- 受限玻尔兹曼机（Restricted Boltzmann Machine, RBM）： 作为NQS的原型，RBM由一层可见节点和一层隐藏节点组成，可见节点编码物理系统中的自由度（如粒子占据数），隐藏节点通过非线性激活函数对可见节点的状态进行编码，实现复杂相关性的学习。本文采用的RBM波函数振幅形式为： $\langle \boldsymbol{n} | \Psi_{\boldsymbol{\theta}} \rangle = \sum_{\boldsymbol{h}} \exp \left( \sum_i a_i n_i + \sum_j b_j h_j + \sum_{i,j} W_{ij} h_j n_i \right)$，其中 $n_i$ 是可见节点（轨道占据数），$h_j$ 是隐藏节点，$\boldsymbol{\theta} = \{ W_{ij}, b_j, a_i \}$ 是复数值变分参数。通过对隐藏变量求和，该振幅可简化为： $\ln (\langle \boldsymbol{n} | \Psi_{\boldsymbol{\theta}} \rangle) = \sum_i a_i n_i + \sum_j \ln \left( 2 \cosh(b_j + \sum_i W_{ij} n_i) \right)$。
原子核相互作用壳模型（Interacting Shell Model, ISM）： 是核物理中描述原子核低能态的标准理论框架。它将核子分为惰性核芯和部分占据的活化空间（本研究中为sd壳层），核子在活化空间中通过有效核力相互作用。ISM计算通过对核子组态空间中的哈密顿量进行精确对角化来获得基态波函数和能量。本文采用了高质量的USDB两体核哈密顿量。轨道以 $(n_a, l_a, j_a, m_{j_a}, \tau_a)$ 量子数表征。
- 二阶量子化表述： 论文采用了在量子化学和凝聚态物理中常用的二阶量子化NQS方法，将其推广用于描述原子核基态。这意味着NQS直接定义在占据数构型空间上，能够自然地处理费米子反对称性。哈密顿量形式：$H = \sum_a \epsilon_a c_a^{\dagger} c_a + \frac{1}{4} \sum_{abcd} V_{abcd} c_a^{\dagger} c_b^{\dagger} c_d c_c$，其中 $c_a^{\dagger}$ ($c_a$) 是产生（湮灭）核子的算符，$\epsilon_a$ 是单核子能量，$V_{abcd}$ 是反对称化相互作用矩阵元。

1.3 技术难点

费米子反对称性： NQS在处理费米子系统时，必须内嵌费米子波函数的反对称性。本文通过采用二阶量子化框架，直接在占据数构型空间上操作，自然地解决了这一问题，避免了第一量子化中手动编码反对称性的复杂性。
希尔伯特空间维度： 即使在sd壳模型这样受限的活化空间内，原子核的构型基数仍然巨大（高达$10^5$量级），对于重核而言，精确对角化在计算上是不可行的。这要求NQS具有高效的压缩和表征能力。
参数优化挑战： NQS的变分参数通常是复数值，且数量庞大（参数量与可见节点数N和隐藏节点数M的乘积成正比，即$O(N \cdot M) = O(\alpha N^2)$）。在如此高维的参数空间中进行优化，容易陷入局部最小值，需要高效且鲁棒的优化算法。
采样效率与自相关： 变分蒙特卡洛（VMC）方法依赖于对波函数振幅的有效采样。对于复杂的多体系统，蒙特卡洛采样可能存在自相关问题，降低统计估计的效率和准确性。需要精心设计的采样策略和去自相关技术。
量子复杂性度量： 量化原子核系统的非稳定性和多体纠缠本身就是一项技术挑战，需要特定的算符计算和求和，尤其是稳定态Rényi熵涉及对所有Pauli算符张量积的求和，计算成本很高。

1.4 方法细节

NQS构型与RBM映射：
- 轨道划分： 核子轨道分为完全填充的芯（core）和部分占据的活化空间（active space），本研究采用sd壳层。
- m-方案： 轨道由量子数 $(n_a, l_a, j_a, m_{j_a}, \tau_a)$ 表征（主量子数、轨道和总角动量、总角动量投影、同位旋投影）。sd壳层包含12个质子轨道和12个中子轨道。
- RBM可见节点： 活化空间中的每个轨道都映射到一个可见节点，可见节点上的占据数 $n_i$ 取值-1或+1，分别对应占据数为0或1。总可见节点数 $N = N_\nu + N_\pi$。
- 隐藏节点： 隐藏节点数 $M = \alpha N$，其中 $\alpha$ 为隐藏单元密度。
- 全局对称性： 在采样和优化过程中，保持总质子数、中子数和总角动量投影 $J_z$ 等全局对称性。
参数优化策略：
- 目标函数：
  - 忠实度最大化（Fidelity Maximization）： $\mathcal{F}_{\boldsymbol{\theta}} = \frac{|\langle \Psi_{\boldsymbol{\theta}} | \Psi_{\text{ex}} \rangle |^2}{\langle \Psi_{\boldsymbol{\theta}} | \Psi_{\boldsymbol{\theta}} \rangle}$。目标是使NQS态与精确对角化（ISM）得到的基态 $|\Psi_{\text{ex}} \rangle$ 的重叠最大化。
  - 能量最小化（Energy Minimization）： $E_{\boldsymbol{\theta}} = \frac{\langle \Psi_{\boldsymbol{\theta}} | H | \Psi_{\boldsymbol{\theta}} \rangle}{\langle \Psi_{\boldsymbol{\theta}} | \Psi_{\boldsymbol{\theta}} \rangle}$。在无法进行精确对角化时，通过最小化能量来寻找基态。
- 优化算法： 两种优化过程均采用随机重构（Stochastic Reconfiguration, SR）算法的RMSProp变体 [59]。SR算法是一种有效的变分蒙特卡洛方法，能够处理复数参数和非对角几何张量。
  - 参数更新规则： $\boldsymbol{\theta}_{t+1} = \boldsymbol{\theta}_t - \eta G_{t}^{-1} g_t$，其中 $\eta$ 是学习率，$G$ 是量子几何张量，$g$ 是能量对参数的梯度。
  - 量子几何张量： $G_{ij} = \frac{\langle O_i \Psi_{\boldsymbol{\theta}} | O_j \Psi_{\boldsymbol{\theta}} \rangle}{\langle \Psi_{\boldsymbol{\theta}} | \Psi_{\boldsymbol{\theta}} \rangle} - \frac{\langle O_i \Psi_{\boldsymbol{\theta}} | \Psi_{\boldsymbol{\theta}} \rangle \langle \Psi_{\boldsymbol{\theta}} | O_j \Psi_{\boldsymbol{\theta}} \rangle}{\langle \Psi_{\boldsymbol{\theta}} | \Psi_{\boldsymbol{\theta}} \rangle^2}$，其中 $O_i | \Psi_{\boldsymbol{\theta}} \rangle = \partial_{\theta_i} | \Psi_{\boldsymbol{\theta}} \rangle$。
  - 梯度： $g_i = 2 \left( \frac{\langle O_i \Psi_{\boldsymbol{\theta}} | H | \Psi_{\boldsymbol{\theta}} \rangle}{\langle \Psi_{\boldsymbol{\theta}} | \Psi_{\boldsymbol{\theta}} \rangle} - \frac{\langle O_i \Psi_{\boldsymbol{\theta}} | \Psi_{\boldsymbol{\theta}} \rangle \langle \Psi_{\boldsymbol{\theta}} | H | \Psi_{\boldsymbol{\theta}} \rangle}{\langle \Psi_{\boldsymbol{\theta}} | \Psi_{\boldsymbol{\theta}} \rangle^2} \right)$。
  - 正则化： 为解决有限采样导致的量子几何张量可能出现负特征值的问题，采用了RMSProp启发式的正则化方案，即 $G_t \to G_t + \lambda \text{diag}(\sqrt{v_t + \epsilon})$，其中 $v_t$ 是平方梯度的指数移动平均，$\epsilon$ 是正则化参数。
变分蒙特卡洛（VMC）采样：
- 构型生成： 采用Metropolis-Hastings（MH）算法生成满足质子数、中子数和 $J_z$ 约束的构型。
- 跳跃操作： 为了高效遍历构型空间并避免大拒绝率，定义了基于单轨道和双轨道交换的提议分布（分别占90%和10%）。这些交换在质子和中子扇区内部分别进行。此外，允许跨扇区的双交换以生成混合质子-中子两核子激发态。
- 去自相关： 为减轻自相关问题，将每次测量局部能量之间的扫描次数设置为单粒子轨道数的10倍（sd壳层为240）。使用Gelman和Rubin的潜在尺度缩减（potential scale reduction）方法监测自相关。
量子复杂性度量：
- 稳定态Rényi熵 $M_2(\Psi)$： 如前所述，用于量化非稳定性。
- 多体纠缠度量：
  - 8-tangles： $T^{(8)}_{\{i_1, \dots, i_8 \}} = |\langle \Psi_{\text{ex}} | \sigma^{(x)}_{i_1} \otimes \dots \otimes \sigma^{(x)}_{i_8} | \Psi_{\text{ex}} \rangle |^2$，直接关联到4-核子纠缠，用于衡量多轨道纠缠。
  - 双体质子-中子冯诺依曼熵 $S_{\pi \nu}$： $S_{\pi \nu} = -\text{Tr}(\rho_\pi \log_2 \rho_\pi)$，其中 $\rho_\pi = \text{Tr}_\nu(|\Psi \rangle \langle \Psi|)$，通过对中子自由度求迹得到质子约化密度矩阵来计算，作为质子-中子多体纠缠的残余量。

2. 关键基准体系，计算所得数据与性能数据

2.1 关键基准体系

本研究选取的基准体系是sd壳层内的介重原子核，这些原子核在核结构物理中具有广泛研究，并已通过相互作用壳模型（ISM）进行了精确对角化。sd壳层由以下核素组成，其构型数（$N_{ ext{conf}}$）和基态的非稳定度（$M_2(|\Psi_{ ext{ex}} \rangle)$）各不相同，从而提供了一个丰富的测试平台来评估NQS在不同复杂性量子态上的性能。所研究的核素范围广泛，从具有相对较少构型数和非稳定度的简单核素（如 $^{38}\text{K}$）到构型数和非稳定度都较高的复杂核素（如 $^{28}\text{Si}$ 和 $^{24}\text{Mg}$）。

论文中具体列举了超过80种sd壳核，涵盖了不同的质子数、中子数和 $J_z$ 投影，例如：

轻核：$^{38}\text{K}$, $^{28}\text{F}$, $^{26}\text{O}$, $^{38}\text{Ar}$, $^{30}\text{Ne}$, $^{18}\text{O}$ 等。
中重核：$^{24}\text{Mg}$, $^{28}\text{Si}$, $^{32}\text{S}$, $^{33}\text{P}$, $^{23}\text{Na}$, $^{26}\text{Al}$, $^{29}\text{Si}$ 等。

这些核素的精确基态波函数通过使用USDB两体核哈密顿量进行ISM精确对角化获得，为NQS的性能评估提供了可靠的“黄金标准”。

2.2 计算所得数据与性能数据

本研究的核心发现集中于NQS的表征准确性与核基态非稳定度之间的相关性。

忠实度最大化（Fidelity Maximization）结果：
- 数据呈现： 图2展示了NQS通过忠实度优化后得到的“非忠实度”（infidelity，$I_\theta = 1 - \mathcal{F}_\theta$）与精确ISM基态非稳定度 $M_2(|\Psi_{\text{ex}} \rangle)$ 的关系，针对不同的隐藏单元密度 $\alpha$ 值（$\alpha = 1, 2, 4, 8$）绘制。颜色代表每个原子核的构型数 $N_{\text{conf}}$。补充材料中的表I提供了详细的数值数据。
- 核心观察：
  - 非稳定度与学习难度： 在固定构型数 $N_{\text{conf}}$ 的情况下，具有较高非稳定度 $M_2$ 的量子态系统性地更难被NQS学习，表现为非忠实度更高（即忠实度更低）。例如，$^{24}\text{Mg}$ 具有相对较少的构型数（28,503），但却表现出最大的非稳定度，并且其NQS表征的忠实度最低。这与$^{24}\text{Mg}$是sd壳层中轴向变形最严重的核素之一相吻合。
  - 隐藏单元密度 $\alpha$ 的影响： 随着 $\alpha$ 值的增加（即隐藏节点数增加，NQS参数量增加），网络的表达能力和准确性普遍提高，全局忠实度有所改善。然而，非稳定度与忠实度之间的负相关关系在所有 $\alpha$ 值下依然存在。这表明RBM压缩核态和描述相关物理的能力受到态非稳定性内容的限制。
  - 纠缠与非稳定度： 未观察到NQS的准确性与简单纠缠度量（如单轨道纠缠熵）之间存在可比拟的直接相关性。然而，对于描述混合质子-中子扇区中的多体纠缠的度量，则出现了相关性（如图4所示）。这与Ref. [20]中发现的sd壳核中多质子-中子纠缠和非稳定度之间的相关模式一致。
  - 非稳定度预测： NQS在预测核非稳定度时，系统性地低估了精确值。
- 最差情况： 对于 $\alpha = 8$，sd壳层核素的波函数在最差情况下也能在小于13%的误差范围内重现。
- 可扩展性： 对于sd壳层中最大的核素 $^{28}\text{Si}$，$\alpha = 8$ 的网络参数数量仅为总构型数的约10%。
能量最小化（Energy Minimization with VMC）结果：
- 数据呈现： 图3展示了通过VMC能量最小化得到的NQS的相对能量误差 $ \epsilon_E $ 和非忠实度 $I_\theta$ 与精确基态非稳定度 $M_2(|\Psi_{\text{ex}} \rangle)$ 的关系。补充材料中的表II和表III提供了详细的数值数据。
- 核心观察：
  - 类似趋势： 能量最小化结果显示出与忠实度最大化类似的趋势，即更高的非稳定度 $M_2$ 仍然与更高的能量误差和非忠实度相关。
  - $\alpha$ 的影响： 同样，增加 $\alpha$ 值有助于改善能量误差和忠实度。例如，对于 $\alpha = 8$，最差情况下的能量相对误差小于3.5%。
量子复杂性度量对比（NQS vs. Exact）：
- 数据呈现： 图5对比了NQS计算得到的核非稳定度 $M_2$ 和双体质子-中子冯诺依曼熵 $S_{\pi \nu}$ 与精确值的关系，针对不同的 $\alpha$ 值。
- 核心观察：
  - M2 预测： NQS系统性地低估了精确态的非稳定度含量。
  - Sπν 预测： NQS对于一些核素，可以高估纠缠度。
  - 复杂性阈值： 只有当 $M_2 > 3$ 或 $S_{\pi \nu} > 1.5$ 时，这些偏差才变得明显；对于较低复杂性的态，NQS能够以高精度重现。这表明网络在处理高复杂性量子态时，其内在的结构性限制更为突出。

总结而言，本研究通过对sd壳核系统的全面基准测试，揭示了核基态的非稳定性是限制受限玻尔兹曼机（RBM）表征能力的关键因素。尽管增加网络参数可以提高整体准确性，但非稳定性与学习难度之间的基本关联依然存在。这一发现为NQS在量子多体问题中的应用和发展提供了重要的物理见解，指明了未来更先进网络架构设计和优化的方向。

3. 代码实现细节，复现指南，所用的软件包及开源 repo link

3.1 代码实现细节

论文中并未提供具体的代码库链接，但从描述中可以推断其实现是基于标准的NQS框架，并针对原子核物理问题进行了定制。其核心实现细节包括：

二阶量子化NQS框架： NQS是建立在占据数构型空间之上的，这自然地处理了费米子系统的反对称性。这意味着基态波函数 $\Psi_{\boldsymbol{\theta}}$ 由一系列占据数构型 $|\boldsymbol{n}\rangle$ 及其对应的复数值振幅 $\langle \boldsymbol{n} | \Psi_{\boldsymbol{\theta}} \rangle$ 来表示。
RBM模型： 采用了受限玻尔兹曼机作为NQS的变分ansatz。RBM的可见层节点与原子核的活化空间轨道（sd壳层中的质子和中子轨道）一一对应，每个可见节点存储该轨道的占据信息（+1或-1）。隐藏层节点则引入了额外的非线性自由度来捕获量子态的复杂关联。RBM参数包括可见层偏置 $a_i$、隐藏层偏置 $b_j$ 以及可见-隐藏层之间的连接权重 $W_{ij}$，这些参数均为复数值。
Hamiltonian实现： 原子核的哈密顿量采用二阶量子化形式实现，包含单粒子能量项和两体相互作用项（由USDB相互作用参数化）。这需要精确计算哈密顿量在占据数基矢之间的矩阵元。
随机重构（SR）优化器： 这是NQS训练中常用的二阶优化算法，它通过近似地计算量子几何张量（Quantum Geometric Tensor, QGT）来确定参数更新方向。SR算法相对于一阶梯度下降方法通常具有更快的收敛速度和更好的稳定性。
- QGT的计算： QGT的元素涉及变分参数对波函数的导数，需要对波函数进行局部扰动以计算这些导数。
- 正则化： 为应对VMC采样带来的QGT可能出现的数值不稳定性（如负特征值），文中采用了RMSProp启发式的正则化策略，通过在QGT对角线上添加一个与平方梯度指数移动平均相关的项来稳定优化过程。
变分蒙特卡洛（VMC）采样：
- Metropolis-Hastings (MH) 算法： 用于从NQS波函数平方振幅分布 $P(\boldsymbol{n}) = |\langle \boldsymbol{n} | \Psi_{\boldsymbol{\theta}} \rangle|^2 / \langle \Psi_{\boldsymbol{\theta}} | \Psi_{\boldsymbol{\theta}} \rangle$ 中生成构型样本。
- 提议分布： 为了高效遍历构型空间并保持相关对称性（质子数、中子数、$J_z$ 投影），MH算法的提议分布采用了单轨道和双轨道交换操作。单轨道交换和双轨道交换分别以90%和10%的概率进行，且在质子和中子扇区内部分别执行。此外，为了生成混合质子-中子激发态，还允许跨扇区的双交换。
- 自相关处理： 为了减轻采样数据的自相关效应，每次测量局部能量之间会进行多次MH步（通常是单粒子轨道数的10倍），并使用多个并行链进行采样以提高统计效率。使用Gelman和Rubin的诊断方法监控收敛性。

3.2 复现指南（概念性）

鉴于论文未提供具体代码库，复现此工作需要结合NQS、核物理和蒙特卡洛模拟的知识。以下是一个概念性的复现流程：

环境准备：
- 编程语言： Python通常是NQS实现的首选，配合NumPy、SciPy等库。
- 硬件： GPU加速对大规模NQS计算至关重要，因此需要配置CUDA环境。
- NQS库： 可以使用如NetKet https://netket.readthedocs.io/ 或类似框架作为起点，这些库提供了RBM模型、SR优化器和VMC采样工具。虽然论文没有明确说明使用的具体NQS库，但NetKet是Carleo团队开发并广泛使用的，与本文所描述的方法高度吻合。
- 核物理库： 用于处理核哈密顿量、轨道信息和进行ISM精确对角化（例如，可以使用开源的NUSHELLX@MSU或其他商业/学术ISM代码来获取精确基态）。
数据准备：
- 原子核系统： 选择sd壳层内的一个或多个原子核作为目标系统。
- 精确基态： 使用ISM代码（如NUSHELLX@MSU）对选定原子核的哈密顿量（USDB相互作用）进行精确对角化，获取其基态波函数 $|\Psi_{\text{ex}} \rangle$ 和能量 $E_{\text{ex}}$。这将作为NQS性能的基准。
- 构型空间： 构建sd壳层原子核在给定质子数、中子数和 $J_z$ 投影下的所有可能占据数构型。
NQS模型构建：
- 可见节点映射： 将sd壳层中的质子和中子轨道映射到RBM的可见节点。
- RBM初始化： 根据论文设置的隐藏单元密度 $\alpha$（例如，$\alpha = 1, 2, 4, 8$），初始化RBM的参数 $a_i, b_j, W_{ij}$（通常采用高斯随机初始化）。确保参数为复数值。
参数优化：
- 忠实度最大化： 如果 $|\Psi_{\text{ex}} \rangle$ 可用，直接优化参数以最大化与 $|\Psi_{\text{ex}} \rangle$ 的忠实度 $\mathcal{F}_{\boldsymbol{\theta}}$。
- 能量最小化： 对于更大或更复杂的系统，或作为独立验证，进行能量最小化。
- SR优化器： 实现SR优化器，包括QGT和梯度的计算。
- VMC采样： 编写Metropolis-Hastings采样器，实现单轨道和双轨道交换提议，并考虑自相关处理。
结果分析：
- 性能指标： 计算忠实度、能量误差、NQS预测的非稳定度 $M_2$、8-tangles 和双体质子-中子冯诺依曼熵 $S_{\pi \nu}$。
- 非稳定度计算： 实现 $M_2$ 的计算，这需要对所有Pauli算符张量积进行求和或采样估计。
- 相关性分析： 将NQS性能指标（忠实度、能量误差）与精确基态的量子复杂性度量（$M_2$、$S_{\pi \nu}$）进行关联分析，复现论文中的图表。

3.3 所用的软件包及开源 repo link

论文中没有明确给出此项研究的开源代码仓库链接。通常，在NQS领域，一些知名的开源库被广泛使用，可以作为实现类似研究的起点：

NetKet： 这是一个由Giuseppe Carleo（本文共同作者）领导开发的用于神经网络量子态的开源软件包。它提供了多种NQS ansatz（包括RBM），以及VMC、SR优化器和各种量子观测量的计算工具。NetKet是用Python和JAX实现的，支持GPU加速，非常适合此项工作的复现。
- GitHub Link： https://github.com/netket/netket
- Documentation： https://netket.readthedocs.io/
QuSpin： 这是一个用于精确对角化和演化量子多体系统的Python库，可以用于生成小规模系统的精确基态作为基准。
- GitHub Link： https://github.com/weinbe58/QuSpin
JAX： 谷歌开发的用于高性能数值计算的Python库，支持自动微分和GPU/TPU加速，是NetKet等NQS库的底层框架，也适用于从头开始构建NQS代码。
- GitHub Link： https://github.com/google/jax

需要强调的是，尽管有这些优秀的工具，但本文的具体实现可能包含针对核物理系统的特定优化和定制代码，这些细节未在论文中公开。对于核壳模型精确对角化部分，可能需要专门的核物理代码如 NUSHELLX@MSU (通常是商业或受限学术软件，但有其开源替代品或学术许可版本)。

4. 关键引用文献与局限性评论

4.1 关键引用文献

本研究构建于量子信息、多体物理和机器学习的交叉领域，因此引用了多个领域的关键工作：

[11] Lorenzo Leone, Salvatore F. E. Oliviero, and Alioscia Hamma, “Stabilizer Rényi Entropy,” Phys. Rev. Lett. 128, 050402 (2022). 这篇论文引入了稳定态Rényi熵的概念，为量化量子态的非稳定性提供了理论基础和具体度量方法，对本研究中评估量子态复杂性至关重要。
[20] Florian Brökemeier, S. Momme Hengstenberg, James W. T. Keeble, Caroline E. P. Robin, Federico Rocco, and Martin J. Savage, “Quantum magic and multipartite entanglement in the structure of nuclei,” Phys. Rev. C 111, 034317 (2025). 这项工作专门研究了原子核系统中的量子魔法和多体纠缠，为本文选择原子核作为基准系统以及理解其内在复杂性提供了直接的背景和数据支持。它在核物理背景下对非稳定性的量化和分析，是本研究的直接前身。
[30] Giuseppe Carleo and Matthias Troyer, “Solving the quantum many-body problem with artificial neural networks,” Science 355, 602-606 (2017). 这篇里程碑式的Science论文正式开启了神经网络量子态（NQS）在解决量子多体问题中的应用，提出了RBM作为NQS ansatz，并展示了其在自旋系统中的潜力。它是NQS领域的基础性工作。
[49] Kenny Choo, Antonio Mezzacapo, and Giuseppe Carleo, “Fermionic neural-network states for ab-initio electronic structure,” Nature Commun. 11, 2368 (2020). 这项工作首次将二阶量子化NQS方法应用于从头算电子结构计算中的费米子系统。本文正是基于这一框架，并将其推广到核物理领域，解决了费米子反对称性等核心问题。
[58] B. Alex Brown and W. A. Richter, “New “usd” Hamiltonians for the sd shell,” Phys. Rev. C 74, 034315 (2006). 这篇论文介绍了USDB相互作用，该相互作用是sd壳层原子核壳模型计算中广泛使用的有效核力，为本文的哈密顿量构建和精确对角化提供了基础物理输入。
[59] Sandro Sorella, “Wave function optimization in the variational Monte Carlo method,” Phys. Rev. B 71, 241103 (2005). 这篇论文详细阐述了随机重构（SR）算法在变分蒙特卡洛（VMC）方法中优化波函数的有效性，为本文NQS参数优化算法的选取提供了重要依据。
[68] Hannah Lange, Anka Van de Walle, Atiye Abedinnia, and Annabelle Bohrdt, “From architectures to applications: a review of neural quantum states,” Quantum Sci. Technol. 9, 040501 (2024). 这篇综述为读者理解NQS的各种架构和应用提供了全面的背景信息，对本文的讨论具有普适性。

4.2 对这项工作局限性的评论

尽管本研究取得了重要进展，揭示了NQS表征能力与非稳定性之间的关键关联，但仍存在一些局限性，值得在未来工作中加以解决和探讨：

RBM ansatz的局限性：
- 表达能力： 受限玻尔兹曼机（RBM）是一种相对简单的NQS架构。虽然它能有效地捕获体积律纠缠，但对于具有极高非稳定度的量子态，其表达能力可能不足。更先进的NQS架构，如循环神经网络（RNN）、卷积神经网络（CNN）、自回归模型（Autoregressive Models）或最近的Vision Transformer架构，可能在处理更高复杂度的量子态方面表现更优。未来的工作应探索这些更复杂的架构。
- 参数效率： 尽管RBM的参数量在某些情况下相对于希尔伯特空间是可控的，但对于非常大的可见节点数，参数量仍然以 $O(N^2)$ 的速度增长，这对于更重核的更大活化空间可能会带来计算挑战。
计算成本与可扩展性：
- VMC采样： 尽管VMC结合SR算法是强大的优化工具，但对于非常大的希尔伯特空间，蒙特卡洛采样本身仍然可能计算成本高昂，尤其是在需要大量样本以降低统计噪声时。
- 精确对角化基准： 本研究依赖于ISM的精确对角化结果作为基准。然而，ISM对于重核或更大活化空间是不可行的。这限制了研究的范围，使其无法直接应用于更复杂、目前无法进行精确对角化的核素。
对量子复杂性度量的预测偏差：
- M2的低估： 论文观察到NQS系统性地低估了精确态的非稳定性 $M_2$。这可能意味着RBM难以完全捕获量子态的所有非稳定性特征，或者在优化过程中优先匹配能量和忠实度而牺牲了对 $M_2$ 的精确重现。
- Sπν的过估： 对于某些核素，NQS可以高估双体质子-中子冯诺依曼熵 $S_{\pi \nu}$。这种过估可能源于NQS在表征纠缠时引入的额外自由度，或未能完全捕捉到量子态中更精细的纠缠结构。
研究范围的限制：
- 仅限于sd壳层： 本研究集中于sd壳层内的原子核。sd壳层虽然复杂，但相对于更重的核区或包含多个振荡器壳层的更大活化空间，其复杂度仍有局限。将研究扩展到p-f壳层或其他更重核区将是重要的下一步，以验证结论的普适性。
- 单一相互作用： 仅使用了USDB相互作用。使用不同的核子-核子相互作用可能会影响核态的复杂性，并进而影响NQS的性能。
缺乏直接的开源代码： 论文中未提供用于此项研究的直接开源代码仓库链接。这在一定程度上阻碍了研究的直接复现和进一步的探索。虽然提到了通用的NQS库如NetKet，但具体的核物理定制化实现细节仍是黑箱。
物理直观性与可解释性： 尽管NQS能有效学习量子态，但其“黑箱”特性使得从训练好的NQS中直接提取物理直观见解仍是一个挑战。如何将NQS参数与底层物理原理建立更清晰的联系，是未来可解释性研究的方向。

5. 其他必要的补充

5.1 本研究的广泛影响与未来方向

这项研究不仅为神经网络量子态（NQS）在核物理领域的应用提供了坚实的基准，更在理解NQS表征能力的根本限制方面取得了突破。其发现——量子态的非稳定性是RBM学习难度的主要驱动因素——对NQS乃至更广泛的量子多体物理和量子信息科学具有深远影响：

指导NQS架构设计： 明确非稳定性作为核心挑战，将促使研究人员开发更具表达能力、能够有效处理高非稳定态的NQS架构。这可能包括结合张量网络思想、图神经网络、注意力机制（如Vision Transformer）或特定物理约束（如规范对称性）的混合模型。
推动量子复杂性度量研究： 本研究进一步突出了非稳定性在量子复杂性中的核心地位。未来可继续探索其他非稳定性度量，并将其与NQS性能进行关联，以构建更全面的量子复杂性图谱。同时，NQS本身也可作为探索和理解未知复杂量子态的工具。
NQS在重核系统中的应用： ISM的计算成本限制了其在重核中的应用。本研究为NQS应用于无法进行精确对角化的重核系统奠定了基础。通过VMC能量最小化方法，NQS有望成为在更大活性空间内研究复杂核结构（如形状共存、集体激发等）的有效工具。
量子计算与模拟的桥梁： NQS与量子计算（QC）和量子模拟密切相关。理解NQS在非稳定态体系中的表现，有助于设计更有效的量子算法（如变分量子本征求解器VQEs）以及混合量子-经典算法。非稳定性是实现量子霸权和通用量子计算的关键资源，NQS的进展将直接推动这一前沿。
物质性质和量子化学： 费米子NQS方法已成功应用于电子结构计算。本研究在原子核费米子体系中的经验，可以为量子化学中研究分子的高复杂度电子态提供新的思路和工具。
基础物理学洞察： 原子核系统是自然界中强相互作用费米子多体问题的典范。NQS为我们提供了一个全新的视角来探索核子的强关联、多体纠缠和量子魔法。这有助于深化我们对核结构、核反应以及宇宙中元素形成等基础物理过程的理解。

5.2 核心贡献与展望

本研究的核心贡献在于：

首次将二阶量子化NQS应用于原子核基态的系统研究。 这为核物理领域引入了强大的机器学习工具，并提供了处理费米子反对称性的有效途径。
建立了NQS学习难度与量子态非稳定性之间的直接定量关联。 这一发现为NQS研究提供了重要的物理驱动因素，表明非稳定性是制约RBM表征效率的主要瓶颈。
提供了sd壳层原子核在不同NQS参数下的全面基准测试数据。 这些数据对于未来NQS方法在核物理领域的开发和验证具有宝贵的参考价值。

展望未来，研究团队计划探索更先进的NQS架构，如结合Vision Transformer等深度学习模型，以提升对极端非稳定态的表征能力。同时，也将研究如何通过基优化技术和引入物理指导的初始态来加速NQS的收敛并缓解优化问题。最终，这些努力将有助于回答“哪些物理特性限制了NQS的表征能力”这一基本问题，并推动NQS成为解决自然界中最具挑战性的量子多体问题的通用工具。

这项工作标志着在利用人工智能理解和模拟量子世界的征程中迈出了重要一步，为揭示原子核深层量子奥秘提供了新的视角和方法。