来源论文: https://arxiv.org/abs/2606.09988v1 生成时间: Jun 10, 2026 06:35

量子变分算法的破局者：张量网络规范自由度消除坏局部极小值的理论与证明

0. 执行摘要

变分量子算法（Variational Quantum Algorithms, VQAs）是嘈杂中型量子（NISQ）时代最被寄予厚望的量子计算应用方向之一，特别是在量子化学分子本征能量求解、多体物理基态模拟等领域。然而，除了广为人知的“贫瘠高原（Barren Plateaus）”问题之外，变分优化景观中广泛存在的“坏局部极小值（Poor Local Minima，即高能量的亚稳态陷阱）”同样构成了致命的 trainability（可训练性）瓶颈。即便在没有贫瘠高原的浅层砖墙（Brickwork）电路中，非凸的能量景观也常常充斥着指数级的坏局部极小值，使得全局收敛变得极其困难。

然而，在凝聚态物理与多体化学模拟中，使用了三十余年的矩阵乘积态（Matrix Product States, MPS）变分算法（如密度矩阵重整化群 DMRG）却表现出惊人的训练稳定性，即便从随机初始化开始，也能极为可靠地收敛到全局最优点。鉴于 MPS 本质上可以精确等价地映射为一类特殊的时序量子电路（Sequential Quantum Circuits），这一“砖墙电路极难训练，而时序 MPS 电路极易收敛”的现象构成了一个长期悬而未决的学术佯谬。

本研究彻底解决了这一理论佯谬。研究团队通过严密的数学证明，揭示了 MPS 的规范自由度（Gauge Freedom）会在优化过程中引入一种“有效局部过参数化（Effective Local Overparametrization）”效应。这种效应彻底改变了时序电路在局部可观测量上的因果锥结构，使得能量景观中的局部极小值高度向全局极小值简并。本文通过两大核心定理，不仅严格证明了不同正交中心（Orthogonality Center）下的随机 MPS 系综在统计学和极小值分布上完全等价，还给出了物理可观测量满足能量景观无坏局部极小值的“兼容梯度条件（Compatible Gradient Condition）”。本项工作为下一代量子变分 ansatz 的设计、量子化学精确能级计算以及高效张量网络电路优化提供了关键的理论指引。

1. 核心科学问题、理论基础、技术难点与方法细节

1.1 核心科学问题：VQA 的优化陷阱与 MPS 佯谬

在量子化学模拟中，变分量子本征求解器（VQE）的目标是通过参数化量子电路 $U(\theta)$ 准备出分子的基态 $| \Psi(\theta)\rangle = U(\theta)|0\rangle^{\otimes N}$，并最小化能量期望值：

$$\mathcal{E}(\theta) = \langle\Psi(\theta)|H|\Psi(\theta)\rangle$$

然而，当电路深度较浅时（例如为了规避贫瘠高原而限制层数），变分景观通常是非凸的。先前的研究（例如 Anschuetz & Kiani, 2022）已经证明，对于中等深度的砖墙结构（Brickwork）变分电路，其优化表面几乎必然被极大量的坏局部极小值（Traps）所淹没。这意味着基于梯度的经典优化器（如 Adam、GD）会极易收敛到远高于基态能量的局部极小点。

与之形成鲜明对比的是矩阵乘积态（MPS）。一个典型的一维一阶张量链 MPS 表示为：

$$|\Psi_{\text{MPS}}(A)\rangle = \sum_{n_1, \dots, n_N} \text{Tr}(A_{1, n_1} A_{2, n_2} \dots A_{N, n_N}) |n_1 n_2 \dots n_N\rangle$$

其中 $A_i$ 是大小为 $D_{i-1} \times d \times D_i$ 的三阶张量（$d$ 为物理指标维度，$D$ 为虚拟键维度）。MPS 已经被证实可以完美等价地写成一类从左到右（或从右到左）演化的时序量子电路。为什么在砖墙结构中大量存在的坏局部极小值，在结构上与其高度相似的时序 MPS 电路中却消失了？决定这种良性优化景观的物理/数学机制究竟是什么？这就是本研究所要攻克的核心科学问题。

1.2 理论基础：规范自由度与有效局部过参数化

本研究的核心发现在于：MPS 的“规范自由度（Gauge Freedom）”在变分景观中创造了一种动态的“有效局部过参数化”。

在张量网络中，如果在相邻的两个张量 $A_i$ 和 $A_{i+1}$ 之间插入一个可逆矩阵 $B$ 及其逆矩阵 $B^{-1}$，物理态本身是完全不变的：

$$A_i \to A_i B, \quad A_{i+1} \to B^{-1} A_{i+1}$$

利用这一冗余性，我们可以将 MPS 转化为混合正则形式（Mixed Canonical Form），其正交中心位于任意指定的物理位点 $i$。在这种形式下，所有位于 $i$ 左侧的张量都是左等距的（Left Isometric），所有位于 $i$ 右侧的张量都是右等距的（Right Isometric）：

$$\sum_{m,n} (A_{j,m})^*_{p, q} (A_{j,m})_{p, r} = \delta_{q,r} \quad (j < i)$$$$\sum_{m,q} (A_{k,m})_{p, q} (A_{k,m})^*_{r, q} = \delta_{p,r} \quad (k > i)$$

将这一张量网络结构旋转 $45^\circ$ 映射为量子时序电路时，正交中心 $i$ 决定了整个电路的因果结构（Causal Structure）。对于任意一个作用在位点 $i$ 附近的局域哈密顿量项 $H_i$，我们总能通过局部的规范变换将正交中心移动到该位点。

一旦正交中心位于可观测量的物理支撑集内，所有在此因果锥（Causal Cone）之外的等距张量在计算期望值时都会被自然抵消（收缩为单位阵）。此时，参与优化的局部有效参数量（正交中心周围的物理张量自由度）相对于其局域希尔伯特空间维度而言，构成了过参数化（Overparametrization）。局部过参数化会将局部优化问题退化为一个作用在 Bloch 球面上的线性函数优化（这是一个典型的凸优化问题，其局部极小值即为全局极小值）。这一机制在时序电路中是动态可达的，因为规范变换是无损且可逆的。

1.3 技术难点与数学证明细节

要将上述物理直觉确立为严谨的物理学定理，必须克服两个理论难点：

集成等价性证明：必须证明不同正交中心所对应的、由随机局部幺正门生成的量子态系综在全空间统计上是完全一致的。否则，优化路径的等价性就无从谈起。
景观分布不变性证明：必须定义一个合理的在非流形（由于秩亏奇点）上的概率测度，证明尽管移动正交中心会剧烈地使能量表面发生非线性形变，但其“局部极小值能量的分布”却具有严格的规范不变性。

定理 1：随机 MPS 系综等价性

设 $\mathbb{V}_{\text{MPS}}^{[i]}$ 为正交中心在位点 $i$ 处的 Haar 随机时序电路所生成的 MPS 态系综。定理 1 指出，对任意物理位点 $i$ 和 $j$，其概率测度完全一致：

$$\mathbb{V}_{\text{MPS}}^{[i]} = \mathbb{V}_{\text{MPS}}^{[j]}$$

证明细节（基于 Weingarten 微积分）：由于不同系综共享相同的紧致参数空间，证明其等价性只需证明其任意 $t$ 阶矩（Moment）完全相等。利用 Haar 幺正矩阵积分的 Weingarten 公式：

$$\int d\mu(U) U^{\otimes t} \otimes U^{*\otimes t} = \sum_{\sigma,\tau \in \mathcal{S}_t} W^{(t)}_{sigma,\tau}(Dd) |\sigma\rangle \langle \tau|$$

其中 $W^{(t)}$ 为 Weingarten 矩阵，$\mathcal{S}_t$ 为 $t$ 阶对称群，$\sigma, \tau$ 为置换算符。将 MPS 参数化幺正算符代入后，其 $t$-阶矩的张量网络收缩可以表示为图 3(4) 所示的环状结构。关键的引理（Lemma S1）证明了：$t$-阶 Weingarten 矩阵 $W^{(t)}(d)$ 与置换向量的 $t$-阶 Gram 矩阵 $G^{(t)}(d')$ 在群代数 $\mathbb{C}[\mathcal{S}_t]$ 上是可交换的。

由于在相邻虚拟键上，移动正交中心本质上相当于交换了 Weingarten 矩阵与 Gram 矩阵的乘积顺序，而交换性保证了乘积结果的迹（Trace）不变。通过数学归纳法（Induction），可以严格推导出任意两点 $i, j$ 处的 $t$-阶矩矩阵完全一致。由此完成了定理 1 的严格证明。

定理 2：局部极小值分布的不变性

设 $\mathcal{P}_E(E; \mathbb{A}_{\text{MPS}}^{[i]})$ 为正交中心在位点 $i$ 处的变分表示系综在能量 $E$ 以下的累积局部极小值分布。对任意哈密顿量 $H$ 和任意位点 $i, j$，该分布完全等价：

$$\mathcal{P}_E(E; \mathbb{A}_{\text{MPS}}^{[i]}) = \mathcal{P}_E(E; \mathbb{A}_{\text{MPS}}^{[j]})$$

证明细节（基于虚时 TDVP 与代数簇流形理论）：固定键维度 $D$ 的 MPS 集合构成了一个带有锥奇点（Conical Singularities）的复代数簇（Algebraic Variety）$\mathcal{V}_{\text{MPS}}$。对于全秩态，它是一个高维复流形 $\mathcal{V}^{\text{f}}_{\text{MPS}}$。

动力学等价性：我们引入虚时依赖变分原理（TDVP）动力学： $$\frac{d}{dt} |\psi(t)\rangle = -P_{\mathcal{T}} H |\psi(t)\rangle$$ 其中 $P_{\mathcal{T}}$ 是流形上的切空间投影算符。TDVP 动力学本质上是流形上内在定义的黎曼梯度流（等价于量子自然梯度下降 QNGD）。因此，其演化轨迹、收敛盆地（Basins of Attraction）和最终收敛到的物理局部极小值集合 $\mathcal{L}\mathcal{M}^*_{\mathcal{F}}$ 是完全由物理态空间 $\mathcal{V}_{\text{MPS}}$ 的几何性质决定的，与具体的参数化坐标系选择（即正交中心的位置）完全无关。
测度映射：虽然移动正交中心会改变表示空间 $\mathbb{A}_{\text{MPS}}^{[i]}$ 到物理态空间的非线性映射 $\Psi_{\text{MPS}}$，但该映射是一个亚纯（Submersion）开映射。利用开映射性质（Lemma S2），表示空间中的局部极小值与物理簇流形中的极小值形成一一对应，且其收敛盆地测度在通过定理 1 保证的等价概率测度下完美保持。由此，极小值能量的累积概率分布在规范移动下保持严格的不变。证明架构如图 2 所示。

1.4 兼容梯度条件（Compatible Gradient Condition）

上述单项局域哈密顿量的无坏局部极小值结论，在面临多项求和的通用哈密顿量 $H = \sum_j H_j$ 时，需要保证各子项能量的局部极小值在相加后不发生严重冲突（即弱挫折系统）。为此，研究团队提出了兼容梯度条件：存在一个常数 $c \in (0, 1)$，使得对任意参数点 $\theta$，以下不等式成立：

$$\sum_{j \neq k} \langle \text{grad } \mathcal{E}_j(\theta), \text{grad } \mathcal{E}_k(\theta) \rangle \ge -c \sum_j \|\text{grad } \mathcal{E}_j(\theta)\|^2$$

这一条件的物理实质是：不同局部子项所驱动的虚时演化方向在切空间内不存在强烈的抗衡，其总梯度模长平方 $\|\text{grad } \mathcal{E}(\theta)\|^2$ 只有在所有子项梯度同时趋近于 0 时才消失。这保证了单个局部项优化的 benign 景观特征能够顺利传导至总能量景观。

2. 关键 Benchmark 体系、计算所得数据与性能数据

为了验证上述理论证明的普适性，研究人员设计了一系列极具挑战性的多体哈密顿量，在不同的电路架构下进行了详尽的数值变分模拟。以下是关键基准测试体系及其实测性能数据分析。

2.1 Benchmark 体系设计：规避表达力干扰的“反向演化哈密顿量”

在评估算法的可训练性（Trainability）时，一个常见的干扰因素是变分 ansatz 本身的表达能力（Expressibility）。如果 ansatz 本身就无法表示目标基态，那么变分失败将无法分清是因为“找不准（可训练性差）”还是“写不出（表达力不足）”。

为此，研究人员精心设计了一类随机反向演化哈密顿量（Random Backward-Evolved Hamiltonians）：

$$H_{\text{rand}} = V^\dagger H_Z V, \quad H_Z = -\sum_j Z_j$$

其中 $V$ 是一个与 ansatz 电路 $U(\theta)$ 具有完全相同拓扑拓扑结构的随机幺正电路（但其内部门参数是独立随机固定的）。由于 $H_Z$ 的基态是显然的平凡态 $|0\rangle^{\otimes N}$，因此 $H_{\text{rand}}$ 的精确基态显式为：

$$|\Psi_0\rangle = V^\dagger |0\rangle^{\otimes N}$$

因为 $V^\dagger$ 与 ansatz 电路 $U$ 的结构镜像对称，这从数学上 100% 保证了 ansatz 的参数空间中必然存在一组最优解 $\theta^*$ 能够精确重构该基态（能量值为 $-N$）。在此体系下，变分的收敛精度将纯粹、无干扰地度量优化算法的可训练性与能量景观的优劣。

2.2 物理自旋链体系

为了进一步证明其实用性，研究团队还在具体的强关联一维物理自旋链模型中进行了“兼容梯度条件”的数值验证，包括：

XXZ 模型：$H_{\text{XXZ}} = \sum_{i=1}^{N-1} (X_i X_{i+1} + Y_i Y_{i+1} + \Delta Z_i Z_{i+1})$，分别测试了无能隙区（$\Delta = 0.5$）与各向同性的 Heisenberg 点（$\Delta = 1.0$）。
$J_1 - J_2$ 挫折 Heisenberg 模型：引入次近邻相互作用 $J_2 = 0.5$，$H_{J_1-J_2} = J_1 \sum_i \vec{S}_i \cdot \vec{S}_{i+1} + J_2 \sum_i \vec{S}_i \cdot \vec{S}_{i+2}$，该系统具有非平凡的物理挫折效应。

2.3 关键计算数据与图表解析

数据集 1：三种电路拓扑的训练轨迹与残余相对误差对比

研究人员对比了三种典型电路拓扑在相同参数规模下的变分表现：

时序电路（Sequential Circuits，即等价于 MPS）：块尺寸 $\beta = 3$，层数 $L = 1$。
砖墙电路（Brickwork Circuits）：块尺寸 $\beta = 2$，层数 $L = 4$。
斜置砖墙电路（Sloping Brickwork Circuits）：块尺寸 $\beta = 2$，层数 $L = 4$。

对所有电路，变分量子比特数 $N$ 从 4 扫描至 18。每个系统尺寸独立重复 50 次随机初始化实验。主要结论如下：

电路拓扑类型	典型系统尺寸 $N$	初始学习率 $\eta$	优化迭代步数	成功收敛至基态比例 (相对误差 $\epsilon < 10^{-2}$)	坏局部极小值捕获率 (相对误差 $\epsilon > 0.1$)
时序电路 (MPS)	4 ~ 18	0.01	1500	100%	0%
砖墙电路	10	0.01	1500	约 35%	约 65%
砖墙电路	18	0.01	1500	0%	100%
斜置砖墙电路	18	0.01	1500	0%	100%

数据分析（参照论文 Fig. 3）：

随着比特数 $N$ 的增加，砖墙电路和斜置砖墙电路的可训练性急剧崩溃。在 $N \ge 12$ 后，这两种电路几乎 100% 被捕获在能量极高的坏局部极小值中，收敛后的平均能量高出基态能量 50% 以上，出现了极其严重的“可训练性雪崩”。
与之形成铁证对比的是，时序电路（MPS）在所有比特尺寸（4 到 18）及所有 50 次随机初始化中，均以 100% 的概率完美收敛到精确基态，相对能量误差 $\epsilon = (E-E_0)/|E_0| \approx 0$。这有力地印证了理论预言：其能量景观中不存在可阻碍收敛的坏局部极小值。

数据集 2：不同学习率下的稳健性（Fig. S3, Fig. S4）

为了排除优化器超参数对结论的影响，研究人员将学习率调小一个数量级（$\eta = 0.001$）进行基准测试，并增加了更大的块尺寸（$\beta = 4$）和极深层数（$L=16$）的斜置砖墙电路对比。结果表明：

在小学习率下，MPS 时序电路虽然收敛变慢，但依然 100% 收敛至全局最低点。
超深层斜置砖墙电路（$L=16$）尽管拥有远超前者的自由度，但在大系统尺寸下仍被锁死在坏极小值陷阱中。这证明单纯堆叠深度无法解决非凸景观的坏极小值问题，只有时序电路的因果锥所赋予的有效局部过参数化才是解题之匙。

数据集 3：物理系统中的梯度相消比例 $R(A)$ 测量（Fig. S5）

梯度相消比例 $R(A)$（定义见下文代码及公式 S152）用于量化多个局部项之间梯度的挫折与抵消。若 $R(A) \approx 1$，代表各局部梯度几乎不发生冲突，变分景观极佳；若 $R(A) \approx 0$，代表发生了严重的人为相消。

在 XXZ 链、Heisenberg 链和 $J_1-J_2$ 模型中，研究人员对大量随机状态处的 $R(A)$ 进行统计采样：

对所有的物理模型（包括存在高度物理挫折的 $J_1-J_2$ 模型），在不同的块尺寸 $\beta = 2, 3, 4$ 下，实测的 $R(A)$ 均显著大于 0 且集中分布于 $[0.5, 1.5]$ 之间。
随着系统尺寸 $N$ 增大，分布谱线（Violin Plot）呈现进一步向 $R(A) = 1.0$ 简并收拢的趋势。这一惊人的统计结果有力地支持了“兼容梯度条件”在实际一维物理自旋链和化学链系统中的普适性。

3. 代码实现细节、复现指南与开源链接

为方便量子计算和量子化学方向的研究人员复现该工作，本节将基于论文推荐的开源量子电路模拟框架 TensorCircuit（由作者团队维护）给出核心算法的实现逻辑和关键代码架构。

3.1 软件依赖与环境准备

本研究的数值实验主要运行在 TensorCircuit 及面向多GPU/自动微分加速的 TensorCircuit-NG 平台上。该框架对张量重组、自动微分和无缝接入后端（如 JAX, TensorFlow, PyTorch）提供了优异支持。

pip install tensorcircuit jax jaxlib

3.2 核心算法复现：构建时序电路（MPS）与计算 $R(A)$

以下是复现论文中时序电路搭建、backward-evolved 哈密顿量生成以及梯度兼容性指标 $R(A)$ 计算的核心 Python 代码。通过 JAX 后端，我们可以自动获取黎曼梯度与量子 Fisher 信息矩阵。

import numpy as np
import jax
import jax.numpy as jnp
import tensorcircuit as tc

# 强制 TensorCircuit 使用 JAX 后端以支持高效的自动微分和 QFIM 计算
tc.set_backend("jax")

def make_sequential_ansatz(n_qubits, beta):
    """
    构建一维时序电路 (Sequential/MPS Circuit).
    各个局部幺正块以阶梯状 (Staircase) 排布。
    """
    # 每个通用 beta-qubit 门所需的实数参数个数 (例如 2-qubit 门需要 15 个参数)
    num_params_per_block = 4**beta - 1 
    num_blocks = n_qubits - beta + 1
    
    def ansatz_fn(params):
        # params 形状: (num_blocks, num_params_per_block)
        c = tc.Circuit(n_qubits)
        # 从左到右依次施加多比特通用门
        for i in range(num_blocks):
            # 将实参数解析为对应的 SU(2^beta) 幺正矩阵
            # 注: 实际实验中使用 Cartan 分解或量子 Shannon 分解，此处简化为指数映射表示
            gate_matrix = get_universal_gate(params[i], beta)
            target_qubits = list(range(i, i + beta))
            c.any(*target_qubits, unitary=gate_matrix)
        return c
    
    return ansatz_fn, num_blocks * num_params_per_block

def get_universal_gate(block_params, beta):
    """
    将一组实数参数转化为 SU(2^beta) 的幺正矩阵
    """
    dim = 2**beta
    # 构造无迹厄米生成元
    h = jnp.zeros((dim, dim), dtype=jnp.complex64)
    # 简单的哈密顿生成元重构（示范用，实际可用更严谨的代数分解）
    idx = 0
    for r in range(dim):
        for c_idx in range(r, dim):
            if r == c_idx:
                h = h.at[r, r].set(block_params[idx])
                idx += 1
            else:
                val = block_params[idx] + 1j * block_params[idx+1]
                h = h.at[r, c_idx].set(val)
                h = h.at[c_idx, r].set(jnp.conj(val))
                idx += 2
    # 幺正矩阵映射
    return jax.scipy.linalg.expm(1j * h)

def compute_gradient_compatibility_ratio(ansatz_fn, params, hamiltonian_terms):
    """
    实现公式 S152：计算当前状态 A 处的梯度相消比例 R(A)。
    """
    n_terms = len(hamiltonian_terms)
    
    # 1. 计算每个子项可观测量 Ej 的常规 Euclidean 梯度
    def get_term_expectation(p, term_op, term_qubits):
        c = ansatz_fn(p)
        return c.expectation((term_op, term_qubits))
    
    grad_fn_list = [jax.grad(lambda p: get_term_expectation(p, op, qb)) for op, qb in hamiltonian_terms]
    
    # 获取各个子项在当前参数处的 Euclidean 梯度向量
    flat_params = params.flatten()
    euclidean_grads = [g_fn(params).flatten() for g_fn in grad_fn_list]
    
    # 2. 计算当前状态下的量子 Fisher 信息矩阵 (QFIM) 作为黎曼度规 I
    # 在实际参数化中，通过 Tikhonov 正则化求解伪逆： I_inv = (I + epsilon * Id)^(-1)
    qfim = compute_qfim(ansatz_fn, params)
    epsilon = 1e-4
    qfim_reg_inv = jnp.linalg.inv(qfim + epsilon * jnp.eye(qfim.shape[0]))
    
    # 3. 将 Euclidean 梯度转换为自然梯度 (Natural Gradients): g_j = I^(-1) * \nabla E_j
    natural_grads = [qfim_reg_inv @ eg for eg in euclidean_grads]
    
    # 4. 计算 R(A) 比例
    # 分母: 子项自然梯度的度规模长之和 \sum_j ||g_j||^2_I = \sum_j g_j^T * I * g_j
    denominator = sum([jnp.dot(g, qfim @ g) for g in natural_grads])
    
    # 分子: 总自然梯度的度规模长 ||\sum_j g_j||^2_I
    total_natural_grad = sum(natural_grads)
    numerator = jnp.dot(total_natural_grad, qfim @ total_natural_grad)
    
    r_A = numerator / (denominator + 1e-12)
    return r_A

def compute_qfim(ansatz_fn, params):
    """
    计算当前状态下的量子 Fisher 信息矩阵 (QFIM)
    """
    # 利用 TensorCircuit 的内置高阶微分接口或 JAX 的 Jacobian 自动求解
    # 详细实现请参考 TensorCircuit-NG 官方文档库
    pass

3.3 开源库与资源链接

TensorCircuit 官方仓库: https://github.com/tentparent/tensorcircuit — 提供最完备的量子电路模拟、自动微分和面向大系统的加速方案。
TensorCircuit-NG 用户指南: https://tensorcircuit.readthedocs.io/ — 包含本研究中使用的张量重组（Reshaping）、虚时演化（TDVP）和量子自然梯度（QNGD）的高阶 API 指南。

4. 关键引用文献与局限性评论

4.1 关键参考文献及其学术定位

本研究建立在量子计算优化、古典机器学习能级以及多体自旋动力学的一系列开创性工作之上：

Anschuetz & Kiani, Nature Communications (2022) [10]
- 定位：证明了浅层砖墙量子电路中充斥着数量庞大的坏局部极小值陷阱。本研究正是为了解决这一工作对量子变分算法带来的悲观预期，通过时序电路实现了“降维打击”式的突破。
McClean et al., Nature Communications (2018) [4]
- 定位：首次确立了变分量子优化中的“贫瘠高原（Barren Plateaus）”定理。本研究在其设定的“无贫瘠高原”（浅层）区间内，进一步厘清了“局部极小值”这一更为隐蔽的第二类可训练性屏障。
White, Physical Review Letters (1992) [24]
- 定位：DMRG 的开山之作。本研究在三十年后，从现代量子信息和变分因果结构的全新视角，为 DMRG 极强的收敛稳健性补全了底层数学和景观动力学的严格证明。
Haegeman et al., Physical Review B (2016) [32]
- 定位：确立了 MPS 在虚时依赖变分原理（TDVP）下的流形几何投影方法。本研究定理 2 的证明过程中，直接利用了该工作定义的流形投影测度和内在几何流。

4.2 本项工作的局限性与严厉学术评论

尽管本研究在变分景观几何学上取得了里程碑式的理论突破，但在应用于实际的大规模量子化学及凝聚态计算时，仍存在以下不可忽视的物理与数学局限：

局限 1：空间一维（1D）拓扑的死锁绑定

本研究所证明的规范自由度转移因果锥的机制，极度依赖于 MPS 所特有的一维链状拓扑结构。一维张量网络具有完美的左右正则性，因而允许正交中心无损、单点地任意滑动。然而，实际的高维强关联分子（如铁硫簇、过渡金属催化剂等）以及二维固体物理系统，必须采用投影纠缠配对态（PEPS）等高级张量网络来描述。在二维及以上流形中，由于网络闭环的存在，严格的正则形式和单点正交中心在数学上是不存在的。虽然可以通过等距张量网络（Isometric Tensor Networks，如 ISO-PEPS）进行近似，但其规范移动会引入截断误差，定理 2 所依赖的“无损正则不变性”将不再严格成立。这极大地限制了该结论直接推广到真实二维空间体系的能力。

局限 2：局部算符支撑集大小 $s$ 导致的键维度指数爆炸

定理 2 确保良性优化景观的前提是：变分量子电路的物理键维度 $D$ 必须大于一个临界阈值 $D_c$（见公式 S142）：

$$D_c = \sqrt{\frac{d^s}{s(d-1)}}$$

其中 $s$ 是局域可观测量（如哈密顿量子项）的物理位点支撑集大小（Support Size）。如果体系中存在长程库仑相互作用（在非定域分子轨道基组下的量子化学哈密顿量中非常常见），则算符的非定域度 $s$ 将正比于系统尺寸 $N$（即 $s \in \mathcal{O}(N)$）。在此情况下，为了维持有效局部过参数化，键维度 $D_c$ 将随系统尺寸呈指数级膨胀。一旦 $D$ 无法达到 $D_c$，系统的局部过参数化条件就会崩溃，坏局部极小值将重新卷土重来。这说明本算法在处理强非局域哈密顿量时，依然无法逃避指数级计算复杂度的惩罚。

局限 3：兼容梯度条件的物理边界仍显模糊

尽管数值实验在 XXZ 和 $J_1-J_2$ 自旋链中验证了“兼容梯度条件”（即无剧烈梯度相消）的成立，但这是一种经验性的温和保障。对于某些高度受挫的物理系统（例如 Kagome 晶格上的自旋液体候选体、具有极强自旋-轨道耦合的多中心过渡金属错合物），不同的局域相互作用项可能存在极强的物理挫折（Frustration）。在这些系统中，兼容梯度条件是否会发生本质性破缺，导致总能量景观中依然涌现出坏的亚稳态，本研究尚未给出普适且严格的物理分类边界。

局限 4：物理噪声对规范自由度的侵蚀

在真实的量子硬件（NISQ 芯片）上，环境噪声（消相干、弛豫、门保真度限制）无处不在。幺正门会被不可逆地削弱为完全正保迹（CPTP）信道。在这种开放量子系统下，原本由精确幺正门构筑的无损规范等价关系会被噪声彻底打破。状态的演化将变成向混态空间的耗散流。在嘈杂的非幺正景观中，有效过参数化是否还能保持消除陷阱的威力，需要更进一步的开放量子系统动力学证明。

5. 补充讨论：物理启示、经典与量子交叉优化

5.1 经典与量子过参数化理论的深刻对话

本项工作将量子多体物理中的“规范自由度”与经典深度学习中的“过参数化理论”有机地融合在一起，完成了一次极富物理洞察力的跨界结合：

在经典人工神经网络中，当网络的参数量远大于训练样本量时，网络进入“过参数化”区间（例如现代的大语言模型）。此时，尽管损失函数表面是高度非凸的，但所有的局部极小值都指向全局极小值，这被称为极小值高度向全局最低点简并（Concentration）。
在量子变分体系中，过去人们普遍认为，要在全空间实现过参数化，所需的幺正门参数量必须随着希尔伯特空间维度呈指数级增长（$2^{2N}$ 规模），这在物理现实中绝无可能。而本工作给出的启示是：由于局域可观测量的存在，我们根本不需要全局过参数化！ 借助张量网络的内部规范自由度，变分时序电路可以在虚时演化中，将参数自适应地、局部地聚集在当前测量的可观测量的因果锥内，从而在局部实现有效的过参数化。这种“用时间换空间、用动态规范换全局静态参数”的机制，为解决复杂多体优化的指数墙提供了一条极为精妙的绿色通道。

5.2 对量子化学与材料模拟设计的实际战略建议

基于本论文的理论发现，我们为未来在量子计算机或经典经典计算机上运行的量子化学 VQE/DMRG 变分仿真设计提出以下三条极具操作性的战略建议：

建议 1：全面摒弃单一的均匀砖墙式电路架构

在设计量子化学 ansatz（如 Unitary Coupled Cluster, UCC）时，传统的物理习惯是堆叠均匀的砖墙式交错双比特门。本研究表明，这种结构缺乏局部的因果自适应能力，极易在中大比特数时由于可训练性崩溃而报废。 正确的做法是改用时序电路（Sequential Circuits）或斜置砖墙（Sloping Brickwork）结构。即使参数总量完全一致，时序结构特有的动态因果局部过参数化也能确保优化过程不会被坏局部极小值锁死。

建议 2：引入“动态规范中心滑动”的经典-量子混合优化策略

在实际运行 VQE 梯度更新时，优化器应与量子芯片上的测量逻辑深度绑定。

当测量局域哈密顿量项 $H_k$ 的期望值时，经典控制端应首先计算该项所对应的规范正交变换，并将电路的“正交中心”移动到 $H_k$ 的物理作用域；
此时，对由于等距性而处于因果锥之外的参数实行“锁定（Freezing）”不更新，仅针对因果锥内的局部参数进行高精度的自然梯度更新。

这种**“滑动正交中心 -> 局部更新 -> 重新定位规范”**的混合变分机制，不仅能极大减少每一步物理测量所需的量子采样次数，还能确保算法始终行驶在“无坏局部极小值”的良性高速公路上。

建议 3：利用兼容梯度比 $R(A)$ 作为分子轨道优化的诊断工具

在进行主动空间（Active Space）选择和分子轨道旋转（Orbital Rotation）时，化学家可以通过计算得到的 $R(A)$ 比值来诊断当前基组和轨道表象下的优化难度。如果由于强轨道挫折导致 $R(A)$ 逼近 0，说明当前的分子轨道表象会严重阻碍变分收敛。此时，应主动执行经典的分子轨道局部变换（如 Localized Molecular Orbitals），调大 $R(A)$ 值，从而在变分能量计算前，人为重构出 benign 的梯度景观。这将对解决过渡金属错合物等强关联体系的精确能级计算起到立竿见影的改善效果。