来源论文: https://arxiv.org/abs/2606.05311v1 生成时间: Jun 06, 2026 07:03

实用级量子近似优化算法（QAOA）角度设置的深度解析与实战指南

0. 执行摘要

量子近似优化算法（Quantum Approximate Optimization Algorithm, QAOA）是含噪中等规模量子（NISQ）时代最受关注的混合量子-经典变分算法之一，被广泛应用于求解组合优化问题。然而，当算法扩展至实用级规模（Utility-Scale，即 100 个以上量子比特）时，传统的闭环（Closed-Loop）现场参数优化面临着双重严峻挑战：一是真实量子硬件（QPU）的物理退相干、读取噪声和有限的运行速率导致原位（In-situ）参数扫描极其昂贵且耗时；二是经典精确状态向量（Statevector）模拟的复杂度随比特数呈指数增长，使得计算 $\langle H_C \rangle$ 期望值在经典计算上变得不可行。

本项研究针对 100+ 比特规模下的 QAOA 角度设置（Angle-Setting）策略进行了系统性的基准测试与理论剖析。研究团队构建并分类了包含物理启发、参数转移、迭代法和机器学习等四大类角度设置方法的分类学体系（Taxonomy），并深入探究了两种核心的经典近似评估技术——**矩阵乘积态（MPS）与泡利传播（Pauli Propagation, PP）**在引导角度寻找中的表现。通过在 144 比特的重度六角（Heavy-Hex）等拓扑结构上进行真实量子硬件（如 ibm_boston, ibm_fez）测试，本研究揭示了经典近似优化角度与真实硬件表现之间的强相关性，并提炼出了一条在不同计算预算下的帕累托前沿（Pareto Frontier）。这一成果为当前及未来实用级量子优化及变分量子算法（如 VQE）的端到端管线构建提供了关键的理论支撑和操作指南。

1. 核心科学问题、理论基础、技术难点与方法细节

1.1 核心科学问题：角度寻找的“实用级壁垒”

QAOA 的基本思想是通过交替施加问题哈密顿量 $H_C$（Cost Hamiltonian）和混合哈密顿量 $H_M$（Mixer Hamiltonian）对应的酉算子，在初始状态 $|+\rangle^{\otimes n}$ 上构建变分态：

$$|\psi(\boldsymbol{\theta})\rangle = \prod_{k=1}^p U_M(\beta_k) U_C(\gamma_k) |+\rangle^{\otimes n}$$

其中，$\boldsymbol{\theta} = (\beta_1, \dots, \beta_p, \gamma_1, \dots, \gamma_p) \in \mathbb{R}^{2p}$ 为待优化的角度参数，$p$ 为算法深度。我们的目标是寻找最优参数 $\boldsymbol{\theta}^\star$ 使得能量期望值最小化：

$$\min_{\boldsymbol{\theta}} F_p(\boldsymbol{\theta}) = \langle\psi(\boldsymbol{\theta})|H_C|\psi(\boldsymbol{\theta})\rangle$$

然而，在实用级规模下，寻找 $\boldsymbol{\theta}^\star$ 存在以下根本性的困难：

非平凡的能量景观（Energy Landscape）：变分景观中充斥着大量的局部极小值（Local Minima）。甚至在深度 $p=1$ 时，由于不可控的非凸性，优化问题也是非平凡的。Bittel & Kliesch 已证明，对于一般的变分量子算法，角度寻优在最坏情况下是 NP-hard 的。更进一步，Korpas 等人将其扩展为不可判定性（Undecidability）（在无噪理想状态、深度为 58 阶时）。
物理硬件的噪声墙（Noise Wall）：在真实 QPU 上执行闭环优化，每次经典迭代都需要在硬件上重复测量数万次以估算期望值，硬件的物理门误差、退相干以及经典-量子通信延迟使得这种方法在经济和时间成本上均难以为继。
经典精确模拟的局限性：无法再依赖经典的状态向量直接计算 $F_p(\boldsymbol{\theta})$，必须引入近似估算手段。

1.2 理论阻碍与结构性限制

即使拥有能够直接给出全局最优解 $\boldsymbol{\theta}^\star$ 的“神谕（Oracle）”，QAOA 本身也存在物理结构上的局限性：

对称性保护（Symmetry Protection）：Bravyi 等人指出，QAOA 状态会继承 $H_C$ 和 $H_M$ 的全局对称性（例如 $Z_2$ 自旋翻转对称性）。这使得对于特定具有高度对称性的图（如正则二分图），QAOA 的近似比在恒定深度下存在硬上限，甚至无法超越经典低阶的多项式时间算法（如 Goemans-Williamson 算法，$\alpha_{GW} \approx 0.878$）。
局部性限制（Locality / Light-Cone Argument）：由于常数深度 $p$ 的量子算子只能在量子比特的 $p$-邻域（光锥）内传播信息，QAOA 的局域观测值仅由局域子图拓扑决定。这导致标准 QAOA 难以区分具有相同局域结构但全局不同的图，表现出类似随机局域算法的局限。
重叠间隙性质（Overlap Gap Property, OGP）：Chou 等人将局域性限制扩展至 $\Omega(\log n)$ 深度，证明了对于展现出 OGP 的稀疏随机正则图，浅层 QAOA 会由于全局解空间的碎裂（Shattering）而彻底失效。

为了绕过这些结构性障碍，领域内提出了多种变体，例如递归 QAOA (RQAOA)——通过逐轮消除变量来打破局域性限制；以及温启动 QAOA (Warm-starting)——利用经典的半正定规划（SDP）松弛解来初始化非对称的起始态，从而打破对称性保护。

1.3 经典近似评估技术细节

既然无法进行经典精确计算，又无法直接在 QPU 上进行低成本优化，我们就必须依赖高效的经典近似方法。本项工作深入评估了以下两种极具代表性的方法：

A. 矩阵乘积态（Matrix Product State, MPS）与 SAT 映射

MPS 是一种一维张量网络表示方法，其表达量子纠缠的能力受限于键维数（Bond Dimension, $\chi$）。一维紧邻系统的量子态可以被 MPS 精确表示。然而，对于一般的复杂图拓扑（如重度六角图或多维网格），施加双比特门会使纠缠迅速增加，导致键维数呈指数增长。为了进行经典近似，必须在每次双比特门操作后执行奇异值分解（SVD）压缩，人为截断较小的奇异值。

为了提升一维 MPS 在模拟高维量子电路时的精度，必须优化物理量子比特到 MPS 一维张量链上的映射。本工作引入了 **SAT 映射（Boolean Satisfiability Mapping）**技术（见下文代码复现部分）。其原理是将量子比特映射问题转化为布尔可满足性问题，最大程度地缩短量子电路中发生双比特门操作的两个比特在一维张量链上的物理距离，从而显著减少不必要的纠缠扩散，大幅降低了 MPS 近似计算的相对误差和计算耗时（实验结果见原论文图 3 与图 15）。

B. 泡利传播（Pauli Propagation, PP）及其截断策略

与基于态矢表示的 MPS 不同，泡利传播运行在海森堡图像下。它通过从测量算子（通常是 $H_C$ 中的二阶泡利项 $Z_i Z_j$）出发，反向通过量子门进行逆向传播：

$$O(t) = U^\dagger(t) O U(t)$$

非克利福德门（Non-Clifford gates，如变分旋转门 $e^{-i\gamma Z_i Z_j}$）会导致泡利算符在传播过程中发生“分叉”，生成包含更多非平凡泡利项的线性组合，其项数随电路深度呈指数级膨胀。为了控制计算复杂度，PP 必须采用以下两种启发式截断策略：

泡利权重截断（Pauli Weight Truncation, $W$）：直接丢弃所有包含大于 $W$ 个非恒等泡利算符的项。由于高阶泡利项在典型的乘积态（如 $|+\rangle^{\otimes n}$）上的期望值通常极小，此操作引入的误差通常是可以忽略的，且具有严格的误差上界。
系数剪枝 / 平均绝对系数剪枝（Coefficient Pruning / Mean Absolute Coefficient, MAC）：在每一步传播中，若某个泡利项的代数系数低于预设阈值（MAC 门槛，例如 $10^{-4}$），则将其直接舍弃。MAC 剪枝能够动态控制传播树的规模，使得在低连通度、稀疏图上，PP 期望值的计算时间能控制在 1 秒以内，且相对误差低于 0.1%（见原论文图 4）。

1.4 角度设置分类学体系（Taxonomy）

根据研究团队梳理的系统分类（详见原论文 Table I），当前主流的角度寻找策略可归纳为以下四大流派：

┌────────────────────────────────────────────────────────────────────────┐
│                      QAOA 角度设置分类学体系                           │
└────────────────────────────────────────────────────────────────────────┘
     │
     ├─► 1. 物理启发方法 (Physics-inspired)
     │     └─► 典型代表：Trotterized 量子退火 (TQA)、线性渐变 (Linear Ramps, LR)
     │     └─► 特点：无需评估能量，直接根据退火 schedule 预设角度，适合快速启动
     │
     ├─► 2. 参数转移方法 (Parameter Transfer)
     │     └─► 典型代表：固定角度 (Fixed Angles, FA)、基于图拓扑的参数迁移
     │     └─► 特点：在小规模/代表性子图上训练，直接缩放并转移至实用级规模
     │
     ├─► 3. 迭代优化方法 (Iterative Methods)
     │     └─► 典型代表：线性插值 (Interp.)、傅里叶变换法 (Fourier)、递归过渡态 (RTS)
     │     └─► 特点：从第 p 层的局部最优解出发，构建 p+1 层的初始点，平滑景观
     │
     └─► 4. 机器学习方法 (Machine Learning)
           └─► 典型代表：强化学习控制 (RL-QAOA)、图神经网络迁移 (GATs)、扩散生成模型
           └─► 特点：依赖高质量历史数据库，训练黑盒模型直接预测最优角度

–─

2. 关键 Benchmark 体系、计算所得数据与性能分析

为了全面评估上述角度寻找策略在实用级规模下的实战表现，研究团队构建了庞大的 Benchmark 矩阵，涵盖了多种图拓扑结构、问题类型及模拟器。

2.1 评估体系设计

经典优化问题类型：
1. 最大剪切问题（MaxCut）：二次无约束二进制优化（QUBO），易于物理映射，是量子算法测试的行业标准。
2. 最大独立集问题（MIS）：带约束的优化问题。通过引入二次罚项转化为 QUBO，其能量景观相较于 MaxCut 更为崎岖坎坷。
3. 低自相关二进制序列（LABS）：非基于图的优化问题，其哈密顿量包含四阶（Quartic）自旋相互作用（见下文哈密顿量定义），电路深度和纠缠度极高，具有极其陡峭和 rugged 的景观。
测试图拓扑拓扑：
- Erdős-Rényi (ER) 随机图（边概率 20% ~ 50%）。
- 重度六角图（Heavy-Hex, HH）：适配 IBM 物理芯片的连通结构，无需 SWAP 门拓扑路由。
- 基于线性的图（Line-Based, LB）：通过在一维链上施加交替的 SWAP 门层构建，用于人为制造紧凑环（Cycles）以测试张量网络误差。
- 随机正则图（Random-Regular, RR）（度数 $d \in [3, 9]$）。
规模划分：
- 小规模（Small-scale）：$N \le 22$ 量子比特，用于精确的状态向量（Statevector, SV）基准比对。
- 实用级规模（Utility-Scale）：$N \in [50, 144]$ 量子比特，使用 MPS 和 PP 估算期望值，并在 144 位的物理芯片 ibm_boston 上执行真实硬件验证。

2.2 核心计算数据与性能分析

A. MaxCut 问题性能比较（基于 Table II 数据的提炼）

在深度 $p=10$ 的 MaxCut 测试中，各优化方法展现出了清晰的层级（详情参照原论文第 11 页 Table II）：

Fixed Angles (FA) / 参数转移的表现：在 RR 图和 HH 图上，直接采用 Wurtz & Lykov 提出的固定角度（Fixed Angles⋆，经过实例级微调），配合 MPS 或 PP 评估器，取得了惊人的极高近似比：
- 在 MPS (Aer) 模拟下，FA⋆ 在 RR 图上的近似比高达 $98.5\% \pm 1.4\%$，在 HH 图上为 $89.7\% \pm 3.9\%$。
- 在 PP 模拟下，FA⋆ 在 HH 图上达到 $94.2\% \pm 0.6\%$。这表明在特定对称结构如图正则图上，参数转移策略能够提供极其强大的 Baseline，且几乎不需要额外的经典优化开销。
通用迭代法的霸主地位：当固定角度不适用时（如非正则的 ER 图），Interp.⋆（线性插值） 和 Linear Ramp⋆（线性渐变） 几乎在所有测试中都名列前茅：
- 在 MPS (Aer) 模拟下，Linear Ramp⋆ 在 ER 图上取得了最高的 $96.5\% \pm 0.8\%$ 近似比；Interp.⋆ 在 ER 图上取得 $94.2\% \pm 4.0\%$。
- 相比之下，Fourier⋆（傅里叶法） 的表现明显落后，在 ER 图上仅为 $81.2\% \pm 6.1\%$。这主要是由于 Fourier 空间的非凸景观导致局部优化极易陷入低劣的局部极小值。

B. MaxCut 与 MIS 的交叉对比：问题依赖性

一个关键的科学发现是：没有一种角度设置策略能够包治百病。 算法在不同问题类上的表现存在显著的分化（见原论文图 6）：

在 MaxCut 上表现最差的 Fourier⋆ 方法，在切换到 MIS 问题时，却与 TQA⋆（温启动量子退火）一同成为了表现最优秀的算法。相反，专为 MaxCut 优化设计的固定角度（Fixed Angles）在 MIS 问题上表现惨淡。
这表明，当面对包含一阶和二阶混合项、能量景观更为陡峭的约束优化问题（如 MIS）时，物理启发的平滑路径（TQA）和频域参数化（Fourier）能更好地规避因约束罚项带来的剧烈局域景观振荡。

C. LABS 的非平凡结果（基于 Table III 与 Table VI）

对于包含四阶自旋作用的 LABS 难题（$p=50$ 超深电路），MPS 和 PP 因纠缠和算符分叉而彻底失效，本项工作通过精确状态向量模拟了至多 21 位比特。实验表明：

Fourier 和 Interp. 几乎收敛到完全相同的极佳角度。在 21 比特、$p=50$ 的深度下，Interp. 实现了 13.4 的最低能量期望值（理论最优值为 26，见 Table VI）。
关键在于，非迭代的 Linear Ramp⋆ 表现出了极强的竞争力，其 Merit Factor 非常接近迭代法，但计算耗时缩短了 95% 以上（在 A100 GPU 上，迭代法需要耗时近 24 小时，而 Linear Ramp⋆ 仅需 1 小时）。这确立了 Linear Ramp 算法在面临高度 rugged 景观问题时的默认首选地位。

D. 真实物理硬件（QPU）验证与帕累托前沿

研究团队在包含 144 个超导量子比特的 ibm_boston 上运行了 $p=5$ 和 $p=10$ 的重度六角图 MaxCut 任务，并绘制了计算时间与硬件近似比的帕累托前沿图（见原论文第 17 页图 10 & 图 11）：

物理硬件近似比 (QPU Approximation Ratio)
  ▲
  │                                         ★ [Interp.* + PP] (高预算，缓慢逼近极限)
  │                                     ▲
  │                                  ▲ [Linear Ramp* + PP] 
  │                             ▲
  │                       ● [Fixed Angles* + PP]
  │                  ▲
  │             ■ [Fixed Angles†] (免优化，秒级返回，性价比之王)
  │         ▲
  │     ▲
  └─────────────────────────────────────────────────────────────► 经典优化总耗时 (Total Duration)
        10^1            10^2            10^3            10^4 (秒, log轴)

核心结论：

信噪比平衡点：在 $p=5$ 时，经典近似优化的角度在真实硬件上呈现出极强的正相关性（PP 优化角度在硬件上的相关系数高达 0.93，MPS 为 0.66）。然而，到了 $p=10$，由于物理门噪声占主导，硬件表现开始退化，不同方法在硬件上的输出变得在统计学上“不可区分”（Indistinguishable）。
帕累托决策建议：
- 若经典计算资源受限（总时间 $< 10^2$ 秒）：强烈推荐直接使用不经任何原位优化的固定角度（Fixed Angles†）或参数转移，其仅需 $O(1)$ 的查表开销，即可在真实芯片上斩获超过 $82\%$ 的硬件近似比。
- 若追求极限精度（总时间 $> 10^3$ 秒）：应选用 Linear Ramp⋆ 或 Interp.⋆，并使用**泡利传播（PP）**作为经典能量评估器。由于 PP 不受高维物理拓扑的局限，其相对 MPS 能在硬件上实现更优的角度收敛品质，且总计算耗时更短。

–─

3. 代码实现细节与复现指南

本节提供一套基于 Qiskit 和作者开源框架的复现蓝图。重点展示物理量子比特到一维张量网络的 SAT 映射算法 的核心逻辑，以及在 QPU 上进行闭环评估的 Python 代码模板。

3.1 量子比特到一维张量链的 SAT 映射算法（Python 核心复现）

为了减小一维 MPS 近似模拟多维物理芯片（如 Heavy-Hex）时的奇异值截断误差，我们需要通过求解布尔可满足性问题（SAT），寻找一个最优的量子比特到一维物理位置映射 $\pi: V \to \{1, \dots, N\}$，使得发生双比特门操作的节点在链上的最大跨度（Span）最小。以下是该算法的核心逻辑实现：

import networkx as nx
from z3 import Solver, Int, And, Or, Implies, Distinct, sat

def solve_sat_mapping(problem_graph: nx.Graph, max_allowed_span: int):
    """
    使用 z3 求解器寻找一个满足双比特门在 MPS 一维链上跨度不超过 max_allowed_span 的映射。
    problem_graph: 问题的相互作用图 (比如 MaxCut 图)
    max_allowed_span: 允许的最大一维距离 (1 表示紧邻)
    """
    num_nodes = problem_graph.number_of_nodes()
    solver = Solver()
    
    # 定义决策变量：每个图节点在一维 MPS 链上的位置 (1 到 num_nodes)
    pos = {node: Int(f"pos_{node}") for node in problem_graph.nodes()}
    
    # 约束1：位置变量必须在 [1, num_nodes] 范围内
    for node in problem_graph.nodes():
        solver.add(pos[node] >= 1, pos[node] <= num_nodes)
        
    # 约束2：所有节点的位置必须互不相同 (双射)
    solver.add(Distinct(list(pos.values())))
    
    # 约束3：图中的每条边 (u, v) 在一维链上的距离不能超过 max_allowed_span
    for u, v in problem_graph.edges():
        diff = pos[u] - pos[v]
        # 绝对值约束转化为线性不等式：-max_span <= pos[u] - pos[v] <= max_span
        solver.add(diff <= max_allowed_span)
        solver.add(diff >= -max_allowed_span)
        
    if solver.check() == sat:
        model = solver.model()
        mapping = {node: model[pos[node]].as_long() for node in problem_graph.nodes()}
        print(f"成功找到可行映射！最大跨度限制：{max_allowed_span}")
        return mapping
    else:
        print(f"在最大跨度限制 {max_allowed_span} 下无解。")
        return None

# 示例：构建一个 5 节点的环状图，尝试映射到一维 MPS 上，限制邻近跨度为 2
g = nx.cycle_graph(5)
mapping = solve_sat_mapping(g, max_allowed_span=2)

3.2 硬件端原位闭环期望值评估（Qiskit 运行时代码）

论文第 31 页展示了在真实物理芯片上使用 Qiskit Runtime 的 Session 和 Sampler 原生接口来快速评估条件风险价值（Conditional Value at Risk, CVaR）的经典闭环程序。这里提供其规范的生产级复现代码：

import numpy as np
from qiskit_ibm_runtime import QiskitRuntimeService, Session, Sampler
from qiskit.circuit import ParameterVector, QuantumCircuit
from scipy.optimize import minimize

# 1. 模拟一个简单的 $p=1$ QAOA 线路
def build_qaoa_circuit(num_qubits=4):
    qc = QuantumCircuit(num_qubits)
    # 初始状态初始化为 |+\rangle
    qc.h(range(num_qubits))
    
    # 声明变分参数
    gamma = ParameterVector('γ', 1)
    beta = ParameterVector('β', 1)
    
    # 施加 $H_C$ 门层 (示例：简单的环状 Ising 哈密顿量)
    for i in range(num_qubits):
        qc.rzz(2 * gamma[0], i, (i + 1) % num_qubits)
    qc.barrier()
    
    # 施加 $H_M$ 门层
    for i in range(num_qubits):
        qc.rx(2 * beta[0], i)
        
    qc.measure_all()
    return qc

# 2. 定义基于 CVaR 的损失函数 (仅统计性能前 alpha% 的样本)
def compute_cvar_loss(counts: dict, alpha: float = 0.05):
    """
    计算前 alpha (例如 5%) 最优剪切值的均值作为优化器目标值
    """
    energies = []
    total_shots = sum(counts.values())
    
    for bitstring, count in counts.items():
        # 映射 bitstring (0/1) 到 Ising 自旋 (-1/1) 并计算割值
        spins = [1 if b == '0' else -1 for b in bitstring]
        # 示例割能计算 (对应环状图)
        energy = sum(spins[i] * spins[(i+1)%len(spins)] for i in range(len(spins)))
        energies.extend([energy] * count)
        
    energies.sort()  # 自小到大排序 (最小化问题)
    cutoff_index = int(np.ceil(alpha * total_shots))
    cvar_val = np.mean(energies[:cutoff_index])
    return cvar_val

# 3. 闭环优化管线
def run_qpu_optimization(service: QiskitRuntimeService, backend_name: str):
    circuit = build_qaoa_circuit(num_qubits=4)
    
    with Session(service=service, backend=backend_name) as session:
        sampler = Sampler(session=session)
        
        def objective(x):
            # 将优化器传入的参数绑定到线路中
            bound_circuit = circuit.assign_parameters(x, inplace=False)
            
            # 提交硬件测量任务
            job = sampler.run([bound_circuit], shots=20000)
            result = job.result()
            
            # 获取概率计数并计算 CVaR 损失
            counts = result.quasi_dists[0].binary_probabilities()
            loss = compute_cvar_loss(counts, alpha=0.05)
            return loss

        # 使用 COBYLA 进行轻量级变分寻找，初始步长设置为极窄的 0.01 避免过冲
        initial_guess = np.array([0.1, 0.1])
        res = minimize(objective, initial_guess, method='COBYLA', options={'rhobeg': 0.01, 'maxiter': 50})
        print("优化完成。最优角度：", res.x, "最低 CVaR：", res.fun)
        return res.x

3.3 关键开源仓库与软件包链接

QAOA Training Pipeline (本研究的核心开源管线)：https://github.com/IBM/qaoa-training-pipeline
Fixed Angles QAOA 数据库 (Wurtz 等人维护的固定角度速查库)：https://github.com/danlkv/fixed-angle-QAOA
Pauli Propagation 模拟器 (Julia 高性能泡利反向传播工具包)：PauliPropagation.jl
Quimb 张量网络库 (用于构建 Sat-Mapping 和高阶张量压缩)：https://github.com/johngray/quimb

–─

4. 关键引用文献与局限性评论

4.1 关键引用文献

[2] Farhi, Goldstone, & Gutmann (2014): 提出 QAOA 的奠基性文献，首次给出了变分逼近的数学架构。
[4] Bittel & Kliesch (2021) [Phys. Rev. Lett. 127, 120502]: 严格证明了 VQA 角度优化的 NP-hard 属性，并揭示了系统性局部极小值无法通过局域梯度下降规避的理论本质。
[13] Bravyi, Kliesch, Koenig, & Tang (2020) [Phys. Rev. Lett. 125, 260505]: 揭示了 QAOA 的对称性保护障碍与局域性光锥限制，证明了恒定深度下 QAOA 在某些图拓扑上无法战胜经典算法。
[48] Wurtz & Lykov (2021) [Phys. Rev. A 104, 052419]: 提出了正则图上 MaxCut 的固定角度（Fixed-angle）猜想与数学级查表数据，是本研究中参数转移（Parameter Transfer）策略的基石。
[59] Zhou, Wang, Choi, Pichler, & Lukin (2020) [Phys. Rev. X 10, 021067]: 提出了极其重要的 Interp. 和 Fourier 迭代启发式角度设置算法，本项研究成功将其扩展至了 144 比特级规模。

4.2 对这项工作的局限性评论

尽管本工作在“实用级规模下消除闭环原位优化”这一目标上取得了重大突破，但作为面向前沿探索的技术作者，我们必须客观指出其存在的局限性：

近似评估器的“阿喀琉斯之踵”：
- MPS 严重受限于图的围长（Girth）：虽然引入了 SAT 映射，但对于包含大量小长度闭环（如三角形或四边形，即 Line-Based 图）的高连通图，MPS 的近似比呈现出惊人的负相关性（见原论文第 14 页）。这是由于小循环引入了深层纠缠，使 SVD 截断误差迅速累积。因此，对于高连通化学自旋相互作用网络，MPS 无法作为可靠的角度寻找评估器。
- PP 严重受限于图的密度（Density）：对于高密度图，泡利算符的反向传播树会发生毁灭性的指数级膨胀（见原论文图 14e）。此时必须通过施加极低的 MAC 阈值进行剧烈剪枝，这会导致期望值计算严重偏离真实值。
物理硬件噪声的抹平效应：如原论文图 10 所示，在 $p=10$ 的深层电路上，噪声主导了输出。此时，耗时费力通过经典近似精心优化出来的“高质量角度”（如 Interp.⋆），其在 QPU 上的实际剪切表现与“无优化直接查表得到的粗糙角度”（如 Fixed Angles†）没有统计学上的显著差异。这意味着当前的 NISQ 硬件根本无法充分变现经典精细优化所带来的理论红利，物理硬件的噪声控制依旧是第一瓶颈。
缺乏与经典先进启发式算法在相同计算预算下的公平对决：本研究在对比经典算法时，仅引入了基本的 Goemans-Williamson (GW) 算法。然而在经典的工业界，多起点 memetic 禁忌搜索、卡尔曼滤波启发式算法以及各类 GPU 加速的精确/近似 solver 能够在数秒内解决成百上千节点的 MaxCut。QAOA 在实用级规模下，其不仅在**精度（近似比）上未展现出超越经典启发式的迹象，在计算耗时（TTS）**上也慢了数个数量级。这表明即便完美解决了角度寻找问题，QAOA 在 NISQ 时代通往“实用量子优势”的道路依然布满荆棘。

–─

5. 补充内容：从组合优化到量子化学变分算法（VQE）的跨界启示

作为量子化学与材料计算领域的科研工作者，我们不应将本研究的结论局限于组合优化领域。QAOA 本质上是**变分量子特征值求解器（VQE）**在特定相互作用哈密顿量下的离散化特例（可以看作是量子绝热通道的时间离散化模拟）。本项工作在实用级规模下积累的角度设置经验，对分子电子结构计算和自旋模型模拟具有极高、极直接的参考价值。

5.1 量子化学变分参数优化的跨界启示

在量子化学中，使用变分算法（如带有 UCCSD 拟设的 VQE）计算分子基态能量时，同样面临着活性空间（Active Space）扩大后，变分景观充斥**贫瘠高原（Barren Plateaus）**和原位 QPU 估值高昂的世纪难题。本研究所阐明的底层逻辑可以无缝移植至量子化学基准测试中：

┌──────────────────────────────────────────────┐
│            量子化学变分优化的移植路径        │
└──────────────────────────────────────────────┘
  │
  ├─► 1. 拟设拓扑一维化与张量映射：
  │     将分子的费米子分子轨道通过 Jordan-Wigner 映射到一维量子比特链上时，
  │     同样应采用 Z3 求解器执行 SAT-Mapping，以将强关联的键轨道物理相邻，
  │     最大化减少一维 MPS 模拟化学变分态时的 SVD 压缩误差。
  │
  ├─► 2. 化学能量景观的参数转移 (化学键收缩线性外推)：
  │     在小化学键长、小基组（如 STO-3G）或极小子空间内预先训练耦合算符的角度，
  │     然后利用线性渐变 (Linear Ramp) 或线性插值 (Interp.) 规律外推至大基组、
  │     长键长或复杂大分子体系。避免在大体系中无起点盲目扫描导致的 Barren Plateaus。
  │
  └─► 3. 二阶/四阶费米子相互作用哈密顿量的处理：
        在化学分子中，两电子库仑排斥积分转化为比特哈密顿量后包含大量的 Pauli-$Z$ 
        多体项。在执行经典近似引导参数寻找时，泡利传播 (PP) 方法由于具有对拓扑无感知、
        支持多体算符的特点，比张量网络更适合用于指导二维及三维复杂分子（如过渡金属催化剂）
        的角度搜索。

5.2 总结

本项工作拉开了实用级（Utility-Scale）量子算法参数寻找与性能验证的序幕。它告诉我们，在跨越 100+ 量子比特这一门槛时，粗暴的原位闭环变分扫描已经彻底失效，而**结合问题结构特征的经典近似估算（通过 SAT 优化的 MPS 与剪枝 PP）以及直接参数转移（Fixed Angles）**是实现高效端到端计算的唯一可行桥梁。对于致力于将量子计算应用于大分子模拟、催化剂设计和先进材料研发的量子化学家，这些底层方法和帕累托帕累托决策规则将是不可或缺的实用工具箱。