来源论文: https://arxiv.org/abs/2602.10776 生成时间: Mar 03, 2026 08:37

变分量子本征求解器（VQE）的效率革命：ExcitationSolve 与 Energy Sorting 的深度集成

0. 执行摘要

在量子化学模拟的征途中，变分量子本征求解器（VQE）被视为近期有噪声中等规模量子（NISQ）设备上实现量子优势的最具潜力算法之一。然而，VQE 面临着两大核心挑战：一是如何构建紧凑且高效的试探波函数（Ansatz），以平衡电路深度与化学精度；二是如何降低寻找最优参数所需的计算开销。传统的自适应方案（如 ADAPT-VQE）虽然能显著缩减电路深度，但其在算符选择阶段需要消耗极高的量子资源（评估大量量子电路梯度）。

本文解析了 Max Haas 等人提出的最新研究方案，该工作巧妙地将 ExcitationSolve 优化器与 Energy Sorting (ES) 算符选择策略相结合。通过这种组合，算法能够通过单次算符池扫描（single sweep）即完成绝大部分重要算符的选择，并提供高质量的参数“热启动”初值。更重要的是，该研究证明了对于二阶激发，这一选择过程可以完全在经典计算机上完成。实测结果表明，在处理 H2 到 C2 等一系列分子体系时，该方法实现了相对于传统方法在评估次数上的二次加速（Quadratic Speedup）。此外，该方法通过集成单变分参数耦合交换算符（OVP-CEOs），进一步将 CNOT 门数量减少了 30% 以上。这一进展为在大规模 NISQ 设备上进行实际化学模拟扫清了重要的算法障碍。

1. 核心科学问题，理论基础，技术难点与方法细节

1.1 核心科学问题：VQE 的“效率困境”

VQE 的核心在于最小化能量期望值 $E(\theta) = \langle \Psi_0 | U^\dagger(\theta) H U(\theta) | \Psi_0 \rangle$。传统的固定 Ansatz（如 UCCSD）面临电路深度随电子数多项式增长的问题，导致在 NISQ 硬件上极易受到退相干噪声的影响。自适应 Ansatz（如 ADAPT-VQE）通过迭代地从算符池中选取对能量贡献最大的算符来构建电路，虽然保持了电路的浅层特性，但其算符选择过程（评估梯度）极其耗时。如何既能保持电路浅层，又不需要通过昂贵的量子资源进行算符选择，是当前量子化学算法研究的核心矛盾。

1.2 理论基础：ExcitationSolve 的能量景观重构

本工作的技术基石是 ExcitationSolve 优化器。其核心观察在于，如果生成算符 $G$ 满足 $G^3 = G$（这涵盖了费米子、量子比特激发以及 OVP-CEO 等几乎所有常用的算符类型），那么对于包含单个算符的旋转 $U(\theta) = \exp(-i\theta G)$，能量 $E(\theta)$ 对参数 $\theta$ 的依赖关系可以解析地写为：

$$E(\theta) = E_{ref} + A(1 - \cos(2\theta)) + B \sin(2\theta)$$

这意味着，我们只需要在 4 个不同的 $\theta$ 点上评估能量（或者通过推导出的解析公式），就能完美地重构出整个能量景观。这与需要通过多次迭代逼近最优解的梯度下降（GD）方法有着本质区别。

1.3 技术难点：从单步优化到多算符并行选择

ADAPT-VQE 通常一次只添加一个算符。如果想一次性添加多个算符（Energy Sorting 策略），面临的问题是算符之间的非交换性。简单的 ES 可能会导致选择冗余或能量不降反升。Haas 等人的突破点在于：

首层选择的经典模拟：利用 Hartree-Fock (HF) 参考态的古典特性，证明了所有二阶激发的能量贡献 $\Delta E$ 和最优参数 $\theta_{max}$ 都可以直接从分子积分（一体和二体积分）中解析算出，无需量子计算机参与。
热启动（Warm-Start）：ExcitationSolve 不仅能选出算符，还能给出该算符在当前态下的最优参数初值。将这些非零初值直接带入后续的 VQE 全局优化，可以避开“贫瘠高原（Barren Plateaus）”问题，极大地加快收敛速度。

1.4 方法细节：算法流程图

该算法流程可概括为：

经典预处理：从算符池中，利用解析公式评估所有二阶激发对 HF 态的能量降低程度 $\Delta E$。
能量排序与筛选：选择 $\Delta E$ 超过阈值 $\epsilon_A$ 的算符，按影响大小降序排列。
构建初拟阵：将选出的算符及其解析得到的最优参数 $\theta$ 拼接成初始电路。
量子修正（可选）：如果精度不足，利用量子设备对一阶激发或更高阶激发进行基于 ExcitationSolve 的单次扫描。
全局优化：进行有限次数的 VQE 联合参数优化（此时电路已处于非常接近基态的局部极小值附近）。

2. 关键 Benchmark 体系，计算所得数据与性能分析

该研究采用了极其详尽的基准测试，覆盖了量子化学中具有代表性的 12 个分子体系，计算规模从 4 量子比特延伸至 20 量子比特。

2.1 测试分子列表

小分子：$H_2$ (4 qubits), $H_3^+$ (8 qubits), $He_2$ (26 算符池), $OH^-$ (35 算符池)。
中等规模分子：$LiH$ (12 qubits), $H_6$ (12 qubits), $H_2O$ (14 qubits), $BeH_2$ (14 qubits)。
挑战性分子：$NH_3$, $BH_3$, $CH_4$ ($560$ 算符池), $C_2$ ($804$ 算符池)。

2.2 核心性能数据分析

研究人员对比了三种主要方法：

GD + Gradient Selection (传统 ADAPT-VQE)：黄色曲线。
Exc.Solve + Exc.Solve Selection (朴素自适应)：红色曲线。
Exc.Solve + ES (本研究提出的组合方案)：绿色曲线。

关键发现：

收敛速度的二次加速：在 Figure 2 的对数-对数坐标图中，随着算符池规模（Pool Size）的增加，所需评估次数的指数斜率显著降低。对于 $CH_4$ 分子，传统方法可能需要数天乃至更久的计算量，而新方法将其缩减至分钟级别。
资源消耗对比：对于 $CH_4$（804 个算符池），新方法比纯 ExcitationSolve 节省了约 100 倍的资源，比传统 ADAPT-VQE 则有更夸张的提升。
化学精度：在所有测试案例中，绿色曲线（新方法）均能迅速进入 1 mHa（化学精度，图中浅蓝色区域）范围内。相比固定 UCCSD Ansatz，新方法生成的电路包含的算符更少（例如 LiH 仅需 34 个算符，而完整 UCCSD 需要 96 个），但收敛极其迅速且无平原期。

2.3 OVP-CEO 的增益数据

研究特别讨论了单参数耦合交换算符。虽然 OVP-CEO 算符池规模是 UCCSD 的两倍，但由于其单算符实现的 CNOT 门数从 13 个减少到 9 个，且电路深度显著降低，通过本文提出的特定选择逻辑（处理 de-excitation 项的影响），最终得到的电路在保持同等精度的前提下，电路执行效率提升了约 30%。

3. 代码实现细节，复现指南与软件包

3.1 软件包支持

该工作的数值模拟主要依赖于以下开源及学术软件包：

TenCirChem：一个高效的量子计算化学包，用于执行无噪声状态向量模拟（State-vector Simulation）。其提供了方便的接口来处理费米子 Hamiltonian 映射。 [GitHub Link](https://github.com/draland/tencirchem - 示例，具体以作者实际 repo 为准)。
PennyLane：研究中分子数据集（如 $H_2O$, $BeH_2$ 等）的原始几何结构和积分数据主要来源于 PennyLane 数据库。 PennyLane Datasets。
ExcitationSolve 核心算法：基于作者团队前序发表在 Communications Physics 的工作 [16]。

3.2 复现指南：经典预处理步骤

要复现本研究中最具成本效益的“经典首层选择”，开发者需按照以下逻辑编写程序：

获取积分：利用 PySCF 或类似工具计算分子的 $h_{pq}$（一阶）和 $h_{pqrs}$（二阶）积分。
子空间缩减：针对每一个双激发对 $(p, q) \to (r, s)$，将全空间 Hamiltonian $H$ 投影到由 $|HF\rangle$ 和双激发态 $|\psi_{pq}^{rs}\rangle$ 构成的 2x2 子空间内。
解析求解：
- 计算参数 $a$ 和 $b$（见论文公式 23, 24）：
  - $a = (H_{00} - H_{11})/2$
  - $b = \Re(h_{pqrs} - h_{pqsr})$
- 能量最大改变量 $\Delta E = a + \sqrt{a^2 + b^2}$。
- 最优旋转角度 $\theta_{max} = \frac{1}{2}(\pi + \arctan(b/a))$。
算符筛选：设定阈值 $\epsilon_A = 10^{-13}$，保留所有 $\Delta E > \epsilon_A$ 的算符。

3.3 热启动集成

在量子仿真器中构建电路时，不要将参数设为 0。直接将步骤 3 计算出的 $\theta_{max}$ 作为初始值填充进量子线路。这步操作是消除 VQE 优化初期“无序搜索”的关键。

4. 关键引用文献与局限性评论

4.1 关键引用文献

Peruzzo et al. (2014) [1]：VQE 的开山之作，奠定了变分原理在量子硬件上的应用基础。
Grimsley et al. (2019) [19]：提出了 ADAPT-VQE，是本文所有自适应策略的对比标杆。
Jäger et al. (2025) [16]：本文的核心组件 ExcitationSolve 优化器的来源，证明了 $G^3=G$ 的性质。
Fan et al. (2023) [22]：Energy Sorting 方法的提出者，探讨了并行添加算符的可能性。
Ramâo et al. (2025) [23]：引入了 OVP-CEO 算符，为本文降低电路深度提供了工具。

4.2 局限性评论

尽管该工作展示了令人印象深刻的加速效果，但作为资深技术作者，我认为仍存在以下局限性：

非古典态的挑战：算法的第一步（首层二阶激发）可以在经典机器上完美模拟，但一旦进入更高阶激发（如三激发、四激发）或者在第一层优化完成后，系统状态不再是简单的经典 HF 态。此时，算符选择仍然必须依赖量子计算机进行能量评估。虽然论文展示了 LiH 的三激发测试，但在更大分子体系中，这种后续的量子评估开销是否会重新成为瓶颈尚待观察。
算符池膨胀问题：在引入 OVP-CEO 时，为了保证精度，必须同时考虑 OVP-CEO+ 和 OVP-CEO- 两种变体。这意味着算符池规模增加了一倍。虽然本文通过特定的逻辑筛选掉了一半冗余，但在电子数极多的情况下，算符池的维护和扫描开销依然是一个潜在的经典计算压力点。
噪声敏感性：ExcitationSolve 依赖于 4 点采样的精确性能量重构。在实际 NISQ 设备上，能量测量存在读出噪声。这种重构方法对采样噪声的鲁棒性相对于传统的梯度下降法是否有优势，文中缺乏详尽的噪声模型模拟（主要基于无噪声状态向量模拟）。

5. 补充：跨领域应用与未来展望

5.1 键长迁移性（Bond Length Transferability）

论文中一个非常有意思的补充发现（Figure 7）是关于算符选择对分子构型（键长）的依赖性。研究发现，对于线性分子（如 LiH），在不同键长下选出的“核心算符集”几乎是完全一致的。这意味着我们只需在某一个键长下做一次昂贵的算符选择，就可以将该拟阵结构直接应用于整个势能面扫描（PES）。这对于模拟化学反应动力学具有极大的实践意义。相比之下，非线性分子（如 H2O）的算符选择随键角/键长变化较快，反映了轨道重叠对称性的复杂性。

5.2 潜在的预处理价值

除了直接求解基态能量，该方法选出的紧凑 Ansatz 为其他量子算法提供了绝佳的“起点”。例如：

量子相位估计（QPE）：QPE 需要一个与真实基态重叠度（Overlap）足够高的初始态。本方法能以极低代价生成这种高质量初始态。
量子子空间扩张（QSE）：利用 ES 选出的算符，可以构建更有效的克雷洛夫子空间（Krylov subspace），从而更精确地计算激发态。

5.3 专利与产业化视角

值得注意的是，作者在论文中明确提到了该方法正在申请德国专利（DE 10 2025 132 756.4）。这暗示了该算法不仅是理论上的突破，在量子化学计算软件产业化方面也具有极高的商业价值。其显著降低计算成本的特性，使得目前的 NISQ 硬件能够在无需等待纠错量子计算机出现的背景下，模拟更复杂的工业分子。

5.4 结语

HAAS 等人的这项工作向我们展示了：与其在量子设备上盲目地进行梯度搜索，不如充分利用经典计算对量子体系的先验知识。通过 ExcitationSolve 对能量景观的解析理解，配以 Energy Sorting 的高效筛选，我们正在向“实用的量子化学模拟”迈出坚实的一步。对于追求高效 VQE 实现的开发者而言，集成这套“解析重构 + 经典预处理”的框架将是未来几年的主流方向。