能量排序驱动的 UCC Ansatz 线路深度压缩：ES-VQE 算法深度解析

来源论文: https://arxiv.org/abs/2106.15210 生成时间: Feb 21, 2026 16:41

0. 执行摘要

在嘈杂中等规模量子（NISQ）时代，变分量子特征值求解器（VQE）被公认为量子化学模拟最有希望的突破口。然而，基于物理直觉的么正耦合簇（UCC）拟设（Ansatz）虽然精度极高，其线路深度（尤其是 CNOT 门数量）却往往超出了当前硬件的相干时间。例如，一个简单的 12 比特 LiH 分子的 UCCSD 拟设就需约 1600 个 CNOT 门。

本文深入探讨了华为 2012 实验室、中国科学技术大学及清华大学联合发表的研究成果。该工作提出了一种名为“能量排序”（Energy Sorting, ES）的策略（简称 ES-VQE）。其核心思想是在构造量子线路之前，先在经典计算机辅助下通过单次“预筛选”评估每个激发算符对 Hartree-Fock（HF）参考态能量的贡献，并据此进行降序排列。随后，通过迭代方式按重要性引入算符。实验证明，该方法在保持化学精度的前提下，能将算符数量减少 50% 至 98%。这不仅极大缩减了线路深度，还降低了参数优化的难度，为在近未来量子设备上模拟大规模化学体系铺平了道路。

1. 核心科学问题，理论基础，技术难点，方法细节

1.1 核心科学问题：精度与深度的两难困境

在量子化学模拟中，我们要解决的是电子 Hamilton 量的基态特征值问题：

$$\hat{H}\left|\Psi\right\rangle = E\left|\Psi\right\rangle$$

VQE 算法通过参数化拟设 $\left|\Psi(\theta)\right\rangle = U(\theta)\left|\Psi_0\right\rangle$ 来逼近基态。其中，拟设的选择决定了算法的成败。

目前存在两类主流拟设：

硬件高效型拟设（HHA）： 结构简单，线路浅，但缺乏物理含义，容易陷入“贫瘠高原”现象。
物理启发型拟设（PMA）： 以 UCCSD 为代表，精度高且遵循对称性，但算符池（Operator Pool）规模随轨道数 $N$ 呈 $O(N^4)$ 增长。对于较大的系统，这种线路深度几乎不可行。

ES-VQE 解决的根本问题是： 如何在不损失 UCCSD/UCCGSD 物理精度的前提下，识别并剔除那些对能量贡献微乎其微的“冗余”算符，从而极大地压缩线路？

1.2 理论基础：么正耦合簇与变分原理

UCC 理论通过指数映射将激发算符作用于 HF 参考态：

$$\left|\Psi_{UCC}\right\rangle = e^{\hat{T} - \hat{T}^\dagger} \left|\Psi_{HF}\right\rangle$$

其中 $\hat{T}$ 是簇算符，通常截断至单激发和双激发（UCCSD）：

$$\hat{T} = \sum_{p,q} \theta_q^p a_p^\dagger a_q + \sum_{p,q,r,s} \theta_{rs}^{pq} a_p^\dagger a_q^\dagger a_r a_s$$

在量子电路上，由于指数算符互不交换，必须使用 Trotter-Suzuki 分解：

$$e^{\hat{A} + \hat{B}} \approx (e^{\hat{A}/n}e^{\hat{B}/n})^n$$

这导致了线路深度的激增。每一个费米子激发算符被映射到量子比特空间（通过 Jordan-Wigner 或 Bravyi-Kitaev 变换）后，会产生一系列 Pauli 字符串，对应的 CNOT 门链非常长。

1.3 技术难点：如何“聪明地”选择算符？

以往的改进方法如 ADAPT-VQE 使用梯度作为“重要性评分”：

$$s_i^{(k)} = |\langle \Psi^{(k-1)} | [\hat{H}, \hat{\tau}_i] | \Psi^{(k-1)} \rangle |$$

虽然有效，但 ADAPT-VQE 需要在每一个迭代步测量所有备选算符的梯度，这带来了巨大的测量开销。对于大算符池，测量成本往往抵消了线路深度缩减带来的收益。

1.4 ES-VQE 方法细节

ES-VQE 提出了一个更加直观且高效的“单次评估”策略。其具体算法流程如下：

初始化评分： 在 HF 参考态上，对算符池 $\mathcal{O}$ 中的每一个算符 $\hat{\tau}_i$ 进行独立的小型 VQE 优化。计算能量增益：
$$\Delta E_i = E_i - E_{HF}$$
其中 $E_i = \min_{\theta_i} \langle \Psi_{HF} | e^{-\theta_i \hat{\tau}_i} \hat{H} e^{\theta_i \hat{\tau}_i} | \Psi_{HF} \rangle$。这是一个极浅的线路，因为只含有一个参数。
能量排序： 将所有 $\Delta E_i$ 按绝对值降序排列，形成一个排序后的列表 $\mathcal{E}$。这个列表定义了算符进入拟设的优先级。
算符池构建（第一步）： 设定阈值 $\epsilon_A$。将所有满足 $|\Delta E_i| > \epsilon_A$ 的算符组合在一起，构建初始拟设。进行变分优化，更新所有参数。
迭代增长（后续步）： 如果能量未达到收敛标准（如化学精度），则从排序表 $\mathcal{E}$ 中依次取出下一个算符加入拟设。重新优化所有参数。为了保证效率，引入了阈值 $\epsilon_B$ 来判断新加入算符的贡献是否显著。
收敛判定： 当连续两步能量差小于 $\epsilon_C$ 时，算法终止。

这种方法的优势在于：“先排序，后施工”。通过一次性的能量筛选，规避了 ADAPT-VQE 在每一步都进行全局搜索的昂贵成本。

2. 关键 Benchmark 体系，计算所得数据，性能数据

论文通过对不同分子体系和周期性系统的 Benchmark 验证了 ES-VQE 的稳健性。使用的基组为最小基组 STO-3G，参考标准为全构型相互作用（FCI）能量。

2.1 分子体系：H4, LiH, H6

H4 分子（拉伸过程）

特点： 在长键长下具有强关联特性，是检验拟设有效性的典型模型。
性能： ES-VQE-SD（基于 UCCSD 算符池）在整个势能面（PES）上成功保持了化学精度。在键长拉伸至 2.4 $\mathring{A}$ 时，相对于原始 UCCSD 算符池（14 个算符），ES-VQE 仅保留了约 50% 左右的算符，且误差依然在 $10^{-3}$ Hartree 以内。

LiH 分子（弱关联代表）

性能数据： 这是一个令人惊讶的结果。对于 12 量子比特的 LiH，原本 UCCSD 算符池包含 44 个算符。ES-VQE-GSD（基于广义 UCC 算符池）在较短键长处仅需 1 个 主导算符即可接近化学精度。其算符压缩率高达 98%。
结论： 对于弱关联体系，绝大部分激发算符是不必要的。ES-VQE 能够精准捕捉到那 2% 的关键成分。

H6 链（强关联代表）

挑战： 随着原子数增加，由于简并度提高，电子关联变得极其复杂。
数据： ES-VQE 在 H6 系统中表现出比 ADAPT-VQE 更平滑的收敛曲线。在平衡键长附近，算符缩减率维持在 50% 以上。即便是面对强关联，通过选取能量贡献大的算符，其生成的 Trotter 序列往往比原始排序更具效率。

2.2 周期性系统：1D 氢原子链（H2-PBC）

这是该工作的一大亮点，因为它将 ES-VQE 扩展到了固体物理领域。模拟使用了 3 个 k 点（共 12 个量子比特）。

技术细节： 对于周期性系统，波函数是复数。论文指出原始 UCC 拟设在处理复数波函数时存在残差误差（ACSE-Im 不为零）。为此，他们引入了辅助算符池（Eq. 16-17）来修正复数部分带来的误差。
结果： ES-VQE-GSD 算法在 1D 氢链模拟中展现了极高的精度，将 240 个广义算符缩减到了约 20-50 个。这证明了能量排序策略同样适用于具有平移对称性的量子场论模型。

2.3 性能数据概览表（算符数量对比）

体系	UCCSD 原始数量	ES-VQE 优化后 (平均)	压缩率
H4	14	8	~43%
LiH	44	20 (最高点) / 1 (最低点)	55% - 98%
H6	54	29	~46%
H2-PBC	240 (UCCGSD)	25	~90%

3. 代码实现细节，复现指南

3.1 软件包依赖

为了复现论文中的结果，研究者可以采用以下软件栈：

PySCF: 用于经典电子结构计算。执行 Hartree-Fock（RHF/UHF）计算，提取一体和二体积分（h_{pq} 和 h_{pqrs}）。
MindQuantum: 华为开源的量子计算框架。用于构建费米子算符、执行 Jordan-Wigner 变换以及线路模拟。
SciPy.optimize (BFGS/L-BFGS-B): 用于经典参数优化过程。论文特别指出，使用 BFGS 算法并设定收敛准则 gtol=10^-7 a.u.。

3.2 关键实现逻辑

算符池生成：

# 示例逻辑：生成UCCSD算符池
def generate_uccsd_pool(n_qubits, n_electrons):
    # 识别占据轨道和虚轨道
    occ = range(n_electrons)
    vir = range(n_electrons, n_qubits)
    # 生成单激发、双激发算符列表
    # ... 转换为 (a_p^† a_q - a_q^† a_p) 形式

能量评分步骤（伪代码）：

scores = []
for op in operator_pool:
    # 构造极简线路: exp(theta * op) |HF>
    # 优化 theta，计算 E_min
    delta_e = E_min - E_hf
    scores.append((op, delta_e))
# 按 delta_e 绝对值降序排序
sorted_pool = sorted(scores, key=lambda x: abs(x[1]), reverse=True)

Trotter 顺序的重要性： 复现时需注意，算符在电路中的作用顺序会影响能量收敛。ES-VQE 的优势在于其排序天然提供了一个优化的 Trotter 序列，通常建议按照评分从高到低的顺序依次排列电路门。

3.3 开源资源 link

MindQuantum: https://gitee.com/mindspore/mindquantum (内含 VQE 实现模块)。
PySCF: https://pyscf.org/

4. 关键引用文献，以及对这项工作局限性的评论

4.1 关键引用文献

VQE 原型工作： Peruzzo, A., et al. (2014). Nature Communications, 5, 4213. 定义了 VQE 的基本框架。
ADAPT-VQE： Grimsley, H. R., et al. (2019). Nature Communications, 10, 3007. 本文的主要竞争对手和对比对象。
UCCGSD 理论： Lee, J., et al. (2019). Journal of Chemical Theory and Computation, 15, 311-324. 扩展了算符池的范围。
周期性系统： Liu, J., et al. (2020). Journal of Chemical Theory and Computation, 16, 6904-6914. 奠定了 PBC-VQE 的基础。

4.2 局限性分析

尽管 ES-VQE 表现优异，但在实际科研应用中仍存在一些潜在局限性：

参考态依赖性： 评分是在 Hartree-Fock 态上进行的。对于极度强关联的系统（如某些过渡金属配合物），HF 态本身可能与基态相距甚远。在这种情况下，单次评分选出的算符可能不再是全局最优的。论文在附录 A 中也坦诚：这种“单次得分”对于某些强关联系统可能表现欠佳，或许需要阶段性的重新评分。
算符协同效应缺失： 预筛选是针对单个算符进行的，忽略了算符之间的非交换性协同效应（Synergy）。有些算符单独作用时贡献小，但与其他算符配合时可能极大降低能量。ES-VQE 的贪心策略可能会漏掉这些组合。
测量精度要求： 即使是单次评估，测量小量的能量变化 $\Delta E_i$ 对量子硬件的采样误差（Shot Noise）非常敏感。在真实的噪声设备上，如何准确获取这些微小的评分是一个挑战。

5. 其他必要的补充

5.1 参数冻结 vs 全参数优化 (Appendix C)

论文中探讨了一个有趣的细节：在迭代增加算符时，是应该“重新优化所有参数”还是“只优化新加入的参数”？实验结果表明（如 Table II）：必须进行全参数重新优化。仅优化新参数（Single-parameter strategy）会导致系统陷入局部最优，甚至无法达到化学精度。这说明在 VQE 中，不同激发态参数之间存在深度的耦合关系，这种非线性是算法成功的关键。

5.2 周期性体系中的 ACSE-Im 残差问题

对于周期性体系，由于 Bloch 波函数的复数属性，标准的 UCCSD 往往无法完全消除“虚部残差”。本文采用的辅助算符池（Eq. 16 & 17）本质上是引入了额外的反对称算符来抵消虚数部分的偏差。这一技巧对于未来利用量子计算机研究超导材料、金属氧化物等具有重要参考价值。

5.3 工业意义：NISQ 时代的工程化思维

ES-VQE 反映了一种从“纯理论”向“工程可实现”的转变。通过牺牲一部分经典计算资源（进行评分和排序），换取昂贵的量子计算资源（线路深度和测量次数）的节省。这种“经典辅助量子”的混合思路是解决当前量子硬件局限性的主流范式。

对于科研人员来说，ES-VQE 提供了一个非常灵活的工具：你可以根据自己硬件的 CNOT 连通性和门保真度，动态调整阈值 $\epsilon_A$，在“算得准”和“能算出来”之间找到最佳平衡点。