来源论文: https://arxiv.org/abs/2106.15210 生成时间: Feb 21, 2026 16:41

0. 执行摘要

在嘈杂中等规模量子(NISQ)时代,变分量子特征值求解器(VQE)被公认为量子化学模拟最有希望的突破口。然而,基于物理直觉的么正耦合簇(UCC)拟设(Ansatz)虽然精度极高,其线路深度(尤其是 CNOT 门数量)却往往超出了当前硬件的相干时间。例如,一个简单的 12 比特 LiH 分子的 UCCSD 拟设就需约 1600 个 CNOT 门。

本文深入探讨了华为 2012 实验室、中国科学技术大学及清华大学联合发表的研究成果。该工作提出了一种名为“能量排序”(Energy Sorting, ES)的策略(简称 ES-VQE)。其核心思想是在构造量子线路之前,先在经典计算机辅助下通过单次“预筛选”评估每个激发算符对 Hartree-Fock(HF)参考态能量的贡献,并据此进行降序排列。随后,通过迭代方式按重要性引入算符。实验证明,该方法在保持化学精度的前提下,能将算符数量减少 50% 至 98%。这不仅极大缩减了线路深度,还降低了参数优化的难度,为在近未来量子设备上模拟大规模化学体系铺平了道路。


1. 核心科学问题,理论基础,技术难点,方法细节

1.1 核心科学问题:精度与深度的两难困境

在量子化学模拟中,我们要解决的是电子 Hamilton 量的基态特征值问题:

$$\hat{H}\left|\Psi\right\rangle = E\left|\Psi\right\rangle$$

VQE 算法通过参数化拟设 $\left|\Psi(\theta)\right\rangle = U(\theta)\left|\Psi_0\right\rangle$ 来逼近基态。其中,拟设的选择决定了算法的成败。

目前存在两类主流拟设:

  1. 硬件高效型拟设(HHA): 结构简单,线路浅,但缺乏物理含义,容易陷入“贫瘠高原”现象。
  2. 物理启发型拟设(PMA): 以 UCCSD 为代表,精度高且遵循对称性,但算符池(Operator Pool)规模随轨道数 $N$ 呈 $O(N^4)$ 增长。对于较大的系统,这种线路深度几乎不可行。

ES-VQE 解决的根本问题是: 如何在不损失 UCCSD/UCCGSD 物理精度的前提下,识别并剔除那些对能量贡献微乎其微的“冗余”算符,从而极大地压缩线路?

1.2 理论基础:么正耦合簇与变分原理

UCC 理论通过指数映射将激发算符作用于 HF 参考态:

$$\left|\Psi_{UCC}\right\rangle = e^{\hat{T} - \hat{T}^\dagger} \left|\Psi_{HF}\right\rangle$$

其中 $\hat{T}$ 是簇算符,通常截断至单激发和双激发(UCCSD):

$$\hat{T} = \sum_{p,q} \theta_q^p a_p^\dagger a_q + \sum_{p,q,r,s} \theta_{rs}^{pq} a_p^\dagger a_q^\dagger a_r a_s$$

在量子电路上,由于指数算符互不交换,必须使用 Trotter-Suzuki 分解:

$$e^{\hat{A} + \hat{B}} \approx (e^{\hat{A}/n}e^{\hat{B}/n})^n$$

这导致了线路深度的激增。每一个费米子激发算符被映射到量子比特空间(通过 Jordan-Wigner 或 Bravyi-Kitaev 变换)后,会产生一系列 Pauli 字符串,对应的 CNOT 门链非常长。

1.3 技术难点:如何“聪明地”选择算符?

以往的改进方法如 ADAPT-VQE 使用梯度作为“重要性评分”:

$$s_i^{(k)} = |\langle \Psi^{(k-1)} | [\hat{H}, \hat{\tau}_i] | \Psi^{(k-1)} \rangle |$$

虽然有效,但 ADAPT-VQE 需要在每一个迭代步测量所有备选算符的梯度,这带来了巨大的测量开销。对于大算符池,测量成本往往抵消了线路深度缩减带来的收益。

1.4 ES-VQE 方法细节

ES-VQE 提出了一个更加直观且高效的“单次评估”策略。其具体算法流程如下:

  1. 初始化评分: 在 HF 参考态上,对算符池 $\mathcal{O}$ 中的每一个算符 $\hat{\tau}_i$ 进行独立的小型 VQE 优化。计算能量增益:

    $$\Delta E_i = E_i - E_{HF}$$

    其中 $E_i = \min_{\theta_i} \langle \Psi_{HF} | e^{-\theta_i \hat{\tau}_i} \hat{H} e^{\theta_i \hat{\tau}_i} | \Psi_{HF} \rangle$。 这是一个极浅的线路,因为只含有一个参数。

  2. 能量排序: 将所有 $\Delta E_i$ 按绝对值降序排列,形成一个排序后的列表 $\mathcal{E}$。这个列表定义了算符进入拟设的优先级。

  3. 算符池构建(第一步): 设定阈值 $\epsilon_A$。将所有满足 $|\Delta E_i| > \epsilon_A$ 的算符组合在一起,构建初始拟设。进行变分优化,更新所有参数。

  4. 迭代增长(后续步): 如果能量未达到收敛标准(如化学精度),则从排序表 $\mathcal{E}$ 中依次取出下一个算符加入拟设。重新优化所有参数。为了保证效率,引入了阈值 $\epsilon_B$ 来判断新加入算符的贡献是否显著。

  5. 收敛判定: 当连续两步能量差小于 $\epsilon_C$ 时,算法终止。

这种方法的优势在于:“先排序,后施工”。通过一次性的能量筛选,规避了 ADAPT-VQE 在每一步都进行全局搜索的昂贵成本。


2. 关键 Benchmark 体系,计算所得数据,性能数据

论文通过对不同分子体系和周期性系统的 Benchmark 验证了 ES-VQE 的稳健性。使用的基组为最小基组 STO-3G,参考标准为全构型相互作用(FCI)能量。

2.1 分子体系:H4, LiH, H6

H4 分子(拉伸过程)

  • 特点: 在长键长下具有强关联特性,是检验拟设有效性的典型模型。
  • 性能: ES-VQE-SD(基于 UCCSD 算符池)在整个势能面(PES)上成功保持了化学精度。在键长拉伸至 2.4 $\mathring{A}$ 时,相对于原始 UCCSD 算符池(14 个算符),ES-VQE 仅保留了约 50% 左右的算符,且误差依然在 $10^{-3}$ Hartree 以内。

LiH 分子(弱关联代表)

  • 性能数据: 这是一个令人惊讶的结果。对于 12 量子比特的 LiH,原本 UCCSD 算符池包含 44 个算符。ES-VQE-GSD(基于广义 UCC 算符池)在较短键长处仅需 1 个 主导算符即可接近化学精度。其算符压缩率高达 98%
  • 结论: 对于弱关联体系,绝大部分激发算符是不必要的。ES-VQE 能够精准捕捉到那 2% 的关键成分。

H6 链(强关联代表)

  • 挑战: 随着原子数增加,由于简并度提高,电子关联变得极其复杂。
  • 数据: ES-VQE 在 H6 系统中表现出比 ADAPT-VQE 更平滑的收敛曲线。在平衡键长附近,算符缩减率维持在 50% 以上。即便是面对强关联,通过选取能量贡献大的算符,其生成的 Trotter 序列往往比原始排序更具效率。

2.2 周期性系统:1D 氢原子链(H2-PBC)

这是该工作的一大亮点,因为它将 ES-VQE 扩展到了固体物理领域。模拟使用了 3 个 k 点(共 12 个量子比特)。

  • 技术细节: 对于周期性系统,波函数是复数。论文指出原始 UCC 拟设在处理复数波函数时存在残差误差(ACSE-Im 不为零)。为此,他们引入了辅助算符池(Eq. 16-17)来修正复数部分带来的误差。
  • 结果: ES-VQE-GSD 算法在 1D 氢链模拟中展现了极高的精度,将 240 个广义算符缩减到了约 20-50 个。这证明了能量排序策略同样适用于具有平移对称性的量子场论模型。

2.3 性能数据概览表(算符数量对比)

体系UCCSD 原始数量ES-VQE 优化后 (平均)压缩率
H4148~43%
LiH4420 (最高点) / 1 (最低点)55% - 98%
H65429~46%
H2-PBC240 (UCCGSD)25~90%

3. 代码实现细节,复现指南

3.1 软件包依赖

为了复现论文中的结果,研究者可以采用以下软件栈:

  1. PySCF: 用于经典电子结构计算。执行 Hartree-Fock(RHF/UHF)计算,提取一体和二体积分(h_{pq}h_{pqrs})。
  2. MindQuantum: 华为开源的量子计算框架。用于构建费米子算符、执行 Jordan-Wigner 变换以及线路模拟。
  3. SciPy.optimize (BFGS/L-BFGS-B): 用于经典参数优化过程。论文特别指出,使用 BFGS 算法并设定收敛准则 gtol=10^-7 a.u.。

3.2 关键实现逻辑

  1. 算符池生成:

    # 示例逻辑:生成UCCSD算符池
    def generate_uccsd_pool(n_qubits, n_electrons):
        # 识别占据轨道和虚轨道
        occ = range(n_electrons)
        vir = range(n_electrons, n_qubits)
        # 生成单激发、双激发算符列表
        # ... 转换为 (a_p^† a_q - a_q^† a_p) 形式
    
  2. 能量评分步骤(伪代码):

    scores = []
    for op in operator_pool:
        # 构造极简线路: exp(theta * op) |HF>
        # 优化 theta,计算 E_min
        delta_e = E_min - E_hf
        scores.append((op, delta_e))
    # 按 delta_e 绝对值降序排序
    sorted_pool = sorted(scores, key=lambda x: abs(x[1]), reverse=True)
    
  3. Trotter 顺序的重要性: 复现时需注意,算符在电路中的作用顺序会影响能量收敛。ES-VQE 的优势在于其排序天然提供了一个优化的 Trotter 序列,通常建议按照评分从高到低的顺序依次排列电路门。


4. 关键引用文献,以及对这项工作局限性的评论

4.1 关键引用文献

  1. VQE 原型工作: Peruzzo, A., et al. (2014). Nature Communications, 5, 4213. 定义了 VQE 的基本框架。
  2. ADAPT-VQE: Grimsley, H. R., et al. (2019). Nature Communications, 10, 3007. 本文的主要竞争对手和对比对象。
  3. UCCGSD 理论: Lee, J., et al. (2019). Journal of Chemical Theory and Computation, 15, 311-324. 扩展了算符池的范围。
  4. 周期性系统: Liu, J., et al. (2020). Journal of Chemical Theory and Computation, 16, 6904-6914. 奠定了 PBC-VQE 的基础。

4.2 局限性分析

尽管 ES-VQE 表现优异,但在实际科研应用中仍存在一些潜在局限性:

  1. 参考态依赖性: 评分是在 Hartree-Fock 态上进行的。对于极度强关联的系统(如某些过渡金属配合物),HF 态本身可能与基态相距甚远。在这种情况下,单次评分选出的算符可能不再是全局最优的。论文在附录 A 中也坦诚:这种“单次得分”对于某些强关联系统可能表现欠佳,或许需要阶段性的重新评分。
  2. 算符协同效应缺失: 预筛选是针对单个算符进行的,忽略了算符之间的非交换性协同效应(Synergy)。有些算符单独作用时贡献小,但与其他算符配合时可能极大降低能量。ES-VQE 的贪心策略可能会漏掉这些组合。
  3. 测量精度要求: 即使是单次评估,测量小量的能量变化 $\Delta E_i$ 对量子硬件的采样误差(Shot Noise)非常敏感。在真实的噪声设备上,如何准确获取这些微小的评分是一个挑战。

5. 其他必要的补充

5.1 参数冻结 vs 全参数优化 (Appendix C)

论文中探讨了一个有趣的细节:在迭代增加算符时,是应该“重新优化所有参数”还是“只优化新加入的参数”? 实验结果表明(如 Table II):必须进行全参数重新优化。仅优化新参数(Single-parameter strategy)会导致系统陷入局部最优,甚至无法达到化学精度。这说明在 VQE 中,不同激发态参数之间存在深度的耦合关系,这种非线性是算法成功的关键。

5.2 周期性体系中的 ACSE-Im 残差问题

对于周期性体系,由于 Bloch 波函数的复数属性,标准的 UCCSD 往往无法完全消除“虚部残差”。本文采用的辅助算符池(Eq. 16 & 17)本质上是引入了额外的反对称算符来抵消虚数部分的偏差。这一技巧对于未来利用量子计算机研究超导材料、金属氧化物等具有重要参考价值。

5.3 工业意义:NISQ 时代的工程化思维

ES-VQE 反映了一种从“纯理论”向“工程可实现”的转变。通过牺牲一部分经典计算资源(进行评分和排序),换取昂贵的量子计算资源(线路深度和测量次数)的节省。这种“经典辅助量子”的混合思路是解决当前量子硬件局限性的主流范式。

对于科研人员来说,ES-VQE 提供了一个非常灵活的工具:你可以根据自己硬件的 CNOT 连通性和门保真度,动态调整阈值 $\epsilon_A$,在“算得准”和“能算出来”之间找到最佳平衡点。