来源论文: https://arxiv.org/abs/2603.11197v1 生成时间: Mar 13, 2026 00:56

量子硬件上的辅助场量子蒙特卡罗：通过酉扩张实现门级动力学演化深度解析

0. 执行摘要

在强关联电子体系的模拟中，辅助场量子蒙特卡罗 (AFQMC) 是经典计算领域公认的最精确、最具扩展性的方法之一。然而，由于 AFQMC 涉及非酉算子的虚时投影和复杂的随机辅助场采样，如何将其高效地移植到量子硬件上一直是领域内的技术瓶颈。传统的尝试往往依赖于变分方法（如 VQE）或高强度的测量重构，难以充分利用 AFQMC 的数学优势。

Xiantao Li 在最新论文中提出了一种突破性的解决方案。该工作引入了基于酉扩张 (Unitary Dilation) 和 线性算子组合 (LCU) 的门级 AFQMC 实现方案。通过将非酉的一体传播子嵌入到更高维度的酉算子中，该算法能够在量子硬件上直接执行虚时投影动力学。核心创新点包括：使用二阶随机 Magnus 展开降低离散化误差、采用酉扩张技术消除对频繁中路测量的依赖，以及推导出一套适用于近阶设备的系统寄存器 LCU 方案。在 IBM 量子硬件上的测试结果证明了该方法在处理强关联 Hubbard 模型时的有效性，为量子化学模拟开辟了非变分、门级驱动的新路径。

1. 核心科学问题，理论基础，技术难点，方法细节

1.1 核心科学问题

量子化学的核心挑战在于求解多电子体系的基态。尽管量子相位估计算法 (QPE) 提供了渐进的优势，但其对逻辑门深度和物理比特的需求在当前含噪中型量子 (NISQ) 时代远不可及。AFQMC 在经典计算中通过 Hubbard-Stratonovich (HS) 变换将复杂的四体交互重写为随机场驱动的一体算子。虽然每个一体传播子都会将斯莱特行列式 (SD) 映射到另一个 SD，这与量子电路高度契合，但其非酉性 (Non-unitarity) 使得直接在量子硬件上模拟变得极其困难。如何在不引入灾难性采样成本或测量开销的情况下，在量子比特上实现这些非酉动力学，是本研究解决的核心科学问题。

1.2 理论基础：Feynman-Kac 与随机微分方程 (SDE)

AFQMC 的本质是虚时投影：$|\psi(\tau)\rangle = e^{-\tau(H-E_T)} |\psi_T\rangle$。作者通过 Feynman-Kac 公式将该投影转化为一个由随机场 $\Omega$ 驱动的一体传播子集合。通过 Stratonovich 积分，态向量的演化遵循随机微分方程：

$$d |\phi_t\rangle = \left[ -\hat{H}_1 dt + \sum_{\gamma=1}^m \sqrt{2} \hat{L}_\gamma \circ dW_\gamma(t) \right] |\phi_t\rangle$$

其中 $\hat{H}_1$ 包含动能项，$\hat{L}_\gamma$ 源于相互作用项的 HS 分解。这种表示法允许我们将整个轨迹看作一系列分段传播子的乘积。

1.3 技术难点：非酉算子的酉化

每个随机步的算子 $e^{\Omega_n}$ 通常是非酉的，且具有指数级增长的迹。传统的处理方式包括：

概率制备：通过后选择实现，成功率极低。
变分模拟：使用酉算子逼近非酉演化，存在非凸优化困境。
测量重构：如量子虚时演化 (QITE)，需要密集的局部层析成像。

1.4 方法细节：酉扩张与随机 Magnus 展开

为了克服上述难点，作者引入了两个关键技术：

A. 随机 Magnus 展开 (Stochastic Magnus Expansion) 传统的 Trotter 分解在步长较大时误差显著。作者采用了二阶随机 Magnus 展开 (Weak order-2 ME)，其生成元 $\Omega_n^{(2)}$ 不仅包含了一阶项，还包含了漂移项与噪声项的对易子 $[\hat{H}_1, \hat{L}_\gamma]$。由于一体算子的对易子仍是一体算子，这确保了演化过程始终保持在费米子高斯态 (Fermionic-Gaussian state) 流行上，从而可以使用 Givens 旋转高效编译。

B. 矩匹配酉扩张 (Moment-matching Unitary Dilation) 这是本文的精髓。作者构造了一个辅助空间 $\mathcal{H}_A$（由 $n_A$ 个辅助比特组成），并定义了一个扩张后的哈密顿量 $\tilde{H}_k = I_A \otimes H_k + (iF) \otimes K_k$。其中 $iF$ 是一个特殊的反对称算子（通常选为 1D 紧束缚链模型）。通过巧妙设计 $iF$ 的谱性质，可以在辅助空间的边界状态 $\langle l |$ 和 $| r \rangle$ 之间提取出非酉传播子：

$$e^{\Omega_k} \approx (\langle l | \otimes I) e^{-i \tilde{H}_k} (| r \rangle \otimes I)$$

这种方法通过增加少量辅助比特，实现了对非酉指数算子的超多项式精度逼近，且无需频繁测量，仅需在段末进行一次后选择。

C. LCU 系统方案 为了适配 NISQ 设备，作者进一步推导了 LCU 形式。通过对辅助生成元 $iF$ 进行谱分解，将扩张电路转化为多个纯系统电路的线性组合：

$$B_{seg} = \sum_{j=1}^{d_A} c_j U_{n,j} U_{n-1,j} \cdots U_{1,j}$$

这种方案完全消除了量子电路中的辅助比特，将硬件开销转移到了经典的随机采样和少量的电路求和上，显著降低了门深度。

2. 关键 benchmark 体系，计算所得数据，性能数据

2.1 测试体系：Hubbard Dimer

作者选择了半填充的二位点 Hubbard 模型（4 个自旋轨道）作为基准。参数设置为 $t=1, U=4$。该体系虽然简单，但具备强关联电子体系的典型特征，常用于验证量子算法的准确性。初始态设为 Hartree-Fock 态 $|1001\rangle$。

2.2 LCU 算子误差分析 (Figure 1)

数据展示了单步 LCU 逼近误差与辅助比特数 $n_A$ 的关系。实验发现：

当 $nA = 3$ 到 4 时，中值误差迅速降至 $10^{-3}$ 以下。
90% 分位数的误差也随之快速下降。这验证了矩匹配技术在较小辅助维度下即可达到高精度，证明了资源开销的可控性。

2.3 虚时投影能量演化 (Figure 2 & 3)

作者对比了一阶 (Magnus-1) 和二阶 (Magnus-2) 随机展开的性能：

二阶 Magnus 展开：在步长 $\tau \le 0.3$ 时，能量估算值与确切的虚时投影轨迹几乎重合。相比之下，一阶方案在相同步长下表现出明显的离散化偏置。
分段演化精度：Figure 3 验证了跨分段（segment）的传播。在虚时 $T \approx 0.6$ 范围内，混合估计值 (Mixed estimator) 紧随参考曲线，未出现分段边界带来的不连续现象或精度崩溃。

2.4 量子硬件执行数据 (Figure 4)

在 IBM-Boston 硬件上的实验参数：

规模：5 个逻辑比特，转译后使用 7 个物理比特。
复杂度：单电路中位深度为 271，中位两比特门 (CZ) 数量为 77。
样本数：40 条经典轨迹，每条电路 400 次 shot。
结果：IBM 硬件产生的数据点与状态向量模拟 (Statevector emulation) 在统计误差范围内保持一致。虽然由于硬件噪声存在较大的标准差，但成功捕获了虚时投影下降的能量趋势。这是目前量子硬件上实现的复杂度最高的非变分 AFQMC 门控模拟之一。

3. 代码实现细节，复现指南，所用的软件包及开源 repo link

3.1 核心算法实现流程

经典预处理：
- 对哈密顿量进行 HS 分解。使用 Cholesky 分解或密度耦合分解获得 $\hat{L}_\gamma$。
- 采样随机 Wiener 增量 $\Delta W_{\gamma, n}$ 和 Stratonovich 积分 $J_{0\gamma, n}$。
电路构造 (LCU 模式)：
- 根据 Magnus-2 公式计算每个时间步的一体生成元 $\Omega_n^{(2)}$。
- 利用谱分解获得 $c_j$ 系数和对应的系统传播子 $U_{k,j}$。
- 使用 Givens 旋转算法（如 qiskit.synthesis.FermionicGaussian）将一体算子序列编译为基础逻辑门。
量子执行：
- 在 Qiskit 等平台上提交作业。使用动力学去耦 (Dynamical Decoupling) 和 Pauli Twirling 等误差缓解技术。
数据后期处理：
- 结合经典采样权重和量子测量结果，计算混合估计值 $E_{mixed} = \langle \psi_T | H | \phi_S \rangle / \langle \psi_T | \phi_S \rangle$。

3.2 软件包建议

量子编程框架：Qiskit (用于 IBM 硬件对接和 Givens 旋转编译)。
数值计算：NumPy, SciPy (用于 Magnus 生成元的代数运算和 SDE 积分)。
状态向量模拟：Qiskit Aer (用于验证小规模体系的电路正确性)。

3.3 开源链接与引用说明

论文相关的核心算法逻辑基于以下基础：

酉扩张框架：参考 [Jin, Liu, Yu, Phys. Rev. Lett. 133, 230602 (2024)]。
Givens 旋转实现：可参考 Qiskit 的 FermionicGaussianState 实现。目前作者虽未直接提供完整的 End-to-end 仓库，但基于文中 Appendix A 的公式 (A2)-(A6) 可完整复现辅助算子 $iF$ 的矩阵表示。

4. 关键引用文献，以及你对这项工作局限性的评论

4.1 关键引用文献

Hubbard-Stratonovich 基础：Hubbard (1959), Stratonovich (1958)。这是 AFQMC 的数学基石。
量子虚时演化 (QITE)：Motta et al. (2020)。本文与其对比，强调了无需局部重构的门级优势。
酉扩张理论：Jin et al. (2024), Li (2025) [arXiv:2507.10285]。本文直接继承了这些近期的数学进展。
随机算法优化：Campbell (2019) 的 QDrift。本文通过 SDE 框架提供了不同于 QDrift 的投影采样路径。

4.2 局限性评论

LCU 的范数开销：随着虚时演化长度增加，LCU 的 $\ell_1$ 范数可能会增长，导致采样成功率下降或方差增加。虽然文中证明了在常数成功率范围内的效率，但对于极大体系，这可能成为瓶颈。
符号问题 (Sign Problem)：本方案在量子硬件上表现为“成功概率”或“估计值方差”的退化。量子资源虽然提供了更精确的演化，但并没有从底层数学上消除费米子符号问题。作者在文末也承认，量子资源能否实质性缓解符号问题的严峻性仍是待解之题。
硬件深度限制：即便使用了 LCU 减深度，Figure 4 中接近 300 的深度对于当前的 NISQ 硬件仍然非常有挑战，这也是硬件测试结果误差较大的主因。

5. 其他必要补充：对比与前景

5.1 与 VQE 的对比

VQE 是目前 NISQ 领域最主流的方法，但它面临巨大的障碍：

贫瘠高原 (Barren Plateaus)：大体系梯度消失。
Ansatz 限制：电路表达能力不足会导致系统误差。 本文方案是“非变分”的。只要步长够小、辅助比特够多，它就能收敛到真实的投影路径。这类似于经典 AFQMC 对比变分蒙特卡罗 (VMC) 的优势。

5.2 对未来算法的影响

本工作建立了一个“量子原生 AFQMC”框架。未来的改进方向可能包括：

相位固定 (Phaseless) 技巧：在量子线路上引入约束路径，以缓解复数相位的漂移。
有限温度模拟：通过 Feynman-Kac 表示的热态演化，将该框架扩展到吉布斯态的准备。
量子加速的重叠估算：利用该框架高效计算 $|\phi_t\rangle$ 与试探态之间的重叠，这在经典 AFQMC 中是最耗时的步骤之一。

5.3 结论

这项工作成功地将具有几十年历史的 AFQMC 投影理论通过“酉扩张”这一现代量子算法工具进行了重构。它不仅填补了门级 AFQMC 实操的空白，也为如何在没有变分优化的条件下，利用近期量子硬件解决化学复杂性问题提供了清晰的蓝图。