资源高效型量子算法：基于构型相互作用矩阵（CIM）框架的子空间对角化深度解析

来源论文: https://arxiv.org/abs/2603.13160v1 生成时间: Mar 15, 2026 23:37

0. 执行摘要

在嘈杂中等规模量子（NISQ）时代，量子计算在电子结构理论中的应用面临着量子比特数量受限与相干时间短的双重挑战。传统的变分量子特征求解器（VQE）虽备受关注，却饱受贫瘠高原（Barren Plateaus）和非变分界限误差的困扰。本文深度解析了一项具有里程碑意义的工作：基于构型相互作用矩阵（CI-Matrix, CIM）框架的量子选择构型相互作用算法（QSCI）及其增强版 QSHCI。

该研究的核心贡献在于打破了传统二量子化（Fock 空间）映射的资源浪费，将所需量子比特数优化至对数级别 $\lceil \log_2(N_{CSF}) \rceil$。通过引入随机近似 Trotter 演化（基于 qDRIFT）和一种新颖的单比特翻转错误缓解（Error Mitigation）方案，该算法在 Rigetti Ankaa-3 等超导量子硬件上成功模拟了 $N_2$ 分子与萘分子的基态能量。结果表明，CIM-QSCI 在资源消耗显著低于现有方法（如 LUCJ-SQD）的前提下，能够达到相近甚至更高的精度。此外，本文提出的 QSHCI 变体通过量子采样改进了经典热浴 CI（HCI）的选择准则，为在近端量子设备上实现超越经典算法的化学模拟开辟了新路径。

1. 核心科学问题，理论基础，技术难点，方法细节

1.1 核心科学问题：量子比特资源的效率瓶颈

量子化学模拟的核心是求解电子哈密顿量的特征值问题。然而，随着基组大小和电子数量的增加，希尔伯特空间呈指数级增长。传统的量子算法（如量子相位估计 QPE）需要极深的电路，而 NISQ 算法（如 VQE）通常采用二量子化编码（如 Jordan-Wigner 变换），所需的量子比特数与轨道数 $N_{orb}$ 成线性关系。对于大型分子，这种线性增长依然超出了当前硬件的能力。QSCI 算法通过采样减少哈密顿量的维度，但其在二量子化框架下的实现仍不尽如人意。本工作的核心目标是：如何通过第一量子化表示进一步压缩量子资源需求？

1.2 理论基础：CI-Matrix (CIM) 框架

该工作的理论基石是**构型相互作用矩阵（CIM）**表示。与直接在 Fock 空间操作不同，CIM 框架在选定的构型态函数（CSF）基底上构建哈密顿矩阵。其优势在于：

最优比特缩放：所需量子比特数仅为 $q = \lceil \log_2(N_{CSF}) \rceil$。这意味着对于包含 100 万个构型的空间，仅需 20 个量子比特，而二量子化可能需要数百个。
对称性集成：在构建 CIM 时，可以预先筛选满足特定点群对称性（如 $D_{2h}$）和自旋对称性的 CSF，从而直接在感兴趣的对称性子空间内工作，避免了量子程序在无效空间中的搜索。

1.3 技术难点：哈密顿量的 Pauli 分解与演化

将 CIM 映射到量子硬件涉及两个关键难点：

算符分解效率：将大型 $N \times N$ 矩阵分解为 Pauli 算子乘积通常具有极高的复杂度。本文采用了快速沃尔什-阿达马变换（FWHT），其复杂度为 $O(N^2 \log N)$。虽然这在经典预处理上存在开销，但对于稀疏的 CIM 矩阵，这是目前已知最高效的分解方案。
电路深度压缩：完全的 Trotter 演化会导致电路深度超过硬件相干极限。本工作引入了qDRIFT 随机编译技术，通过按概率采样哈密顿项来截断 Lie-Trotter 序列，从而生成极短的量子电路。

1.4 方法细节：从 CIM-QSCI 到 CIM-QSHCI

CIM-QSCI 流程：

预处理：经典计算一电子和二电子积分，通过 Slater-Condon 规则构造 CIM 矩阵元素 $H_{ij}$。
量子化：使用 FWHT 将 CIM 分解为 Pauli 串 $H_q = \sum \alpha_{r,s} P_{r,s}$。
近似演化（AE）：从 Hartree-Fock 态出发，执行近似 qDRIFT 演化 $|\Psi\rangle = e^{-iHt} |\Phi\rangle$。
采样与后处理：在计算基下测量，获取高频出现的构型比特串，构建经典子空间哈密顿量并对角化。

CIM-QSHCI 增强方案： 为了解决 QSCI 在处理强相关体系时采样效率不足的问题，作者借鉴了经典热浴 CI (HCI) 的思想。HCI 使用准则 $|H_{ki} c_i| > \epsilon$ 来决定是否将构型 $k$ 加入子空间。QSHCI 则将其修改为基于量子采样概率 $P_k$ 的动态准则：

$$ |H_{ki} c_i| > \frac{\sqrt{P_k}}{v} $$

其中 $v$ 是用户定义的方差因子。这种方法利用量子计算机提供关于波函数分布的“启发式”信息，从而更智能地扩展子空间。

2. 关键 benchmark 体系，计算所得数据，性能数据

2.1 氮分子 ($N_2$) 的势能曲线模拟

$N_2$ 是量子化学中公认的难题，其三键断裂过程涉及极强的静态相关性。

体系配置：cc-pVDZ 基组，(10,10) 和 (10,12) 活性空间。
模拟结果：在模拟器上，CIM-QSCI (80% 子空间) 的能量曲线与精确对角化（Full CI）高度吻合。相比之下，CCSD 方法在键长超过 1.8 Å 后出现显著偏差且无法收敛。
硬件表现：在 Rigetti Ankaa-3 硬件上，即使存在噪声，通过错误缓解后的 CIM-QSCI 平均误差在 0.0016 Hartree（化学精度）左右。随着子空间大小从 40% 增加到 80%，硬件测得的误差显著下降，验证了算法的稳健性。

2.2 萘分子 (Naphthalene) 的资源优势

对于较大的多环芳烃分子，量子比特的节省尤为突出。

活性空间：(10,10)，对应 7,992 个 singlet $A_g$ 构型。
比特数对比：
- LUCJ-SQD (二量子化): 需 20 个量子比特。
- CIM-QSCI: 仅需 14 个量子比特（$\lceil \log_2(7992) \rceil = 13$，加 1 个纠错比特）。
闸操作数 (Gate Count)：
- SqDRIFT 方法需要 5 倍于 CIM-QSCI 的电路深度才能达到同等精度。这是因为 CIM 框架天然剔除了非物理对称性的状态，量子演化仅在有效希尔伯特空间内进行。

2.3 QSHCI 的收敛性能

QSHCI 展示了在极小子空间下捕获相关能的能力。数据表明，QSHCI 仅需全空间的 1.5% 到 10.5% 即可达到与 80% 子空间规模的 QSCI 相同的精度。通过设置方差因子 $v=100.0$，其能量误差比标准 QSCI 降低了一个数量级，证明了“量子启发式热浴采样”的优越性。

3. 代码实现细节，复现指南，所用的软件包及开源 repo link

3.1 软件包栈

该工作的复现依赖于以下核心组件：

Psi4 [39]：用于进行经典的 Hartree-Fock 计算，提取分子轨道积分（一体和二体积分）。
PyCI [40]：一个 Python 脚本库，用于构建任意行列式的 CI 矩阵。作者利用其生成 CIM 的矩阵元素。
pauli_lcu [27]：基于快速沃尔什-阿达马变换的 Pauli 分解库，用于将 CIM 映射为量子门序列。
Qiskit / AWS Braket：用于构建量子电路。模拟使用 AerSimulator (带 IBM FakeMarrakesh 噪声模型)，硬件运行通过 AWS Braket 访问 Rigetti Ankaa-3。

3.2 复现指南步骤

积分提取：使用 Psi4 定义分子几何结构和基组，执行 RHF 计算并导出积分。
CIM 构造：调用 PyCI，根据选定的活性空间和点群对称性（如 $D_{2h}$）筛选 CSF，生成 $H_{ij}$ 矩阵。建议初次复现时使用单精度以节省显存。
Pauli 映射：应用 pauli_lcu 中的 fwht 函数将 $H_{ij}$ 转换为 Pauli 字符串集合。记录每个项的系数 $\alpha_{r,s}$。
电路生成：实现截断的 qDRIFT 演化。根据公式 $n_a = 2\lambda t^2$ 计算需要保留的 Pauli 项数量，并构建随机量子电路。
纠错配置：在 bitstring 编码中加入奇偶校验位（Parity bit），确保所有物理态的汉明重量符合特定奇偶性。
经典对角化：收集 QPU 返回的 bitstring，根据出现频率排序，构建子空间矩阵，使用 Lanczos 方法求解最小特征值。

3.3 开源资源 link

Psi4: https://psicode.org/
PyCI: https://github.com/mricher/PyCI
Qiskit: https://qiskit.org/
相关算法库: 参考原论文引用 [27] 中的 pauli_lcu 仓库（通常可在 GitHub 的作者主页找到）。

4. 关键引用文献，以及你对这项工作局限性的评论

4.1 关键引用文献

[14] Kanno et al. (2023): 提出了原始的 QSCI 算法，奠定了子空间采样的基础。
[28] Campbell (2019): 提出了 qDRIFT 随机编译算法，是本工作中近似演化的核心。
[29] Holmes et al. (2016): 经典热浴 CI (HCI) 的开创性工作，为 QSHCI 提供了理论模板。
[25] Toloui & Love (2013): 首次探讨了 CI 矩阵的稀疏性及其在量子算法中的潜力。

4.2 局限性评论

尽管该工作在资源效率上取得了突破，但仍存在以下局限：

经典预处理瓶颈：FWHT 虽然是 $O(N^2 \log N)$，但对于极大型分子（$N > 10^7$），构建完整的 CIM 并进行 Pauli 分解在经典计算机上依然非常吃力。这限制了该算法向超大规模体系的直接扩展。
矩阵密度敏感性：如果 CIM 矩阵非常稠密，采样效率会大幅下降。Slater-Condon 规则虽保证了矩阵的稀疏性（最多双激发），但在大基组下非零项依然可观。
噪声缓解的局限：目前的单比特翻转纠错仅能处理单一比特错误。在硬件噪声复杂的环境下（如两比特门错误、退相干），这种简单的后选择方案可能不足以维持高化学精度。
初态依赖：算法依赖于 Hartree-Fock 态与真实基态的重叠。对于极强相关的体系（如金属多核中心），可能需要更复杂的初始态准备。

5. 其他必要补充：错误缓解与量子硬件调优

5.1 深入解析单比特翻转错误缓解 (Bit-flip Mitigation)

本文的一大亮点是针对 CIM 框架设计的纠错方案。在二量子化中，我们可以通过监测电子数守恒来纠错。但在 CIM 框架中，比特串直接代表 CSF 的索引，没有直观的物理量守恒。作者通过增加一位纠错比特，使所有合法的 CSF 索引对应的比特串具有相同的奇偶性（汉明距离为 2 的倍数）。

实验验证：在使用 FakeMarrakesh 噪声模型的测试中，该方案将采样分布与理想分布的余弦相似度从 0.58 提升至 0.62。更重要的是，它允许“纠正”而非仅仅是“丢弃”错误。如果测得一个非法比特串（汉明距离为 1），可以将其归类为距离最近的合法高频比特串。这种“恢复”机制显著提高了量子样本的利用率。

5.2 近似转译 (Approximate Transpilation) 的艺术

在 Rigetti 硬件上运行时，原始电路往往过深。作者引入了近似度 (AD) 参数。通过将 AD 设置为 0.5，电路被强制压缩，虽然牺牲了一定的数学严谨性，但却因为减少了量子门总数，从而降低了累积的硬件噪声误差。实验结果显示，AD=0.5 的硬件运行结果反而比 AD=1.0 更接近准确值。这揭示了 NISQ 计算的一个核心悖论：有时更不精确的电路逻辑由于其物理操作更少，反而能给出更精确的物理结果。

5.3 未来展望：算符访问模型 (Operator Access Models)

作者在展望中提到，未来的改进方向是采用更高效的哈密顿算符访问模型。目前的 FWHT 是对矩阵的整体操作，如果能结合类似 Block-Encoding 或稀疏矩阵采样技术，直接在量子电路中“即时”生成矩阵元素，将有望规避 $O(N^2)$ 的经典预处理成本。这将使 CIM-QSCI 真正具备在百量子比特规模上挑战经典 FCI 的潜力。