簇自适应采样量子对角化 (CSQD)：破解强相关系统中的多构型恢复偏置

来源论文: https://arxiv.org/abs/2603.09346v1 生成时间: Mar 11, 2026 03:13

0. 执行摘要

在现代量子化学中，准确描述具有强相关（Strong Correlation）特征的电子结构系统（如过渡金属氧化物、超导体及多自由基物种）始终是一项核心挑战。传统的单参考方法（如 CCSD）在这些系统中往往失效，因为其波函数表现出内在的多构型（Multiconfigurational）特征。采样量子对角化（Sample-based Quantum Diagonalization, SQD）作为一种新兴的量子-经典混合算法，利用量子硬件作为构型采样器，显著扩展了变分空间的搜索能力。然而，SQD 在处理极其复杂的多峰分布波函数时，由于依赖单一的全局参考占据向量进行粒子数恢复（Particle-number Recovery），容易产生“均值偏置”，导致对低权重但关键的化学构型捕捉不足。

近期，Byeongyong Park 等人提出的**簇自适应采样量子对角化（Cluster-Adaptive SQD, CSQD）**通过引入非监督学习（如 BMM 或 k-modes）对量子采样得到的位串进行聚类，并针对每个簇采用自洽更新的局部参考向量。这种方法在 $N_2$ 解离过程及 $[2Fe-2S]$ 簇的基态能量计算中表现优异，相比传统 SQD，在强相关区域的能量估算精度提升了多达 45.53 mHa。本文将从理论基础、技术实现、实验数据及局限性等维度，深度解析这一突破性进展。

1. 核心科学问题，理论基础，技术难点，方法细节

1.1 强相关系统的挑战：从单参考到多构型

在量子化学的传统视野中，Hartree-Fock (HF) 和耦合簇理论 (CCSD) 建立在“电子主要占据单一参考态（Slater 行列式）”的假设之上。然而，当电子间的库仑相互作用与动能相当甚至占据主导时，系统会出现大量近简并的电子态。这种情况下，波函数不再能被单一构型描述，而是多个行列式的线性叠加。在动力学相关（Dynamical Correlation）之外，静态相关（Static Correlation）的引入使得单参考方法在拉伸化学键或描述过渡金属簇时表现出质的错误。

1.2 SQD 的基本逻辑与瓶颈

SQD 算法的核心思想是：量子处理器负责从复杂的波函数分布中“采样”出重要的行列式集 $\mathcal{V}$，随后在经典计算机上投影哈密顿量 $\hat{H}$ 并进行对角化。为了应对量子硬件的噪声（如位翻转错误导致的粒子数不守恒），SQD 引入了自洽粒子数恢复机制。它利用一个全局参考占据向量 $\mathbf{n}$（反映各轨道的平均占据数）来指导错误位串的修复。

技术难点：参考偏置（Reference Bias） 在强相关、多模态（Multimodal）状态下，系统的波函数分布可能有多个互不重叠的峰。如果仅使用一个全局平均的 $\mathbf{n}$，这个向量实际上是所有模态的混合平均值。利用它进行粒子数恢复，会强行将所有采样的构型拉向这个“平均模态”，从而稀释了特定模态的结构特征，导致生成的变分空间质量下降。这正是 CSQD 试图解决的核心痛点。

1.3 CSQD 的方法细节：簇自适应恢复

CSQD 通过以下流程实现了“模态感知”的对称性恢复：

单自旋串拆分与聚类 (Spin-string Splitting & Clustering)：将量子采样得到的 $2N_{MO}$ 位串拆分为 $\alpha$ 和 $\beta$ 分量。利用非监督学习算法（如伯努利混合模型 BMM 或针对类别数据的 k-modes），将海量的单自旋串划分为 $K$ 个簇。聚类的依据是构型的 Hamming 距离和经验频率权重。
簇特异性参考向量 (Cluster-specific Reference Vectors)：为每个簇 $k$ 分别定义参考占据向量 $\mathbf{n}^{(k)}$。在初始化阶段，$\mathbf{n}^{(k)}$ 是该簇内构型的加权占据平均；在后续迭代中，则通过变分计算得到的 CI 系数平方进行自洽更新。
簇局部恢复机制 (Local Recovery)：当采样的位串出现粒子数不守恒时，算法会根据所属簇的 $\mathbf{n}^{(k)}$ 计算各个轨道的翻转得分（Flip Score），利用修改后的 ReLU 权重函数指导比特翻转。这一步骤保证了恢复后的构型保留了该簇特有的占据模式。
变分对角化与批处理：从各个簇中按比例抽取构型构成共享池，构建对称化的乘积空间 $\mathcal{D} \times \mathcal{D}$。通过对投影哈密顿量进行 Davidson 迭代求解，获得当前的基态估算。CSQD 特别引入了 $B$ 个独立批次的处理，以减少采样随机性带来的能量涨落。

2. 关键 benchmark 体系，计算所得数据，性能数据

论文选择了两个极具代表性的体系来验证 CSQD 的优越性。所有实验均在 IBM 的 Heron 量子处理器（ibm_fez 和 ibm_torino）上完成。

2.1 $N_2$ 分子解离曲线 ($10e, 26o$ 活性空间)

氮气分子的解离是研究从弱相关（平衡位置）到强相关（拉伸位置）过渡的标准测试。活性空间设定为 26 个空间轨道和 10 个活性电子。

数据表现：
- 在平衡位置（$R < 1.5 R_e$），SQD 的表现略优于 CSQD（能量低约几个 mHa），这验证了在单参考主导区域，单一全局参考已足够高效。
- 在强相关区域（$R \ge 1.647 \text{\AA}$），CSQD 展现了压倒性优势。在 144 个测试用例中，CSQD 在 143 个用例里都给出了更低的变分能量。
- 最大能量降低：对于拉伸状态的 $N_2$，CSQD 将变分能量降低了高达 15.95 mHa。
物理分析：随着键长增加，RHF 权重的平方 $|c_{RHF}|^2$ 从 0.9 骤降至 0.1 以下，系统进入典型的多构型状态。CSQD 的聚类机制捕捉到了这些偏离平均场的占据模式。

2.2 $[2Fe-2S]$ 铁硫簇 ($30e, 20o$ 活性空间)

这是一个极具挑战性的强相关生物无机化学模型，具有密集的低能多构型流形。

数据表现（见论文 Table 1）：
- 设定变分空间维度 $\text{dim}(\mathcal{V}) = 4 \times 10^6$ 时，SQD 的能量为 -116.43666 $E_h$。
- 使用 BMM 模型 ($K=5$) 的 CSQD 能量达到 -116.48219 $E_h$。
- 能量降低：CSQD 在所有测试设置下均优于 SQD，能量降低幅度在 30.27 mHa 到 45.53 mHa 之间。
自洽收敛曲线：图 3a 展示了随着迭代进行，SQD 迅速陷入平台期，而 CSQD 能够持续发现更高质量的构型并降低能量。这表明簇特异性的参考向量在迭代中能不断优化，引导算法探索原本被全局平均偏置所掩盖的化学重要空间。

2.3 经典计算开销

虽然 CSQD 增加了聚类和局部恢复的步骤，但其经典计算的额外开销非常小：

在 $N_2$ 体系中，CSQD 的总运行时间仅比 SQD 增加 2.9% - 8.5%。
在 $[2Fe-2S]$ 体系中，CSQD 的时间消耗约为 SQD 的 1.42 倍。考虑到能量精度的显著提升，这种量级的开销增长在实际科研中是完全可以接受的。

3. 代码实现细节，复现指南，所用的软件包及开源 repo link

3.1 软件栈构成

CSQD 的实现依赖于现有的量子计算库与经典的电子结构计算工具：

Qiskit (2.2.3)：用于量子线路的构建、编译和在 IBM 量子后端上的执行。具体的 runtime 环境为 qiskit-ibm-runtime 0.44.0。
qiskit-addon-sqd (0.12.0)：作为 SQD 框架的基础支撑库，CSQD 在此基础上进行了模块化扩展。
PySCF (2.11.0)：负责经典部分的哈密顿量投影、Davidson 对角化以及活性空间积分计算。
StepMix (2.2.3)：用于实现伯努利混合模型 (BMM) 聚类。
kmodes (0.12.2)：用于实现基于类别属性的 k-modes 聚类算法。
ffsim：用于高效模拟和构建费米子量子线路（如 LUCJ ansatz）。

3.2 复现核心流程

研究人员如需复现 CSQD 的结果，可参考以下步骤：

第一阶段：采样与预处理
- 使用 LUCJ 线路（层数 $L=1$）在量子处理器上执行采样，总 Shot 数建议在 $3 \times 10^5$ 量级。
- 应用 Reset-mitigation：剔除初始状态非 $0\dots0$ 的样本。
- 将位串拆分为单自旋串并进行去重，统计频率权重。
第二阶段：初始化聚类
- 调用 stepmix 或 kmodes 对单自旋串进行聚类。论文建议 $K$ 取值在 2-5 之间。通常 BMM 在精度上略优于 k-modes。
第三阶段：自洽迭代 loop
- 根据公式 (16) 计算簇参考向量 $\mathbf{n}^{(k)}$。
- 执行局部粒子数恢复，修正错误位串。
- 构建子空间，并在对角化时加入自旋惩罚项 $\lambda = 0.1$ 以靶向单态（Singlet）。
- 判断能量及参考向量变化是否达到收敛阈值（如 $10^{-8} E_h$）。

3.3 开源资源

论文源代码：作者已在 AIQF Chem Lab Algorithms 发布了相关实现。
原始数据：实验数据托管于 Zenodo 仓库：https://doi.org/10.5281/zenodo.18899495。

4. 关键引用文献，以及你对这项工作局限性的评论

4.1 关键引用文献解析

[26] Robledo-Moreno et al. (2025)：SQD 的奠基性工作。CSQD 直接继承了其量子采样+经典对角化的框架，并将粒子数恢复步骤从全局改进为局部。
[18] Holmes et al. (2016)：关于热浴配置相互作用 (HCI) 的工作。HCI 为本文提供了高精度的经典基准，证明了 CSQD 在强相关区域接近确定性 FCI 极限的能力。
[53] Motta et al. (2021)：LUCJ ansatz 的来源。这种低深度线路设计使得在 NISQ 硬件上进行大规模采样成为可能。

4.2 工作局限性评论

尽管 CSQD 在强相关系统上取得了显著成功，但在实际应用中仍存在一些潜在局限：

簇数 $K$ 的选择策略：目前的 $K$ 值仍需手动指定或通过网格搜索确定。论文中提到能量提升并不总是随着 $K$ 的增加而单调提升。如何根据采样分布的信息熵或构型特征自动确定最优簇数，仍是一个开放问题。
弱相关区域的“精度惩罚”：实验观察到在 $N_2$ 平衡位置，CSQD 略逊于 SQD。这可能是由于过度聚类（Over-clustering）引入了额外的随机抽样噪声，或者导致了构型池的分散化。在实际工作中，可能需要一种动态切换机制，根据系统的 $|c_{RHF}|^2$ 指标决定是否开启聚类模式。
簇边界的硬分配问题：目前采用的是硬分配聚类。虽然论文通过“成员资格累积”部分软化了边界，但在处理极其平坦的概率分布时，边界附近的采样仍可能产生不稳定性。未来引入全软分配（Soft Membership）的贝叶斯框架或许能进一步增强鲁棒性。
硬件噪声的深层次干扰：虽然 CSQD 缓解了参考偏置，但它对量子硬件原始采样偏置（如某些门操作导致的特定构型缺失）仍没有完全的免疫力。它更像是一种“后期补救”而非“源头治理”。

5. 其他必要补充：硬件映射与误差缓解

为了让读者更全面地理解 CSQD 在真实量子计算机上的表现，以下补充两点技术细节：

5.1 量子线路的物理布局 (Hardware Mapping)

在 IBM 的重十六边形（Heavy-Hex）拓扑结构中，线路映射至关重要。图 4 展示了 $N_2$（52 量子比特）和 $[2Fe-2S]$（40 量子比特）的物理布局。为了降低门开销，作者采取了以下策略：

辅助比特利用：在 ibm_fez 上，除了 52 个用于轨道的量子比特外，还使用了 7 个辅助比特进行路由优化。这使得最终生成的 1,876 个两量子比特门能够以较低的保真度损失执行。
Jastrow 项限制：在构建 LUCJ ansatz 时，作者只保留了物理拓扑上相邻比特的交互项，极大缩减了电路深度，保证了在连通性受限的硬件上仍能高效采样。

5.2 误差缓解 (Error Mitigation) 栈

CSQD 的成功在很大程度上依赖于一套精密的误差缓解流程：

Dynamical Decoupling (DD)：使用 XpXm 序列抑制空闲比特的退相干。
Measurement Twirling：通过 32 次随机化消除读出误差的相干性。
Reset-Mitigation：这是核心。在准备态之前插入测量，只有当下电平确认为 $|0\dots0\rangle$ 时才进行实验，这排除了硬件复位不完全带来的本底噪声。

5.3 CSQD 的模块化潜力 (Composability)

CSQD 不仅仅是一个孤立的算法，它可以作为一种增强模块嵌入到更复杂的量子-经典流形中：

与激发态扩展结合：CSQD 可以为 Ext-SQD 提供更高质量的基态种子，从而改善激发态的描述。
作为 AFQMC 的试探波函数：在辅助场量子蒙特卡洛 (AFQMC) 中，CSQD 生成的多构型波函数可以显著降低相位偏置（Phaseless Bias），比单参考试探函数更具优势。

通过将非监督学习的“聚类思维”引入采样恢复过程，CSQD 为解决强相关电子结构问题提供了一种低成本、高收益的新范式，预示着基于采样的量子算法正在从“暴力采样”向“智能恢复”进发。