迈向化学精度与可扩展量子模拟：基于 IQM 硬件的量子-HPC 混合方法深度解析

来源论文: https://arxiv.org/abs/2604.01983v1 生成时间: Apr 03, 2026 03:39

0. 执行摘要

在量子计算迈向实用化的进程中，量子化学始终被视为最具潜力的应用领域。然而，如何在现有的含噪声中等规模量子（NISQ）设备上实现具有化学精度的分子性质预测，并将其扩展至具有生物学或药理学意义的大规模体系，仍然是一个巨大的挑战。近日，由来自 Qclairvoyance Quantum Labs 等机构的研究团队在 IQM Sirius 24位超导量子处理器上，通过量子-HPC（高性能计算）混合方法，实现了目前最全面的实验演示之一。该研究不仅成功计算了多种基准分子的基态能量，还首次在超导量子硬件上生成了水分子完整的二维位势能面（2D-PES），并结合密度矩阵嵌入理论（DMET）对药理学相关的金刚烷胺（Amantadine）分子进行了高精度模拟。这项工作标志着采样量子对角化（SQD）算法在真实硬件上的鲁棒性得到了有力验证，并为未来实现 classically intractable 的分子模拟铺平了道路。

1. 核心科学问题，理论基础，技术难点与方法细节

1.1 核心科学问题：维数灾难与 NISQ 时代的权衡

量子化学的核心在于求解非相对论性时间无关的薛定谔方程。然而，由于电子关联效应的复杂性，体系的希尔伯特空间随活性电子和轨道数量呈指数级增长，这即是著名的“维数灾难”。传统的全配置相互作用（FCI）方法虽然能给出精确解，但其计算成本仅限于极小体系。尽管 CCSD(T) 等后哈特里-福克（Post-HF）方法被誉为“金标准”，但在处理强关联体系或大规模生物分子时仍力不从心。量子计算利用量子叠加和纠缠特性，理论上能以多项式量级的资源表示指数级的波函数，提供潜在的指数加速。然而，当前的 NISQ 设备存在相干时间短、门保真度有限以及变分量子本征求解器（VQE）面临的“贫瘠高原”和测量开销巨大等难题。如何在有限的硬件资源下，既保证精度又实现可扩展性，是本项目试图解决的核心科学问题。

1.2 理论基础：采样量子对角化（SQD）与拟设选择

本研究采用了采样量子对角化（Sample-based Quantum Diagonalization, SQD）范式。不同于 VQE 需要在量子硬件上频繁优化变分参数，SQD 将量子处理器（QPU）纯粹用作波函数采样器。其理论基础在于：利用 QPU 从一个精心设计的试探态波函数中识别出高权重的 Slater 行列式，然后在由这些选定行列式构成的压缩子空间内，通过经典的计算资源对哈密顿量进行对角化。这种方法天然具有噪声鲁棒性，因为能量的解析是在经典端通过确定的对角化过程完成的，只要量子采样能覆盖关键的物理配置，就能在变分界之上获得极高的精度。

研究对比了两种关键的量子拟设（Ansatz）：

局部单元簇积 Jastrow（LUCJ）拟设：这是一种受哈伯德模型启发的、硬件高效型拟设。它由多层轨道旋转算符和 Jastrow 关联算符交替构成。LUCJ 的优势在于利用了电子关联的局部性特征，其量子电路深度随轨道数呈 $O(N^2)$ 标度，非常适合近期的量子硬件。本研究通过经典的 CCSD 振幅初始化 LUCJ 参数，极大地减少了硬件上的变分压力。
线性 CNOT 单元耦合簇单双激发（LCNot-UCCSD）拟设：传统的 UCCSD 在 Jordan-Wigner 变换后会产生冗长的 CNOT 梯形电路。LCNot-UCCSD 通过重新阐释量子比特激发算符，移除部分宇称控制链路，将 CNOT 门数量从指数增长降低到线性增长，从而在保留化学直觉的同时缩短电路深度。其参数使用 MP2 级初始化，减少了经典预计算负担。

1.3 技术难点：配置恢复与对称性维护

在真实的 QPU 采样过程中，硬件噪声会导致采样的比特串（Bitstrings）违反物理对称性（如粒子数不守恒或自旋不匹配）。这是 SQD 在硬件上落地的主要技术瓶颈。研究团队引入了“对称性感知配置恢复（CR）”技术。该技术利用有效采样的统计规律或平均场估计，概率性地将损坏的比特串修正为符合对称性的物理配置。通过 10 次自洽循环迭代，不断优化子空间的选择，从而在低采样率和高噪声环境下提取出有效的化学信息。

1.4 密度矩阵嵌入理论（DMET）的可扩展实现

为了解决大分子模拟的规模问题，本研究引入了 DMET 嵌入框架。其基本思想是将大分子划分为多个“碎片”（Fragment），每个碎片与其周围的“环境”（Bath）构成一个小的杂质体系。通过 Schmidt 分解，可以将无限或大型的环境简化为与碎片维度相等的 bath 轨道。这种方法实现了能量的尺寸一致性划分，并将整体问题的复杂度降低到 16 量子比特以内的杂质问题，使得在 24 位 IQM 处理器上并行或串行处理复杂分子（如金刚烷胺）成为可能。

2. 关键基准体系，计算所得数据与性能分析

2.1 小型分子的化学精度验证

研究团队首先在 $H_2, LiH, BeH_2, H_2O, NH_3$ 等经典基准分子上验证了 SQD(LUCJ) 和 SQD(LCNot-UCCSD) 的表现。对于 $H_2, LiH$ 和 $BeH_2$，在 STO-3G 基组下，SQD 成功找回了 FCI 级的基态能量，误差保持在 $10^{-6}$ Hartree 以内，远低于 $1.6\times10^{-3}$ Hartree 的化学精度阈值。值得注意的是，对于 $BeH_2$ 这种在键解离过程中具有显著多参考特征的体系，SQD 表现出了极强的修正能力，完美补足了单参考 CCSD 在解离区的失效（其误差在拉伸区域高达 $10^{-2}$ Ha，而 SQD 保持了亚纳 Hartree 精度）。

2.2 全实验 2D-PES 扫描：水分子的能量景观图

这是本研究的一大亮点。团队在 IQM Sirius 硬件上完成了一个 $32\times32$（共 1024 个几何点）的 $H_2O$ 位势能面扫描。每个点都涉及 QPU 采样、配置恢复和经典对角化。数据表明，在非限制采样模式下（$\epsilon_s = 10^8$），实验生成的位势能面极其平滑，其能量极小点定位在 $r_{min}=1.03$ Å, $\theta_{min}=96.61^\circ$，与理论精确值几乎完全吻合。即使在限制子空间维度的极端情况下（$\epsilon_s = 21$），虽然能面出现了一定的随机波动（由于采样统计涨落引起的子空间不完备），但整体拓扑结构依然稳固，证明了 SQD 在捕捉全局几何能量演变方面的卓越能力。

2.3 药理学体系：金刚烷胺与 11 个分段的 DMET 模拟

对于包含 11 个重原子的金刚烷胺分子，如果直接进行全配置计算，需要 144 个量子比特，这在目前是无法实现的。通过 DMET 策略，研究者将其划分为 11 个碎片，每个碎片经过活性空间裁剪后仅需 16 个量子比特。实验测得的金刚烷胺能量为 -438.09785054 Hartree。与经典 DMET-CASCI 参考值相比，当采样次数达到 1000 次以上时，误差即进入微 Hartree 量级。这一结果证明了量子-HPC 混合方法在处理中等规模药物分子时的实用化潜力。

2.4 硬件性能评估

在 24 位 IQM Sirius 处理器上，研究团队利用了星形拓扑结构。所有 16 个活跃量子比特通过中央谐振器实现“全对全”连接。实验记录的 $T_1$ 时间平均为 28.69 $\mu s$，$T_2^*$ 为 17.11 $\mu s$。尽管硬件环境存在噪声（如 QB13 和 QB15 的性能稍弱），但 SQD 算法通过配置恢复有效地过滤了噪声。在电路深度方面，LUCJ 表现出极高的效率，对于 $NH_3$ 体系，门总数 $G_T$ 为 1898，而同等精度下的 LCNot-UCCSD 门数高达 33466，电路深度增加了 17 倍。这也直接导致了 LCNot-UCCSD 在 $H_2O$ 和 $NH_3$ 等较大体系中因噪声干扰未能成功回传有效采样，确立了 LUCJ 在 NISQ 硬件上的优越性。

3. 代码实现细节，复现指南与软件包

3.1 软件栈架构

该项目的复现依赖于一套高度集成的 Python 软件生态：

量子电路管理：使用 Qiskit v1.4.2 进行电路构建与转译（Transpilation）。
后端访问：通过 iqm-client v32.1.1 接入 IQM 的云端量子算力池服务。
拟设构建：LUCJ 拟设的构建主要依赖于 ffsim v0.0.56，这是一个专为费米子模拟设计的快速仿真与拟设生成工具。对于 LCNot-UCCSD，研究者编写了自定义的 CNOT-ladder 分解逻辑。
算法框架：采样后的后处理层使用 qiskit-addon-sqd v0.10.0，负责执行配置恢复和经典的子空间哈密顿量对角化。
量子化学计算：基组积分生成、RHF、CCSD 和 FCI 参考值计算全部通过 PySCF v2.11.0 完成。
数值加速：矩阵运算使用了 NumPy v2.3.5 和 SciPy 1.15.3，部分底层操作使用了 JAX v0.8.1 以提供 GPU 或 TPU 级的向量化加速。

3.2 复现步骤指南

初始化环境：安装上述版本的 Python 库。获取 IQM 算力池的 API Key。
体系预处理：使用 PySCF 确定分子几何，调用 scf.RHF 获取分子轨道积分。运行一次经典 CCSD 得到耦合簇振幅 $t_1, t_2$。
拟设生成：将 $t_1, t_2$ 振幅映射到 ffsim 的 LUCJ 模板中，生成量子电路。确保量子比特映射符合 IQM Sirius 的星形拓扑（Star 24）。
QPU 采样：调用 execute 方法提交任务，设置 shots=10,000。由于 IQM Sirius 是基于云的任务队列，建议设置 inter-run sleep 间隔。
配置恢复与对角化：将回传的比特串字典输入 SQD 循环。第一轮不使用平均轨道占据数（$n=None$），从第二轮开始利用前一轮对角化得到的密度矩阵更新 $n$，进行 10 次自洽迭代。最终选取最小能量输出。

3.3 开源资源链接

本研究所使用的全部原始数据集已在 Zenodo 仓库公开存储。科研工作者可以访问以下 DOI 进行检索：

数据归档：[DOI: 10.5281/zenodo.19185862]
核心算法参考：研究中频繁引用的 qiskit-addon-sqd 可在 GitHub 找到官方开源仓库。

4. 关键引用文献与局限性评论

4.1 关键参考文献

SQD 算法基础：Robledo-Moreno, J. et al. “Chemistry beyond the scale of exact diagonalization on a quantum-centric supercomputer.” Sci. Adv. (2025). 该文奠定了 SQD 算法在大规模科学计算中的基础。
DMET 嵌入理论：Knizia, G. & Chan, G. K.-L. “Density matrix embedding: A simple alternative to dynamical mean-field theory.” Phys. Rev. Lett. (2012). 本文所使用的嵌入方法的核心理论来源。
LUCJ 拟设：Motta, M. et al. “Bridging physical intuition and hardware efficiency for correlated electronic states.” Chem. Sci. (2023). 详细描述了局部单元簇积拟设的数学构造。
IQM 硬件定义：IQM Client API 官方文档及相关硬件校准报告。提供了 24 位 Sirius 芯片的技术指标。

4.2 局限性与工作评论

尽管本研究取得了令人印象深刻的成果，但在通往通用量子优势的道路上仍存在几点局限性：

对经典预计算的依赖：LUCJ 拟设的高度准确性很大程度上归功于 CCSD 振幅的初始化。这意味着对于经典 CCSD 完全失效的强关联体系（如某些金属配合物），简单的振幅初始化可能不足以捕捉到正确的物理基态。未来的改进方向应包括开发更具自适应能力的参数演化策略。
LCNot-UCCSD 的深度难题：实验表明，即使是线性标度的 CNOT 拟设，在 $N=14$ 及以上的体系中依然会因为电路深度超过 QPU 的相干极限而导致采样失败。这说明，在 NISQ 设备上，算法的“理论标度”与“实际可用性”之间仍存在巨大的鸿沟。
采样效率的瓶颈：随着希尔伯特空间的增大，发现新的重要行列式变得指数级困难。虽然本研究使用了配置恢复技术，但在面对极大规模体系时，如何确保有限次数的采样能捕获到对总能量贡献最大的配置，依然是一个待解决的统计学难题。

5. 其他必要补充：量子-HPC 混合计算的未来

5.1 量子硬件拓扑的优势

IQM Sirius 的星形拓扑（STAR 24）在此项工作中发挥了关键作用。传统的网格拓扑（Grid Topology）在实现长程轨道关联时通常需要大量的 SWAP 门，这会迅速消耗相干时间。而通过中央谐振器（COMPR1）实现的 hub-and-spoke 连接，使得任何量子比特对之间的交互门（CZ）都具有极短的路径长度，极大地提高了 LUCJ 这种涉及多轨道旋转算符的算法效率。

5.2 误差消减的层级性

本研究展示了一种分层的误差消减策略：

硬件层：通过 DRAG 余弦脉冲等底层控制优化门保真度。
算法层：通过 SQD 将能量求解转移到经典端，规避门演化过程中的相位噪声对能量数值的直接干扰。
对称性层：配置恢复（CR）强制对比特串进行物理法则的约束。这种多层防护体系是当前超导量子计算机能够处理“化学复杂性”的核心秘诀。

5.3 从 1D 到 2D 的飞跃

相比于一维 PES 扫描，二维能面的生成不仅仅是工作量的叠加，它还验证了算法在处理多维度几何畸变（如键角弯曲与键长伸缩同时发生）时的鲁棒性。这对于计算化学家理解过渡态、反应路径以及力场参数化具有深远的实践价值。研究中所生成的 1024 个数据点构成了一幅精细的能量景观图，这预示着量子计算正在从“原理验证”转向“生产级模拟”。

5.4 未来展望：走向真正的量子优势

随着 IQM 下一代更高保真度 QPU 的推出，以及类似于“半量子比特”（Half-qubit）架构和“纠缠锻造”（Entanglement Forging）等新技术的整合，我们有望在未来 3-5 年内看到量子-HPC 混合平台解决经典的超级计算机都无法处理的蛋白质-配体相互作用问题。本项工作确立的基准和方法论，无疑是这一壮阔征程中的重要基石。