来源论文: https://arxiv.org/abs/2604.01983v1 生成时间: Apr 03, 2026 03:39
0. 执行摘要
在量子计算迈向实用化的进程中,量子化学始终被视为最具潜力的应用领域。然而,如何在现有的含噪声中等规模量子(NISQ)设备上实现具有化学精度的分子性质预测,并将其扩展至具有生物学或药理学意义的大规模体系,仍然是一个巨大的挑战。近日,由来自 Qclairvoyance Quantum Labs 等机构的研究团队在 IQM Sirius 24位超导量子处理器上,通过量子-HPC(高性能计算)混合方法,实现了目前最全面的实验演示之一。该研究不仅成功计算了多种基准分子的基态能量,还首次在超导量子硬件上生成了水分子完整的二维位势能面(2D-PES),并结合密度矩阵嵌入理论(DMET)对药理学相关的金刚烷胺(Amantadine)分子进行了高精度模拟。这项工作标志着采样量子对角化(SQD)算法在真实硬件上的鲁棒性得到了有力验证,并为未来实现 classically intractable 的分子模拟铺平了道路。
1. 核心科学问题,理论基础,技术难点与方法细节
1.1 核心科学问题:维数灾难与 NISQ 时代的权衡
量子化学的核心在于求解非相对论性时间无关的薛定谔方程。然而,由于电子关联效应的复杂性,体系的希尔伯特空间随活性电子和轨道数量呈指数级增长,这即是著名的“维数灾难”。传统的全配置相互作用(FCI)方法虽然能给出精确解,但其计算成本仅限于极小体系。尽管 CCSD(T) 等后哈特里-福克(Post-HF)方法被誉为“金标准”,但在处理强关联体系或大规模生物分子时仍力不从心。量子计算利用量子叠加和纠缠特性,理论上能以多项式量级的资源表示指数级的波函数,提供潜在的指数加速。然而,当前的 NISQ 设备存在相干时间短、门保真度有限以及变分量子本征求解器(VQE)面临的“贫瘠高原”和测量开销巨大等难题。如何在有限的硬件资源下,既保证精度又实现可扩展性,是本项目试图解决的核心科学问题。
1.2 理论基础:采样量子对角化(SQD)与拟设选择
本研究采用了采样量子对角化(Sample-based Quantum Diagonalization, SQD)范式。不同于 VQE 需要在量子硬件上频繁优化变分参数,SQD 将量子处理器(QPU)纯粹用作波函数采样器。其理论基础在于:利用 QPU 从一个精心设计的试探态波函数中识别出高权重的 Slater 行列式,然后在由这些选定行列式构成的压缩子空间内,通过经典的计算资源对哈密顿量进行对角化。这种方法天然具有噪声鲁棒性,因为能量的解析是在经典端通过确定的对角化过程完成的,只要量子采样能覆盖关键的物理配置,就能在变分界之上获得极高的精度。
研究对比了两种关键的量子拟设(Ansatz):
- 局部单元簇积 Jastrow(LUCJ)拟设:这是一种受哈伯德模型启发的、硬件高效型拟设。它由多层轨道旋转算符和 Jastrow 关联算符交替构成。LUCJ 的优势在于利用了电子关联的局部性特征,其量子电路深度随轨道数呈 $O(N^2)$ 标度,非常适合近期的量子硬件。本研究通过经典的 CCSD 振幅初始化 LUCJ 参数,极大地减少了硬件上的变分压力。
- 线性 CNOT 单元耦合簇单双激发(LCNot-UCCSD)拟设:传统的 UCCSD 在 Jordan-Wigner 变换后会产生冗长的 CNOT 梯形电路。LCNot-UCCSD 通过重新阐释量子比特激发算符,移除部分宇称控制链路,将 CNOT 门数量从指数增长降低到线性增长,从而在保留化学直觉的同时缩短电路深度。其参数使用 MP2 级初始化,减少了经典预计算负担。
1.3 技术难点:配置恢复与对称性维护
在真实的 QPU 采样过程中,硬件噪声会导致采样的比特串(Bitstrings)违反物理对称性(如粒子数不守恒或自旋不匹配)。这是 SQD 在硬件上落地的主要技术瓶颈。研究团队引入了“对称性感知配置恢复(CR)”技术。该技术利用有效采样的统计规律或平均场估计,概率性地将损坏的比特串修正为符合对称性的物理配置。通过 10 次自洽循环迭代,不断优化子空间的选择,从而在低采样率和高噪声环境下提取出有效的化学信息。
1.4 密度矩阵嵌入理论(DMET)的可扩展实现
为了解决大分子模拟的规模问题,本研究引入了 DMET 嵌入框架。其基本思想是将大分子划分为多个“碎片”(Fragment),每个碎片与其周围的“环境”(Bath)构成一个小的杂质体系。通过 Schmidt 分解,可以将无限或大型的环境简化为与碎片维度相等的 bath 轨道。这种方法实现了能量的尺寸一致性划分,并将整体问题的复杂度降低到 16 量子比特以内的杂质问题,使得在 24 位 IQM 处理器上并行或串行处理复杂分子(如金刚烷胺)成为可能。
2. 关键基准体系,计算所得数据与性能分析
2.1 小型分子的化学精度验证
研究团队首先在 $H_2, LiH, BeH_2, H_2O, NH_3$ 等经典基准分子上验证了 SQD(LUCJ) 和 SQD(LCNot-UCCSD) 的表现。对于 $H_2, LiH$ 和 $BeH_2$,在 STO-3G 基组下,SQD 成功找回了 FCI 级的基态能量,误差保持在 $10^{-6}$ Hartree 以内,远低于 $1.6\times10^{-3}$ Hartree 的化学精度阈值。值得注意的是,对于 $BeH_2$ 这种在键解离过程中具有显著多参考特征的体系,SQD 表现出了极强的修正能力,完美补足了单参考 CCSD 在解离区的失效(其误差在拉伸区域高达 $10^{-2}$ Ha,而 SQD 保持了亚纳 Hartree 精度)。
2.2 全实验 2D-PES 扫描:水分子的能量景观图
这是本研究的一大亮点。团队在 IQM Sirius 硬件上完成了一个 $32\times32$(共 1024 个几何点)的 $H_2O$ 位势能面扫描。每个点都涉及 QPU 采样、配置恢复和经典对角化。数据表明,在非限制采样模式下($\epsilon_s = 10^8$),实验生成的位势能面极其平滑,其能量极小点定位在 $r_{min}=1.03$ Å, $\theta_{min}=96.61^\circ$,与理论精确值几乎完全吻合。即使在限制子空间维度的极端情况下($\epsilon_s = 21$),虽然能面出现了一定的随机波动(由于采样统计涨落引起的子空间不完备),但整体拓扑结构依然稳固,证明了 SQD 在捕捉全局几何能量演变方面的卓越能力。
2.3 药理学体系:金刚烷胺与 11 个分段的 DMET 模拟
对于包含 11 个重原子的金刚烷胺分子,如果直接进行全配置计算,需要 144 个量子比特,这在目前是无法实现的。通过 DMET 策略,研究者将其划分为 11 个碎片,每个碎片经过活性空间裁剪后仅需 16 个量子比特。实验测得的金刚烷胺能量为 -438.09785054 Hartree。与经典 DMET-CASCI 参考值相比,当采样次数达到 1000 次以上时,误差即进入微 Hartree 量级。这一结果证明了量子-HPC 混合方法在处理中等规模药物分子时的实用化潜力。
2.4 硬件性能评估
在 24 位 IQM Sirius 处理器上,研究团队利用了星形拓扑结构。所有 16 个活跃量子比特通过中央谐振器实现“全对全”连接。实验记录的 $T_1$ 时间平均为 28.69 $\mu s$,$T_2^*$ 为 17.11 $\mu s$。尽管硬件环境存在噪声(如 QB13 和 QB15 的性能稍弱),但 SQD 算法通过配置恢复有效地过滤了噪声。在电路深度方面,LUCJ 表现出极高的效率,对于 $NH_3$ 体系,门总数 $G_T$ 为 1898,而同等精度下的 LCNot-UCCSD 门数高达 33466,电路深度增加了 17 倍。这也直接导致了 LCNot-UCCSD 在 $H_2O$ 和 $NH_3$ 等较大体系中因噪声干扰未能成功回传有效采样,确立了 LUCJ 在 NISQ 硬件上的优越性。
3. 代码实现细节,复现指南与软件包
3.1 软件栈架构
该项目的复现依赖于一套高度集成的 Python 软件生态:
- 量子电路管理:使用
Qiskit v1.4.2进行电路构建与转译(Transpilation)。 - 后端访问:通过
iqm-client v32.1.1接入 IQM 的云端量子算力池服务。 - 拟设构建:LUCJ 拟设的构建主要依赖于
ffsim v0.0.56,这是一个专为费米子模拟设计的快速仿真与拟设生成工具。对于 LCNot-UCCSD,研究者编写了自定义的 CNOT-ladder 分解逻辑。 - 算法框架:采样后的后处理层使用
qiskit-addon-sqd v0.10.0,负责执行配置恢复和经典的子空间哈密顿量对角化。 - 量子化学计算:基组积分生成、RHF、CCSD 和 FCI 参考值计算全部通过
PySCF v2.11.0完成。 - 数值加速:矩阵运算使用了
NumPy v2.3.5和SciPy 1.15.3,部分底层操作使用了JAX v0.8.1以提供 GPU 或 TPU 级的向量化加速。
3.2 复现步骤指南
- 初始化环境:安装上述版本的 Python 库。获取 IQM 算力池的 API Key。
- 体系预处理:使用 PySCF 确定分子几何,调用
scf.RHF获取分子轨道积分。运行一次经典 CCSD 得到耦合簇振幅 $t_1, t_2$。 - 拟设生成:将 $t_1, t_2$ 振幅映射到
ffsim的 LUCJ 模板中,生成量子电路。确保量子比特映射符合 IQM Sirius 的星形拓扑(Star 24)。 - QPU 采样:调用
execute方法提交任务,设置shots=10,000。由于 IQM Sirius 是基于云的任务队列,建议设置inter-run sleep间隔。 - 配置恢复与对角化:将回传的比特串字典输入 SQD 循环。第一轮不使用平均轨道占据数($n=None$),从第二轮开始利用前一轮对角化得到的密度矩阵更新 $n$,进行 10 次自洽迭代。最终选取最小能量输出。
3.3 开源资源链接
本研究所使用的全部原始数据集已在 Zenodo 仓库公开存储。科研工作者可以访问以下 DOI 进行检索:
- 数据归档:[DOI: 10.5281/zenodo.19185862]
- 核心算法参考:研究中频繁引用的
qiskit-addon-sqd可在 GitHub 找到官方开源仓库。
4. 关键引用文献与局限性评论
4.1 关键参考文献
- SQD 算法基础:Robledo-Moreno, J. et al. “Chemistry beyond the scale of exact diagonalization on a quantum-centric supercomputer.” Sci. Adv. (2025). 该文奠定了 SQD 算法在大规模科学计算中的基础。
- DMET 嵌入理论:Knizia, G. & Chan, G. K.-L. “Density matrix embedding: A simple alternative to dynamical mean-field theory.” Phys. Rev. Lett. (2012). 本文所使用的嵌入方法的核心理论来源。
- LUCJ 拟设:Motta, M. et al. “Bridging physical intuition and hardware efficiency for correlated electronic states.” Chem. Sci. (2023). 详细描述了局部单元簇积拟设的数学构造。
- IQM 硬件定义:IQM Client API 官方文档及相关硬件校准报告。提供了 24 位 Sirius 芯片的技术指标。
4.2 局限性与工作评论
尽管本研究取得了令人印象深刻的成果,但在通往通用量子优势的道路上仍存在几点局限性:
- 对经典预计算的依赖:LUCJ 拟设的高度准确性很大程度上归功于 CCSD 振幅的初始化。这意味着对于经典 CCSD 完全失效的强关联体系(如某些金属配合物),简单的振幅初始化可能不足以捕捉到正确的物理基态。未来的改进方向应包括开发更具自适应能力的参数演化策略。
- LCNot-UCCSD 的深度难题:实验表明,即使是线性标度的 CNOT 拟设,在 $N=14$ 及以上的体系中依然会因为电路深度超过 QPU 的相干极限而导致采样失败。这说明,在 NISQ 设备上,算法的“理论标度”与“实际可用性”之间仍存在巨大的鸿沟。
- 采样效率的瓶颈:随着希尔伯特空间的增大,发现新的重要行列式变得指数级困难。虽然本研究使用了配置恢复技术,但在面对极大规模体系时,如何确保有限次数的采样能捕获到对总能量贡献最大的配置,依然是一个待解决的统计学难题。
5. 其他必要补充:量子-HPC 混合计算的未来
5.1 量子硬件拓扑的优势
IQM Sirius 的星形拓扑(STAR 24)在此项工作中发挥了关键作用。传统的网格拓扑(Grid Topology)在实现长程轨道关联时通常需要大量的 SWAP 门,这会迅速消耗相干时间。而通过中央谐振器(COMPR1)实现的 hub-and-spoke 连接,使得任何量子比特对之间的交互门(CZ)都具有极短的路径长度,极大地提高了 LUCJ 这种涉及多轨道旋转算符的算法效率。
5.2 误差消减的层级性
本研究展示了一种分层的误差消减策略:
- 硬件层:通过 DRAG 余弦脉冲等底层控制优化门保真度。
- 算法层:通过 SQD 将能量求解转移到经典端,规避门演化过程中的相位噪声对能量数值的直接干扰。
- 对称性层:配置恢复(CR)强制对比特串进行物理法则的约束。 这种多层防护体系是当前超导量子计算机能够处理“化学复杂性”的核心秘诀。
5.3 从 1D 到 2D 的飞跃
相比于一维 PES 扫描,二维能面的生成不仅仅是工作量的叠加,它还验证了算法在处理多维度几何畸变(如键角弯曲与键长伸缩同时发生)时的鲁棒性。这对于计算化学家理解过渡态、反应路径以及力场参数化具有深远的实践价值。研究中所生成的 1024 个数据点构成了一幅精细的能量景观图,这预示着量子计算正在从“原理验证”转向“生产级模拟”。
5.4 未来展望:走向真正的量子优势
随着 IQM 下一代更高保真度 QPU 的推出,以及类似于“半量子比特”(Half-qubit)架构和“纠缠锻造”(Entanglement Forging)等新技术的整合,我们有望在未来 3-5 年内看到量子-HPC 混合平台解决经典的超级计算机都无法处理的蛋白质-配体相互作用问题。本项工作确立的基准和方法论,无疑是这一壮阔征程中的重要基石。