来源论文: https://arxiv.org/abs/2606.06015v1 生成时间: Jun 06, 2026 00:32

执行摘要

在现代量子化学和分子模拟领域,精确描述大体系中的强关联电子结构一直是一项极具挑战性的任务。传统的经典量子化学方法在面对过渡金属催化、材料表面吸附以及复杂生物酶促反应时,往往面临着精度与计算复杂度(“指数墙”)之间的两难选择。随着量子计算技术(特别是超导量子计算硬件)的蓬勃发展,利用量子算法处理强关联电子体系展现出了广阔的前景。然而,受限于目前嘈杂中期量子(NISQ)时代以及早期容错量子计算(FTQC)阶段的硬件资源,直接在量子芯片上运行全体系的高精度计算依然是不切实际的。

为了克服这一瓶颈,来自大阪大学(University of Osaka)量子信息与量子生物学研究中心(Center for Quantum Information and Quantum Biology)的 Tuan Minh Do、Yuichiro Yoshida、Tomoya Shiota 以及 Wataru Mizukami 等学者,在 2026 年发表的最新研究中提出了一种突破性的多级嵌入计算框架(Multilevel Embedding Framework)。该框架的核心思想是将复杂大体系划分为不同的物理区域,采用不同的理论方法进行多级嵌套描述:

  1. 环境区域(Environment):采用低成本的 Kohn-Sham 密度泛函理论(KS-DFT),并基于 Manby 投影嵌入技术(Projection-based embedding)在原子轨道(AO)表象下对周围环境的非加和动能、库仑作用及交换关联能进行精确的有效势描述。
  2. 活性波函数子系统(WF Subsystem):在 DFT 嵌入势场下构建出嵌入哈密顿量,并在此基础上选择出化学反应最关键的活性空间(Active Space)。
  3. 强关联活性空间的处理:利用**量子选择配置相互作用(Quantum-Selected Configuration Interaction, QSCI)**算法,在大阪大学自有的 144 位超导量子计算机上进行状态准备与计算基采样,高效筛选出最主要的 Slater 行列式,从而在经典计算机上构建并对角化紧凑的有效哈密顿量,直接捕获体系中的静态关联(Static Correlation)。
  4. 外部动力学关联的恢复(Post-Processing):为了弥补活性空间之外丢失的动力学关联(Dynamical Correlation),框架引入了三种高精度的经典后处理方法——定制耦合簇理论(Tailored Coupled Cluster, TCC [如 TCCSD(T)])、强收缩第二阶 N 电子价态微扰理论(NEVPT2)以及基于无耦合极限下绝热连接近似的 AC0 方法。

该研究通过对乙醇 O-H 键解离丙腈 C≡N 三键拉伸这两个极具代表性的基准体系进行了严格的精度验证。随后,团队将该框架成功推广应用于三个具有重大工业及学术价值的大型体系:

  • 碳纳米管(CNT)内部限制效应下的 Menshutkin $S_N2$ 亲核取代反应:实现了与经典高精度基准(THC-CASPT2)在约 1 kcal/mol 误差范围内的惊人一致,完美再现了物理限域效应对化学反应势垒的降低作用。
  • HKUST-1 金属有机框架(MOF)团簇上的水分子吸附:证明了该多级框架在处理过渡金属开壳层配位键时的系统收敛性,成功复现了实验吸附能。
  • 高熵合金(HEA)纳米颗粒(IrPdPtRhRu)表面的 CO 分子 hopping(跳跃)行为:通过引入 $s, p, d$ 轨道活性空间描述,克服了经典 VQE 算法在金属纳米催化剂表面极易陷入局部极小值以及严重高估势垒的灾难性缺陷。

本篇深度解析博客将全面拆解该论文的科学背景、数学理论基础、技术难点、应用案例以及复现指南,并对其局限性进行批判性评估,以期为致力于量子计算与量子化学交叉研究的科研人员提供全方位的技术洞察。


1. 核心科学问题、理论基础与技术细节

1.1 大体系电子结构计算的计算复杂度瓶颈

在传统经典量子化学中,精确计算包含数百个原子和上千个基函数的复杂体系中的电子 correlation 是一个不可逾越的鸿沟。电子关联通常被划分为两类:

  • 静态关联(Static/Strong Correlation):当体系存在近简退的轨道时(如键断裂处的过渡态、过渡金属多重开壳层体系、高熵合金表面等),单一的 Hartree-Fock(HF)行列式无法定性描述体系的波函数,必须引入多个行列式的线性组合(即多参考方法,Multireference methods)。最极端的精确多参考方法是全配置相互作用(FCI),然而 FCI 的计算复杂度随轨道数和电子数呈指数级爆炸: $$N_{FCI} \propto \binom{2N_{orb}}{N_{elec}}$$
  • 动力学关联(Dynamical Correlation):由电子之间的瞬时库仑排斥引起的微扰关联。在活性空间方法(如 CASSCF)中,活性空间内部的关联主要体现为静态关联,而活性空间与外部轨道(Core 轨道及 Virtual 轨道)之间的相互作用则表现为大量的动力学关联。经典方法中恢复动力学关联的最有效手段是耦合簇理论(Coupled Cluster),例如被誉为经典计算“金标准”的 CCSD(T) 方法,但其计算复杂度分别呈 $O(N^6)$ 和 $O(N^7)$ 的陡峭多项式攀升。

这就导致了一个残酷的物理现实:对于复杂的真实催化体系,我们无法直接使用高精度经典波函数方法进行全体系计算,只能通过极度简化的气体模型或隐式溶剂模型来替代真实环境。但这往往会忽略至关重要的环境效应(如静电极化、空间限域、协同配位等)。

1.2 投影式 WF-in-DFT 嵌入理论体系

为了在保持高精度的同时降低全体系的计算成本,大阪大学团队采用了**投影式波函数在密度泛函理论中嵌入(Projection-based Wavefunction-in-DFT embedding)**的方案。其数学形式推导如下:

设体系的总电子密度为 $\rho^{total}$。我们将全体系划分为活性子系统 $A$(对应进行高精度量子/经典波函数计算的区域)和周围环境区域 $B$(进行低成本 DFT 计算的环境):

$$\rho^{total} = \rho^A + \rho^B \quad (1)$$

对应的体系总能量可划分为:

$$E[\rho^{total}] = E[\rho^A] + E[\rho^B] + \delta E[\rho^A, \rho^B] \quad (2)$$

其中,$\delta E[\rho^A, \rho^B]$ 代表非加和能量项,包含非加和动能、非加和库仑能以及非加和交换关联能。在传统 DFT 密度嵌入(Density Embedding)中,非加和动能的近似泛函形式极难精确描述。而 Manby 提出的投影嵌入技术巧妙地避开了这一难题。它通过引入全体系的 Kohn-Sham 单粒子密度矩阵 $\gamma^{total}$ 并进行空间轨道定域化和划分,将其拆分为子系统 $A$ 和环境 $B$ 的贡献:

$$\gamma^{total} = \gamma^A + \gamma^B \quad (3)$$

子系统 $A$ 在环境 $B$ 存在下的嵌入能量写为:

$$E[\gamma^A, \gamma^B] = \text{tr}(\gamma^A + \gamma^B)\mathbf{h} + \mathbf{J}[\gamma^A + \gamma^B] + E_{xc}[\gamma^A + \gamma^B] \quad (4)$$

其中 $\mathbf{h}$ 是原子轨道(AO)基组下的核心单电子哈密顿量(包含动能和外势)。为了彻底消除子系统 $A$ 和环境 $B$ 之间的轨道杂化,确保两组分子轨道在数学上严格正交,Manby 引入了一个正交化电平漂移算符(Level-shift operator):

$$\mu \mathbf{P}^B = \mu \mathbf{S}\gamma^B \mathbf{S} \quad (5)$$

其中 $\mu$ 是一个足够大的正实数常数(通常取 $10^6$ Hartree),$\mathbf{S}$ 为 AO 基下的重叠矩阵。这一项的作用是将属于环境区域 $B$ 的轨道能级向上漂移到极高的能量尺度,使其在随后子系统 $A$ 的自洽场(SCF)求解中完全无法参与杂化。由此,我们得到了子系统 $A$ 在环境 $B$ 势场下的有效单电子嵌入哈密顿量(Embedded Core Hamiltonian):

$$\mathbf{h}^{\text{A in B}} = \mathbf{h} + \mathbf{J}[\gamma^A + \gamma^B] - \mathbf{J}[\gamma^A] + \mathbf{v}_{xc}[\gamma^A + \gamma^B] - \mathbf{v}_{xc}[\gamma^A] + \mu \mathbf{P}^B \quad (6)$$

以此嵌入哈密顿量 $\mathbf{h}^{\text{A in B}}$ 为基础,对子系统 $A$ 进行限制性哈特里-福克(RHF)或开壳层自洽场计算,得到嵌入 Fock 矩阵:

$$\mathbf{F}^A = \mathbf{h}^{\text{A in B}} + \mathbf{g}[\gamma^A] \quad (7)$$

最终,整个嵌入体系的总能量(WF-in-DFT)可以严谨地表示为:

$$E[\Psi^A, \gamma^B] = \langle \Psi^A | \hat{H}^{\text{A in B}} | \Psi^A \rangle - \text{tr}\gamma^A (\mathbf{v}_{xc}[\gamma^A + \gamma^B] - \mathbf{v}_{xc}[\gamma^A]) + E_{xc}[\gamma^A + \gamma^B] - E_{xc}[\gamma^A] + E[0, \gamma^B] \quad (8)$$

其中,$\hat{H}^{\text{A in B}}$ 是由 $\mathbf{h}^{\text{A in B}}$ 和相应的双电子积分构建而成的嵌入多电子哈密顿量,$\Psi^A$ 是子系统 $A$ 的高精度多电子波函数。

1.3 量子选择配置相互作用(QSCI)算法

在获得了子系统 $A$ 的嵌入多电子哈密顿量 $\hat{H}^{\text{A in B}}$ 之后,下一个核心问题是如何精确求解其强关联活性空间。对于活性空间包含大量活性电子和活性轨道的情况,经典 FCI 难以为继。QSCI 算法通过以下三个核心步骤架构起了量子与经典计算之间的桥梁:

  1. 量子状态准备:在超导量子计算机上,使用量子变分特征求解器(VQE)或者量子相位估计(QPE)等算法,在活性空间内制备出一个逼近基态的多电子量子态 $|\Psi_{quantum}\rangle$。
  2. 计算基投影测量(Sampling):对制备好的 $|\Psi_{quantum}\rangle$ 在计算基(Computational Basis)下进行大量的独立测量(测量次数为 $N_{shot}$)。每一次测量都会输出一个代表特定电子排布配置(比特串)的 Slater 行列式。通过统计这些比特串的出现频率,我们能够快速、自适应地识别出该多体波函数中振幅最大、最重要的少量主导 Slater 行列式集合: $$\{\Phi_i\}_{i=1}^R$$
  3. 经典子空间对角化:将这些筛选出来的 $R$ 个最主要的行列式作为基函数,在经典计算机上显式构建一个极度紧凑的有效 Hamiltonian 矩阵 $\mathbf{H}^{eff}$,其矩阵元为: $$H^{eff}_{ij} = \langle \Phi_i | \hat{H}^{\text{A in B}} | \Phi_j \rangle \quad (11)$$ 随后,在经典硬件上求解该低维矩阵的特征值问题: $$\mathbf{H}^{eff}\mathbf{c} = E\mathbf{c} \quad (12)$$ 从而得到高精度且物理图像清晰的 QSCI 波函数: $$|\Psi_{QSCI}\rangle = \sum_{i=1}^R c_i |\Phi_i\rangle \quad (10)$$

自旋对称性保持技术

为了防止有限测量次数(Finite-shot sampling)导致的 $\alpha$ 和 $\beta$ 自旋对称性破缺,QSCI 在波函数构建时引入了笛卡尔积扩展技术。首先将采样的每个行列式拆分为 $\alpha$ 和 $\beta$ 部分:

$$|\Phi_i\rangle = |\Phi_i^{(\alpha)}\rangle |\Phi_i^{(\beta)}\rangle \quad (13)$$

然后通过两部分自旋配置的笛卡尔积来重构扩展的子空间:

$$\{\tilde{\Phi}_i\} = \{|\Phi_m^{(\alpha)}\rangle |\Phi_n^{(\beta)}\rangle \mid 1 \le m \le R, 1 \le n \le R\} \quad (14)$$

这一机制能极大地提升 QSCI 的物理保真度,避免出现人为的单重态-三重态混合偏离。

1.4 经典后处理方法:TCC, NEVPT2 与 AC0

QSCI 能够完美捕获活性空间内的静态(强)关联,但对于活性空间外的动力学关联无能为力。为了实现定量化学精度(1 kcal/mol),必须结合经典后处理方法。本论文系统评估了三种互补的方法:

1.4.1 定制耦合簇理论(Tailored Coupled Cluster, TCC)

TCC 通过将耦合簇的簇算符(Cluster Operator) $\hat{T}$ 拆分为活性空间内部项 $\hat{T}^{active}$ 和包含活性空间外部轨道的贡献项 $\hat{T}^{external}$:

$$|\Psi_{TCC}\rangle = e^{\hat{T}^{external}} e^{\hat{T}^{active}} |\Psi_0\rangle \quad (16)$$

在求解耦合簇方程时,$\hat{T}^{active}$ 的振幅直接通过 QSCI 的波函数配置系数进行逆向投影和强行约束(锁定),即:

$$\hat{T}^{active}_1 = \hat{C}_1, \quad \hat{T}^{active}_2 = \hat{C}_2 - \frac{1}{2}\hat{C}_1^2 \quad (19, 20)$$

而 $\hat{T}^{external}$ 的振幅则在锁定 $\hat{T}^{active}$ 的前提下,通过常规的经典 CCSD 振幅方程进行迭代求解。最后,在评估微扰三激发贡献(T)时,为了避免静态关联导致的数值发散和双重计数,需要人为将所有活性空间内的单、双激发振幅强制设为零。

1.4.2 强收缩第二阶 N 电子价态微扰理论(NEVPT2)

NEVPT2 是描述开壳层和多参考体系动力学关联的现代微扰标杆。它采用 Dyall 零阶哈密顿量:

$$\hat{H}^{(0)} = \hat{H}_{active} + \sum_i \varepsilon_i a_i^\dagger a_i + \sum_a \varepsilon_a a_a^\dagger a_a + C \quad (22)$$

其中 $i$ 和 $a$ 分别代表处于双占据核轨道和全空虚拟轨道的电子指数。NEVPT2 利用基于 $|\Psi_{QSCI}\rangle$ 构建的一阶和二阶变分摄动状态空间,计算二级微扰能量纠正值:

$$E^{(2)} = \langle \Psi_{QSCI} | \hat{V}\hat{Q} (E^{(0)}_0 - \hat{H}^{(0)})^{-1} \hat{Q}\hat{V} | \Psi_{QSCI} \rangle \quad (23)$$

其最大优势在于利用了 Dyall 哈密顿量,天然避免了多参考摄动理论(如 CASPT2)中臭名昭著的“入侵态”(Intruder State)发散问题。

1.4.3 绝热连接 AC0 修正

AC0 方法是一种计算资源消耗极低的动力学关联修正方法。它通过参数 $\alpha$ 在非相互作用参考体系($\alpha=0$)和真实物理相互作用体系($\alpha=1$)之间建立绝热连接线路径,将关联能严格表达为积分形式:

$$E_{corr}^{AC} = \int_0^1 (W^\alpha + \Delta^\alpha) d\alpha \quad (27)$$

在 AC0 线性化近似下,将积分项在 $\alpha=0$ 处进行一阶泰勒展开,并假设单粒子密度沿路径不变($\Delta^\alpha \approx 0$)。在活性空间波函数参考下,由于 $W^{\alpha=0} = 0$,关联能公式被极限简化为:

$$E_{corr}^{AC0} \approx \frac{W^{(1)}}{2} \quad (29)$$

其中 $W^{(1)}$ 代表绝热连接一阶导数,该导数可通过计算扩展随机相位近似(ERPA)的电荷/自旋响应矩阵直接闭合求解,完全无需高阶密度矩阵,展现了极佳的计算经济性。


2. 关键 Benchmark 体系与应用案例深度剖析

2.1 乙醇中的 O-H 键解离过程

  • 基准目的:验证嵌入算法在共价单键均裂解离极限下,处理强静态关联与动力学关联共存时的精度。
  • 模型构建:活性子系统 $A$ 定义为参与解离的 O 元素和 H 元素的价轨道,包含 2 个电子和 2 个定域化轨道,即 $(2e, 2o)$ 活性空间。乙醇的其余甲基和亚甲基部分归为环境区域 $B$。经典基准参考线采用超大基组下的多参考单双激发配置相互作用 + Davidson 修正(MRCISD+Q/cc-pVDZ)。DFT 环境描述采用 PBE 泛函。
  • 数据分析(见原文 Fig. 2)
    • PBE 泛函的失效:在平衡位置 $d(O-H) \approx 1.0\text{ \AA}$ 附近表现良好,但当键拉伸至 $>2.0\text{ \AA}$ 时,PBE 发生严重的对称性破缺并高估能量,误差在 $3.0\text{ \AA}$ 处高达约 $1.0\text{ eV}$,这表明单参考 DFT 无法处理键均裂处的强静态关联。
    • 纯 QSCI(无嵌入,无后处理):在拉伸区($>2.0\text{ \AA}$)表现出合理的趋势,但在平衡区($<1.5\text{ \AA}$)误差明显增大(约 $0.5\text{ eV}$),因为微小的活性空间 $(2e, 2o)$ 遗漏了大量的核心动力学关联。
    • QSCI-in-PBE 嵌入处理:使平衡区附近的势能面误差整体下移,证明了投影嵌入的有效性。
    • 后处理多级计算(QSCI-TCCSD(T)-in-PBE, QSCI-NEVPT2-in-PBE, QSCI-AC0-in-PBE):三个后处理方法展现出无与伦比的纠正能力。从平衡区到渐近解离限制区,误差线被一致压低到 $0.1\text{ eV}$(约 $2\text{ kcal/mol}$)以内。AC0 修正在这项测试中取得了最平滑、最均衡的全势能曲线描述,最大误差仅为 $0.2\text{ eV}$。

2.2 丙腈中的 C≡N 三键拉伸

  • 基准目的:极高难度的多重键均裂断裂模拟。当三键被拉伸时,体系会迅速演变为包含多个开壳层自由基组成的极强多参考多重态关联体系。
  • 模型构建:活性子系统定义在 C≡N 键上,包含 6 个活性电子和 6 个定域轨道,即 $(6e, 6o)$ 活性空间。剩余的乙基链作为环境。参考基准线为高精度 Frozen-Core 密度矩阵重整化群方法(DMRG(FC)/cc-pVDZ)。DFT 环境由 B3LYP 泛函描述。
  • 数据分析(见原文 Fig. 3)
    • B3LYP 泛函的致命偏离:在拉伸到 $1.8\text{ \AA}$ 时,B3LYP 产生了高达 $1.5\text{ eV}$ 的非物理能垒偏差。
    • 嵌入与后处理的协同效用:相比纯 QSCI 在短程处的劣势,QSCI-in-B3LYP 极大改善了平衡态压缩区的势能曲率。通过联用 TCCSD(T)、NEVPT2 和 AC0 动力学后处理,使得平衡态附近的误差被收敛在近乎零的水平。但在高度拉伸区($>1.6\text{ \AA}$),由于 DFT 嵌入势自身的非自洽误差以及活性空间切分的边界极化效应,后处理方法的误差存在部分抬升,这也表明了更庞大活性波函数分区设计的必要性。

2.3 碳纳米管限制环境下的 Menshutkin $S_N2$ 反应

  • 体系科学背景:经典亲核取代反应 $\text{NH}_3 + \text{CH}_3\text{Cl} \rightarrow [\text{H}_3\text{N}\cdots\text{CH}_3\dots\text{Cl}]^{\ddagger} \rightarrow \text{CH}_3\text{NH}_3^+ + \text{Cl}^-$ 伴随着剧烈的电荷分离与过渡态极化。当该反应被限域在疏水的 $(10, 0)$ 碳纳米管(CNT)内部时,管壁的静电屏蔽和范德华吸引会显著降低过渡态势垒,展现出独特的纳米催化限域效应。
  • 多级嵌入细节:活性波函数子系统 A 包含反应物分子的所有 $36$ 个价电子,活性空间设为 $(4e, 4o)$ 捕获核心键断裂和生成。整个包含 $140$ 个碳原子的 CNT 被划归为 B3LYP 描述的环境区域。采用 6-31G* 基组。对比基准采用目前公认极精确的经典张量超收缩微扰理论(THC-CASPT2)。
  • 计算数据深度对比(见下表)
计算方法气相(GP)过渡态能量 (kcal/mol)气相(GP)产物能量 (kcal/mol)CNT 内过渡态势垒 (kcal/mol)CNT 内反应能 (kcal/mol)
B3LYP24.3-1.516.5-10.2
Plain QSCI35.812.124.15.8
QSCI-in-B3LYP (无后处理)23.54.8
QSCI-TCCSD(T)-in-B3LYP32.89.822.89.2
THC-CASPT2 (经典高精基准)33.110.223.19.5
QSCI-NEVPT2-in-B3LYP28.56.518.25.1
QSCI-AC0-in-B3LYP29.17.119.16.0
  • 关键结论
    • 在 CNT 限域下,高精度的 THC-CASPT2 预测势垒为 $23.1\text{ kcal/mol}$。常规 B3LYP 严重低估势垒高达 $6.6\text{ kcal/mol}$。而本框架中的 QSCI-TCCSD(T)-in-B3LYP 算出的势垒为 $22.8\text{ kcal/mol}$,与经典基准的绝对误差仅为 $0.3\text{ kcal/mol}$,反应能误差也仅为 $0.3\text{ kcal/mol}$,完美跨越了化学精度门槛($1\text{ kcal/mol}$)。
    • 这一结果无可辩驳地证明了:只要选择合适的后处理手段(如定制耦合簇 TCC),DFT 嵌入下的量子计算机 QSCI 采样完全能够定量描述大型真实化学限域反应通道。

2.4 HKUST-1 MOF 团簇上的水吸附行为

  • 体系难点:MOF 材料开壳层金属铜中心($d^{9}$ 组态)的非定域化配位。吸附水分子与 $\text{Cu}^{2+}$ 的配位作用包含精细的静电吸引、电荷转移以及配体场分裂,对波函数活性空间的选择具有极高的敏感性。
  • 活性子系统边界层逐步外推测试(Regions 1-4)
    • Region 1:仅包含 $\text{H}_2\text{O}$ 分子和吸附靶点 $\text{Cu}$。活性空间 $(2e, 2o)$。
    • Region 2:在 Region 1 基础上向外扩展,纳入与该 $\text{Cu}$ 直接配位的 $4$ 个氧原子。
    • Region 3:进一步纳入该桨轮式(Paddle-wheel)金属节点中的第二个 $\text{Cu}$ 原子及桥联氧原子。
    • Region 4:最完整区域。纳入连接羧酸基团与苯环配体的所有碳、氧骨架原子(见原文 Fig. 5a)。
  • 物理规律收敛验证
    • 不经过经典后处理的 QSCI-in-PBE 在不同区域大小下能量曲面无序震荡,没有表现出任何物理收敛规律,这是由于切分边界时忽略了局域电荷电荷极化的动力学补偿。
    • 当引入 TCCSD(T)NEVPT2 动力学后处理后,能量表现出极其优美的系统单调收敛性。随着区域从 Region 1 扩展到 Region 4,水吸附能最终收敛至 $-0.55\text{ eV}$(TCC)$-0.62\text{ eV}$(NEVPT2)。这与实验测量的单水分子吸附热($-0.57\text{ eV}$)达到了惊人的吻合,吸附平衡键长也收敛至 $2.25\text{ \AA}$(实验值为 $2.17\text{ \AA}$)。

2.5 IrPdPtRhRu 高熵合金纳米颗粒上的 CO 跳跃行为

  • 科学价值与难点:高熵合金(HEA)具有高度复杂的无序局部化学环境,存在海量的准简退近金属费米面电子态。CO 在其表面的 hopping(从 Bridge 位置向 On-top 位置扩散)是理解其多相催化机理的关键步骤。
  • 算法失效与纠正表现(见原文 Fig. 6)
    • 经典单参考 VQE 的灾难性溃败:在无嵌入、无后处理的纯 VQE 模拟中,由于未定域化的金属 $d$ 轨道背景干扰,能量优化极易陷入非物理的局部极小值,甚至给出了极度荒谬的势能曲线:Bridge 能量被错误地优化得比 On-top 低得多,且势垒高度被严重高估到 $3.3\text{ eV}$(物理常理应在 $0.4\text{ eV}$ 左右)。
    • 多级嵌入 QSCI 框架的救赎:当使用投影嵌入(PBE 描述环境合金原子),将活性空间精确局域在 CO 和结合位点的 $\text{Ir}$ 原子上,并进行 $s, p, d$ 轨道 AVAS 筛选后,QSCI-in-PBE 直接将不合理的非物理势垒压低至 $0.6\text{ eV}$。配合后处理 TCCSD(T) 和 NEVPT2,不仅完美重现了 Bridge 能量高于 On-top 这一正确的相对稳定性物理事实,更给出了极其精确合理的扩散能垒($0.5\text{ eV}$$0.8\text{ eV}$),与经典纯金属表面实验值高度吻合。

3. 代码实现细节、平台运行环境与复现指南

3.1 软件栈与工具链构成

该研究所建立的混合量子-经典计算生态依托于一整套现代化的开源及商业计算工具链:

  • QSimulate-QM:由 QSimulate 公司开发的高效电子结构商业平台,其底层核心基于知名的开源分子波函数计算库 BAGEL。主要用于执行大体系自洽场计算、Pipek-Mezey 局域化以及基于投影技术的嵌入哈密顿量积分生成。
  • PySCF (v2.2.1):经典量子化学的“瑞士军刀”。用于执行核心嵌入 Fock 矩阵的自洽迭代、强收缩 NEVPT2 微扰微观积分计算以及作为 TCCSD(T) 开发的经典宿主。
  • PySCF-AC0:由 Quantinuum 公司主导开发的绝热连接(AC)物理模块,直接用于提取 QSCI 一、二阶密度矩阵并计算 AC0 动力学纠正能。
  • chemqulacs:基于极速经典量子电路模拟器 Qulacs 的量子化学前置开发包,用于在经典计算机上对 VQE 的变分参数 $\theta$ 进行鲁棒性的经典预优化。
  • QURI Parts (v0.20) & QURI Parts OQTOPUS:由 QunaSys 主导开发的下一代量子-经典混合算法 SDK。主要负责量子电路的门级转译、测控指令下发、以及云端对接量子硬件平台。

3.2 硬件平台与量子运行配置

  • 物理芯片:大阪大学量子信息与量子生物学研究中心拥有的 144 位物理比特超导量子芯片。该芯片基于平面转角 Transmon 设计,运行在独特的 $5\text{ GHz}$ 频段,在退相干时间($T_1, T_2$)和单双门保真度上均经过专门优化。
  • 编译技术:采用对称性保持的 Bravyi-Kitaev (SCBK) 费米子到量子比特映射(Symmetry-Conserving Bravyi-Kitaev mapping),该映射能够根据空间和自旋对称性,自动消减掉 $2$ 个冗余的纠缠比特,显著降低了物理门深度。
  • 测量资源预算:量子状态准备好后,采样阶段的总测量 shot 预算严格控制为 $10,000$ 次。这一有限射击次数(Finite shot budget)设置符合 NISQ 时代的实际工程约束。

3.3 模块化复现工作流脚本

为了便于科研同行复现该框架,以下给出了一个整合该多级嵌入-QSCI-后处理(以 TCC 为例)工作流的简化 Python 概念脚本:

import numpy as np
from pyscf import gto, scf, cc
# 假定此处已导入 qsimulate, quri_parts 以及 pySCF_tcc 相关定制化库
# import qsimulate_qm_interface as qsim
# from quri_parts.qsci import run_qsci_on_hardware

def run_multilevel_workflow():
    # 1. 建立全体系分子几何结构及高精度/环境分区
    # 这里以简化模型为例,实际需要使用 QSimulate-QM 进行 Pipek-Mezey 局域化和嵌入划分
    mol = gto.M(
        atom='O 0 0 0; H 0 0 0.96; He 0 0 3.0', # He 模拟环境原子描述
        basis='cc-pVDZ',
        spin=0
    )
    
    # 2. 执行全体系自洽场计算并生成投影式嵌入哈密顿量
    print("[Step 1] Running projection-based embedding with QSimulate-QM...")
    # my_embedded_calc = qsim.WF_in_DFT_Embedding(mol, active_atoms=['O', 'H'], env_atoms=['He'], env_functional='PBE')
    # h_core_embedded = my_embedded_calc.get_embedded_hcore()
    # active_integrals = my_embedded_calc.get_active_integrals() # 抽取嵌入哈密顿量的 1-electron/2-electron 积分

    # 模拟替代:这里使用 PySCF 内置哈密顿量用于演示流转过程
    mf = scf.RHF(mol).run()
    
    # 3. 提取活性空间并设计量子变分电路 (以 2 电子 / 2 轨道为例)
    print("[Step 2] Selecting active space and preparing quantum circuit...")
    active_electrons = 2
    active_orbitals = 2
    # 经典 chemqulacs 进行 VQE 预参数优化
    # optimized_angles = chemqulacs.optimize_vqe_ansatz(active_integrals, active_electrons, active_orbitals)
    
    # 4. 在大阪大学超导量子硬件上执行计算基采样
    print("[Step 3] Running QSCI state preparation and sampling on Osaka 144-qubit hardware...")
    # sampled_determinants, sampling_frequencies = run_qsci_on_hardware(
    #     angles=optimized_angles, 
    #     shots=10000, 
    #     mapping="SCBK"
    # )
    
    # 模拟采样结果:生成 Slater 行列式主导基组空间 (Cartesian Product)
    # deterministic_subspace = qsci_helper.build_spin_symmetry_subspace(sampled_determinants)
    
    # 5. 在经典端构建有效哈密顿量并对角化,重建 QSCI 紧凑波函数
    print("[Step 4] Diagonalizing effective Hamiltonian on classical computer...")
    # e_qsci, c_qsci = qsci_helper.solve_subspace_eigenproblem(active_integrals, deterministic_subspace)
    
    # 6. 进行经典定制耦合簇 (TCC) 后处理以恢复外部动力学关联
    print("[Step 5] Restoring dynamical correlation via classical Tailored CCSD(T)...")
    # 初始化一个基于嵌入轨道基础的经典 Coupled Cluster 对象
    my_cc = cc.CCSD(mf)
    
    # 核心 TCC 操作:将量子硬件上采样重建得到的 QSCI 波函数振幅
    # 直接锁死到经典 Coupled Cluster 的活性空间部分振幅内
    # t1_active, t2_active = qsci_helper.project_qsci_to_cc_amplitudes(c_qsci, active_electrons, active_orbitals)
    # my_cc.tailor_amplitudes(t1_active, t2_active, active_space_indices=[0, 1])
    
    # 运行收敛外部振幅
    my_cc.kernel()
    
    # 加上微扰三激发纠正 (T) 
    # e_triples = my_cc.ccsd_t()
    # total_energy = my_embedded_calc.get_dft_environment_energy() + my_cc.e_tot + e_triples
    
    print(f"Multilevel Workflow Completed! Total Energy = {my_cc.e_tot:.8f} Hartree")

if __name__ == "__main__":
    run_multilevel_workflow()

4. 关键引用文献与局限性批判性评估

4.1 核心局限性分析

尽管该研究设计精巧、结果令人瞩目,但作为一名前沿量子化学技术作者,我们需要客观、理性地指出该工作在现阶段存在的几个核心技术局限性:

  1. 高度依赖轨道局域化算法的收敛性与稳定性: 投影式嵌入的第一步是必须将全体系的分子轨道(MO)进行精确的定域化(如 Pipek-Mezey 方法)。在金属多相催化、高熵合金或高度共轭的富电子大离域 $\pi$ 体系中,分子轨道极其离域化。此时,强行进行定域化划分常常会导致不收敛,或者产生物理意义模糊的“跨边界”轨道,导致环境区域与活性区域划分失效。这直接限制了该框架向超大尺度共轭石墨烯、金属体相催化等体系的无缝推广。
  2. 经典后处理计算复杂度的“尾大不掉”: 虽然本方法将 QSCI 局限在极小的活性空间(如 4 电子 4 轨道),但后处理方法如 TCCSD(T) 其经典计算复杂度依然高达 $O(N^7)$。当活性波函数子系统(WF Subsystem)为了追求精度而不得不划分得较大时(例如包含 100 个原子),即使有 DFT 嵌入削减环境,经典 TCCSD(T) 的计算耗时依然会迅速超过可接受的范畴,成为整个多级计算链条中的最严重性能瓶颈。
  3. DFT 嵌入势能面的固有误差传递: 多级嵌入能计算公式(等式 8)本质上建立在单粒子密度矩阵 $\gamma^B$ 的高保真描述上。如果环境泛函(如 PBE 或 B3LYP)由于自身严重的“自相互作用误差”(Self-Interaction Error)或由于缺乏色散修正(Dispersion correction)而给出了错误的电荷分布,这个误差会作为“环境背景电场”百分之百传递给活性子系统的嵌入哈密顿量。这种由基础泛函导致的系统性宿主偏差(Host bias),是任何精妙的后处理算法都无法挽回的。
  4. 缺乏周期性边界条件(Periodic Boundary Conditions, PBC)支持: 目前的开源和商业软件实现中,该框架仅支持有限尺寸的孤立团簇模型(Cluster models)。对于 HKUST-1 MOF 或是金属合金催化表面,团簇截断不可避免地会引入边缘氢饱和(Hydrogen capping)误差。如何开发支持三维周期性晶胞的投影式嵌入哈密顿量积分器,是决定该算法能否真正迈向工业固态电池和非均相催化工程应用的关键所在。

4.2 关键参考文献目录

以下是该研究所依托的重要里程碑式经典文献,有助于读者深入探究:

  1. Manby 投影嵌入技术
    • F. R. Manby, M. Stella, J. D. Goodpaster, and T. F. Miller, A Simple, Exact Density-Functional-Theory Embedding Scheme, J. Chem. Theory Comput. 8, 2564 (2012).
    • S. J. R. Lee, M. Welborn, F. R. Manby, and T. F. Miller, Projection-Based Wavefunction-in-DFT Embedding, Acc. Chem. Res. 52, 1359 (2019).
  2. QSCI 算法原理
    • K. Kanno, M. Kohda, R. Imai, S. Koh, K. Mitarai, W. Mizukami, and Y. O. Nakagawa, Quantum-Selected Configuration Interaction: Classical diagonalization of Hamiltonians in subspaces selected by quantum computers, arXiv:2302.11320 (2023).
    • Y. Yoshida, L. Erhart, T. Murokoshi, R. Nakagawa, C. Mori, T. Miyanaga, T. Mori, and W. Mizukami, Auxiliary-field quantum Monte Carlo method with quantum selected configuration interaction, arXiv:2502.21081 (2025).
  3. 定制耦合簇 (TCC) 理论
    • T. Kinoshita, O. Hino, and R. J. Bartlett, Coupled-cluster method tailored by configuration interaction, J. Chem. Phys. 123, 074106 (2005).
    • L. Erhart, Y. Yoshida, V. Khinevich, and W. Mizukami, Coupled cluster method tailored with quantum computing, Phys. Rev. Res. 6, 023230 (2024).
  4. NEVPT2 摄动理论
    • C. Angeli, R. Cimiraglia, S. Evangelisti, T. Leininger, and J.-P. Malrieu, Introduction of n-electron valence states for multireference perturbation theory, J. Chem. Phys. 114, 10252 (2001).
  5. AC0 绝热连接动力学修正
    • E. Pastorczak and K. Pernal, Correlation Energy from the Adiabatic Connection Formalism for Complete Active Space Wave Functions, J. Chem. Theory Comput. 14, 3493 (2018).

5. 补充与前沿展望

5.1 NISQ 向 FTQC 时代的平滑过渡

在探索量子计算化学应用的征途中,QSCI 算法展现出了其独特的、可作为连接不同技术时代的“桥梁”属性。在目前的 NISQ 时代,QSCI 对状态准备精度的宽容度极高。哪怕超导硬件制备出来的多体态含有可观的热噪声和退相干误差,只要它能正确地把基态中物理振幅占支配地位的几个主导 Slater 行列式(例如占波函数权重前 $80\%$ 的行列式)的正确比特串采样出来,后续在经典计算机上进行的特征值对角化操作(等式 12)就会自动、彻底地清洗掉这些硬件物理噪声,给出完全符合物理学规则的厄米矩阵特征能。

而当未来技术跨入早期容错量子计算(FTQC)时代,基于逻辑量子比特(Logical Qubits)和量子相位估计(QPE)的技术能够制备出几近完美的基态时,QSCI 无缝升级。此时,它只需要极少的采样 shot 即可在经典端精准定出更庞大、自旋态更复杂的 Slater 子空间,极大地降低经典对角化矩阵的维度。这种硬件越强、经典辅助开销越小、整体精度单调爬升的自适应特性,赋予了该多级嵌入计算框架非凡的生命力。

5.2 工业应用潜力与社会价值

多级嵌入 QSCI 框架的成熟,对多个关键性工业应用场景具有颠覆性的社会经济价值:

  • 高能绿色催化剂开发(高熵合金):高熵合金(HEA)作为新一代催化剂,在二氧化碳还原(CO2RR)、析氢反应(HER)中表现出超越传统单金属催化剂的超高活性。该算法能够精确模拟合金表面精细的协同催化能垒,从而通过高通量筛选(High-throughput screening)大幅缩短新型多金属组合催化剂的研发周期。
  • 碳捕集与有害气体吸附(MOF):对金属有机框架(MOF)多孔材料与小分子(CO2, CO, H2O)作用机制的定量描述,能帮助工程师设计具有更强化学稳定性、高选择性、耐湿热性能的新一代碳捕集吸附塔(Carbon Capture Towers)。
  • 固态电池界面工程:锂离子电池/钠离子电池固体电解质界面(SEI 膜)的演化,涉及电极表面(金属导体环境)与电解质电极液(强关联极化分子)在充放电极限条件下的化学反应。WF-in-DFT 嵌入加后处理方案是刻画该复杂固液界面的最佳候选方案。

5.3 理论与算法层面的未来演进

展望未来,多级嵌入量子化学计算有望在以下几个前沿交叉方向取得突破:

  1. 融入双占据配置相互作用(DOCI-QSCI): 为了进一步缩减量子测量的复杂度,最新的理论研究(如论文引用的 Ref. [21])尝试将双占据配置相互作用(DOCI)与 QSCI 融合。DOCI 假定所有空间轨道要么完全空置,要么被两个自旋相反的电子双占据,这使得活性空间的自旋配置数缩减了数个数量级,从而能够用极少量的 qubits 处理极其庞大的过渡金属多重键体系。
  2. 机器学习势能面(MLP)的引入: 正如该论文中利用了针对水分子优化训练的机器学习分子间相互作用势(MACE-Osaka24)来预先优化 MOF 吸附几何结构一样,未来将“量子-经典多级高精度单点能计算”作为高保真数据源(High-fidelity data source),去主动训练基于图神经网络(GNN)的物理机器学习势能面,将能彻底解决长时间尺度分子动力学(MD)模拟的精度与速度瓶颈。开发“量子计算哈密顿量积分器 - 经典多级后处理 - 机器学习力场外推”三合一的集成式计算平台,将是量子化学计算领域的下一个技术皇冠。

通过对大阪大学这一前沿研究的深入学习与剖析,我们有理由相信,由多级嵌入、QSCI 量子采样以及经典微扰后处理技术共同谱写的“量子-经典混合共生”交响曲,已然为我们推开了通往真实大尺度高精度量子化学模拟的神秘大门。