来源论文: https://arxiv.org/abs/2506.04223 生成时间: Mar 03, 2026 15:23

0. 执行摘要

本论文提出了一种全新的视角来解决量子化学中最基础的自洽场(SCF)问题,尤其是Hartree-Fock(HF)方法。作者们成功地将Hartree-Fock方程的优化问题精确地重构为一系列二次无约束自旋/二元优化(QUSO/QUBO)问题,进而可以进一步映射为MaxCut图问题。这项创新性的重构不仅在理论上为Hartree-Fock的求解提供了性能保证,能够确保在每个SCF步骤中找到最低能量的Slater行列式,从而规避传统SCF算法中常见的内部不稳定性问题和局部最小值收敛。通过在羟基阴离子(OH⁻)和氮分子(N₂)的基准体系上的数值模拟,作者们展示了所提出的QUBO-SCF和MaxCut-SCF方法在收敛性和稳定性方面优于传统的SCF计算。此外,论文还详细阐述了四种混合量子-经典SCF算法(GAS-SCF、QAOA-SCF、QA-SCF和DQI-SCF)的框架,为将量子优化算法应用于Hartree-Fock方法指明了方向,为未来在噪声中等规模量子(NISQ)设备上实现量子加速提供了理论基础。这项工作为连接量子化学与组合优化、特别是量子计算领域开辟了新的途径,有望显著提升基础量子化学计算的稳健性和效率。

1. 核心科学问题,理论基础,技术难点,方法细节

1.1 核心科学问题

量子化学的核心目标是准确描述分子和材料的电子结构。Hartree-Fock(HF)理论是分子轨道(MO)理论的基石,它通过将每个电子描述为占据单个分子轨道来近似电子波函数。HF计算本质上是一个自洽场(SCF)过程,旨在通过迭代优化分子轨道,使能量达到最低。然而,这一过程面临着两个主要挑战:

  1. 收敛性和局部最小值问题: 传统的SCF算法通常是非线性的,并且迭代过程可能收敛到局部最小值或鞍点,而非真实的全局最低能量基态。这导致计算结果不稳定,并且可能需要复杂的稳定分析和重启动策略。
  2. 计算复杂度: 尽管HF被广泛使用,但其在最坏情况下的计算复杂性已被证明是NP-complete问题。这意味着,对于某些特定问题实例,即使是经典计算机也可能难以找到精确解。这为探索利用组合优化技术甚至量子算法来解决HF问题提供了强有力的动机。

本论文的核心科学问题正是:如何通过将Hartree-Fock的优化问题重构为具有性能保证的组合优化问题,以提高其收敛的稳健性,并为未来利用量子算法求解HF问题奠定基础。

1.2 理论基础

1.2.1 Hartree-Fock理论回顾

Hartree-Fock理论的核心在于用一个单Slater行列式来近似多电子波函数。这个行列式是通过自洽地求解Fock方程得到的,Fock算符本身依赖于它所产生的分子轨道。在第二量子化形式下,Born-Oppenheimer近似下的非相对论电子哈密顿量可以写为:

$$H_{ferm} = \sum_{p,q} h_{pq}(C) a_p^\dagger a_q + \frac{1}{2} \sum_{p,q,r,s} g_{pqrs}(C) a_p^\dagger a_q^\dagger a_r a_s$$

其中 $a_p^\dagger$ 和 $a_q$ 是费米子产生和湮灭算符,$h_{pq}$ 和 $g_{pqrs}$ 是一电子和二电子积分,它们依赖于分子轨道系数矩阵 $C$。论文强调,对于给定的 $C$,可以通过酉变换 $U(κ) = e^{-κ}$ 获得一组新的分子轨道,其中 $κ = \sum_{p>q} κ_{pq} (a_p^\dagger a_q - a_q^\dagger a_p)$ 是反Hermitian的。在新的MO基组中,哈密顿量变为 $H_{ferm}(κ) = e^{-κ} H_{ferm} e^κ$。HF方法的目标是找到使能量最低的单Slater行列式,即:

$$E_{HF}^{ferm} = \min_κ \left[ \langle HF_{ferm} | e^{-κ} H_{ferm} e^κ | HF_{ferm} \rangle \right] = \min_κ \left[ \langle HF_{ferm} | H_{ferm}(κ) | HF_{ferm} \rangle \right]$$

传统的HF方法通过梯度法或Hessian法优化 $κ$。论文的关键在于,选取 $H_{ferm}(κ)$ 的对角项(对应于单Slater行列式的期望值),并将其重构为组合优化问题。

1.2.2 二次优化问题 (QUSO/QUBO) 与 MaxCut

伪布尔函数与QUSO/QUBO: 伪布尔函数是一个实值函数 $f(x_1, ..., x_n)$,其中 $x_i \in \{0, 1\}$ 是二元变量。二次无约束二元优化(QUBO)问题旨在最小化一个伪布尔函数,其中函数项最多为二次项。其常见形式为 $g(x) = x^T Q x + b^T x + c$。当二元变量 $x_i \in \{0, 1\}$ 通过 $x_i = (1 - z_i)/2$ 映射为自旋变量 $z_i \in \{+1, -1\}$ 时,QUBO问题就变为二次无约束自旋优化(QUSO)问题。

Jordan-Wigner变换: 为了将HF哈密顿量映射到QUSO/QUBO问题,需要使用Jordan-Wigner变换将费米子算符转换为Pauli算符。论文指出,对角化的费米子哈密顿量 $H_D(R)$(即 Equation 4)在Jordan-Wigner变换下可以直接映射为:

$$H_D(R) = \sum_n \frac{\bar{h}_{nn}(R)}{2} (1-Z_n) + \frac{1}{8} \sum_{m \neq n} (\bar{g}_{mmnn}(R) - \bar{g}_{mnnm}(R)) (1-Z_n-Z_m+Z_m Z_n)$$

其中 $Z_n$ 是作用在第 $n$ 个量子位上的Pauli-Z算符。这个Pauli哈密顿量自然地描述了一个QUSO问题,因为其中只包含Pauli-Z算符的乘积,并且最高阶为二次项。

MaxCut问题: MaxCut是图论中的一个经典组合优化问题,旨在将加权图的顶点划分为两个不相交的集合,使得连接这两个集合的边的总权重最大。MaxCut是QUSO/QUBO问题的一个特例。论文进一步详细阐述了如何将QUBO问题映射为MaxCut问题,这得益于Boros和Hammer的工作[105]。关键步骤是引入一个辅助量子位 $w$,将QUBO问题转化为 MaxCut 成本函数的形式 $C_{MaxCut} = \sum_{i

性能保证: 对于MaxCut问题,Goemans-Williamson(GW)算法[52]提供了一个重要的性能保证:对于边权重非负的图,该算法能提供至少0.878的近似比。这意味着GW算法的解至少是最优解的87.8%。尽管在引入惩罚项时可能出现负边权重,论文指出这种情况下近似比可能会有所下降,但对于这种特殊结构的MaxCut问题,负边权重数量与自旋轨道数量呈线性关系,而正边权重呈二次关系,表明其结构仍然有利于近似求解。

1.3 技术难点

  1. SCF收敛到局部最小值: 传统的SCF算法通常会陷入局部最小值,导致不准确的能量和不稳定的计算。本研究旨在通过更彻底的组合优化来解决这一问题。
  2. 对称性约束的实现: 在HF计算中,必须确保最终的Slater行列式满足分子对称性,例如正确的α和β电子数量、总自旋量子数($S^2$)和点群对称性。在QUSO/QUBO框架中,这些约束通常通过添加惩罚项来强制执行。例如,用于电子数量的惩罚项(B5a, B5b)是二次的,能够保持QUSO的二次形式。但对于总自旋量子数 $S^2$,如果直接使用其通用形式(B7),会引入四次项,这就需要使用“二次化”技术(quadratization techniques,Appendix D)将其转换为二次形式,但这可能引入额外的辅助变量,从而增加问题规模。
  3. 负边权重与MaxCut近似比: 标准Goemans-Williamson算法的0.878近似比只适用于非负边权重的MaxCut问题。当QUSO问题转换为MaxCut问题时,尤其是在引入惩罚项后,可能会出现负边权重。虽然论文指出正边权重的数量是二次的,负边权重是线性的,这在一定程度上是“有利的”,但负边权重仍可能降低近似比,需要更复杂的分析和算法来处理。
  4. 硬件连通性限制: 将QUSO/Ising问题映射到专用硬件(如D-Wave量子退火器)时,由于量子位之间的连通性限制,可能需要引入大量辅助量子位(ancilla bits),这会增加问题的复杂性和所需的硬件资源。尽管论文的数值结果主要在经典计算机上获得,避免了这一问题,但对于未来的量子硬件应用,这是一个重要的考量。
  5. 缺乏通用性和可扩展性: 本文提出的方法主要针对单参考HF方法。对于多参考自洽场方法(如CASSCF),其基态不再是单一的Fock态,而是多个Fock态的叠加,如何将其推广到这些更复杂的场景仍是开放问题。

1.4 方法细节

本论文提出了两种新型的SCF算法(算法1和算法2),它们通过将传统的HF优化过程中的离散部分重构为QUSO/QUBO/MaxCut问题,从而获得性能保证和更好的收敛性。

1.4.1 算法1 (QUSO-SCF)

算法1(见论文图1a和方程11)的核心思想是迭代地优化分子轨道基(由参数矢量 $κ$ 定义),并在每个外部迭代中,通过解决一个QUSO问题来寻找当前基组下最低能量的计算基态(Fock态)。

  1. 外部循环(经典优化): 算法的外部循环负责优化分子轨道基。这通过更新参数矢量 $κ$ 来实现,利用经典的轨道梯度和Hessian信息。这是一个连续变量优化问题,通过牛顿共轭梯度法(Newton-CG)等经典方法求解。
  2. 内部循环(组合优化): 对于给定的 $κ$,计算对角化的费米子哈密顿量 $H_D(κ)$(Equation 4)。这个哈密顿量通过Jordan-Wigner变换(Equation 7)转换为一个Pauli哈密顿量,它定义了一个QUSO问题。
  3. QUSO求解: 内部循环的目标是找到使 $H_D(κ)$ 期望值最低的计算基态 $|b_{min}⟩$。这个QUSO问题可以进一步转换为QUBO或MaxCut问题(Appendix E)。然后,使用经典的QUSO/QUBO/MaxCut求解器(如CPLEX、Tabu、模拟退火或Goemans-Williamson算法)来找到最优的 $|b_{min}⟩$。本论文也展望了利用量子算法(如GAS、QAOA、QA、DQI)来解决这一离散优化问题。
  4. 收敛判断: 迭代继续进行,直到能量变化小于预设的阈值 $ε$。

与传统HF不同,算法1在优化 $κ$ 的同时,允许基准态在内部循环中改变,从而更灵活地探索解空间。

1.4.2 算法2 (MaxCut-SCF)

算法2(见论文图1b和方程12)与传统HF的实现更接近,但其关键区别在于在优化过程中允许选择最低能量的Slater行列式来定义密度矩阵。这个算法迭代地优化分子轨道系数矩阵 $C$。

  1. 外部循环(经典优化): 算法的外部循环更新分子轨道系数矩阵 $C$。它从一个初始 $C$ 开始,构建费米子哈密顿量 $H_{ferm}(C)$(Equation 13)。
  2. 内部循环(组合优化): 对于给定的 $C$,首先计算对角化的费米子哈密顿量 $H_D(C)$。与算法1类似,这个哈密顿量通过Jordan-Wigner变换转换为一个QUSO问题,然后映射到QUBO或MaxCut问题。
  3. QUSO求解: 使用经典的QUSO/QUBO/MaxCut求解器(或潜在的量子求解器)找到最低能量的Slater行列式 $|b_{min}⟩$。这个 $|b_{min}⟩$ 定义了一个新的1-粒子约化密度矩阵(1-RDM)。
  4. Fock矩阵更新: 利用新的1-RDM和当前 $C$ 矩阵,构建新的Fock矩阵 $F(C, γ_{1-RDM})$。然后对Fock矩阵进行对角化,得到新的分子轨道系数矩阵 $C'$。这个新的 $C'$ 用于下一次迭代。
  5. 收敛判断: 迭代继续进行,直到Fock矩阵(或 $C$)收敛,能量变化小于预设的阈值 $ε$。

算法2的关键优势在于,在优化分子轨道基的同时,它具有选择最低能量Slater行列式的灵活性,这使得它比传统HF更具鲁棒性,更不容易陷入局部最小值。

1.4.3 对称性惩罚项(Appendix B)

为确保找到的Slater行列式满足分子系统的对称性,论文引入了惩罚项:

  • 电子数量对称性: 对于α和β电子数量($N_α$, $N_β$),引入惩罚项 $V_α(λ)$ 和 $V_β(λ)$ (Equations B5a, B5b)。这些项是二次的,能够保持QUSO问题的形式。
  • 总自旋量子数 ($S^2$): 对于闭壳层系统,当 $S^2=0$ 时,空间轨道是双占据或空置的,论文提出了一个二次惩罚项(B8)。对于更通用的 $S^2$ 约束,可能引入四次项(B7),需要二次化技术将高阶项转化为二次项,但这可能引入辅助变量。

1.4.4 哈密顿量映射细节(Appendix E)

  • QUSO到QUBO映射: 将QUSO中的自旋变量 $Z_i \in \{+1, -1\}$ 映射到二元变量 $x_i \in \{0, 1\}$,通过关系 $Z_i = 1 - 2x_i$。这使得QUSO问题可以转换为标准的QUBO形式。
  • QUSO到MaxCut映射: 引入一个辅助费米子自旋 $w$(通常设置为0),将对角化的费米子哈密顿量 $H_D^{ferm}(R)$ 转换为一个包含 $Z_w$ 项的等效哈密顿量 $H_{MaxCut}^{JW}(R)$ (Equation E5b)。这个巧妙之处在于,当 $Z_w = -1$ 时,它恢复原始哈密顿量;当 $Z_w = +1$ 时,它对应于所有自旋翻转的态,但具有相同的本征值。通过将这个哈密顿量乘以-1,将其最小化问题转化为最大化问题,从而将其转换为MaxCut问题(Equation E12),其系数定义了图的边权重。

1.4.5 混合量子-经典SCF算法(Section III D)

论文还提出了四种混合量子-经典SCF算法框架,用于解决内部循环的离散优化问题:

  1. GAS-SCF (Grover Adaptive Search): 利用Grover自适应搜索算法为QUSO问题提供二次加速,通过迭代寻找低于阈值的解来逼近最优值。
  2. QAOA-SCF (Quantum Approximate Optimization Algorithm): 将QUSO问题作为成本哈密顿量,结合混合哈密顿量,通过量子算法(QAOA)近似求解内部优化问题。
  3. QA-SCF (Quantum Annealing): 直接利用量子退火器来求解内部的Ising问题。
  4. DQI-SCF (Decoded Quantum Interferometry): 将MaxCut-SCF问题转换为加权MAX-2-XORSAT实例,利用DQI算法的稀疏傅里叶谱特性求解。需要注意的是,这些量子算法框架在本文中仅为概念性提出,未进行实际量子计算验证。

1.5 原子到分子轨道积分 (Appendix G)

为了构建对角化的费米子哈密顿量,需要将原子轨道(AO)基组中的两电子排斥积分(ERI)转换为分子轨道(MO)基组中的积分。论文详述了这一过程:

  • 通用两电子积分 (pq|rs): 通过四重张量收缩实现 (Equation G1)。
  • 特殊对角项 (pq|qp) 和 (pp|qq): 论文指出,并非所有积分都用于构建对角化哈密顿量,只计算必要的项 (Equations G2, G3),这能提高速度并节省内存。这些特殊的项的计算通过优化的收缩路径完成,如论文表II和表III所示。

1.6 小结

通过上述理论基础和方法细节,论文构建了一个从Hartree-Fock到QUSO/MaxCut的完整映射,并设计了两种新颖的SCF算法。这些算法不仅在理论上提供了性能保证,而且通过明确定义内部离散优化步骤,为引入量子算法提供了清晰的路径。这种重构的核心在于将复杂的非线性优化问题分解为连续的轨道优化和离散的基态选择问题,从而能针对每个子问题应用最合适的求解策略。

2. 关键benchmark体系,计算所得数据,性能数据

2.1 关键Benchmark体系

为了验证QUBO-SCF和MaxCut-SCF方法的有效性、收敛性和鲁棒性,论文选择了两个具有代表性的分子体系进行基准测试:

  1. 羟基阴离子 (OH⁻): 在6-31G基组下,该体系对应于22个量子位(自旋轨道)的问题。这是一个相对较小的体系,适合于初步验证算法的正确性和收敛性,并与传统SCF方法进行直接比较。
  2. 氮分子 (N₂) 解离曲线: 分别在cc-pVDZ、cc-pVTZ和cc-pVQZ基组下进行研究。这些基组对应的问题规模分别为56、120和220个量子位(自旋轨道)。氮分子解离是一个经典的量子化学难题,因为在键长伸长时,它会逐渐表现出多参考特性,使得限制性Hartree-Fock(RHF)计算容易出现内部不稳定性或不准确的解。这为新算法在处理RHF方法常见失效场景时的鲁棒性提供了严峻的测试。

2.2 计算环境与设置

  • 分子积分获取: 所有分子积分均使用PySCF软件包[70]获得。
  • 费米子-量子位映射: 费米子哈密顿量通过Jordan-Wigner变换[73]转换为量子位哈密顿量。
  • 对称性强制: 引入了二次惩罚项以确保S²=0(闭壳层体系)和正确的α/β电子数量。惩罚系数λ设定为哈密顿量1-范数的值。
  • QUSO/QUBO/MaxCut转换: QUSO问题首先转换为QUBO问题(Appendix E1),然后转换为MaxCut问题(Equation E12)。
  • 经典QUSO/MaxCut求解器:
    • MaxCut求解器: 使用Goemans-Williamson (GW) 算法[52, 61]。SDP(半正定规划)问题通过CVXPY[78]求解,接着利用NumPy[79]进行Cholesky分解和超平面舍入。
    • QUBO求解器(模拟退火与Tabu搜索): 使用D-Wave系统的TabuSampler (dwave-tabu)[74]和SimulatedAnnealingSampler (dwave-neal)[75]。
    • 通用优化器: 使用Qiskit Optimization中的CplexOptimizer[76, 77],它调用IBM CPLEX优化器。
  • 传统SCF计算: 使用PySCF的默认RHF设置和第二阶(SO)RHF计算(进行内部稳定性分析并修正)。此外,还与Psi4[82]、Gaussian[83]和Orca[84]等常用量子化学软件进行比较。
  • 所有数值结果均在经典硬件上获得,未进行量子计算。 初始轨道通常采用原子密度叠加方法[56]。

2.3 OH⁻ 体系的计算结果与性能数据

论文图2(第11页)展示了OH⁻在6-31G基组下的SCF收敛情况,表IV-VIII(第31-32页)提供了详细的数值数据。

  • 传统SCF方法的表现 (图2a):

    • 许多传统方法(如Psi4、Gaussian、PySCF的默认RHF)收敛到局部最小值,其能量高于真实的Hartree-Fock基态。这些局部最小值伴随着内部不稳定性。例如,Psi4和PySCF的初始几次迭代能量下降很快,但很快陷入了次优解。
    • 少数方法(如Gaussian SCF=QC、Orca、PySCF-SOSCF)能够收敛到真正的Hartree-Fock基态。但这些通常需要使用第二阶SCF方法或软件内部的收敛辅助技术(如电平位移、DIIS)。Orca的优化曲线甚至在收敛前曾短暂低于最终的Hartree-Fock能量,这表明软件内部可能进行了修改以辅助收敛。
  • QUBO/MaxCut-SCF方法的表现 (图2b,表VII-VIII):

    • 令人印象深刻的是,所有使用QUBO-SCF和MaxCut-SCF的实例(无论是算法1还是算法2,使用CPLEX、Tabu、MaxCut、模拟退火等求解器)都收敛到了真正的Hartree-Fock基态
    • 这些新方法表现出更强的内部不稳定性抵抗能力,并且收敛速度更快,通常在4步之内就能收敛到基态,显著优于图2a中的传统方法。
    • 这表明将SCF问题重构为组合优化问题,并在每一步精确找到最低能量的Slater行列式,可以有效地避免传统SCF算法的收敛问题和局部最小值。

2.4 N₂ 体系的计算结果与性能数据

论文图3(第12页)展示了N₂在cc-pVDZ、cc-pVTZ和cc-pVQZ基组下的解离曲线,表IX-XI(第32-33页)提供了详细的数值数据。

  • 传统RHF方法的表现 (图3):

    • 在键长较长时(例如,N₂解离曲线的末端),传统的RHF方法(PySCF默认RHF)表现不佳,其能量高于更优的Slater行列式能量。这表明在这些区域,RHF计算存在内部不稳定性。这是因为RHF在处理键断裂等具有多参考特征的体系时往往会遇到困难。
    • 经过内部稳定性检查和修正的第二阶(SO)RHF计算,在整个解离曲线上表现显著更好,其能量与新方法的结果一致,验证了新方法的稳健性。
  • QUBO/MaxCut-SCF方法的表现 (图3):

    • QUBO-SCF和MaxCut-SCF(算法2)方法在整个解离曲线上都表现出与SO-RHF相当甚至更好的性能。
    • 它们有效地克服了传统RHF在长键长区域的内部不稳定性问题,始终能够找到最低能量的Slater行列式。
    • 即使对于220个量子位(cc-pVQZ基组)这样相对较大的问题,这些新方法依然表现出良好的收敛性和稳定性。

2.5 CISD计算结果与分析

论文图4(第13页)和表XII-XIV(第33-34页)展示了使用由QUBO/MaxCut-SCF选择的分子轨道进行的CISD(Configuration Interaction with Singles and Doubles)计算结果。

  • MOs的优越性: 结果表明,由QUBO/MaxCut-SCF方法生成的分子轨道在某些情况下可以优于传统SCF获得的轨道,从而导致CISD能量更低。例如,在图4a的第一个CPLEX数据点处,其CISD能量低于传统SCF的CISD能量。
  • 原因分析: 论文推测,这种改进可能源于新SCF算法在迭代优化过程中考虑了不同的Fock态,从而更好地优化了未占据分子轨道。传统的HF方法通常专注于优化占据轨道以最小化HF能量,但对未占据轨道关注较少。新方法通过在每个步骤中寻找最低能量的Slater行列式,可能在整个MO空间中实现了更全面的优化,从而为高阶后HF方法提供了更好的参考基组。

2.6 性能总结

总的来说,本论文的数值结果强有力地证明了QUBO-SCF和MaxCut-SCF算法在解决Hartree-Fock问题时的稳健性和准确性。它们有效地避免了传统SCF算法中常见的内部不稳定性问题和局部最小值收敛,并且在多个分子体系和基组上展现出与第二阶RHF方法相当或更优的性能。此外,新方法生成的分子轨道为高阶后HF方法提供了更优质的基组,进一步提升了下游计算的准确性。这些结果证实了将Hartree-Fock重构为组合优化问题,并通过经典求解器获得性能保证的潜力。

本论文详细描述了将Hartree-Fock自洽场(SCF)问题转化为QUSO/QUBO/MaxCut问题的算法和数值结果。虽然论文没有提供具体的代码仓库链接,但它清晰地阐述了实现方法,并列举了所使用的软件包,使得复现其核心思想和结果是可行的。以下将基于论文内容,详细分析代码实现细节、提供复现指南,并列出相关开源软件包及其链接。

3.1 总体实现架构

论文的核心是两种SCF算法(算法1和算法2),它们都包含一个外部的经典优化循环和一个内部的离散优化步骤。这个架构将复杂的非线性SCF问题分解为两个子问题:

  1. 外部经典优化: 负责连续变量(分子轨道参数 $κ$ 或分子轨道系数矩阵 $C$)的优化,使用经典的梯度下降或牛顿法。
  2. 内部离散优化: 负责在给定分子轨道基组下,找到最低能量的单Slater行列式。这被重构为QUSO/QUBO/MaxCut问题,并通过专门的求解器(经典或量子启发式)解决。

3.2 核心软件包和库

论文中提到了多个关键的开源软件包和库,它们构成了整个实现的基础:

  1. PySCF [70]: Python-based Simulations of Chemistry Framework。

    • 作用: 获取分子体系的一电子和二电子积分(h_pqg_pqrs),执行传统的RHF和第二阶SO-RHF计算以进行比较。
    • 开源仓库: https://github.com/pyscf/pyscf
  2. Jordan-Wigner Transformation [73]:

    • 作用: 将费米子哈密顿量(以产生/湮灭算符表示)转换为作用在量子位上的Pauli算符哈密顿量(Ising模型或QUSO)。这是量子化学中用于量子计算的标准转换。
    • 实现: 通常需要手动编写转换逻辑,或使用现有量子库(如Qiskit、Cirq、OpenFermion)中提供的工具。
  3. CVXPY [78]: A Python-embedded modeling language for convex optimization problems。

    • 作用: 用于解决MaxCut问题中的半正定规划(SDP)松弛问题,这是Goemans-Williamson算法的关键步骤。
    • 开源仓库: https://github.com/cvxpy/cvxpy
  4. NumPy [79]: The fundamental package for scientific computing with Python。

    • 作用: 在Goemans-Williamson算法中,用于SDP解的Cholesky分解和超平面舍入(hyperplane rounding)。
    • 开源仓库: https://github.com/numpy/numpy
  5. SciPy [81]: Python-based ecosystem of open-source software for mathematics, science, and engineering。

    • 作用: 在算法1的外部循环中,用于实现牛顿共轭梯度法(Newton-CG)[80]来优化轨道梯度和Hessian。SciPy提供了scipy.optimize模块,其中包含多种优化算法。
    • 开源仓库: https://github.com/scipy/scipy
  6. D-Wave Samplers (dwave-tabu [74], dwave-neal [75]):

    • 作用: 作为经典的QUSO启发式求解器,用于Tabu搜索和模拟退火算法,以找到QUSO问题的近似解。
    • 开源仓库: https://github.com/dwavesystems/dwave-tabu, https://github.com/dwavesystems/dwave-neal
  7. Qiskit Optimization [76, 77]: Part of IBM’s Qiskit ecosystem for solving optimization problems.

    • 作用: 论文提到了CplexOptimizer,表明通过Qiskit的优化模块接口集成了IBM CPLEX求解器,用于精确求解QUBO问题。
    • 开源仓库: https://github.com/qiskit-community/qiskit-optimization
  8. 其他传统量子化学软件: Psi4 [82], Gaussian [83], Orca [84]。

    • 作用: 用于生成对比数据,以评估新算法相对于业界标准工具的性能。

3.3 代码实现细节

1. 数据输入和初始化:

  • 分子几何与基组: 定义分子的原子坐标和基组(例如,OH⁻/6-31G,N₂/cc-pVDZ)。
  • PySCF积分: 调用PySCF模块计算一电子和二电子积分 $h_{pq}$ 和 $g_{pqrs}$。这些积分将作为构建哈密顿量的基础。
  • 初始轨道: SCF迭代通常从一个初始轨道猜测开始,论文提到使用原子密度叠加方法[56]。

2. 哈密顿量构建与转换:

  • 对角化费米子哈密顿量构建: 根据当前的分子轨道(由 $κ$ 或 $C$ 决定),构建对角化费米子哈密顿量 $H_D(R)$ 或 $H_{ferm}(C)$(Equations 4, 13)。这涉及分子轨道积分的转换(Appendix G)。
  • Jordan-Wigner转换: 将费米子哈密顿量转换为Pauli哈密顿量,即QUSO形式(Equation 7)。这会将费米子算符替换为Pauli-Z算符的乘积。

3. 对称性惩罚项的实现:

  • 电子数量惩罚: 实现Equation B5a和B5b所示的惩罚项,确保解具有正确的α和β电子数量。这些是二次项,可以直接添加到QUSO目标函数中。
  • 总自旋平方惩罚 ($S^2$): 对于闭壳层系统,$S^2=0$ 的惩罚项(Equation B8)是二次的。对于更一般的情况,如果需要精确地实施 $S^2$ 惩罚项(Equation B7),可能需要实现二次化技术(Appendix D),这可能涉及到引入辅助变量,将高阶Pauli项转化为二次项。

4. QUSO/QUBO/MaxCut映射:

  • QUSO到QUBO: 将QUSO中的自旋变量 $Z_i$ 替换为二元变量 $x_i = (1-Z_i)/2$,将QUSO转换为标准的QUBO形式(Appendix E1)。
  • QUSO到MaxCut: 引入辅助量子位 $w$,将QUSO问题转换为MaxCut问题。这涉及到Equation E5b和E12的实现,计算出MaxCut图的边权重 $A_{ij}$。

5. SCF迭代循环实现:

  • 算法1 (图1a):
    • 内部循环(离散优化): 使用上述的QUSO/QUBO/MaxCut求解器找到当前 $κ$ 下的最低能量Slater行列式 $|b_{min}⟩$ 及其对应的能量 $E_{new}$。
    • 外部循环(轨道优化): 根据 $E_{new}$ 更新 $κ$。这需要计算轨道梯度和Hessian,可以通过广义Fock矩阵(Equation A7a, A7b)来获得。使用SciPy的scipy.optimize.minimize函数,配合自定义的梯度和Hessian函数,进行连续优化。
  • 算法2 (图1b):
    • 内部循环(离散优化): 同样使用QUSO/QUBO/MaxCut求解器找到当前 $C$ 下的最低能量Slater行列式 $|b_{min}⟩$。
    • 1-RDM计算: 从 $|b_{min}⟩$ 计算得到1-粒子约化密度矩阵(1-RDM)。
    • Fock矩阵构建与对角化: 利用新的1-RDM和当前 $C$ 矩阵,构建新的Fock矩阵 $F$。然后对 $F$ 进行对角化,得到新的分子轨道系数矩阵 $C'$。这个新的 $C'$ 将作为下一次迭代的输入。
  • 收敛标准: 比较当前能量 $E_{new}$ 与前一次迭代能量 $E_{prev}$ 的差值。如果 $|E_{new} - E_{prev}| < ε$,则认为SCF收敛。

6. 经典求解器的集成:

  • CPLEX/Qiskit: 通过Qiskit Optimization的CplexOptimizer接口调用IBM CPLEX,进行精确QUBO求解。
  • D-Wave启发式求解器: 直接调用dwave-tabudwave-neal库中的Sampler。
  • Goemans-Williamson (GW)算法: 实现GW算法,包括使用CVXPY定义和求解SDP问题,以及使用NumPy进行Cholesky分解和超平面舍入来从SDP解中构造二元解。

3.4 复现指南

要复现本论文的核心结果,量子化学研究人员可以遵循以下步骤(假设已安装Python环境及pip):

  1. 安装必要库:

    pip install pyscf numpy scipy cvxpy d-wave-tabu d-wave-neal qiskit qiskit-optimization
    

    (注意:CPLEX本身通常需要单独安装和授权,并通过Qiskit Optimization连接。如果只是想复现MaxCut的GW部分,CPLEX非必需。PySCF可能需要额外依赖如h5py等)

  2. 准备分子体系数据:

    • 编写Python脚本,使用PySCF定义OH⁻和N₂分子,并设置基组(例如mol = pyscf.gto.M(atom='OH', basis='6-31g'))。
    • 调用mf = pyscf.scf.RHF(mol).run()进行传统RHF计算,并获取一电子和二电子积分:hcore = mf.get_hcore(), eri = mol.intor('int2e')
  3. 实现哈密顿量转换和QUSO构建:

    • 编写函数将PySCF获得的积分转换为对角化费米子哈密顿量的系数 $h_{nn}$ 和 $g_{mmnn}$ 等(参考Appendix A和G)。
    • 实现Jordan-Wigner变换逻辑,将费米子哈密顿量转换为Pauli哈密顿量,生成QUSO问题对应的二次系数矩阵 $Q_{QUSO}$ 和线性系数向量 $b_{QUSO}$。
  4. 添加对称性惩罚项:

    • 根据Equations B5a, B5b, B8,编写函数生成对应于电子数量和 $S^2=0$ 的惩罚项的 $Q_{penalty}$ 和 $b_{penalty}$。
    • 将惩罚项添加到主QUSO问题中:$Q_{total} = Q_{QUSO} + λ Q_{penalty}$,$b_{total} = b_{QUSO} + λ b_{penalty}$。
  5. 实现QUSO/QUBO到MaxCut映射 (可选但推荐):

    • 如果希望利用GW算法的性能保证,则需要实现QUSO到MaxCut的转换(Appendix E2)。这包括引入辅助比特,并将QUSO问题转化为MaxCut图的边权重 $A_{ij}$。
  6. 实现SCF算法循环:

    • 算法1 (针对 $κ$ 优化):
      • 定义一个能量函数,其输入是 $κ$(或其等效表示),内部调用QUSO/QUBO/MaxCut求解器,并返回最低能量。
      • 实现一个函数来计算能量函数对 $κ$ 的梯度和Hessian(基于广义Fock矩阵)。
      • 使用scipy.optimize.minimize(例如选择method='CG''Newton-CG')来优化 $κ$,传入自定义的能量、梯度和Hessian函数。
    • 算法2 (针对 $C$ 优化):
      • 编写主SCF循环。
      • 在每次迭代中,从当前 $C$ 构建 $H_{ferm}(C)$。
      • 调用QUSO/QUBO/MaxCut求解器获得 $|b_{min}⟩$。
      • 从 $|b_{min}⟩$ 计算1-RDM。
      • 构建新的Fock矩阵 $F$,并对其对角化以获得新的 $C$。
      • 检查能量收敛。
  7. 集成经典求解器:

    • QUBO求解器: 对于QUBO问题,可以实例化CplexOptimizer或D-Wave的TabuSamplerSimulatedAnnealingSampler,将QUBO问题对象传递给它们求解。
    • MaxCut求解器: 实现GW算法,包括使用CVXPY构建和求解SDP(prob = cp.Problem(cp.Maximize(objective), constraints) prob.solve(solver=cp.SCS)),然后编写Python代码进行Cholesky分解和超平面舍入。

3.5 论文未提供但重要的开源仓库

尽管论文未提供其自定义实现的完整代码仓库,但上述列出的软件包都是开源且广泛使用的。对于理解和复现论文提出的算法,掌握这些库的使用是关键。

重要提示: 论文明确指出所有数值结果都是在经典硬件上获得的,没有进行实际的量子计算。因此,论文中提出的混合量子-经典算法(GAS-SCF, QAOA-SCF, QA-SCF, DQI-SCF)的实现和验证是未来工作的方向,而不是本次工作的直接输出。

总而言之,虽然没有直接的代码仓库,但论文提供了足够的算法细节和使用的工具信息,使得有经验的量子化学和计算优化研究人员能够复现其经典结果并进一步探索其量子算法的潜力。

4. 关键引用文献,以及你对这项工作局限性的评论

4.1 关键引用文献

本论文的贡献建立在量子化学、组合优化和量子计算领域的深厚基础之上。以下是论文中一些我认为关键的引用文献,它们支撑了本文的理论和方法:

  1. Hartree-Fock理论与SCF:

    • [22] C. C. J. Roothaan, Reviews of modern physics 23, 69 (1951). Roothaan的开创性工作奠定了现代Hartree-Fock理论和分子轨道方法的基石,是理解SCF算法的必要起点。
    • [25] A. Szabo and N. S. Ostlund, Modern Quantum Chemistry: Introduction to Advanced Electronic Structure Theory (1996). 这是一本经典的量子化学教科书,详细介绍了Hartree-Fock方法、积分计算以及自洽场过程,为本文的背景知识提供了全面的支持。
    • [26] T. Helgaker, P. Jorgensen, and J. Olsen, Molecular electronic-structure theory (2013). 另一本权威教科书,提供了轨道梯度和Hessian的计算细节,这些在本文算法1的外部循环中用于优化轨道。
  2. HF/DFT的NP-完全性:

    • [30] J. D. Whitfield and Z. Zimborás, The Journal of chemical physics 141 (2014).[31] J. D. Whitfield, N. Schuch, and F. Verstraete, Many-Electron Approaches in Physics, Chemistry and Mathematics: A Multidisciplinary View, 245 (2014). 这些工作证明了Hartree-Fock和Kohn-Sham密度泛函理论(DFT)问题在最坏情况下是NP-完全的,为本文将SCF问题重构为组合优化问题提供了强大的理论依据。
  3. 二次优化 (QUSO/QUBO) 与 MaxCut:

    • [52] M. X. Goemans and D. P. Williamson, in Proceedings of the twenty-sixth annual ACM symposium on Theory of computing (1994) pp. 422-431.[61] M. X. Goemans and D. P. Williamson, Journal of the ACM (JACM) 42, 1115 (1995). Goemans-Williamson (GW) 算法的原始论文,该算法为MaxCut问题提供了具有性能保证的半定规划(SDP)近似解。这是本文MaxCut-SCF方法中性能保证的核心来源。
    • [105] E. Boros and P. L. Hammer, Discrete Applied Mathematics 123, 155 (2002). 这项工作提供了将QUBO问题映射到MaxCut问题的方法,是本文MaxCut重构的关键技术细节之一。
  4. 量子优化算法:

    • [3] E. Farhi, J. Goldstone, and S. Gutmann, “A quantum approximate optimization algorithm,” (2014). 描述了量子近似优化算法(QAOA),这是本文提出QAOA-SCF的基础。
    • [6] S. P. Jordan, N. Shutty, M. Wootters, A. Zalcman, A. Schmidhuber, R. King, S. V. Isakov, and R. Babbush, arXiv preprint arXiv:2408.08292 (2024). 介绍了解码量子干涉测量(DQI)算法,是本文DQI-SCF的理论基础。
    • [65] A. Gilliam, S. Woerner, and C. Gonciulea, Quantum 5, 428 (2021). 描述了Grover自适应搜索(GAS)算法在加速QUBO问题方面的应用,是本文GAS-SCF的理论依据。
  5. 量子退火与量子化学:

    • [33] R. Xia, T. Bian, and S. Kais, The Journal of Physical Chemistry B 122, 3384 (2018).[36] S. N. Genin, I. G. Ryabinkin, and A. F. Izmaylov, arXiv preprint arXiv:1901.04715 (2019). 这些工作探讨了如何将电子结构问题映射到量子退火器,并指出了辅助量子位带来的挑战,为本文的方法提供了背景参考。
  6. SCF稳定性分析:

    • [45] J. Čížek and J. Paldus, The Journal of Chemical Physics 47, 3976 (1967).[47] R. Seeger and J. A. Pople, The Journal of Chemical Physics 66, 3045 (1977). 这些是关于SCF稳定性分析的早期经典文献,解释了内部不稳定性的概念及其与Hartree-Fock基态的关系。

4.2 对这项工作局限性的评论

尽管本论文在SCF优化方面提出了一个新颖且有前途的框架,但也存在一些值得深入探讨和改进的局限性:

  1. 缺乏实际量子计算验证: 本文最大的局限性在于,所有数值结果均是在经典硬件上获得的,而所有提出的混合量子-经典SCF算法(GAS-SCF、QAOA-SCF、QA-SCF、DQI-SCF)都仅是理论框架,并未在实际量子计算机或模拟器上进行性能测试。这意味着本文并未直接展示量子算法在加速或改进SCF收敛方面的实际优势。对于希望利用量子计算解决实际化学问题的研究人员来说,这是一个重要的缺失。

  2. 仅限于单参考SCF方法: 本文的方法主要针对单Slater行列式近似(Hartree-Fock)。对于具有强关联特性的体系,需要使用多参考方法(如CASSCF),而这些方法涉及优化多个Fock态的叠加,其复杂性远超单个行列式。将本文的框架推广到多参考场景将是一个重大的挑战,可能需要完全不同的映射策略。

  3. 经典求解器的可扩展性限制: 尽管本文展示了MaxCut/QUBO求解器(如CPLEX、Tabu、GW)在高达220个量子位(自旋轨道)的问题上具有竞争力,但QUBO和MaxCut问题在最坏情况下仍是NP-hard。对于更大规模的分子体系,即使是性能最佳的经典求解器也可能成为计算瓶颈。GW算法虽然提供近似比保证,但其SDP求解过程本身也具有多项式时间复杂度,对于超大规模问题可能变得昂贵。

  4. 负边权重与近似比: Goemans-Williamson算法的0.878近似比保证仅适用于非负边权重的MaxCut问题。在本文的MaxCut重构中,尤其是在引入惩罚项时,可能出现负边权重。虽然论文提到正边权重数量呈二次关系,负边权重呈线性关系,但负边权重仍可能降低GW算法的实际近似性能。论文虽提及存在处理负边权重的方法[59-61],但并未深入分析其在此特定问题上的表现。

  5. 辅助量子位与硬件连通性: 尽管论文的MaxCut映射仅引入了一个辅助比特,但如果将问题部署到具有有限连通性(如D-Wave量子退火器)的实际量子硬件上,将图嵌入硬件拓扑结构可能需要额外的辅助量子位,从而显著增加问题规模和计算成本。这抵消了直接映射的一些优势。

  6. 通用 $S^2$ 惩罚项的复杂性: 论文为强制执行总自旋量子数 $S^2$ 而引入的惩罚项(例如Equation B7)可能包含四次项,这要求进行二次化处理(Appendix D)。二次化通常会引入额外的辅助变量,从而增加QUSO问题的维度和复杂性,可能影响求解效率和映射的精确性。

  7. 缺乏开放源代码: 论文详细描述了算法和结果,但没有提供其自定义实现的公开代码仓库链接。这使得其他研究人员难以直接复现论文中的新颖SCF算法,限制了其透明性和可重复性。

  8. 有限的基准测试: 本文仅对OH⁻和N₂这两个分子体系进行了研究。虽然N₂解离曲线是测试多参考特性的良好案例,但更广泛的分子种类、几何构型和基组的测试将有助于更全面地评估新方法的普适性和鲁棒性。

  9. 渐近加速与实际效益: 论文指出,Grover类算法提供的二次加速通常是渐近的,对于实际问题规模,常数项开销可能抵消理论上的优势(第8页)。这意味着即使量子算法在理论上提供加速,其在当前NISQ设备上的实际性能可能仍不如高度优化的经典算法。

这些局限性指明了未来研究的多个方向,包括在真实量子硬件上验证混合算法、扩展到多参考问题、优化惩罚项处理以及提供开源代码以促进社区合作等。

5. 其他你认为必要的补充

5.1 工作的深远意义与影响

本论文不仅仅是提出了几种新的SCF算法,更是为量子化学和量子计算领域之间建立了一座重要的桥梁,具有多方面的深远意义和影响:

  1. 提升SCF计算的稳健性与可靠性: 传统SCF方法长期以来受困于收敛到局部最小值和内部不稳定性。本论文通过将HF优化问题重构为具有性能保证的组合优化问题,为解决这些经典难题提供了一个根本性的新途径。实验结果表明,QUBO-SCF和MaxCut-SCF显著增强了SCF计算的稳健性,这对于所有依赖HF作为起点的量子化学方法(如DMRG, Coupled Cluster, CI, MP2等)都至关重要。一个更可靠的HF基态意味着后续高精度计算的起点更优,从而提升整个计算流程的准确性。

  2. 为高级量子化学方法提供优质基态: 论文通过CISD计算的例子验证了这一点:由QUBO/MaxCut-SCF优化出的分子轨道有时甚至优于传统SCF获得的轨道,导致更高层次方法(如CISD)的能量更低。这暗示了新方法能够更全面地优化分子轨道空间,包括未占据轨道,从而为后续的关联能计算提供更优质的参考基组。

  3. 为SCF问题引入更丰富的优化工具: 将HF问题重构为QUSO/QUBO/MaxCut问题,意味着可以利用组合优化领域中大量成熟且不断发展的经典精确求解器和启发式算法(如CPLEX、Tabu搜索、模拟退火等),以及诸如半定规划(SDP)等提供性能保证的算法。这极大地拓展了SCF计算的工具箱。

  4. 构建量子计算在基础量子化学中应用的路线图: 本论文的核心贡献之一是提出了GAS-SCF、QAOA-SCF、QA-SCF和DQI-SCF等混合量子-经典SCF算法框架。尽管本研究未进行实际量子计算,但这些框架明确了如何将量子优化算法(即使是当前的NISQ设备)集成到最基础的量子化学计算中。这为未来的量子加速和实现实际量子优势提供了具体的理论蓝图和实验方向。这对于推动量子化学领域探索量子计算的实用性至关重要。

  5. 理论上的性能保证: MaxCut重构提供了一种罕见的优势——在每次离散优化步骤中提供近似比的性能保证。这在传统的迭代式SCF方法中是缺失的,传统的SCF收敛性依赖于经验性启发式方法,而缺乏严格的数学保证。

  6. 重新审视NP-hard问题: 论文明确指出Hartree-Fock在最坏情况下是NP-hard的。将一个NP-hard问题映射到另一个NP-hard问题(如QUBO/MaxCut)乍看之下似乎只是“换汤不换药”,但它带来了新的机会:可以利用特定于这些新问题的算法工具,其中一些算法(如Goemans-Williamson)带有可证明的近似比,这在原始问题空间中是难以获得的。

5.2 未来研究方向与展望

本论文为量子化学和量子计算的交叉领域开辟了广阔的研究空间。基于此项工作,未来可以从以下几个方面深入探索:

  1. 混合量子-经典算法的实验验证与基准测试: 鉴于本研究尚未进行实际量子计算,最迫切的任务是在真实的NISQ量子硬件或高性能模拟器上实现并严格基准测试所提出的GAS-SCF、QAOA-SCF、QA-SCF和DQI-SCF算法。这将包括:

    • 评估不同层数(对于QAOA)和退火时间(对于QA)对收敛性、准确性和资源消耗的影响。
    • 比较量子算法在实际噪声环境下的表现与经典求解器的性能差距。
    • 探究量子算法在处理特定构型(如N₂解离曲线中的强关联区域)时是否能提供超越经典算法的优势。
  2. 大规模体系与强关联效应: 将当前方法扩展到更大规模的分子体系和具有显著强关联效应的系统。这可能需要:

    • 开发更高效的QUSO/MaxCut经典求解器或量子算法,以处理数千甚至数万个量子位的问题。
    • 探索如何将多参考自洽场(MRSCF)方法,例如完备活性空间自洽场(CASSCF),也纳入到这种组合优化框架中。这将比单参考HF复杂得多,因为需要优化多个Slater行列式的叠加态。
  3. 对称性强制与二次化技术优化: 改进惩罚项的设计和实施,确保在强制执行电子数量、总自旋、点群对称性等约束时,能够最小化辅助变量的引入,并避免不必要的更高阶项。这可能涉及:

    • 探索替代的费米子-量子位映射(如Bravyi-Kitaev变换或宇称变换),这些映射可能更好地保留哈密顿量的局部性或对称性结构,从而简化惩罚项的构建。
    • 研究更高级的二次化技术,以在保持问题规模最小化的同时,处理任何可能出现的四次或更高阶项。
  4. 自适应求解器选择与混合策略: 开发智能的自适应策略,使得内部的离散优化步骤能够根据问题的实时特性(如图的密度、负边权重数量、当前迭代的收敛状态)动态选择最佳的经典或量子求解器。例如,对于易于收敛的区域使用经典启发式算法,而在困难区域切换到量子算法或精确经典求解器。

  5. 与高级梯度方法结合: 将本文稳健的内部离散优化与更先进的、可能由量子加速的外部连续优化方法相结合,以更高效地计算和应用轨道梯度和Hessian,从而进一步加速整个SCF过程的收敛。

  6. 开源工具的开发与社区协作: 为了促进研究社区的协作和加速进展,未来的工作应包括开发和发布易于使用且文档完善的开源代码库,将本论文中描述的算法集成到现有量子化学和量子计算软件平台(如PySCF、Qiskit等)中。这将大大降低其他研究人员复现和扩展本工作的门槛。

5.3 个人见解与总结

本论文代表了量子化学领域思维模式的一次重要转变。长期以来,Hartree-Fock及其派生方法被视为已“解决”的问题,但其内在的数值不稳定性一直困扰着从业者。将HF问题重新框架为组合优化问题,不仅在理论上揭示了其NP-hard的本质,更重要的是,它为经典计算提供了新的稳健性保障,并为量子计算的应用开辟了新天地。

虽然目前所有的数值结果都基于经典计算,但这并不削弱其对量子计算领域的指导意义。它为量子算法提供了一个明确的目标问题:如何在每次SCF迭代中高效地找到哈密顿量的基态,从而直接影响SCF的收敛性和最终能量精度。这尤其适合于当前NISQ设备的特点——它们更擅长解决小规模的优化问题。未来的挑战将是如何有效克服量子硬件的噪声、有限连通性和量子位数量,使理论上的量子加速能够转化为实际的化学计算优势。

总而言之,这项工作不仅为克服Hartree-Fock的收敛难题提供了强大且理论上有保障的经典解决方案,更为将量子计算技术无缝集成到量子化学的核心计算中提供了清晰的蓝图,预示着量子化学与量子信息科学的深度融合将带来全新的研究范式和计算能力。