来源论文: https://arxiv.org/abs/2404.06070 生成时间: Feb 22, 2026 04:52

完备活性空间迭代耦合簇理论：提升多参考体系计算精度的新范式

0. 执行摘要

传统的单参考耦合簇方法在处理具有显著多参考特征的分子体系时面临挑战，这些体系通常涉及到化学键的断裂或激发态的描述。为了克服这一限制，研究人员开发了多种多参考方法，但它们往往在计算成本和精度之间难以平衡，或者存在如“入侵态”等固有的数值不稳定性。本文介绍了一种新颖的理论方法——完备活性空间迭代耦合簇（CASiCC）理论，旨在通过在完备活性空间自洽场（CASCI）计算与多参考驱动的耦合簇方法（如定制耦合簇TCC和外校正耦合簇ecCC）之间建立迭代反馈循环，系统性地提升这些方法的精度。该方法通过对哈密顿量进行相似变换，并利用外部耦合簇振幅来更新内部活性空间描述，实现了内部与外部关联之间的协同优化。研究人员通过对H4、H8、H2O和N2等典型分子的势能曲线进行基准测试，结果表明CASiCC方法，特别是在三阶BCH展开截断（CASiTCCSD(3)）下，相较于单参考CCSD及传统的TCCSD和ecCCSD，在整个势能曲线上均展现出显著且系统性的精度提升，同时保持了适度的计算成本。尽管在某些强关联区域，TCCSD由于误差补偿可能偶然表现出更高精度，但CASiCC提供了更稳健且无偏的系统性改进途径。这项工作为处理复杂化学问题中的静态和动态关联提供了一个有前景的工具。

1. 核心科学问题，理论基础，技术难点，方法细节

1.1. 核心科学问题：静态与动态关联

量子化学领域长期以来面临的核心挑战之一是准确描述分子中的电子关联效应，尤其是在“静态-动态关联”问题突出时。当哈特里-福克（HF）行列式不能提供对波函数的定性正确表示时，即波函数由多个具有相似且不可忽略的组态相互作用（CI）系数的行列式主导时，问题便会显现。这种情况在化学键断裂、过渡金属化合物、某些激发态和自由基等具有显著多参考特征的体系中尤为常见。在这种情况下，诸如耦合簇单双激发（CCSD）等基于单参考行列式系统性构建激发的方法，往往会给出不准确甚至完全不可靠的结果，因为它们无法有效地捕获由近简并或简并电子态引起的长程静态关联。

动态关联则描述了电子瞬时相互作用引起的关联效应，通常可以通过高阶激发来描述。单参考耦合簇方法，例如CCSD，在弱关联体系中对动态关联的描述非常出色。然而，当静态关联变得重要时，单参考方法的核心假设（即波函数可以由单个Slater行列式主导）就会失效。

为了解决静态关联问题，需要采用多参考（MR）方法。这些方法通过选择一个包含多个重要行列式的模型空间来构建波函数。其中，完备活性空间（CAS）方法是一种广泛使用的MR方法，它将所有可能的电子激发限制在一个选定的活性空间轨道集合中。然而，CASCI（完备活性空间组态相互作用）的计算成本随活性空间的大小呈阶乘级增长，限制了其实际应用。此外，CASCI本身只描述了静态关联，而忽略了活性空间之外的动态关联，这会导致能量不准确。

因此，核心的科学问题在于如何高效、准确地将静态关联（通过多参考方法）和动态关联（通过单参考耦合簇等方法）结合起来，尤其是在整个势能曲线上，包括从弱关联到强关联的过渡区域。

1.2. 理论基础：耦合簇、多参考方法与相似性重整化群

1.2.1. 耦合簇理论与多参考方法

耦合簇（CC）方法是单参考体系的“黄金标准”，特别是CCSD和CCSD(T)（包含非迭代微扰三阶激发校正）。其波函数通常表示为 \( |\Psi_{CC}\rangle = e^T |\Phi_0\rangle \)，其中 \( T \) 是聚类算符，\( |\Phi_0\rangle \) 是参考行列式。CC方法具有尺寸一致性和尺寸外延性等理想性质。然而，在多参考体系中，CC方法需要对参考波函数进行修改，导致多参考耦合簇（MRCC）方法的发展面临诸多挑战。

为了解决这些挑战，一系列多参考驱动的单参考耦合簇（MR-driven SRCC）方法被提出。这些方法通常基于“分离振幅（split-amplitude）”Ansatz，将聚类算符 \( T \) 分为内部（活性空间内）和外部（活性空间外）两部分： \( T = T_{int} + T_{ext} \)。

定制耦合簇（TCC）方法：由Kinoshita、Hino和Bartlett提出。它通过从CASCI或其他多参考波函数中获取低阶（通常是单激发和双激发）内部振幅，并将这些振幅固定，然后在SRCC框架下优化剩余的外部振幅。TCC方法有效地将部分多参考效应纳入到CC计算中，但内部振幅是预先确定的，并且在外部振幅优化过程中不会迭代更新。
外校正耦合簇（ecCC）方法：与TCC类似，ecCC方法利用CASCI波函数来提供高阶（通常是三激发和四激发）内部振幅作为校正项，然后优化单激发和双激发振幅。它通常比TCC在某些情况下提供更好的结果，但计算成本更高，特别是需要计算高阶约化密度矩阵（RDMs）。

1.2.2. 相似性重整化群（SRG）的启发

耦合簇理论不仅可以被视为非线性波函数公式，也可以被视为一种有效的哈密顿量理论。这一解释建立了CC与相似性重整化群（SRG）方法之间的联系。SRG方法最初由Głazek和Wilson以及Wegner提出，它依赖于哈密顿量酉变换的流方程。通过选择合适的生成算符，可以积分流方程，使得哈密顿量的非对角线元素逐渐消失。White后来将SRG方法推广到多体空间，并在化学中得到应用，被称为in-medium SRG（IMSRG）。

受IMSRG方法的启发，Evangelista开发了驱动SRG（DSRG）方法，并应用于化学问题。DSRG的优势在于它不需要积分流方程，而是一步求解。DSRG也被推广到多参考形式，以解决入侵态问题。SRG的核心思想是通过一个连续的变换将哈密顿量“对角化”或“块对角化”，从而简化问题。这种思想为CASiCC方法中哈密顿量的相似变换提供了理论基础。

1.2.3. Kowalski的激发子代数理论

Kowalski引入的激发子代数理论为将CC方程分解为内部空间和外部空间提供了严格的数学框架。根据该理论，总的聚类算符 \( T \) 可以分解为 \( T_{int} \) 和 \( T_{ext} \) 两个部分，分别作用于内部（CAS）和外部（所有其他）激发空间。这种分解允许将薛定谔方程也分为内部和外部两部分。关键在于，外部聚类算符 \( T_{ext} \) 可以用于对哈密顿量进行相似变换，从而得到一个有效的哈密顿量 \( \bar{H}_{ext} = e^{-T_{ext}} H e^{T_{ext}} \)。这个变换后的哈密顿量在内部空间中被对角化，以获得内部振幅和能量。同时，外部振幅通过外部薛定谔方程在 \( T_{int} \) 的存在下进行优化。Kowalski还证明了在两个单独子代数中迭代求解CC方程等同于在整个空间中求解CC方程，这为CASiCC的迭代方案提供了理论支持。

1.3. 技术难点

CASiCC方法试图解决多参考驱动CC方法中的一些固有技术难点：

内部与外部关联缺乏反馈：在TCC和ecCC等传统方法中，内部和外部振幅之间的相互作用是单向的。内部振幅（来自CASCI）影响外部振幅，但外部振幅通常不会反过来影响内部振幅的计算。这导致在势能曲线上可能出现偏差，特别是在强关联区域。
非厄米哈密顿量：通过 \( e^{-T_{ext}} H e^{T_{ext}} \) 进行相似变换会生成一个非厄米哈密顿量。虽然现有的CI程序可以适应非厄米矩阵的对角化，但需要在实现上进行调整。
BCH展开的截断：精确的相似变换会产生高阶的多体相互作用项，导致计算成本过高（例如，产生六体相互作用，需要存储十二指数张量）。因此，必须对Baker-Campbell-Hausdorff（BCH）展开进行截断，通常在二阶、三阶或四阶。截断会导致变换不再是严格的相似变换，并且对真空态的定义产生依赖性，可能导致与原始哈密顿量特征值不完全匹配。高阶算符的纳入可以减小这种差异。
计算效率与精度平衡：虽然ecCCSD可以利用CASCI的三体和四体振幅，但在实践中，这会带来巨大的内存和计算开销（例如，内存标度为 \( O(O^3V^3) \) 和 \( O(O^4V^4) \)）。如何在利用高阶关联信息的同时，保持方法的计算效率是一个挑战。
参考确定偏置：多参考驱动方法的一个局限性在于参考行列式的选择。这可能导致在单参考区域中，如CCSD反而比TCCSD更准确，因为缺乏内部和外部振幅之间的反向耦合，并降低了多参考区域中的精度，这源于参考行列式的偏置。

1.4. 方法细节：完备活性空间迭代耦合簇（CASiCC）

CASiCC方法旨在通过引入迭代反馈循环来解决上述挑战，从而实现内部（CAS）和外部（其余轨道）空间之间振幅的自洽优化。该方法的核心步骤如下：

1.4.1. 激发子代数与哈密顿量变换

空间划分：将整个激发空间划分为内部激发（CAS(K,L)中K个电子在L个轨道上的激发）和外部激发（所有其他激发）。
聚类算符分解：总聚类算符 \( T \) 分解为内部聚类算符 \( T_{int} \) 和外部聚类算符 \( T_{ext} \)。 \( T_{int} \) 产生CASCI波函数， \( T_{ext} \) 产生所有其他激发。
相似性变换：引入相似性变换的哈密顿量 \( \bar{H}_{ext} = e^{-T_{ext}} H e^{T_{ext}} \)。这个变换的目的是将外部关联效应“下折叠”到哈密顿量中。
BCH展开截断：由于 \( \bar{H}_{ext} \) 的精确表达式会包含高阶相互作用，计算成本过高，因此通过Baker-Campbell-Hausdorff (BCH) 展开进行截断。本文考虑了二阶（CASiCC(2)）、三阶（CASiCC(3)）和四阶（CASiCC(4)）截断。例如，二阶截断的 \( \bar{H}_{SD}^{ext,(2)} = \chi_0 + \sum_{pq} \chi_{pq} \{p^\dagger q\} + \frac{1}{4} \sum_{pqrs} \chi_{pqrs} \{p^\dagger q^\dagger sr\} \)。

1.4.2. 迭代算法流程（以CASiTCCSD(n)为例）

CASiCC算法通过交替求解内部和外部方程，直至自洽。具体流程如下（参见论文图1）：

初始化：
- 进行哈特里-福克（HF）计算以生成初始哈密顿量。
- 将初始外部耦合簇振幅 \( T_{SD}^{ext} \) 设置为零（即，假设最初没有外部关联）。
- 生成初始的相似变换哈密顿量 \( \bar{H}_{SD}^{ext,(n)} \)（此时由于 \( T_{SD}^{ext}=0 \)，它就是原始的哈密顿量）。
内部空间计算：
- 在活性空间内对 \( \bar{H}_{SD}^{ext,(n)} \) 进行对角化，这需要一个非厄米CASCI求解器。这将产生一组初始的CASCI系数。
- 从这些CASCI系数中提取内部耦合簇振幅 \( T_{SD}^{int} \)（在TCCSD的情况下为单双激发，在ecCCSD的情况下为三四激发）。
外部空间计算：
- 利用上一步生成的 \( T_{SD}^{int} \) 作为多参考效应的输入，进行一次TCCSD或ecCCSD计算（取决于选择的Ansatz）以求解外部CC方程。
- 这将优化并得到一组新的外部耦合簇单双激发振幅 \( T_{SD}^{ext} \)。
迭代与收敛：
- 使用新的 \( T_{SD}^{ext} \) 再次计算相似变换哈密顿量 \( \bar{H}_{SD}^{ext,(n)} \)。
- 重复步骤2和3，交替更新 \( T_{SD}^{int} \) 和 \( T_{SD}^{ext} \) 。
- 在每次宏迭代后，检查体系能量的变化。如果能量差低于预设的收敛阈值（例如 \( 10^{-10} \) Hartree），则算法终止。否则，继续下一个迭代步骤。

1.4.3. CASiTCCSD 与 CASiecCCSD 的选择

CASiTCCSD(n)：外部方程使用TCCSD求解。内部CASCI波函数提供单激发和双激发振幅 \( T_1^{int} \) 和 \( T_2^{int} \) 来“定制”外部CC计算。最终的波函数形式为 \( |\Psi_{CASiTCCSD(n)}\rangle = e^{T_{SD}^{ext}+T_{SD}^{int}}|0\rangle \)。
CASiecCCSD(n)：外部方程使用ecCCSD求解。内部CASCI波函数提供三激发和四激发振幅 \( T_3^{int} \) 和 \( T_4^{int} \) 作为外部CC计算的校正。最终的波函数形式为 \( |\Psi_{CASiecCCSD(n)}\rangle = e^{T_{SD}^{ext}}|\Psi_{int}\rangle \)。

核心思想在于：(i) 内部振幅的优化受到外部振幅编码的动态关联的影响（通过变换后的哈密顿量），以及 (ii) 外部振幅的优化受到内部振幅编码的静态关联的影响。这种双向的反馈循环是CASiCC区别于传统TCC/ecCC的关键，它旨在解决以往方法中内部与外部关联信息传递的局限性，并最终产生一个改进的CCSD波函数。

2. 关键 benchmark 体系，计算所得数据，性能数据

为了验证CASiCC方法的效率和准确性，研究人员选择了一系列典型的分子体系进行基准测试，包括H4、H8、H2O和N2，涵盖了从弱关联到强关联的不同关联强度。

2.1. H4 体系：方形解离

H4体系是一个原型性模型，用于研究四个氢原子呈方形排列时的键解离过程。这种几何构型允许通过调整参数 \( \alpha \) 来控制多参考特性，其中 \( k \) 参数固定为2 Å， \( \alpha \) 从0.5 Å变化到4 Å。在 \( \alpha = k = 2 \) Å时，基态表现出完美简并，而在 \( \alpha \) 值更大或更小时，动态关联占主导地位。计算采用cc-pVDZ基组，共20个轨道，CAS设置为CAS(4,4)。

关键数据与性能：

CCSD：在 \( \alpha \) 趋近于2 Å的简并区域，CCSD方法彻底失效，误差接近10 mHartree。在动态关联区域（\( \alpha < 1 \) Å 和 \( \alpha > 3 \) Å）误差是2到4个数量级。
TCCSD：TCCSD在 \( \alpha > 1 \) Å时显示出较大的系统误差（>1 mHartree），在解离过程中误差保持持续较高，但在 \( \alpha = 2 \) Å处没有出现CCSD那样的尖峰。
ecCCSD：ecCCSD的性能优于CCSD和TCCSD，但在 \( \alpha = 2 \) Å处也存在一个小的尖峰，误差略高于1 mHartree。
CASiTCCSD(n) / CASiecCCSD(n)：
- 截断阶数影响：对于CASiTCCSD(2)，哈密顿量展开在二阶时尚未达到收敛，误差曲线从n=2到n=3过渡时发生显著变化。然而，n=3和n=4的曲线几乎无法区分，表明在n=3时已经达到了收敛。
- TCC与ecCC的收敛性：有趣的是，对于CASiTCCSD和CASiecCCSD，当n>2时，结果是相同的。这表明，当自洽地应用时，通过包含单双激发还是三四激发来解释静态关联，对能量没有影响。
- 系统性改进：除了CASiTCCSD(2)外，所有CASiCC方法在单参考和多参考区域均系统性地优于CCSD方法，并且总体上显示出最低的误差，也优于TCCSD和ecCCSD。

非平行性误差（NPE）：NPE是势能曲线最大误差和最小误差之差，衡量了方法在整个势能曲线上描述的均匀性。

方法	H4 (mHa)
CCSD	8.41
TCCSD	4.59
ecCCSD	0.97
CASiTCCSD(2)	11.12
CASiTCCSD(3)	0.71
CASiTCCSD(4)	0.68
CASiecCCSD(2)	0.97
CASiecCCSD(3)	0.71
CASiecCCSD(4)	0.68

CASiTCCSD(3)和CASiecCCSD(3) / (4) 的NPE最低，显著优于TCCSD和ecCCSD，表明它们在整个势能曲线上都更加均匀准确。CASiTCCSD(2)表现不佳，甚至高于CCSD。
从计算角度看，TCCSD更具吸引力，因为它避免了ecCCSD所需的T3和T4振幅计算，从而避免了 \( O(O^3V^3) \) 和 \( O(O^4V^4) \) 的内存开销。

2.2. H8 体系：八边形模型

H8模型体系由八个氢原子构成一个八边形，通过参数 \( \alpha \) 的变化来调节多体关联强度。 \( k \) 参数固定为1 Å， \( \alpha \) 从-0.22 Å变化到0.22 Å，其中 \( \alpha=0 \) 对应于正八边形，是强关联区域。计算采用6-31G基组，共16个轨道，CAS设置为CAS(8,8)。

关键数据与性能：

收敛性：与H4体系类似，CASiCC模型在截断阶数n=3时达到收敛。CASiTCCSD和CASiecCCSD在收敛后再次给出相同结果，进一步验证了该方法的普适性。
CCSD：在 \( \alpha = 0 \) 的简并点处，CCSD的误差出现明显的峰值。
TCCSD：TCCSD在整个曲线上的误差相对较大且恒定，但在 \( \alpha = 0 \) 处仅显示出较小的峰值。
CASiTCCSD：再次证明了对CCSD的系统性改进。然而，在 \( \alpha = 0 \) 处的误差比TCCSD更大。CASiTCCSD(2)的误差始终低于CASiTCCSD(3)，这可能归因于偶然的误差补偿。
NEVPT2：作为一种广泛使用的多参考方法，NEVPT2的曲线显示出最小的峰值误差（在 \( \alpha = 0 \) 附近），但误差持续降低，NPE最低。

非平行性误差（NPE）：

方法	H8 (mHa)
CCSD	9.05
TCCSD	2.17
ecCCSD	5.77
CASiTCCSD(2)	6.00
CASiTCCSD(3)	6.82
CASiTCCSD(4)	6.83
CASiecCCSD(2)	6.76
CASiecCCSD(3)	6.82
CASiecCCSD(4)	6.83
NEVPT2	2.14

NEVPT2的NPE最低，其次是TCCSD。CASiCC方法的NPE高于TCCSD，但仍优于CCSD。
这再次表明CASiCC方法相对于CCSD提供了系统性改进。

2.3. N2 分子：键解离

研究人员使用CAS(6,6)和cc-pVDZ基组（共28个轨道）来描述N2分子的键断裂过程。DMRG (m=2000) 被用作参考，DMRG计算考虑了所有轨道，预期非常接近FCI结果。

关键数据与性能：

CCSD：在解离极限完全失效，无法正确描述。
TCCSD：能够可靠地描述N2的解离，在解离极限误差约为10 mHartree，与TCC的初步结果一致。
CASiTCCSD(2) 和 CASiTCCSD(3)：定性上正确，但在解离极限处存在显著误差。这些缺陷归因于CASiCC并非真正的多参考方法，作为多参考驱动的单参考方法，在近简并或精确简并情况下，由于参考行列式的偏好，激发中存在持续的不对称性。其次，外部空间中缺失的关联随着解离的进行而增加，需要包含更高阶的聚类振幅来解释这些关联。
NEVPT2：显示出比所有CC模型更高的准确性，尽管存在系统性偏差。

2.4. H2O 分子：对称双键解离

对于H2O分子，研究人员考察了键角为104.5°的对称双键解离过程，使用CAS(6,5)和cc-pVDZ基组（共24个轨道）。同样，DMRG (m=2000) 被用作参考。

关键数据与性能：

CCSD：产生非物理结果。
TCCSD：正确描述了H2O的解离，在解离极限处误差约为10 mHartree。
ecCCSD：定性描述了解离，但误差较大，约为50 mHartree。
CASiTCCSD(3)：弥补了CCSD的不足，并正确描述了解离，误差约为35 mHartree，介于TCCSD和ecCCSD之间。
TCCSD的误差补偿：对于H2O和N2，TCCSD在强关联极限下显示出更高的精度。这被认为归因于误差补偿。最近的研究也观察到，单参考TCC在强关联体系中产生了与更严格的Hilbert空间多参考TCC方法相似的结果，也指向了误差补偿机制。CASiCC在强关联区域的误差可归因于外部空间中缺失的关联和参考行列式的偏置。

2.5. 总结与性能考量

迭代收敛：迭代算法通常在5到15次宏迭代步骤内收敛到 \( 10^{-10} \) Hartree。通过将前一次迭代的振幅作为初始猜测，显著加速了收敛。CC方程通常在前几次宏迭代后在2到3次迭代内收敛。
CASiTCCSD vs. CASiecCCSD：尽管CASiTCCSD和CASiecCCSD在收敛时给出相同的能量结果（对于n > 2），但CASiTCCSD在计算上更具优势。ecCCSD需要计算T3和T4振幅，导致更高的内存和计算成本。CASiTCCSD避免了这些计算复杂性，使其成为更高效和实用的选择。CASiTCCSD(3)被认为是最佳候选方案。
系统性改进：CASiCC方法（除CASiTCCSD(2)外）在单参考和多参考区域均系统性地优于CCSD，总体误差最低，但在强关联区域，TCCSD由于偶然误差补偿可能表现更好。CASiCC旨在提供不依赖于误差补偿的系统性改进。

总的来说，CASiCC在处理多参考体系方面显示出强大的潜力，通过迭代反馈循环有效地结合了静态和动态关联，并在准确性和计算成本之间取得了良好的平衡。

3. 代码实现细节，复现指南，所用的软件包及开源 repo link

3.1. 代码实现细节

本研究所提出的CASiCC方法是通过一个定制的Python程序实现的，该程序在计算密集型任务中利用C++例程，通过 pybind11 库实现Python与C++之间的高效互操作性。这种混合编程方法兼顾了Python的灵活性和C++的性能优势。

非厄米CASCI求解器：该程序能够对包含多达四体算符的实对称和非对称哈密顿量进行对角化，这对于求解经过相似变换后的非厄米哈密顿量至关重要。非厄米对角化通常比厄米对角化更复杂，但现有的CI程序经过适当修改后可以适应。
CC方程与DIIS：耦合簇（CC）计算部分集成了DIIS（Direct Inversion in the Iterative Subspace）算法，以加速CC方程的迭代收敛。DIIS是一种广泛用于加速收敛的技巧，对于复杂的耦合簇方程组尤为重要。
自动代码生成：研究人员依赖于 Wick&d 工具进行自动代码生成。Wick&d 在以下方面发挥了关键作用：
- CC方程的推导：自动生成复杂的CC方程。
- 相似变换：自动生成哈密顿量相似变换 \( e^{-T_{ext}} H e^{T_{ext}} \) 的各项表达式及其系数。
- CI系数到CC振幅的转换：实现从CASCI波函数中提取CC振幅的转换逻辑。自动代码生成极大地减轻了手动推导和实现这些复杂表达式的负担，降低了出错的可能性，并提高了开发效率。

3.2. 复现指南

为了确保研究结果的可复现性，本工作中使用到的所有Python脚本和计算数据均已在Zenodo数据存储库上公开发布。这意味着其他研究人员可以通过访问提供的链接下载代码和数据，并独立地复现论文中的结果。

代码库链接：CASICC Package 1.0.0, 2024; https://doi.org/10.5281/zenodo.10927298。
收敛阈值：
- CC计算：能量收敛阈值为 \( 10^{-8} \) Hartree。
- 振幅范数收敛阈值为 \( 10^{-5} \) 原子单位。
- CASiCC宏迭代收敛阈值为 \( 10^{-10} \) Hartree。
DMRG计算：
- 所有DMRG计算均使用QCMaquis软件包进行。QCMaquis是一个高效的量子化学DMRG实现。
- 轨道排序采用Fiedler排序，这有助于优化DMRG的收敛速度和效率。
- 最大键维度（m）设置为2000，确保了足够的精度。论文中指出，对于N2分子（本文中最大的体系），该键维度能够使DMRG结果收敛到0.5 mHartree以内，这满足了CC方法性能评估的要求。
- DMRG能量收敛阈值为 \( 10^{-6} \) Hartree。

3.3. 所用的软件包及开源 Repo Link

除了研究团队自己开发的Python程序和C++例程外，本工作还广泛利用了多个成熟的开源量子化学和计算工具：

Pybind11：C++与Python互操作性库。
- GitHub 链接: https://github.com/pybind/pybind11
QCMaquis：用于执行DMRG计算的软件。
- 通常在特定环境下安装和使用，具体公开仓库可能需要查找其官方发布渠道或项目页面。
- 论文引用：Keller, S.; Dolfi, M.; Troyer, M.; Reiher, M. An efficient matrix product operator representation of the quantum chemical Hamiltonian. J. Chem. Phys. 2015, 143, 244118.
PySCF：一个Python实现的量子化学计算框架，用于执行分子轨道积分、受限哈特里-福克（RHF）基组、CASSCF和NEVPT2计算。
- GitHub 链接：https://github.com/pyscf/pyscf (主仓库)
- 论文引用：Sun, Q.; Berkelbach, T. C.; Blunt, N. S.; Booth, G. H.; Guo, S.; Li, Z.; Liu, J.; McClain, J. D.; Sayfutyarova, E. R.; Sharma, S.; Wouters, S.; Chan, G. K.-L. PySCF: The Python-based Simulations of Chemistry Framework. WIREs Comput. Mol. Sci. 2018, 8, e1340.
Wick&d：用于自动生成多体理论方程的工具。
- 论文引用：Evangelista, F. A. Automatic derivation of many-body theories based on general Fermi vacua. J. Chem. Phys. 2022, 157, 064111.

通过这些工具和详细的复现指南，本研究为量子化学界提供了一个透明且可验证的新方法，促进了该领域的进一步发展。

4. 关键引用文献，以及你对这项工作局限性的评论

4.1. 关键引用文献

本研究建立在量子化学领域数十年来在电子关联理论和计算方法方面取得的显著进展之上。以下是与这项工作紧密相关的几个关键文献类别：

耦合簇理论基础：
- Shavitt, I.; Bartlett, R. J. Many-Body Methods in Chemistry and Physics: MBPT and Coupled-Cluster Theory; Cambridge Molecular Science; Cambridge University Press, 2009. 这本书提供了耦合簇和多体微扰理论的全面概述，是理解单参考CC方法核心的基石。
- Piecuch, P.; Kucharski, S. A.; Bartlett, R. J. Coupled-cluster methods with internal and semi-internal triply and quadruply excited clusters: CCSDt and CCSDtq approaches. J. Chem. Phys. 1999, 110, 6103–6122. 这篇论文详细介绍了如何通过包含内部和半内部的三重和四重激发来改进CC方法，为多参考驱动的SRCC方法奠定了基础。
多参考方法与活性空间：
- Roos, B. O. Advances in Chemical Physics; John Wiley & Sons, Ltd, 1987; pp 399-445. 奠定了完备活性空间自洽场（CASSCF）方法的基础，是处理静态关联的核心工具。
- Andersson, K.; Malmqvist, P.-Å.; Roos, B. O. Second-order perturbation theory with a complete active space self-consistent field reference function. J. Chem. Phys. 1992, 96, 1218-1226. 介绍了CASPT2方法，一种重要的多参考微扰理论，用于在CASCI基础上添加动态关联。
多参考驱动的单参考CC方法（TCC和ecCC）：
- Oliphant, N.; Adamowicz, L. Multireference coupled-cluster method using a single-reference formalism. J. Chem. Phys. 1991, 94, 1229–1235. 首次提出了多参考驱动的单参考CC方法，是TCC和ecCC的先驱。
- Kinoshita, T.; Hino, O.; Bartlett, R. J. Coupled-cluster method tailored by configuration interaction. J. Chem. Phys. 2005, 123, 074106. 提出了TCC方法，其核心思想是利用CI信息定制CC振幅。
- Peris, G.; Planelles, J.; Paldus, J. Externally corrected singles and doubles coupled cluster methods for open-shell systems. J. Chem. Phys. 1997, 107, 90-98. 详细介绍了ecCC方法，利用CASSCF校正来提高单参考CCSD在开壳体系中的性能。
- Mörchen, M.; Freitag, L.; Reiher, M. Tailored coupled cluster theory in varying correlation regimes. J. Chem. Phys. 2020, 153, 244113. 作者组之前的研究工作，探讨了TCC在不同关联区域的性能。
相似性重整化群（SRG）与下折叠：
- White, S. R. Numerical canonical transformation approach to quantum many-body problems. J. Chem. Phys. 2002, 117, 7472-7482. 引入了将SRG概念应用于化学的数值正则变换方法，为哈密顿量的相似变换提供了灵感。
- Evangelista, F. A. A driven similarity renormalization group approach to quantum many-body problems. J. Chem. Phys. 2014, 141, 054109. 提出了DSRG，一种不需要积分流方程的SRG变体，对CASiCC的迭代更新机制有启发作用。
- Kowalski, K. Properties of coupled-cluster equations originating in excitation subalgebras. J. Chem. Phys. 2018, 148, 094104. 提出了激发子代数框架，为将CC方程分解为内部和外部空间提供了理论基础，是CASiCC方法的核心理论支柱。
DMRG及其应用：
- White, S. R. Density matrix formulation for quantum renormalization groups. Phys. Rev. Lett. 1992, 69, 2863-2866. DMRG方法的开创性工作，为计算强关联体系提供了高精度参考。
- Baiardi, A.; Reiher, M. The density matrix renormalization group in chemistry and molecular physics: Recent developments and new challenges. J. Chem. Phys. 2020, 152, 040903. 对DMRG在化学中的应用进行了全面回顾。

4.2. 对这项工作局限性的评论

尽管CASiCC方法在整合静态和动态关联方面取得了显著进展，并在多个基准体系上展现出优异性能，但它仍存在一些局限性：

非真正的多参考方法：CASiCC被描述为一种“多参考驱动的单参考方法”，而非“真正的”多参考方法。这意味着它仍然依赖于单一参考行列式，即使通过相似变换和迭代反馈引入了多参考效应。在近简并或精确简并情况下，由于参考行列式的偏好，激发中可能存在持续的不对称性，这可能导致在某些极端强关联区域的精度受限，如N2和H2O解离极限处的较大误差。真正的MRCC方法直接在多参考空间中构建波函数，从而避免了这种不对称性。
外部空间中缺失的更高阶关联：论文中指出，在解离过程中，外部空间中缺失的关联会增加，需要包含更高阶的聚类振幅（如T3、T4等）来解释这些关联。目前CASiCC主要聚焦于单激发和双激发（CCSD），忽略了外部空间中的更高阶激发。虽然ecCCSD可以利用CASCI的三体和四体振幅，但其高昂的计算成本限制了实际应用。如果要在外部空间中系统性地纳入更高阶激发，CASiCC的计算复杂性将显著增加，这与保持“适度计算成本”的目标可能产生冲突。
参考确定偏置的限制：方法的核心局限性在于参考行列式的选择。论文结论明确指出，“多参考驱动的CC方法的准确性本质上受到参考偏置的限制”。这意味着，无论CASiCC如何迭代优化，如果初始参考行列式对真实基态的描述存在严重偏离，方法可能难以完全纠正。这与IMSRG等方法的目标相似，但SRG的流方程设计通常更具普适性，旨在减少对参考状态的依赖。
偶然误差补偿：论文观察到TCCSD在N2和H2O的强关联极限下显示出更高的精度，并将其归因于“偶然的误差补偿”。虽然CASiCC旨在提供系统性改进，避免这种偶然性，但这一现象本身揭示了在复杂关联体系中，不同近似方法之间误差抵消的微妙性质。对于CASiCC而言，如何在确保系统性改进的同时，不损失由这种补偿带来的精度优势，是一个值得深思的问题。如果CASiCC在某些区域不如TCCSD，这可能暗示了CASiCC的近似（如BCH展开的截断、对参考行列式的依赖）仍然引入了系统性误差。
BCH展开截断的影响：对哈密顿量的BCH展开进行截断（例如在二阶、三阶或四阶）是出于计算可行性的考虑。然而，截断意味着变换不再是严格的相似变换，因此变换后的哈密顿量的特征值不再精确对应于原始哈密顿量。尽管通过纳入更高阶的算符可以使这种差异变得可忽略不计，但它仍然是方法的一个近似来源。CASiTCCSD(2)性能不佳也印证了这一点。
非厄米CI求解器的实现：虽然论文提到现有CI程序可以适应非厄米矩阵的对角化，但实际的实现可能比厄米情况更具挑战性，并且需要专门的数值算法来确保稳定性和效率。

总而言之，CASiCC为解决多参考问题提供了一个优雅且实用的框架，通过迭代反馈弥补了以往TCC/ecCC的不足。然而，它仍然是通往“精确”多参考方法道路上的一个近似步骤，其精度最终仍受限于其单参考驱动的本质和外部关联描述的完整性。

5. 其他必要补充

5.1. 整体意义与前瞻性

CASiCC方法代表了量子化学中一个重要的发展方向，即如何系统地将处理静态关联的多参考方法与高效描述动态关联的耦合簇理论相结合。该方法的核心创新在于建立了一个内部（CAS）和外部（非CAS）空间之间的双向迭代反馈循环，这有效地弥补了传统TCC和ecCC方法的局限性，即外部CC振幅无法反向影响内部CAS波函数的描述。通过这种自洽的优化过程，CASiCC能够更全面、更平衡地捕捉电子关联，特别是在势能曲线上从弱关联到强关联的过渡区域。

这项工作的重要意义在于：

桥接多参考与单参考鸿沟：它提供了一个在计算成本和精度之间取得良好平衡的框架，适用于那些传统单参考方法失效但纯粹多参考方法计算成本过高的体系。
系统性改进而非偶然补偿：与TCCSD在强关联区域可能依赖偶然误差补偿获得高精度不同，CASiCC旨在提供系统性的精度提升，使其在不同关联强度下表现更稳定可靠。
理论优雅与实际可行性：基于Kowalski的激发子代数理论和SRG思想，CASiCC在理论上是严谨的。同时，通过BCH展开的截断和DIIS等数值技术，使其在实际计算中也具有可行性。

5.2. 对比传统方法与误差分析

论文中对H4、H8、N2和H2O等典型体系的基准测试结果，有力地证明了CASiCC的优越性，但也揭示了其与传统方法的相对优势和劣势。

相对于CCSD：CASiCC在所有测试体系中都显著优于单参考CCSD，特别是在多参考区域，CCSD完全失效或出现巨大误差。这证明了CASiCC成功地将多参考效应纳入了考虑。
相对于TCCSD和ecCCSD：CASiCC在NPE方面通常表现更好，表明其在整个势能曲线上提供了更均匀的精度。虽然在N2和H2O的强关联区域，TCCSD由于误差补偿而可能展现出与CASiCC相近甚至更高的精度，但这是一种“幸运”的情况，而非系统性改进。CASiCC的迭代反馈机制正是为了克服这种单向信息流的限制，实现更根本的改进。
相对于MRPT (NEVPT2)：在H8体系中，NEVPT2表现出最低的NPE。这表明，对于某些体系，更完善的MRPT方法仍可能是具有竞争力的选择。然而，MRPT方法也存在其自身的局限性，如精度受限于扰动阶数、对多体约化密度矩阵（RDMs）的需求以及入侵态问题。CASiCC提供了一种不同路径，即通过迭代自洽的CC框架来解决问题。

误差分析表明，CASiCC在强关联区域的剩余误差可能源于：(1) 外部空间中更高阶关联的缺失，以及 (2) 参考行列式的固有偏置。这为未来的改进指明了方向。

5.3. 未来工作展望

本研究为CASiCC方法奠定了坚实的基础，并提出了几个有前景的未来研究方向：

外部空间中更高阶激发的纳入：目前CASiCC主要在CCSD水平上处理外部关联。未来的工作可以探索如何在保持计算可行性的前提下，将外部空间中的三重、甚至四重激发系统性地纳入CASiCC框架。这将需要更精细的哈密顿量相似变换处理和新的计算算法。
DMRG作为CASCI求解器：为了维持与标准CCSD方法相似的成本效率，并扩展到更大的活性空间，作者团队正在探索将密度矩阵重整化群（DMRG）算法整合为CASCI求解器。这将在处理非厄米哈密顿量时，能够有效地处理多达三体算符。DMRG在处理大活性空间方面具有显著优势，其与CASiCC的结合有望进一步提升方法的普适性和可扩展性。
对参考行列式选择的进一步优化：由于参考行列式偏置是多参考驱动CC方法的一个固有局限，未来的工作可以研究如何更明智地选择或优化初始参考行列式，以最大程度地减少这种偏置的影响。例如，可以探索基于自然轨道的参考、或使用DMRG产生的轨道作为初始参考。
应用于更广泛的化学问题：在基准测试之外，CASiCC可以应用于更广泛的复杂化学问题，例如：
- 激发态：在保持基态精度的同时，探索CASiCC在激发态计算中的性能，尤其是在多参考激发态。
- 化学反应过渡态：准确描述过渡态的势能面对于理解反应机理至关重要，这些体系通常具有显著的多参考特征。
- 复杂材料科学：例如具有强关联电子的金属有机框架或固体材料。

5.4. 代码开源与计算工具链的贡献

该研究的另一大贡献在于其代码实现和可复现性。通过开发Python/C++混合程序，并利用 pybind11、QCMaquis、PySCF 和 Wick&d 等开源工具，作者团队不仅展示了方法的有效性，也为量子化学社区提供了一个开放且透明的计算平台。代码和数据的Zenodo发布进一步促进了科学研究的开放性和可验证性，降低了其他研究人员复现和扩展这项工作的门槛。这种对开源工具和可复现性的强调，对于推动计算化学领域的发展至关重要。

5.5. 总结

CASiCC方法在处理电子关联问题上迈出了重要一步，为更准确地模拟复杂化学体系提供了新的视角和工具。通过巧妙地结合CASCI、多参考驱动的CC方法和迭代反馈机制，它成功地在精度、鲁棒性和计算成本之间取得了新的平衡。随着未来对更高阶效应和更大活性空间的处理能力的提升，CASiCC有望成为解决长期困扰量子化学家的多参考问题的重要利器，推动我们对化学世界的理解进入更深层次。