大活性空间下的强关联计算突破：DMRG-ENPT2 方法深度解析

来源论文: https://arxiv.org/abs/1909.11954 生成时间: Mar 01, 2026 10:41

0. 执行摘要

在现代量子化学中，准确描述强关联体系（如过渡金属配合物、多环芳烃和低维材料）的电子结构是一个持久的挑战。这类体系通常要求同时处理静态电子相关（Static Correlation）和动态电子相关（Dynamic Correlation）。密度矩阵重正化群（DMRG）方法虽然在处理大型活性空间内的静态相关方面展现了卓越的性能，但由于其变分性质，往往难以高效捕获活性空间外的动态相关。

由宋寅轩、马海波等学者提出的 DMRG-ENPT2 方法，通过将 DMRG 参考波函数与多参考二阶 Epstein-Nesbet 微扰理论（ENPT2）相结合，并引入基于缠结驱动遗传算法（EDGA）的选择配置相互作用（SCI）近似，成功地将准确计算的活性空间范围扩展到了 30-40 个轨道甚至更多。本文将深入探讨该方法的理论背景、技术细节、基准测试表现以及在实际科研中的应用价值。

1. 核心科学问题，理论基础，技术难点与方法细节

1.1 核心科学问题：静态与动态相关的双重博弈

在电子结构理论中，电子相关通常被划分为：

静态相关：起源于基态与低能激发态之间的近简并，通常需要多重构（Multi-reference）方法描述。DMRG 在此领域已能处理超过 50 个轨道的活性空间（CAS）。
动态相关：起源于电子间的瞬时库仑排斥，涉及大量虚拟轨道的激发。通常需要微扰理论（如 CASPT2, NEVPT2）或配置相互作用（MRCI）来处理。

技术痛点：传统的 post-DMRG 方法（如 DMRG-CASPT2 或 DMRG-NEVPT2）在处理大活性空间时，往往受限于高阶约化密度矩阵（n-RDM）的计算存储开销，或者受限于内部收缩（Internal Contraction）带来的复杂方程求解。因此，开发一种“廉价”且能兼容大活性空间的动态相关修正方法是当务之急。

1.2 理论基础：Epstein-Nesbet 微扰理论 (ENPT2)

ENPT2 是一种非 Rayleigh-Schrödinger 类型的微扰理论。其核心思想是将全配置空间划分为变分空间 $\Pi$（由行列式 $|D_i\rangle$ 组成）和外部空间（由 $|D_a\rangle$ 组成）。

其零阶哈密顿量 $H_0$ 定义为：

在变分空间 $\Pi$ 内，保留全哈密顿量的所有矩阵元。
在外部空间，仅保留哈密顿量的对角矩阵元。

这种定义的优势在于：在处理外部空间激发时，无需对角化巨大的矩阵，也无需求解线性方程组。微扰能级修正公式极其简洁：

$$\Delta E_{ENPT2} = \sum_{a \notin \Pi} \frac{(\sum_{i \in \Pi} \langle D_a | \hat{H} | D_i \rangle c_i)^2}{E_0 - \langle D_a | \hat{H} | D_a \rangle}$$

其中 $E_0$ 是零阶能量，$c_i$ 是变分空间内行列式的系数。

1.3 技术难点：从 MPS 到行列式的转换与采样

DMRG 的波函数是以矩阵乘积态（MPS）形式表达的。虽然 MPS 包含了全配置相互作用（FCI）空间的信息，但其系数 $c_{\sigma}$ 是通过矩阵乘积得到的：

$$c_{\sigma_1 \dots \sigma_L} = A^{\sigma_1} A^{\sigma_2} \dots A^{\sigma_L}$$

对于一个 30 轨道的活性空间，行列式的总数超过 $10^{18}$，直接搜索重要的行列式 $|D_i\rangle$ 以构建变分空间 $\Pi$ 是典型的 NP-hard 问题。

1.4 方法细节：EDGA 采样与 SCI 近似

为了解决上述采样难题，该工作集成了缠结驱动遗传算法（EDGA）。其步骤如下：

DMRG 预计算：首先进行低键维数 $M$ 的 DMRG 计算，获得初步的 MPS 参考态。
遗传算法演化：利用轨道间的量子互信息（Mutual Information）指导遗传算法的交叉与变异过程。这使得算法能优先探索那些对能量贡献大的配置空间。
完备性筛选：通过计算采样行列式的完备性系数 $P = \sum |c_i|^2$ 来衡量。当 $P$ 达到 0.99 或更高时，认为已捕获了参考波函数的主要特征。
SCI 对角化：在选定的行列式集合（通常为 $10^2 \sim 10^5$ 个）上构造哈密顿矩阵并对角化，获得 $|\Psi_0\rangle$ 和 $E_0$。
ENPT2 修正：对剩余空间进行二阶微扰计算。

2. 关键 Benchmark 体系，计算所得数据与性能分析

2.1 H₂S 分子的平衡态与拉伸态测试

H₂S 是一个验证动态相关贡献的理想体系。实验设定活性空间为 (16e, 15o)，并使用巨大的 ANO-L-VQZP 基组。

关键数据分析（单位：Hartree）：

DMRG-FCI (参考值)：能量为 -398.99268 (平衡态)，能量差 $\Delta = 73.55$ mHartree。
DMRG-CASCI (仅静态相关)：在平衡态下仅为 -398.72456，缺失了约 268 mHartree 的动态相关能。
DMRG-ENPT2 (本文方法)：在 CASSCF 轨道下，平衡态能量为 -398.97694，成功捕获了约 92.4% 的动态相关能。

结论：在平衡态到拉伸态的能量差计算中，DMRG-ENPT2 得到的 74.32 mHartree 与参考值 73.55 mHartree 极其接近，误差仅为 0.77 mHartree，远优于未经微扰修正的 CASCI。

2.2 Hexacene (并六苯) 的 S₀-T₁ 能隙

并六苯是研究并苯类分子单重态-三重态（S₀-T₁）间隙的经典体系。该计算使用了 (26e, 26o) 的超大活性空间。

性能表现：

DMRG-CASCI 预测的能隙为 39.66 mHartree。
DMRG-ENPT2 预测的能隙为 31.27 mHartree。
DMRG-ec-MRCISD+Q 参考值为 30.44 mHartree。

效率优势：计算发现，ENPT2 仅消耗了 ec-MRCISD+Q 约 10% 的计算时间，却达到了极高的精度。这证明了在面对大规模 $\pi$ 电子体系时，ENPT2 的简洁对角形式具有巨大的性能优势。

2.3 2D H₆₄ 方格晶格

这是最具挑战性的强关联模型体系之一，活性空间高达 (42e, 42o)。

DMRG-CASCI 能量：-32.50450 Hartree。
DMRG-ENPT2 能量：-32.63126 Hartree。
通过与 (42e, 117o) 的大型计算对比，证明了 ENPT2 在这种极度非局域化的体系中依然能够稳定收敛，并有效回收动态相关能。

3. 代码实现细节、复现指南与开源链接

3.1 核心软件包架构

该方法通过耦合多个专业软件包实现：

QCmaquis：用于执行高性能的 MPS-DMRG 计算，提供基础的 MPS 矩阵元输出。其支持自旋对称性和分子点群对称性。
In-house EDGA Code：这是该研究的关键核心，负责从 QCmaquis 输出的矩阵中解析系数，并执行缠结驱动的采样。
SCI & ENPT2 Engine：一个基于 Slater 行列式的行列式处理引擎，利用比特串（Bitstring）技术高效存储配置并计算哈密顿矩阵元（由 Slater-Condon 规则驱动）。

3.2 复现指南步骤

如果您希望复现该工作，可以遵循以下流程：

轨道生成：使用 PySCF 或 GAUSSIAN 生成 HF 轨道或 CASSCF 自然轨道。注意：该方法强烈依赖轨道选择，CASSCF 轨道通常能提供最佳收敛性。
DMRG 采样：运行 QCmaquis 获得收敛的 MPS。建议键维数 $M$ 在测试阶段设为 500-1000。
执行采样：调用 EDGA 脚本。核心参数包括：
- target_completeness: 建议设为 0.99。
- population_size: 每一代遗传算法的种群数（通常设为数百）。
微扰计算：运行 ENPT2 程序。该步骤通常是多线程高度并行的。

3.3 开源资源 link

QCmaquis: https://github.com/qcmaquis/qcmaquis (基础 DMRG 引擎)
PySCF: https://github.com/pyscf/pyscf (推荐用于前期的轨道处理和基础计算交互)
作者课题组主页: 读者可联系南京大学马海波教授课题组获取相关的 EDGA/ENPT2 内部插件代码。

4. 关键引用文献与深度评论

4.1 关键引用

White (1992) [1]: 奠定了 DMRG 的数学基础。
Chan & Head-Gordon (2002) [4]: 将 DMRG 引入量子化学大活性空间计算。
Sharma et al. (2017) [51]: 热浴 CI (SHCI) 方法，与本项目中的采样思想有异曲同工之妙。
Malrieu et al. (1973) [50]: 经典的 CIPSI 思想，即通过扰动采样行列式的鼻祖。

4.2 局限性评论（技术审稿人视角）

尽管 DMRG-ENPT2 表现出色，但在实际应用中仍存在三个不容忽视的局限性：

轨道不变量缺失（Orbital Invariance）：由于 ENPT2 的零阶哈密顿量只包含对角项，它对轨道的旋转非常敏感。如 Table 1 所示，在局域化轨道下的表现远不如 CASSCF 自然轨道。这意味着用户必须进行繁琐的轨道优化。
尺寸一致性（Size Consistency）：SCI 方法本身通常不是尺寸一致的，虽然增加采样完备性可以缓解这一问题，但在处理断键过程或团簇体系时，需谨慎评估能量误差。
计算瓶颈：虽然 ENPT2 只需要 10% 的 MRCISD+Q 时间，但其外部空间的求和仍然受限于行列式生成速度。对于包含大量激发态的超大分子，内存 IO 可能会成为新的瓶颈。

5. 补充：为什么选择 ENPT2 而非 NEVPT2？

在 post-DMRG 的研究中，NEVPT2（n-电子价微扰理论）通常被认为是“黄金标准”，因为它天生解决了侵入态（Intruder States）问题且具有尺寸一致性。那么，为什么本文选择了“过时”的 ENPT2？

5.1 算力开销的极致优化

NEVPT2 的计算核心在于处理四阶约化密度矩阵（4-RDM）。在 DMRG 框架下计算 4-RDM 的复杂度随活性空间 $L$ 指数增长或极高幂次增长。对于 $L=40$ 的体系，4-RDM 的存储需求是天文数字。

相比之下，ENPT2 避开了 n-RDM 的构建。它通过采样行列式直接在配置空间操作，这本质上将问题从“全局张量收缩”转化为“局部比特位运算”。在超大型活性空间面前，这种牺牲部分物理特性（如尺寸一致性）来换取“可计算性”的策略，是工程上的高明抉择。

5.2 对侵入态的免疫力

由于 ENPT2 在分母中保留了行列式的全对角能级差，相比于传统 CASPT2 使用的一类（Level-shift）近似，它在处理开壳层体系时表现得更为稳健，不易产生发散的微扰项。

5.3 未来展望：集成到机器学习

目前的 EDGA 采样仍然需要多次 DMRG 预演。未来的一个方向可能是利用机器学习（如神经网络波函数）来预测 MPS 中的重要配置，从而完全绕过遗传算法的迭代过程，实现真正意义上的“一键式”强关联动态相关修正。

总结：DMRG-ENPT2 为我们提供了一个在计算精度和计算资源之间取得平衡的新工具。它不仅是理论上的创新，更是为解决实际化学难题（如光伏材料、生物金属酶）扫清了障碍。对于追求极致性能的科研人员来说，这一方法无疑是目前处理 40 轨道以上体系动态相关能的最佳方案之一。