来源论文: https://arxiv.org/abs/1912.04173 生成时间: Mar 01, 2026 08:11

执行摘要

准确描述电子基态（GS）与激发态（ES）之间的转换能量是量子化学领域长期存在的巨大挑战。对于大型体系，研究人员通常依赖时间依赖密度泛函理论（TD-DFT），但其准确性高度依赖于交换相关泛函的选择。为了量化这些方法的可靠性，高精度的基准数据（Benchmarks）至关重要。本文深度解析了 Pierre-François Loos 等人于 2020 年发表在 arXiv 上的重要工作（后发表于 JCTC），该工作建立了一个包含 27 个有机分子（含有 4、5、6 个非氢原子）、共 238 个激发态的高精度激发能数据库。作者采用了被称为“登山策略”的方法，通过不断提升耦合簇（CC）激发阶数和基组完备度，结合选定构型相互作用（SCI）方法，提供了被称为“理论最佳估计值”（TBE）的参考数据。这项工作不仅扩展了此前的 1-3 个非氢原子的数据库，还对 CC3、ADC(2)、NEVPT2 等多种流行方法进行了系统的精度评估。

1. 核心科学问题、理论基础与技术细节

核心科学问题

本研究的核心问题是如何在保持化学精度的前提下，为中等尺寸的有机分子建立激发能的“绝对参考值”。在量子化学中，虽然实验数据可以作为参考，但实验测量通常给出的是 0-0 能量或吸收峰值，包含了振动修正、溶剂效应或环境扰动。而理论计算通常针对的是垂直跃迁能（Vertical Transition Energies）。为了公平地评估不同计算方法的性能，必须在完全相同的几何构型和物理模型（无环境效应、垂直跃迁）下进行比较，这便催生了对“理论最佳估计值”（Theoretical Best Estimates, TBE）的需求。然而，随着分子尺寸从 1-3 个非氢原子增加到 4-6 个，计算复杂度呈指数级增长，如何高效外推至全构型相互作用（FCI）极限和完整基组（CBS）极限是主要技术难点。

理论基础：耦合簇层级与选定 CI

作者的理论框架建立在耦合簇（Coupled Cluster, CC）理论的等级制度之上：

CC3 方法：作为 CC 理论的一个平衡点，它包含了三激发（Triples）的近似处理。研究表明，对于单激发占主导（%T1 > 90%）的态，CC3 通常能提供非常接近实验观测的精度。
EOM-CCSDT 与 EOM-CCSDTQ：方程运动（Equation-of-Motion）耦合簇方法。CCSDT 完整包含三激发，其计算代价为 $O(N^8)$，而 CCSDTQ 包含四激发，代价高达 $O(N^{10})$。在本工作中，作者将这些方法推向了技术可能的极限，用于校正 CC3 的误差。
选定构型相互作用 (SCI)：采用 CIPSI（Configuration Interaction using a Perturbative Selection made Iteratively）算法。该方法不预先定义活性空间，而是通过二阶微扰能量贡献作为判据，在 FCI 空间中迭代地选择最重要的行列式。当变分能量与外推微扰贡献之和收敛时，可以得到极高质量的激发能估计，接近 FCI 极限。

技术细节：登山策略与基组外推

“登山策略”寓意研究者在基组（Basis Set）和电子相关（Correlation）两个坐标轴上攀登，目标是峰顶的 FCI/CBS 极限。由于中等尺寸分子（如苯、吡啶等）无法直接进行大基组下的 FCI 计算，作者采取了“靴帮外推”（Bootstrap Extrapolation）技术：

首先在较小的基组（如 6-31+G(d)）下利用 CCSDTQ 或 SCI 获取高质量的参考值。
然后利用 CC3 方法在较小基组和大基组（如 aug-cc-pVQZ）之间的能量差作为修正项（Basis Set Correction），补偿基组不完备性误差。
具体公式为：$E(TBE) \approx E(High-Level/Small-Basis) + [E(CC3/Large-Basis) - E(CC3/Small-Basis)]$。这种方案利用了 CC3 方法在描述基组敏感性（尤其是 Rydberg 态）方面的稳定性，同时用高阶 CC 方法捕捉精细的相关效应。

几何构型与计算环境

所有的计算均在 CC3/aug-cc-pVTZ 水平下优化的基态几何构型上进行。这保证了评估其他 ES 方法时的构型一致性。计算过程严格遵守冻芯近似（Frozen-core approximation），并对含有硫原子的体系使用了较大的核心定义。统计指标包括平均符号误差（MSE）、平均绝对误差（MAE）、均方根误差（RMSE）等，为读者提供了全面的性能图景。

2. 关键 Benchmark 体系、数据与性能表现分析

体系选择

研究涵盖了 27 种具有代表性的有机分子，分为以下三类：

4 个非氢原子：丙酮、丙烯醛、丁二烯、氰基乙炔、氰基甲醛、联氰、环丙烯酮、环丙烯硫酮、二乙炔、乙二醛、异丁烯、甲基亚甲基环丙烯、丙炔醛、硫丙酮、硫丙炔醛。
5 个非氢原子：环戊二烯、呋喃、咪唑、吡咯、噻吩。
6 个非氢原子：苯、吡嗪、哒嗪、吡啶、嘧啶、四嗪、三嗪。这些体系包含了 $\pi \to \pi^*$、 $n \to \pi^*$、 $n \to 3s$ 等多种跃迁类型，涵盖了价层态和 Rydberg 态，具有极强的多样性。

计算所得关键数据

在 Table 11 中，作者详尽列出了 238 个态的 TBE 值。以下是一些显著发现：

CC3 的稳定性：对于单激发占比（%T1）较高的态，CC3 的 MAE 仅为 0.01-0.03 eV。这证明了在大多数单激发跃迁中，CC3 几乎可以作为“廉价的 FCI”使用。
双激发的挑战：在乙二醛（Glyoxal）和四嗪（Tetrazine）等分子中，存在具有显著双激发性质（%T1 较低）的激发态。对于这类态，CC3 和 CCSDT 的误差迅速增大（甚至超过 0.5 eV），此时必须求助于 CCSDTQ 或 NEVPT2 方法。
基组效应：Rydberg 态对弥散函数极其敏感。从 aug-cc-pVDZ 升级到 aug-cc-pVTZ 时，Rydberg 态能量通常会下降约 0.1 eV，而价层态则相对稳定。

流行方法的性能对比 (基于 Table 12)

作者利用建立的 TBE 数据库对多种常用方法进行了 Benchmark，结果如下：

CC3：MAE = 0.01 eV。当之无愧的单激发态基准方法。
CCSDT-3：MAE = 0.05 eV。虽然包含三激发，但略逊于 CC3，且在大基组下计算成本极高。
CCSDR(3)：MAE = 0.05 eV。一种非迭代处理三激发的方法，表现出了极高的性价比。
STEOM-CCSD：MAE = 0.12 eV。在处理 Rydberg 态方面表现出色，优于标准 CCSD。
CCSD：MAE = 0.13 eV。倾向于高估激发能，MSE 为 +0.11 eV。
ADC(2) 与 CC2：MAE 分别为 0.14 eV 和 0.15 eV。作为二阶方法，其表现非常稳健，且 CC2 在描述价层态方面优于描述 Rydberg 态。
NEVPT2：MAE = 0.13 eV。作为多参考方法，它在包含双激发的态上表现更优，但在纯单激发态上略逊于高阶 CC 方法。
CIS(D)：MAE = 0.23 eV。在所有评估的方法中表现最差，不推荐用于高精度研究。

3. 代码实现细节、复现指南与软件资源

所使用的软件包

本工作展示了现代计算化学对多种软件工具的综合调用，每种软件负责其最具优势的部分：

QUANTUM PACKAGE 2.0 (开源)：这是本研究的核心，用于执行 CIPSI（选定 CI）计算。该代码由作者团队开发，专门针对大规模多行列式波函数优化。其开源链接通常可在 GitHub 或其官方站点获取。它的并行效率极高，支持在数千个核心上外推 FCI 极限。
CFOUR：用于高阶耦合簇计算（CC3, CCSDT, CCSDT-3, CCSDTQ）。CFOUR 在处理 EOM-CC 的三激发和四激发方面具有深厚的算法积累。
DALTON：用于 CC2、CCSD 和 CC3 的线性响应计算，特别是在提取振子强度方面表现优异。
GAUSSIAN 16：用于 CIS(D) 计算。
ORCA：用于 STEOM-CCSD 计算。
MRCC：用于处理 CCSDT 和 CCSDTQ 等极高激发阶数的耦合簇计算。
Q-Chem：用于 ADC(2) 计算。
MOLPRO：用于执行多参考的 NEVPT2 计算。

复现指南

若要复现本文的 TBE 数据，建议遵循以下步骤：

第一步：几何优化。使用 CC3/aug-cc-pVTZ 级别，不使用冻芯近似。确保获得极其精确的基态构型。坐标可参考 SI 文件（Bohr 为单位）。
第二步：小基组高阶计算。在 6-31+G(d) 基组下，使用 MRCC 运行 CCSDTQ，或使用 QUANTUM PACKAGE 运行 CIPSI 计算。CIPSI 需要生成至少 5,000,000 个行列式的参考空间，并使用态平均天然轨道（State-averaged natural orbitals）进行迭代。
第三步：大基组 CC3 校正。分别在 6-31+G(d) 和 aug-cc-pVQZ 基组下进行 CC3 计算，获得基组校正能级差。
第四步：外推与汇总。将第二步的 FCI 估计值加上第三步的修正值。对于 Rydberg 态，务必检查是否包含足够的弥散函数（如加倍弥散函数 d-aug）。

硬件需求

复现 5-6 个原子的 CCSDTQ 或大基组 SCI 计算需要显著的计算资源。建议准备具有 512GB 以上内存的节点，并行计算核心数应不少于 128 个。

4. 关键引用文献与局限性评论

关键引用文献

Thiel 等人 (2008-2010) [Refs 23, 25, 26]：Thiel 的基准集是该领域的奠基之作，定义了 28 个分子的首个 TBE 集合。本文是其重要的现代扩展和修正。
Serrano-Andrès, Roos 等人 (1990s) [Refs 30-38]：利用 CASPT2 方法建立的早期参考值。本文通过 CC 方法证明了 CASPT2 在不加 IPEA shift 时倾向于低估激发能。
Loos 等人 (2018) [Ref 28]：作者此前针对 1-3 个非氢原子的小分子基准工作，本文是其“登山策略”向中等尺寸分子的延续。
Quantum Package 2.0 [Ref 80]：详细介绍了 SCI 算法实现的论文，是理解本工作技术手段的关键。

局限性评论

尽管本工作代表了目前的最高水平，但仍存在以下局限：

分子结构的局限性：数据库集中在共轭有机分子（含 C, N, O, H, S），缺乏含有金属中心、杂化轨道更复杂的无机配合物。这可能导致在应用到催化或光电材料领域时存在偏向。
垂直跃迁的理想化：所有的 TBE 均针对垂直激发。在实际实验中，零点振动能（ZPVE）和结构弛豫会产生显著影响。仅凭垂直跃迁能无法直接预测具有显著斯托克斯位移的分子的荧光特性。
环境效应缺失：计算均在气相下进行。对于具有强偶极矩变化的跃迁（如电荷转移态 CT），溶剂化效应可能会改变态的顺序，而本基准集无法评估这一点。
计算成本的高墙：虽然提供了 TBE，但获取这些值的方法（如 CCSDTQ）对于稍微大一点的分子（如 10 个以上重原子）依然是不可逾越的，这限制了该策略的普适性。

5. 补充：深度洞察与科学意义

%T1 诊断工具的关键地位

在本文中，作者强调了单激发占比（%T1）作为一个简易诊断工具的重要性。当量子化学家面临一个新的体系时，如果初步计算发现某个态的 %T1 小于 80%，那么就必须警惕二阶方法（如 CC2, ADC(2)）甚至三阶方法（CC3）的失效。这一结论对于工业界的计算方案筛选具有极强的指导意义：它告诉我们什么时候可以相信廉价计算，什么时候必须投入昂贵的多参考或高阶 CC 资源。

比价层态更复杂的 Rydberg 态

实验中经常观测到能量非常接近的价层态和 Rydberg 态。作者发现，许多方法在处理这两者时的误差方向不一致。例如，CC2 倾向于高估价层态能量，却低估 Rydberg 态能量。这意味着在复杂的电子光谱拟合中，能级交错现象可能会被错误的理论预测。本数据库为研究人员提供了一个清晰的图谱，帮助识别哪些方法能更平衡地描述这种竞争关系。

对 CASPT2 的重新评价

长期以来，CASPT2 被认为是激发态计算的黄金标准，特别是在多参考体系中。然而，本工作再次证实了 CASPT2（以及 NEVPT2）在处理纯单激发态时，其精度往往不及单参考的耦合簇方法。尤其是在 CASPT2 容易低估激发能的背景下，使用 CC3 作为校准基准显得尤为迫切。这一发现促进了多参考微扰理论（MRPT）与耦合簇理论之间的良性对话与竞争。

科学意义与未来展望

这项工作的完成标志着激发态计算进入了“亚 kcal/mol”精度时代。随着 SCI 算法的进一步成熟和高性能计算（HPC）架构的演进，我们可以预见，未来几年内会有更多包含 10 个以上原子的分子的“登山”成功。此外，作者所倡导的这种“透明、可复现、分步骤外推”的科研范式，也为计算化学数据库的标准化建立了典范。该数据库（TBE 集）已经成为目前学术界评估新型激发态泛函、波函数方法、甚至机器学习势函数的标准量尺，对推动整个计算化学领域的发展具有深远影响。