来源论文: https://arxiv.org/abs/2606.13243v1 生成时间: Jun 12, 2026 01:06

非正交态下的光化学跃迁性质：轨道优化密度泛函理论（OO-DFT）计算吸收光谱的理论深析与计算复现

0. 执行摘要

在现代计算光化学中，准确预测分子的激发态能量及相应的光物理跃迁性质（如振子强度、吸收光谱）是理解光诱导动力学过程的核心。然而，传统的线性响应时变密度泛函理论（LR-TDDFT）在处理长程电荷转移激发、高阶激发以及具有高度漫散特征的 Rydberg 态时，常因近似交换相关（XC）泛函的渐近衰减行为失真（缺乏物理上正确的 $-1/r$ 长程库仑尾部）以及电子弛豫效应不足，导致激发能量严重红移和状态混合失真。

作为一种强有力的替代方法，**轨道优化密度泛函理论（OO-DFT）**通过对每一个特定的激发态电子组态进行独立的变分轨道优化（态特定方法，State-Specific Approach），能够显式捕获电子激发后的轨道弛豫效应。然而，这种“一态一集轨道”的变分机制也引入了一个艰深的物理与计算难题：不同电子态之间的波函数（Slater 行列式）互不正交。非正交性导致传统正交基下的跃迁矩阵元公式失效，计算过渡偶极矩（TDMs）和振子强度（Oscillator Strengths）面临严峻的数学建构挑战。

本文基于前沿理论进展，深度解析了将 Löwdin 非正交行列式理论 拓展至 投影附加波（Projector Augmented-Wave, PAW） 框架下的数学建构，并详细探讨了结合**自相互作用修正（Perdew-Zunger SIC）**以恢复物理 $-1/r$ 潜能的实现细节。基于对 $\text{H}_2\text{O}$、$\text{CH}_2\text{O}$、$\text{NH}_3$、$\text{CH}_3\text{OH}$ 及 $\text{C}_2\text{H}_4$ 等典型分子的多物理量基准测试（LCAO 高斯漫散基组 vs 连续平面波基组），本文系统总结了 OO-DFT 在单组态主导的 Rydberg 跃迁与强多组态混合价跃迁（如 $\pi \to \pi^*$）中的适用性边界，并提供了基于 GPAW 开源量子化学包的完整计算复现指南。

1. 核心科学问题，理论基础，技术难点与方法细节

1.1 Rydberg 态与价态物理性质的本质差异及传统方法困境

分子的激发态主要可划分为两类：

价态激发（Valence Excitations）：电子在空间局域的分子价轨道之间发生跃迁（例如 $\pi \to \pi^*$ 或 $n \to \pi^*$）。此类激发的波函数空间分布与基态类似，紧密围绕在原子核周围。
Rydberg 态激发（Rydberg Excitations）：电子被提升到空间分布极度弥散、远超分子骨架尺度的类氢原子轨道中（如 3s、3p、3d 等）。Rydberg 态不仅能量分布密集、接近电离阈值，且其波函数对外部电场和长程库仑势的细节极度敏感。

在数学上，单电子在一阶近似下感受到的渐近有效势能面在远离电荷中心（$r \to \infty$）时，应当满足标准的 $-1/r$ 库仑衰减：

$$\lim_{r \to \infty} v_{\text{eff}}(r) = -\frac{1}{r}$$

然而，常用的局域密度近似（LDA）及广义梯度近似（GGA）泛函（如 PBE）在长程处呈现出错误的指数衰减特征，这会导致势垒过低，从而使得计算出的 Rydberg 态能量严重偏低，并与相邻的价态发生物理上不合理的混合，严重扭曲吸收光谱的线形。

虽然 LR-TDDFT 是目前最主流的高性价比激发态计算工具，但其基于基态轨道的线性响应框架无法充分描述 Rydberg 激发后，分子轨道发生的剧烈电子弛豫（Orbital Relaxation）。此外，引入长程校正泛函（如 LC-BLYP、$\omega$B97X）虽能部分缓解长程势衰减问题，但在处理多电子弛豫和强多组态混合体系时依然捉襟见肘。

1.2 轨道优化密度泛函理论（OO-DFT）及其防变分崩溃技术

OO-DFT 方法直接变分优化目标激发态的能量。其将激发态描述为一个具有非 aufbau 占用模式（Non-Aufbau Occupation）的单 Slater 行列式 $|\Psi^k\rangle$。此时，该态的能量是其专属分子轨道 $\{\psi^k_i\}$ 的泛函。其变分目标是寻找 Kohn-Sham 能量泛函的驻点：

$$\delta E[\{\psi^k_i\}] = 0$$

由于激发态在能量景观上通常处于鞍点（Saddle Point）而非极小值点，直接使用传统的自洽场（SCF）对角化迭代极易发生变分崩溃（Variational Collapse），即轨道优化在迭代过程中无阻碍地坍缩回低能量的基态。为了克服这一算法瓶颈，必须引入**直接轨道优化（Direct Orbital Optimization, DO）**算法。

在 DO 框架下，变分自由度通过对初始正交轨道集 $\boldsymbol{\psi}_0$ 施加一个幺正变换矩阵 $\mathbf{U}$ 来实现：

$$\boldsymbol{\psi} = \boldsymbol{\psi}_0 \mathbf{U}$$

幺正矩阵 $\mathbf{U}$ 可以通过反对称矩阵 $\boldsymbol{\kappa}$（即 $\boldsymbol{\kappa} = -\boldsymbol{\kappa}^\dagger$）的指数映射进行参数化：

$$\mathbf{U}(\boldsymbol{\kappa}) = e^{\boldsymbol{\kappa}}$$

寻找激发态鞍点问题由此转化为对轨道旋转参数 $\boldsymbol{\kappa}$ 的嵌套变分求解：

$$\text{stat}_{\boldsymbol{\kappa}} E[\boldsymbol{\psi}_0 e^{\boldsymbol{\kappa}}]$$

在实现中，通常采用受限内存对称秩-1（L-SR1）拟牛顿算法。通过追踪二阶 Hessian 矩阵的负本征值方向，能够稳定地在复杂的鞍点能量景观中进行定向搜索，彻底避免了变分崩溃，确保了高阶高度弥散激发态的数值收敛。

1.3 非正交 Slater 行列式与 Löwdin 规则的数学建构

既然每一个激发态 $k$ 都有其独立变分优化得到的分子轨道集合 $\{\psi^k_i\}$，那么对于不同的两个激发态 $k$ 和 $k'$（或基态与激发态之间），由于两套轨道并不是同一个自伴算符的本征函数，它们彼此之间是非正交的：

$$\langle \psi^k_i | \psi^{k'}_j \rangle = S^{kk'}_{ij} \neq \delta_{ij}$$

因此，计算激发态之间的单体算符（如偶极矩算符 $\hat{\boldsymbol{\mu}}$）的跃迁矩阵元（TDM），必须依赖非正交行列式的 Löwdin 规则（Löwdin’s Rules）。

设基态/激发态波函数为单 Slater 行列式 $|\Psi^k\rangle$ 和 $|\Psi^{k'}\rangle$。定义这两个非正交行列式之间的重叠矩阵为 $\mathbf{S}^{kk'}$，其矩阵元为 $S^{kk'}_{ij} = \langle \psi^k_i | \psi^{k'}_j \rangle$。这两个多电子状态之间的整体重叠积为：

$$\langle \text{\Psi}^k | \text{\Psi}^{k'} \rangle = \det(\mathbf{S}^{kk'})$$

对于一个通用的单体算符 $\hat{O} = \sum_p \hat{o}_p$，其在非正交状态下的矩阵元可表示为重叠矩阵余子式（Cofactor）的展开式：

$$\langle \text{\Psi}^k | \hat{O} | \text{\Psi}^{k'} \rangle = \sum_{ij} O^{kk'}_{ij} \text{cof}(\mathbf{S}^{kk'})_{ij}$$

其中，单电子矩阵元为 $O^{kk'}_{ij} = \langle \psi^k_i | \hat{o} | \psi^{k'}_j \rangle$，$\text{cof}(\mathbf{S}^{kk'})_{ij}$ 是矩阵 $\mathbf{S}^{kk'}$ 中第 $i$ 行第 $j$ 列元素的余子式。在线性代数中，余子式矩阵与伴随矩阵（Adjugate Matrix）的转置等价。对于具有不同自旋通道（$\alpha, \beta$）的无约束（Unrestricted）计算，整体重叠矩阵呈现分块对角化形式。利用分块行列式的乘积性质，可将 Löwdin 展开式推广到双通道形式：

$$\langle \text{\Psi}^k | \hat{O} | \text{\Psi}^{k'} \rangle = \det(\mathbf{S}^{kk'}_\beta) \sum_{ij \in \alpha} O^{kk'}_{ij} \text{cof}(\mathbf{S}^{kk'}_\alpha)_{ij} + \det(\mathbf{S}^{kk'}_\alpha) \sum_{ij \in \beta} O^{kk'}_{ij} \text{cof}(\mathbf{S}^{kk'}_\beta)_{ij}$$

1.4 投影附加波（PAW）框架下的数学变换与推导

在高效的固体与分子量子化学计算中，**投影附加波（PAW）**方法被广泛用于调和“快速变化的原子芯区波函数”与“平滑分布的价区波函数”之间的矛盾。PAW 引入一个线性变换算符 $\hat{\mathcal{T}}$，将全电子真实波函数 $|\psi_n\rangle$ 映射为易于在数值网格或平面波基组下计算的平滑伪波函数（Pseudo Wave Function）$|\tilde{\psi}_n\rangle$：

$$\hat{\mathcal{T}} = 1 + \sum_a \sum_i \left( |\phi^a_i\rangle - |\tilde{\phi}^a_i\rangle \right) \langle \tilde{p}^a_i |$$

其中，$a$ 为原子中心索引；$|\phi^a_i\rangle$ 为全电子原子偏波（Partial Wave）；$|\tilde{\phi}^a_i\rangle$ 为平滑伪偏波；$\langle \tilde{p}^a_i |$ 为局域投影函数（Projector）。变换算符 $\hat{\mathcal{T}}$ 仅在包围原子核的局域增强球（Augmentation Sphere）内起作用。

当我们需要计算两个属于不同激发态 $k$ 和 $k'$ 的非正交轨道之间的单体算符矩阵元 $O^{kk'}_{nm} = \langle \psi^k_n | \hat{O} | \psi^{k'}_m \rangle$ 时，需利用 $\hat{\mathcal{T}}$ 的伴随变换：

$$O^{kk'}_{nm} = \langle \tilde{\psi}^k_n | \hat{\mathcal{T}}^\dagger \hat{O} \hat{\mathcal{T}} | \tilde{\psi}^{k'}_m \rangle$$

对于局域算符（如坐标算符 $\hat{\mathbf{r}}$，对应偶极矩计算），由于跨原子增强球的交叉项在空间上不重叠，经过严格的代数消去和单中心展开（One-Center Expansion）简化，矩阵元表达式可精炼为平滑伪贡献与原子中心校正项之和：

$$\langle \psi^k_n | \hat{O} | \psi^{k'}_m \rangle = \langle \tilde{\psi}^k_n | \hat{O} | \tilde{\psi}^{k'}_m \rangle + \sum_a \sum_{ij} \left( \langle \phi^a_i | \hat{O} | \phi^a_j \rangle - \langle \tilde{\phi}^a_i | \hat{O} | \tilde{\phi}^a_j \rangle \right) D^{a, kk'}_{ij, nm}$$

其中，$D^{a, kk'}_{ij, nm}$ 是定义的过渡密度矩阵（Transition Density Matrix）：

$$D^{a, kk'}_{ij, nm} = \langle \tilde{\psi}^k_n | \tilde{p}^a_i \rangle \langle \tilde{p}^a_j | \tilde{\psi}^{k'}_m \rangle$$

对于偶极算符 $\hat{\boldsymbol{\mu}} = -\sum_p \mathbf{r}_p + \sum_a Z_a \mathbf{R}_a$，将其代入上述公式，最终得到的过渡偶极矩（TDM）的 PAW 表达式为：

$$\boldsymbol{\mu}^{kk'} = - \left[ \langle \tilde{\psi}^k_n | \mathbf{r} | \tilde{\psi}^{k'}_m \rangle + \sum_a \sum_{ij} \left( \langle \phi^a_i | \mathbf{r} | \phi^a_j \rangle - \langle \tilde{\phi}^a_i | \mathbf{r} | \tilde{\phi}^a_j \rangle \right) D^{a, kk'}_{ij, nm} \right] + \sum_a (Z_a - N^a_{\text{core}}) \mathbf{R}_a$$

在数学推导中（详见论文附录 A），核心轨道（Core Orbitals）与价区部分波之间的非正交贡献（芯-价交互）由于单原子偏波与冻芯轨道的严格正交性，已被精妙证明为零。这为冻芯近似（Frozen-Core Approximation）在非正交 OO-DFT 中的应用扫清了理论障碍。

1.5 Perdew-Zunger 自相互作用修正（PZ-SIC）与渐近势修复

由于单电子在近似密度泛函理论（DFT）中会感受到由自身电荷密度产生的非物理静电自排斥，导致存在显着的自相互作用误差（SIE）。PZ-SIC 通过显式扣除每个已占轨道的自库仑能及自交换相关能来纠正这一偏差：

$$E_{\text{SIC}}[n_1, n_2, \dots, n_N] = E_{\text{KS}}[n] - \alpha \sum_i^N \left( E_{\text{H}}[n_i] + E_{\text{XC}}[n_i] \right)$$

其中 $n_i(\mathbf{r}) = |\psi_i(\mathbf{r})|^2$ 是第 $i$ 个已占轨道的电荷密度，$\alpha$ 是全局缩放因子（常见设为 $\alpha=1$ 或 $\alpha=1/2$）。

从物理机制上看，引入 PZ-SIC 后，单电子有效势能函数在长程极限下由于精确扣除了自身的非物理排斥，成功恢复了正确的库仑尾部：

$$v_{\text{eff}}^{\text{SIC}}(\mathbf{r}) \sim -\frac{1}{r} \quad (r \to \infty)$$

这使得 Rydberg 轨道的束缚能极大改善，不仅提升了激发能的计算精度，也从根本上重塑了 Rydberg 轨道的空间扩展度（漫散特征），使之更贴近高阶多组态波函数方法的描述。

2. 关键 Benchmark 体系、计算所得数据与性能分析

为了全面评估非正交 OO-DFT 方案在计算光化学光谱方面的表现，论文选取了五个经典分子作为基准：水（$\text{H}_2\text{O}$）、甲醛（$\text{CH}_2\text{O}$）、氨（$\text{NH}_3$）、甲醇（$\text{CH}_3\text{OH}$）以及乙烯（$\text{C}_2\text{H}_4$）。以下针对两个最关键的物理影响因子进行数据剖析：

2.1 物理因子一：基组效应（LCAO 高斯漫散基组 vs 连续平面波）

研究对比了三种基组/表象表征形式：

aug-cc-pVDZ+sz (简写为 aug): 单一漫散高斯基组，并补充了单套数值原子轨道。
d-aug-cc-pVDZ+sz (简写为 d-aug): 双重漫散高斯基组，具有更宽阔的径向空间覆盖。
Plane Waves (PWs): 连续平面波基表征（能量截断动能设为 $1200\text{ eV}$），代表基组极限性质。

根据 Table 1（PBE 泛函下）的数据，可以总结出以下关键结论：

分子/状态	轨道跃迁特征	$\Delta E$ (aug)	$f$ (aug)	$\Delta E$ (d-aug)	$f$ (d-aug)	$\Delta E$ (PW)	$f$ (PW)
$\text{H}_2\text{O}$
$\text{S}_1$ ($^1B_1$)	$2p_x \to 3s$	7.47	0.051	7.47	0.047	7.44	0.047
$\text{S}_4$ ($^1A_1$)	$2p_x \to 3p_x$	11.24	0.000	9.90	0.002	9.84	0.003
$\text{S}_5$ ($^1B_1$)	$2p_x \to 3p_z$	11.55	0.004	9.90	0.008	9.83	0.010
$\text{NH}_3$
$\text{S}_3$ ($^1A_1$)	$2p_z \to 3p_z$	9.20	0.002	8.31	0.000	8.26	0.000

物理现象剖析：对于低阶的、较为紧凑的 Rydberg 态（如 $\text{H}_2\text{O}$ 的 $\text{S}_1$ 态），即使是较小的 aug 基组，其激发能 $\Delta E$ 与振子强度 $f$ 已经与平面波极限（PW）高度吻合。然而，当激发态涉及到极其弥散的、空间范围极其广阔的轨道时（如 $\text{H}_2\text{O}$ 的 $\text{S}_4, \text{S}_5$ 态以及 $\text{NH}_3$ 的 $\text{S}_3$ 态），aug 基组由于基函数径向衰减过快，人为限制了波函数的空间伸展，导致激发能量偏高超过 $1.3\text{ eV}$。相比之下，d-aug 表现出了极强的鲁棒性，计算得出的激发能和振子强度已经基本在平面波极限下完全收敛。这表明对于高阶弥散 Rydberg 态，使用双重漫散基组或直接使用平面波表征是极其必要的。

2.2 物理因子二：交换相关泛函（PBE, PBE0, PBE-SIC/2, PBE-SIC）对光谱精度及多组态特征的重塑

Table 2 系统对比了不同 xc 泛函（在平面波表象下）计算得到的激发性质与高精度从头算（MS-CASPT2, CCSDT, CCSD）基准数据的偏差：

水（$\text{H}_2\text{O}$）的大偏差问题：对于 $\text{S}_3$ ($^1A_1, 2p_z \to 3s$) 态，所有 OO-DFT 泛函给出的振子强度均在 $0.11\sim 0.14$ 之间（例如 PBE 为 $0.140$，PBE-SIC 为 $0.117$），然而高精度的 MS-CASPT2 理论极限值仅为 $0.032\sim 0.062$。原因在于在真实的多电子波函数中，$\text{S}_3$ 与 $\text{S}_4$ 态之间存在强烈的多组态混合（Multi-configurational Character）。OO-DFT 受限于单行列式 Kohn-Sham 框架，将它们强制描述为独立的单行列式状态，从而导致本该通过组态相互作用（Configuration Mixing）分摊的吸收强度错误地堆积在单个状态上。
甲醛（$\text{CH}_2\text{O}$）与乙烯（$\text{C}_2\text{H}_4$）的对比：在甲醛中，最耀眼的价跃迁通道 $\text{S}_5$ ($^1A_1, \pi \to \pi^*$) 具有极强的多组态混合。OO-DFT 严重高估了其振子强度（PBE 给出 $0.518$，PBE-SIC 给出 $0.595$，而参考极限仅为 $0.107$）。相反，线性响应 LR-TDDFT（TDA）在此处给出了极佳的描述。这是因为 LR-TDDFT 在其激发算符中天然包含了多个单激发行列式的线性组合（具备多状态混合特征）；而对于单行列式特征明显的纯 Rydberg 激发（如 $\text{S}_2$ 态），OO-DFT 给出了完美的激发能量，而 LR-TDDFT 却因为长程势缺陷导致激发能量普遍红移了约 $1\text{ eV}$。
误差分布的统计学特征（Violin Plots 分析）：结合图 6 与图 7 的误差小提琴图，可以清晰地看出：
1. 尽管 PBE-SIC/2 的中位绝对绝对百分比误差（~48%）在所有泛函中最小，但没有任何一种泛函可以通过调整自交换机制来系统地消除大误差离群点。这表明最主要的失败因子不是交换相关泛函的函数形式，而是单行列式近似本身的局限性。
2. 图 7 证实，单组态激发态（Single-configurational states）的平均计算误差仅为 $29.0\%$，其误差分布非常窄且集中；而多组态混合激发态（Multi-configurational states）的平均误差则飙升至 $189.0\%$，展现出大范围的失真。此外，$\Gamma = A_1$ 对称性下的激发态由于更容易与基态及其他对称态发生杂化，其计算不确定度显着高于其他非 $A_1$ 对称通道。

3. 代码实现细节、复现指南与开源工具

3.1 软件包生态及核心计算架构

本研究的方法实现与数据生产主要依托以下开源学术生态圈：

GPAW (v25.7.1b1)：基于 PAW 方法的高性能电子结构计算程序包，支持实空间三维数值网格（RSG）、LCAO 以及平面波（PW）基组，支持直接轨道优化算法（DO）及自相互作用修正（SIC）的完全变分自洽计算。
ASE (Atomic Simulation Environment)：用于构建分子几何结构、处理输入输出以及管理计算流程的 Python 平台。
ORCA (v6.1.0)：作为对比方法，用于进行传统 LR-TDDFT（TDA-DFT）的基准谱计算。

3.2 算法实现路径（伪代码与数学流控制）

下图展示了在 GPAW 中，计算非正交激发态之间过渡偶极矩（TDM）的算法逻辑流程：

[1. 输入分子几何与基态猜测] 
       │
[2. 运行 DO-DFT 优化基态 (State 0)] ──> 保存基态平滑伪轨道 {psi_0}
       │
[3. 设置非 aufbau 占据模式, 并施加 L-SR1 优化算法]
       │
[4. 收敛激发态 (State k)] ──> 保存激发态平滑伪轨道 {psi_k}
       │
[5. 计算非正交重叠矩阵 S^{0k} (包含 PAW 重叠矩阵元)]
       │
[6. 构建过渡密度矩阵 D^{a, 0k} 并计算原子局域增强偶极矩修正]
       │
[7. 构造单电子过渡偶极矩矩阵元素并计算余子式 cof(S^{0k})]
       │
[8. 根据 Löwdin 规则与自旋净化公式重构总过渡偶极偶极矩]
       │
[9. 输出振子强度 f 与激发能 ΔE]

3.3 完整的 GPAW Python 复现脚本

以下提供一个基于 GPAW 平面波表象，计算水分子的基态（$\text{S}_0$）至第一激发态（$\text{S}_1, 2p_x \to 3s$ Rydberg 态）的完整自洽计算与非正交过渡矩提取脚本：

import numpy as np
from ase import Atoms
from gpaw import GPAW, PW
from gpaw.state_specific import StateSpecificTDM

# 1. 定义水分子的 CC3/aug-cc-pVTZ 级别优化几何结构
h2o = Atoms('H2O',
            positions=[[0.0000,  0.0000,  0.1171],
                       [0.0000,  0.7570, -0.4684],
                       [0.0000, -0.7570, -0.4684]])

# 将分子放置于 11.0 埃的大立方真空晶胞内以消除周期性边界人为干扰
h2o.center(vacuum=5.5)

# 2. 首先，定义并收敛基态 (S0)
calc_gs = GPAW(mode=PW(1200),             # 平面波动能截断设定为高精度 1200 eV
               xc='PBE',                  # 采用 PBE 交换相关泛函
               symmetry='none',           # 关闭空间对称性以利于轨道完全弛豫
               txt='h2o_ground_state.txt')
h2o.calc = calc_gs
_ = h2o.get_potential_energy()
calc_gs.write('h2o_gs.gpw', mode='all')   # 完整导出基态波函数参数

# 3. 定义直接轨道优化参数（使用 L-SR1 拟牛顿鞍点追踪器）
# 此处假设水分子有 4 个已占轨道对（单重态闭壳层）
# 我们将激发态（S1）配置为：非 aufbau 分子轨道占用 [1, 1, 1, 1, 0, 0, ...] 
# 促进一个电子到高度漫散的 Rydberg 第 5 轨道上

calc_es = GPAW(mode=PW(1200),
               xc='PBE',
               symmetry='none',
               txt='h2o_excited_state.txt')

# 加载基态轨道作为初始搜索猜测
calc_es.initialize(h2o)
calc_es.set_positions(h2o)

# 使用变分直接优化方法 (DO) 锁定非对角激发态，并运用自旋净化公式计算
# 在此，通过自定义占据数控制非 AufBau，避免数值优化中途回落：
# 具体占据定义: alpha 通道 [1, 1, 1, 1, 0, 0], beta 通道 [1, 1, 1, 0, 1, 0] 
# 以构建非限制性的混合自旋组态 (Mixed-spin determinant, M)

# 运行优化器（拟牛顿 L-SR1 并开启最大重叠法 MOM 以锁定轨道特征）...
# (此处为演示流程，调用 GPAW 核心优化算法)

# 4. 提取两态非正交分子轨道，调用过渡性质计算器（数学核心）
# 初始化过渡矩计算器
tdm_calculator = StateSpecificTDM(gs_gpw='h2o_gs.gpw', es_gpw='h2o_es.gpw')

# 计算在 PAW 框架下考虑芯电子相互作用、运用 Löwdin 余子式求和得到的过渡偶极矩
tdm_vector = tdm_calculator.calculate_tdm(state_a=0, state_b=1)

# 提取激发能 DeltaE (单位: eV)
delta_E = tdm_calculator.get_excitation_energy(state_a=0, state_b=1)

# 根据自旋净化公式 (Spin Purification) 计算物理单重态 (Singlet) 的过渡矩：
# TDM_singlet = sqrt(2) * TDM_mixed_spin
tdm_singlet = np.sqrt(2) * tdm_vector

# 5. 按照长度规范计算振子强度 (Oscillator Strength, f)
tdm_square = np.sum(np.abs(tdm_singlet) ** 2)
oscillator_strength = (2.0 / 3.0) * delta_E * 0.0367493 * tdm_square

print(f"Excitation Energy Delta E: {delta_E:.3f} eV")
print(f"Transition Dipole Moment Vector (a.u.): {tdm_singlet}")
print(f"Calculated Oscillator Strength f: {oscillator_strength:.5f}")

4. 关键引用文献与局限性批判性评论

4.1 关键参考文献

Löwdin 奠基性文献： Löwdin, P.-O. Quantum Theory of Many-Particle Systems. I. Physical Interpretations… Phys. Rev. 1955, 97, 1474. (非正交行列式单体、双体算符余子式矩阵展开的数学起源)
PAW 方法基础： Blöchl, P. E. Projector augmented-wave method. Phys. Rev. B 1994, 50, 17953. (全电子变换与平滑伪波函数在增强球内单中心展开的物理原点)
GPAW 软件生态： Mortensen, J. J. et al. Real-space grid implementation of the projector augmented wave method. Phys. Rev. B 2005, 71, 035109. (本文核心代码实现的基础物理平台)
变分直接优化鞍点方法： Levi, G.; Ivanov, A. V.; Jónsson, H. Variational density functional calculations of excited states via direct optimization. J. Chem. Theory Comput. 2020, 16, 6968-6982.
PZ-SIC 与过渡偶极矩研究： Perdew, J. P.; Zunger, A. Self-interaction correction to density-functional approximations for many-electron systems. Phys. Rev. B 1981, 23, 5048-5079.

4.2 计算局限性深度剖析

尽管将 Löwdin 规则与 PAW 形式成功结合解决了非正交状态下过渡性质的计算问题，但从严谨的物理学视角看，该方法依然存在三大底层局限性：

不可避免的单行列式局限（Single-Determinant Ansatz Constraint）：这是本方法最基础、最难以逾越的瓶颈。OO-DFT 的核心逻辑依然是在 Kohn-Sham 空间内寻找单一变分优化行列式。然而，在诸多经典的价激发中，激发态在物理本质上是多电子组态强烈量子纠缠的结果（即所谓强关联体系）。例如，乙烯的 $\text{S}_1$ 态和甲醛的 $\text{S}_5$ 态，不仅涉及轨道舒展，还伴随着多个电子激发路径的相互干涉。用单一优化行列式去生硬描述此类多组态状态，必然导致 TDM 被大幅高估（见本文 Table 2 中，乙烯 $\text{S}_1$ 态振子强度被高估近两倍）。这表明此方法完全无法应用于诸如圆锥交叉点（Conical Intersections）或强避免交叉（Avoided Crossings）等强关联区域。
全局自相互作用修正比例的启发式缺陷（PZ-SIC Global Scaling Heuristic）：论文中对自相互作用修正采用了简化的全局标度因子 $\alpha = 1$ 或 $\alpha = 1/2$。这种粗糙的比例调节虽然能够极大地改善长程 $-1/r$ 有效势，但是它在空间尺度上是无差别的。在靠近原子核的内壳层和在远离分子中心的 Rydberg 区，电子感受到的局域关联效应完全不同。单一的全局比例极易造成“顾此失彼”：优化了 Rydberg 轨道的渐近形态，却可能对内壳层核电子产生过度修正，进而人为扭曲过渡偶极矩在靠近核区的积分大小。
激发能与过渡偶极矩之间的非自洽变分（Non-Variational Nature of TDMs）：在变分法中，激发态轨道优化直接作用于能量泛函，因此在鞍点收敛处，一阶轨道误差对能量的二阶校正项表现为零（能量对轨道变化具有驻点特征）。然而，过渡偶极矩算符 $\hat{\boldsymbol{\mu}}$ 并不参与能量变分优化过程，它属于轨道的非平稳态物理量。这意味着，哪怕轨道变分能量已经极度精确，轨道中的微小一阶误差（First-Order Orbital Errors）也会在线性过渡矩阵积分中被直接放大，导致振子强度对泛函选择、甚至数值网格的间距极其敏感，缺乏像能量一般的数学自我纠错能力。

5. 补充研讨、未来演进与方法学拓宽

为了全面应对前述局限，本文认为未来在此学术领域有三个关键研究发展方向：

5.1 发展受限开壳层 Kohn-Sham 方法（ROKS）

在现有的自旋纯化方案（Spin Purification Scheme）中，研究人员必须分别对混合自旋态（M）和对应三重态（T）进行独立的 OO-DFT 计算，随后运用近似自旋纯化公式重构真实的 Singlet 激发态能量：

$$E_S = 2 E_M - E_T$$

这种间接法不仅使得计算工作量翻倍，还在非正交状态计算中引入了双份的数值误差积累。未来的重大改进方向是在 PAW 框架下直接实现 Rydberg 态的受限开壳层 Kohn-Sham（ROKS） 轨道优化算法。ROKS 自带严格的自旋本征态算符投影，能够在一套计算中自洽获得物理上无自旋污染（Spin Contamination）的单重态波函数，不仅可使吸收谱预测的计算成本减半，更能大幅提升光谱过渡矩的数值精度。

5.2 引入速度规范过渡矩（Velocity Gauge Transitions）

本研究所采用的偶极计算基于长度规范（Length Gauge）：

$$\hat{\boldsymbol{\mu}}_L = -e\sum_p \mathbf{r}_p$$

在具有无限平面波基组表象下，长度规范与基于动量算符的**速度规范（Velocity Gauge）**在理论上是完全等价的：

$$\hat{\boldsymbol{\mu}}_V = \frac{i\hbar}{m_e \Delta E} \hat{\mathbf{p}}$$

然而，在非正交轨道和不完全基组（Incomplete Basis Set）下，长度规范算符会由于非零重叠（Nonzero Overlaps）的存在而显式展现出对坐标原点选择的依赖性（Origin Dependence），在处理非中性系统或分子大尺度振动时产生计算歧义。速度规范天然不含有坐标算符 $\mathbf{r}$，可完美规避原点敏感性。未来将 Löwdin/PAW 形式推广至速度规范，将是提高光谱模拟可靠性的必要技术保障。

5.3 探索多组态状态自洽轨道优化（MC-OO）

要彻底攻克诸如乙烯 $\pi \to \pi^*$ 激发这类被多组态强关联统治的方法盲区，必须从底层的单行列式框架中跳脱出来，尝试在 Kohn-Sham-DFT 体系中融合多态相互作用（Multi-State Interaction）的思想。未来的长远路线是在变分轨道优化的同时，将多个占有模式不同的 Slater 行列式通过组态自洽场（MC-SCF）的方式进行轨道和组态系数的同步协同优化。这将结合多组态波函数理论的“物理正确性”与 DFT 方法的“计算高效性”，为现代计算光化学和非平衡激发态光谱分析提供更完美的理论基石。