告别 Hubbard U 参数：多电子关联理论在铈氧化物氧化还原化学中的突破性应用

来源论文: https://arxiv.org/abs/2112.02850 生成时间: Mar 07, 2026 13:52

0. 执行摘要

在强关联电子体系（如铈氧化物）的模拟中，传统的密度泛函理论（DFT）面临着巨大的挑战。其根源在于铈（Ce）原子的 $4f$ 轨道电子具有高度局域化的特性，普通泛函极易产生严重的自相互作用误差（Self-Interaction Error, SIE），导致能带结构和几何结构的错误预测。为了修正这一偏差，学术界长期依赖于 DFT+$U$ 或杂化泛函（Hybrid Functionals），但这些方法引入了人为调节参数 $U$ 或 Fock 交换系数 $\alpha$，使得计算结果往往具有“参数依赖性”。

由 Tobias Schäfer 等人发表在 The Journal of Physical Chemistry Letters 上的这项研究，展示了如何利用基于第一性原理的多电子关联（Many-Electron, ME）理论——特别是直接随机相位近似（dRPA）和二阶莫勒-普莱塞特微扰理论（MP2）——在无需任何经验参数的情况下，准确描述二氧化铈（$CeO_2$）与三氧化二铈（$Ce_2O_3$）的相变能和晶格参数。这项工作不仅建立了周期性体系下 ME 理论的基准，也为未来利用机器学习优化泛函提供了高质量的数据基础。

1. 核心科学问题，理论基础与技术细节

1.1 核心科学问题：$4f$ 电子的局域化与还原偏差

二氧化铈在催化、储能和材料科学中具有举足轻重的地位。其核心化学过程是 $Ce^{4+} \leftrightarrow Ce^{3+}$ 的氧化还原转变。在还原过程中，一个电子进入了 Ce 的 $4f$ 轨道。然而，(semi)local DFT 泛函倾向于过度离域（delocalize）这些价态电子，错误的将 $CeO_2$ 还原产物描述为金属性。虽然 DFT+$U$ 能够通过惩罚非对角线占据来强行局域化电子，但最优的 $U$ 值在不同性质（如带隙、形成能、晶格常数）之间并不通用，且随反应坐标变化。这种“参数偏置”成为了定量预测的瓶颈。

1.2 理论基础：从单电子到多电子关联

研究的核心在于将电子关联处理从单电子平均场提升到多电子理论水平。电子间的相互作用在 ME 理论中表示为单电子平均场自旋轨道的总和：

$$\frac{1}{2} \sum_{ij}^{occ} [\langle ij | ij \rangle - \langle ij | ji \rangle] + \frac{1}{2} \sum_{ij}^{occ} \sum_{ab}^{unocc} \langle ij | ab \rangle [t_{ij}^{ab} - t_{ji}^{ab}]$$

其中第一项是 Hartree-Fock 交换项，第二项则是关联能的核心。$t_{ij}^{ab}$ 是双激发振幅，决定了关联处理的精度级别。

MP2 (Second-order Møller-Plesset)： 将双激发振幅定义为 $t_{ij}^{ab} = \langle ab | ij \rangle / (\epsilon_i + \epsilon_j - \epsilon_a - \epsilon_b)$。虽然 MP2 在分子体系中表现优异，但在处理具有高极化率的固体材料时，由于忽略了电子屏蔽（screening），往往表现欠佳。
RPA (Random Phase Approximation)： RPA 通过对无限阶环状 Goldstone 图（ring-like diagrams）求和，能够捕获长程关联和屏蔽效应。其振幅 $t_{ij}^{ab}$ 隐含定义在递归方程中，处理了粒子-空穴对的相互作用。
rSOX (renormalized Second-Order Exchange)： 为了修复 RPA 缺失的交换关联，作者引入了重整化的二阶交换项，进一步提升了精度。

1.3 技术难点：周期性边界条件下的计算复杂度

在周期性体系下运行 ME 理论长期以来因其极高的计算成本（通常为 $O(N^5)$ 或 $O(N^6)$）而被视为“不可完成的任务”。特别是对于含有铈这种重元素的体系，基组收敛极其缓慢。本文通过采用 低阶缩放算法（Low-scaling algorithms），将计算量降至可控范围，并利用 全基组外推（Complete Basis Set extrapolation） 和 热力学极限处理 确保了结果的收敛性。

2. 关键 Benchmark 体系、数据与性能评估

2.1 研究对象

研究选择了两种典型的铈氧化物相：

$CeO_2$ (萤石结构，Fm3̅m)： 包含 $Ce^{4+}$，无 $4f$ 电子占据。
$Ce_2O_3$ (A型倍半氧化物，P3̅m1)： 包含 $Ce^{3+}$，具有局域化的 $4f^1$ 配置，表现出反铁磁性。

2.2 晶格常数表现 (Table 1 数据摘要)

实验值分别为 $CeO_2$ ($a_0=5.394\,Å$) 和 $Ce_2O_3$ ($a_0=3.882\,Å, c_0=6.047\,Å$)。

PBE+U (4.5 eV)： 对 $CeO_2$ 误差为 +1.8%，对 $Ce_2O_3$ 的 $c_0$ 误差高达 +2.2%。这种高估随 $U$ 值增加而恶化。
HSE03 ($\alpha=0.25$)： 晶格常数非常接近实验值，但代价是严重高估了能带间隙（O 2p - Ce 4f 间隙达 9.45 eV，实验仅为 2.4 eV）。
RPA： 表现惊人。$Ce_2O_3$ 的 $a_0$ 误差为 0.0%，$CeO_2$ 的 $a_0$ 误差仅为 +0.5%。这证明了 RPA 在处理不同价态混合时的鲁棒性。
RPA+rSOX： 进一步修正了 RPA 略微的高估，所有晶格参数误差均控制在 0.4% 以内。

2.3 反应焓变 $\Delta H$ (Figure 3 分析)

作者研究了反应 $r_1$: $CeO_2 \rightarrow Ce_2O_3 + 0.5 O_2$。结果显示：

DFT+$U$ 与 HSE： 反应能随 $U$ 或 $\alpha$ 呈线性变化。这意味着计算结果完全取决于研究者选择的参数。
RPA@HSE03($\alpha$)： 尽管使用了不同的杂化泛函轨道作为起始，RPA 的反应能变化极小（< 0.06 eV），表现出卓越的参数无关性（parameter-independent）。
绝对精度： RPA 计算出的反应焓与实验值高度吻合，而 MP2 由于过高估计了 $Ce_2O_3$ 的内聚能，偏离了实验区间。

3. 代码实现细节与复现指南

3.1 使用软件包

该研究完全基于 VASP (Vienna Ab initio Simulation Package)。这是一个在固态物理领域极具权威性的软件包。

3.2 关键参数配置

为了复现本文结果，需要关注以下技术细节：

势函数： 必须使用铈原子的 Norm-Conserving (NC) PAW 势。常规的 PAW 势在计算关联能时可能无法保证高能态轨道的收敛。
基组扩展： 使用了极高的截断能（Plane-wave cutoff），并利用 ENCUTGW 参数控制关联部分的计算精度。
K点采样： 采用 Born-von Karman 周期性边界条件，对布里渊区进行了充分采样以达到热力学极限。
外推技术： 对关联能进行 $1/N_{plane-waves}$ 的外推，以获取完全基组极限（CBS）下的能量。

3.3 开源数据链接

作者将所有的 VASP 输入输出文件托管在 ioChem-BD 数据库中：

Repo Link: https://doi.org/10.19061/iochem-bd-6-86 在该链接中可以获取具体的 INCAR 配置文件、KPOINTS 以及所用的赝势信息。

4. 关键引用文献与评论

4.1 关键引用文献

Dudarev et al. (Ref 41, 42): 奠定了 DFT+$U$ 的理论框架，也是本文主要挑战的对象。
Kaltak, Kresse et al. (Ref 29, 30): 提供了 VASP 中低阶缩放 RPA 和 MP2 算法的技术支撑。
Da Silva et al. (Ref 7): 早期关于杂化泛函在稀土氧化物中应用的系统研究，为本文提供了 PBE+$U$ 趋势的参考。
Capdevila-Cortada et al. (Ref 21): 深入讨论了 $U$ 值在氧化还原坐标上的偏置问题。

4.2 局限性评论

尽管该工作代表了当前固态量子化学的顶尖水平，但仍存在以下局限：

零点能（ZPE）： 计算未包含零点振动效应。对于氧化还原反应，ZPE 的贡献虽然通常较小且有抵消，但在极高精度需求下仍不可忽略。
实验参考值的准确性： $Ce_2O_3$ 的实验数据多来源于 20 世纪 60 年代的测量，存在一定的实验不确定度（如 Debye 模型估算的误差），这限制了理论模型验证的绝对上限。
计算资源门槛： 尽管有低阶缩放算法，RPA 和 MP2 的计算开销依然比 DFT 高出 3-4 个数量级。对于大规模的缺陷表面模拟，目前仍难以全面推广。

5. 补充探讨：对未来研究的启示

5.1 自相互作用误差（SIE）的终结者？

这项研究有力地证明了，电子关联处理的系统性改善（从单体到多体）能够自发修复 SIE，而无需依赖经验性的 $U$ 修正。在 RPA 水平下，$4f$ 电子的局域化自然发生，这为处理其他强关联体系（如超导体原型材料、锕系元素化合物）指明了方向。

5.2 机器学习泛函的“真理集”

目前的机器学习（ML）泛函拟合往往依赖于分子数据集（如 QM9）。然而，固体体系的物理特性截然不同。本文生成的 $CeO_2$ 还原势能面数据，可以作为极佳的“黄金标准”（Gold Standard），用于训练能在固体中准确处理局域电子的机器学习泛函，从而实现“RPA 的精度，DFT 的速度”。

5.3 展望：超越 RPA

作者在结论中提到，RPA 是耦合簇理论（CCSD）的一个子集。随着算法的进一步优化，未来在周期性体系中实现全耦合簇（Full Coupled Cluster）计算将不再是梦想。届时，我们将能够以前所未有的精度解析多价态过渡金属氧化物的催化机制，彻底解决诸如“氧空位形成能”在不同泛函下差异巨大的历史难题。