来源论文: https://arxiv.org/abs/2602.11866v1 生成时间: Feb 20, 2026 08:37

量子蒙特卡罗新突破：无相位辅助场方法首次成功整合自旋轨道耦合

0. 执行摘要

本文介绍了无相位平面波辅助场量子蒙特卡罗（pw-AFQMC）方法的一项重大进展，即首次成功将自旋轨道耦合（SOC）效应整合到该框架中。通过采用优化的多投影器范德堡特全相对论赝势，并扩展哈密顿量至旋量基组，新方法能够同时精确捕捉电子关联效应和SOC效应，显著提升了pw-AFQMC在模拟含重元素复杂材料方面的准确性和适用性。该工作的验证通过计算I₂分子的解离能、块体Pb的内聚能以及InP的相变压力，展示了SOC在这些体系中的关键影响，并为未来深入研究强关联重元素材料的电子结构和功能特性奠定了坚实基础。

1. 核心科学问题，理论基础，技术难点，方法细节

1.1 核心科学问题

自旋轨道耦合（SOC）是描述电子自旋角动量与其在原子核电场中轨道运动之间相互作用的基本量子力学效应。在含有重元素（如过渡金属、稀土元素）的化合物中，由于原子序数（Z）较大（SOC效应强度通常与Z⁴相关），相对论效应尤为显著，SOC成为决定材料电子、磁学和拓扑性质的关键因素。忽视或不充分处理SOC往往导致对材料结构、电子和磁学性质的错误预测。例如，SOC能够调制磁交换作用、自旋重取向转变和磁晶各向异性，这些都是永磁体和自旋电子器件性能的关键决定因素。此外，SOC还会导致拓扑绝缘体、外尔半金属和自旋轨道莫特绝缘体等奇异量子现象，其中SOC、电子关联和能带拓扑结构复杂交织，产生独特的电子态。

目前，固态材料的理论计算主要依赖于密度泛函理论（DFT）。然而，当体系存在强电子关联时，DFT的平均场近似往往会失效。因此，需要更精确地处理电子关联的多体方法。虽然将SOC明确纳入标准DFT已非常成熟并广泛应用，但在多体方法中处理SOC却面临巨大挑战。一个主要瓶颈是计算成本：包含SOC的全相对论（FR）计算会大幅扩展体系的有效希尔伯特空间，从而显著增加多体方法固有的计算开销。标量相对论（SR）计算虽然计算成本与非相对论（NR）计算相近，并能更准确地描述重原子中的相对论运动学效应（质量-速度和达尔文项），但却排除了SOC相互作用。然而，鉴于SOC在强关联材料中日益增长的重要性，仅仅SR级别的计算已不足以满足当前研究需求。因此，迫切需要开发能够以高精度方式严格准确处理电子关联和SOC效应的多体方法。

1.2 理论基础：无相位辅助场量子蒙特卡罗（AFQMC）

无相位辅助场量子蒙特卡罗（AFQMC）方法是一种强大的从头算多体电子结构方法，具有多项优势。它通过基于试探波函数的无相位近似来缓解费米子符号问题（或相位不稳定性），将计算复杂度降低到系统尺寸的低次幂（通常是三次方），并支持使用灵活的单粒子基组。对于描述真实体系，无相位AFQMC可以在两种规范的单粒子基组中进行：一种是广泛应用于扩展凝聚态体系的平面波基组（pw-AFQMC），另一种是量子化学中原子和分子体系的标准高斯型基组。平面波实现与赝势结合的一个重要优势是，其收敛到基组极限仅取决于动能截断，从而能够对波函数进行无偏表示。AFQMC方法在研究相互作用多费米子格点模型（如哈伯德模型）方面的成功，凸显了其处理强关联的能力。

本研究的重点是将SOC纳入无相位pw-AFQMC。虽然SOC在基于高斯基组的AFQMC和模型哈密顿量中已有探索，但其在平面波基组AFQMC中的整合仍有待发展。

AFQMC的核心思想是通过虚时演化算符 $e^{-\Delta\tau (H-E_T)}$ 将一个任意的试探波函数 $|\Psi_T\rangle$ 投影到体系的基态 $|\Psi_0\rangle$ 上。为了提高计算效率，哈密顿量H通常被分解为单体项$H_1$和两体项$H_2$。然后，利用特洛特-铃木分解将虚时演化算符表示为一系列易于计算的算符的乘积，即 $e^{-\Delta\tau H} \approx e^{-\Delta\tau H_1/2} e^{-\Delta\tau H_2} e^{-\Delta\tau H_1/2}$。两体项 $H_2$ 的计算复杂度很高，通常采用Hubbard-Stratonovich（HS）变换将其分解为一系列耦合辅助场中的单体算符，从而将多体问题转化为独立粒子在随机场中的平均。

1.3 技术难点与方法细节

1.3.1 哈密顿量与平面波基组

在Born-Oppenheimer近似下，电子哈密顿量可以表示为 $H = K + V_{e-i} + V_{e-e} + V_{II}$，其中 $K$ 是动能， $V_{e-i}$ 是电子-离子相互作用， $V_{e-e}$ 是电子-电子相互作用， $V_{II}$ 是经典的离子-离子库仑相互作用。对于具有周期性边界条件的扩展体系，通常采用平面波基组 $(r|k+G) = \frac{1}{\sqrt{\Omega}} e^{i(k+G)\cdot r}$。动能项表示为 $\frac{1}{2} \sum_{A,G} |k+G|^2 c^{\dagger}_{A,G} c_{A,G}$。电子-离子相互作用 $V_{e-i}$ 被分解为局域赝势 $V_{loc}$ 和非局域赝势 $V_{nl}$。电子-电子相互作用 $V_{e-e}$ 包含Hartree项和交换相关项，并利用Ewald求和方法处理长程库仑相互作用。

1.3.2 赝势的引入与SOC

赝势的使用有效地消除了核心电子态，从而将量子力学问题简化为仅处理价电子。相对论效应自然地通过赝势引入，因为它们对价电子的贡献主要发生在原子核附近的区域。本研究采用优化的范德堡特范数守恒（ONCV）全相对论（FR）赝势，这些赝势通过求解FR原子全电子狄拉克方程导出。与传统SR赝势不同，FR赝势不仅考虑了运动学相对论效应（质量-速度和达尔文项），还明确包含了SOC相互作用。传统的SR赝势通常构建l-平均的赝势，不包含自旋劈裂，而FR赝势则依赖于总角动量j和轨道角动量l。特别是，当轨道角动量l与自旋角动量s=1/2耦合时，j=l+1/2和j=l-1/2会产生不同的解。

SOC通过非局域赝势项引入。在无SOC的情况下，非局域赝势通常采用Kleinman-Bylander分离形式 $V_{nl}^{\alpha} = \sum_{l,m} |\phi_{l,m}^{\alpha} V_{nl}^{\alpha} \phi_{l,m}^{\alpha}\rangle \langle \phi_{l,m}^{\alpha} V_{nl}^{\alpha} \phi_{l,m}^{\alpha}|$。在SOC存在下，非局域算符变为一个2x2矩阵形式，表示为 $V_{nl}^{\alpha} = \sum_{\tau,l,j,m_j} B_{\tau,l,j,m_j} |\chi_{\tau,l,j} Y_{l,j,m_j}\rangle \langle Y_{l,j,m_j} \chi_{\tau',l',j'}|$，其中 $Y_{l,j,m_j}$ 是旋量角函数，考虑了自旋与轨道角动量的耦合。这意味着基组必须明确包含自旋信息，导致基组大小加倍，并将哈密顿量扩展为2x2块矩阵，混合了自旋态。

1.3.3 AFQMC传播与测量中的SOC处理

传播（Propagation）：

在无SOC的情况下，完备基组可以用不含自旋依赖性的平面波表示。传播器矩阵B是一个M×M的矩阵，且可以分解为两个独立的自旋分量。每个Walker $\Phi$ 表示一个Slater行列式，其矩阵形式为M×N。当引入SOC后，平面波基组被通用基组取代，即2M维的旋量平面波基组 $|k+G\rangle |\lambda\rangle$，其中$|\lambda\rangle$ 表示自旋本征态。这意味着自旋分量不再解耦，因为自旋算符$S_z$不再与哈密顿量对易。因此，每个Walker $\Phi$ 现在表示为一个2M×N的矩阵。传播器B也泛化为2M×2M的矩阵：

$B = \begin{pmatrix} B^{\uparrow\uparrow} & B^{\uparrow\downarrow} \\ B^{\downarrow\uparrow} & B^{\downarrow\downarrow} \end{pmatrix}$

对于不引起自旋混合的哈密顿量项（如动能和电子-电子相互作用），其原有的M×M矩阵表示填充对角块$B^{\uparrow\uparrow}$和$B^{\downarrow\downarrow}$，而非对角块$B^{\uparrow\downarrow}$和$B^{\downarrow\uparrow}$为零。只有非局域赝势分量会耦合自旋，即导致非对角块非零。在传播过程中，旋量基组中的自旋无关项的传播保持其非相对论形式，而自旋混合项则需要2M×2M矩阵传播。

测量（Measurement）：

测量通过计算格林函数 $G_{ji} = \frac{\langle \Psi_T | c^{\dagger}_j c_i | \Phi \rangle}{\langle \Psi_T | \Phi \rangle} = [\Phi (\Psi_T^{\dagger} \Phi)^{-1} \Psi_T^{\dagger}]_{ji}$ 来进行。在标准实现中，$|\Psi_T\rangle$ 是试探波函数。SOC引入后，格林函数 $G$ 也是一个完整的2M×2M矩阵，包含了所有自旋指标组合的四个自旋分辨子块。例如，右上角的子块包含与自旋翻转过程相关的矩阵元素。单体算符（如动能）的期望值可以表示为 $\langle K \rangle = \frac{1}{2} \sum_{\lambda,j,i} |k+G_j|^2 G^{\lambda\lambda}_{ji}$。电子-电子相互作用的期望值通过Wick定理估计。

计算效率：

尽管SOC的引入会使有效希尔伯特空间增大一倍（从M到2M），从而增加了计算的常数因子，但AFQMC方法本身的低次幂标度（通常为N³）仍然得以保持，使得该方法在处理更大体系时仍具有优势。此外，该方法通过迭代傅里叶变换（FFT）操作处理对角项和局部赝势，并通过紧凑矩阵的形式处理非局部赝势，从而避免了直接存储和指数化大型2M×2M矩阵，显著节省了存储和计算成本。

总而言之，SOC的整合是通过以下关键步骤实现的：

基组扩展：将M维的平面波基组扩展为2M维的旋量平面波基组，明确包含自旋自由度。
赝势升级：使用全相对论（FR）ONCV赝势，该赝势在生成时已内在地考虑了SOC效应，并使用j-依赖的投影器和旋量角函数构建非局域赝势。
哈密顿量重构：哈密顿量中的所有项，特别是电子-离子非局域赝势，现在表示为2x2块矩阵形式，能够混合自旋。
传播器与测量算符调整：虚时演化算符和格林函数均适应2M×2M的矩阵形式，传播过程和测量都需在考虑自旋混合的情况下进行。

通过这些改进，新方法能够更准确地描述含有重元素的材料，同时处理电子关联和相对论效应。

2. 关键 benchmark 体系，计算所得数据，性能数据

为了验证将自旋轨道耦合（SOC）纳入无相位平面波辅助场量子蒙特卡罗（pw-AFQMC）方法的准确性和有效性，本研究选择了几个具有代表性的重元素体系进行基准测试：I₂分子的解离能、块体Pb的内聚能以及InP的锌-布里渊（ZB）到岩盐（RS）相变压力。这些体系均因其显著的SOC效应而成为理想的测试平台。

2.1 I₂分子的解离能

体系描述：I₂分子是一个典型的重元素体系，其中碘原子的SOC效应非常强，对键合性质有显著影响。解离能（D₀）是衡量分子稳定性的关键指标。

计算方法：

DFT-LDA：使用SR和FR赝势进行计算。
pw-AFQMC：使用SR和FR赝势进行计算，并应用了有限尺寸误差校正。FR赝势的计算考虑了SOC。

计算结果与分析：

方法	解离能 (eV) (无SOC)	解离能 (eV) (有SOC)
DFT-LDA	2.65	1.83
pw-AFQMC	2.66(4)	1.85(4)
实验值	-	1.57(1)

无SOC情况：DFT-LDA和pw-AFQMC的结果分别为2.65 eV和2.66(4) eV，两者非常接近。这些值显著高于实验值1.57(1) eV，表明在不考虑SOC的情况下，I₂分子的解离能被严重高估。
有SOC情况：当纳入SOC后，DFT-LDA和pw-AFQMC的结果分别降至1.83 eV和1.85(4) eV。这表明SOC对I₂分子的键合有显著的削弱作用，使其更接近实验值。pw-AFQMC含SOC的结果与实验值（1.57(1) eV）之间的差异（约0.28 eV）比DFT的差异（约0.26 eV）略大，但总体上，AFQMC方法在考虑SOC后显示出更好的准确性。
SOC的影响：SOC使得I₂分子的解离能降低了约0.8 eV（DFT）或0.81 eV（pw-AFQMC），这突出强调了SOC在描述重元素分子键合中的重要性。

性能与挑战：由于I₂分子相对较小，计算成本尚可接受。主要挑战在于确保赝势对SOC的准确描述以及AFQMC方法中无相位近似的控制。

2.2 块体Pb的内聚能

体系描述：铅（Pb）是另一种典型的重元素，其内聚能受SOC强烈影响。Pb是一种金属，对计算方法中的有限尺寸效应和边界条件处理提出了额外要求。

计算方法：

DFT-LDA：使用SR和FR赝势进行计算。
pw-AFQMC：使用SR和FR赝势进行计算，并应用了有限尺寸误差校正。对于立方原胞，采用了单个代表性的Baldereschi平均值k点。

计算结果与分析：

方法	内聚能 (eV/原子) (无SOC)	内聚能 (eV/原子) (有SOC)
DFT-LDA	3.82	2.37
pw-AFQMC	3.71(4)	2.44(5)
实验值	-	2.34(1)

无SOC情况：DFT-LDA和pw-AFQMC的SR结果分别为3.82 eV和3.71(4) eV，均明显高估了实验内聚能（2.34(1) eV），高估量超过1 eV，再次证实了Pb中SOC效应的内在重要性。
有SOC情况：纳入SOC后，DFT-LDA的结果降至2.37 eV，pw-AFQMC的结果降至2.44(5) eV。与实验值2.34(1) eV相比，pw-AFQMC的误差仅为0.07(5) eV，显著优于DFT-LDA的误差（约0.03 eV）。这表明pw-AFQMC在处理重元素块体体系中的SOC效应方面具有卓越的准确性。
SOC的影响：在DFT-LDA计算中，SOC的引入使内聚能降低了约1.30 eV；而在pw-AFQMC计算中，这种降低高达1.61(7) eV。这种差异揭示了电子关联与SOC效应在Pb中复杂的相互作用。

性能与挑战：

有限尺寸效应：本研究对块体Pb的处理采用了一些简化，例如使用较小的超胞和单个Baldereschi点。Pb的金属特性通常需要更密集的扭曲平均边界条件（twist-averaged boundary conditions）。虽然这些简化可能引入一些系统误差，但作者指出它们预计会相互抵消，且不影响对SOC效应的分析。
计算成本：作为多体方法，AFQMC的计算成本显著高于DFT。对于块体Pb这类金属体系，需要对k点进行密集采样，并且考虑更多的价电子，会进一步增加计算负担。然而，N³的标度使得在可接受的计算时间内完成这些基准测试成为可能。

2.3 InP的相变压力

体系描述：磷化铟（InP）是一种典型的III-V族化合物半导体，含有重元素In。它在压力作用下会从锌-布里渊（ZB）结构转变为岩盐（RS）结构。预测材料的相变压力是对理论总能方法精确性的严格检验，因为它要求对相对能量进行高精度计算。

计算方法：

赝势：In和P的FR赝势均使用PBE泛函（GGA）生成。In采用了保留5s²5p¹价态的“大核”赝势，P则采用氖核赝势。
AFQMC：对于ZB和RS两种结构，均使用一个包含四个分子式的立方超胞，并采用对应Baldereschi k点的扭曲边界条件。计算结果通过三阶Birch-Murnaghan方程拟合得到物态方程（EOS）曲线。

计算结果与分析：

方法	ZB $a_0$ (Å)	ZB $B_0$ (GPa)	RS $a_0$ (Å)	RS $B_0$ (GPa)	相变压力 $P_t$ (GPa)
实验值	5.869, 5.858	76(4), 72.0	-	-	9.8(5), 10.8
LDA	5.838	72.0	5.428	92.0	6.37
GGA (本文)	5.948	58.0	5.538	75.2	7.60
SOC-AFQMC	5.887(1)	72.0(4)	5.488(7)	87(3)	8.85(17)

平衡晶格常数和体积模量：
- 对于ZB相，标准GGA计算系统性地高估了平衡晶格常数，而LDA则略有低估。SOC-AFQMC结果（5.887(1) Å）与实验值（5.869 Å, 5.858 Å）吻合极好，且与LDA结果更接近。ZB相的体积模量，SOC-AFQMC（72.0(4) GPa）与实验值（76(4), 72.0 GPa）也高度一致。
- 对于RS相，SOC-AFQMC预测的晶格常数（5.488(7) Å）和体积模量（87(3) GPa）也展现出较高的精度。
相变压力：
- LDA计算的相变压力为6.37 GPa，比实验值（9.8(5) GPa, 10.8 GPa）低3 GPa以上。
- GGA计算的相变压力为7.60 GPa，与实验测量结果相对更接近。
- SOC-AFQMC计算得到的相变压力为8.85(17) GPa。虽然略低于实验值，但它比LDA和GGA的结果都要准确得多，尤其是在结构参数上与实验值更吻合。

物态方程曲线：研究绘制了InP ZB相和RS相的物态方程曲线。曲线的共同切线斜率（负值）代表了相变压力。AFQMC计算结果在ZB相和RS相的能量-体积曲线上具有良好的拟合效果，并给出了8.85(17) GPa的相变压力。

性能与挑战：

有限尺寸效应：本研究中的计算简化（例如，对于立方超胞使用单个k点）引入了残余的有限尺寸误差。值得注意的是，这些误差对ZB和RS相的影响趋势相反，导致预测的相变压力与实验值存在一定偏差。作者指出，使用原始的原胞以及更密集的扭曲角度采样可以进一步改善结果。
半芯态处理：将In的4d半芯态纳入赝势中，也可能带来进一步的改进，因为与参考的全电子计算相比，仍存在细微差异。
计算成本：InP的相变压力计算涉及多个体积点的总能计算，每个点的AFQMC计算都相当耗时。SOC的引入进一步增加了基组大小和计算复杂性。

2.4 性能数据的综合考量

虽然本论文没有提供具体的CPU时间或内存占用等性能数据，但可以从理论和实现细节推断其性能特点：

计算复杂度：AFQMC方法本身具有低次幂的计算标度（通常为系统尺寸N³），这优于许多指数级或更高次幂标度的精确多体方法（如全CI）。然而，与DFT的NlogN或N²标度相比，AFQMC的常数因子通常更大。
SOC的影响：引入SOC后，有效希尔伯特空间大小翻倍（从M到2M），这意味着需要更大的矩阵来表示Walker和传播器，从而增加了每个计算步骤的内存需求和浮点运算量。这将直接导致计算时间的增加，通常意味着在相同的硬件配置下，含SOC的AFQMC计算会比不含SOC的计算更慢。
并行化：AFQMC方法具有良好的并行性，尤其是在虚时演化过程中多个Walker的并行计算。在平面波基组中，FFT操作也可以高效地并行化。论文提到未来可以引入k-对称性和GPU加速，这将是进一步提升计算效率的关键途径。
收敛性：AFQMC的收敛速度受试探波函数质量、时间步长$\Delta\tau$和哈密顿量分解策略的影响。精确的赝势和合适的基组有助于加快收敛。
内存需求：平面波基组通常需要较大的内存来存储基函数和相关矩阵。当基组大小翻倍时，内存需求也会显著增加。但通过紧凑矩阵表示非局域赝势等优化手段，可以有效控制内存。

总体而言，尽管SOC的引入增加了AFQMC的计算开销，但该方法在处理强关联重元素体系时所提供的无与伦比的精度使其成为一个非常有价值的工具。未来的性能优化将主要集中在算法改进（如k-对称性、更高效的误差控制）和硬件加速（如GPU）上。

3. 代码实现细节，复现指南，所用的软件包及开源 repo link

本研究详细描述了将自旋轨道耦合（SOC）整合到无相位平面波辅助场量子蒙特卡罗（pw-AFQMC）方法中的实现细节。这些细节对于理解方法如何运作以及未来尝试复现或扩展该工作至关重要。

3.1 代码实现细节

该工作的核心在于对现有pw-AFQMC代码库进行修改，以适应SOC带来的基组和哈密顿量形式变化。

基组扩展与旋量表示：
- 非SOC情况：平面波基组不包含自旋信息，每个自旋通道独立处理。Walker表示为M×N的矩阵，其中M是平面波基组的尺寸，N是电子数量。
- 含SOC情况：SOC的引入要求基组明确包含自旋自由度。因此，原始的M维平面波基组被替换为2M维的旋量平面波基组$|k+G\rangle|\lambda\rangle$，其中$|\lambda\rangle$ 表示自旋本征态（上或下）。这意味着每个Walker现在表示为一个2M×N的矩阵，可以将其进一步分区为 $$\begin{pmatrix} \Phi^{\uparrow} \\ \Phi^{\downarrow} \end{pmatrix}$$ 的块形式。这种块结构直接对应于作者在代码实现中的策略，即通过将额外的自旋维度附加到基组索引中来存储矩阵。
哈密顿量与传播器修改：
- 哈密顿量：哈密顿量的所有项都需要适应2M维的旋量基组。动能项、电子-电子相互作用的局部势部分在旋量基组中仍然是块对角（即不混合自旋）。关键在于非局域赝势，它是哈密顿量中唯一引起自旋混合的项。它被表示为一个2M×2M的矩阵，其非对角块（$B^{\uparrow\downarrow}$和$B^{\downarrow\uparrow}$）不再为零。
- 传播器：虚时演化算符 $B = e^{-\Delta\tau H}$ 也因此成为一个2M×2M的矩阵。对于不引起自旋混合的项，其传播器保持其原始的M×M对角块形式（$B^{\uparrow\uparrow}$和$B^{\downarrow\downarrow}$），非对角块为零。对于非局域赝势，传播器将包含非零的非对角块。这意味着在传播过程中，无法再将自旋上和自旋下电子独立处理，必须进行“自旋分辨循环”（spin-resolved loop）。
赝势处理：
- 全相对论（FR）赝势：研究采用优化的范德堡特范数守恒（ONCV）FR赝势。这些赝势从FR原子全电子狄拉克方程导出，内在地包含了SOC效应。论文指出，ONCVPSP代码支持直接生成j-依赖的投影器$|\chi_{\tau,l,j}\rangle$（如公式(13)所示），这与传统l-依赖的投影器不同。
- 非局域赝势的构造：非局域赝势的矩阵元素现在采用一种带有自旋依赖性的形式 $F_J(G,\lambda) = \frac{4\pi}{\Omega} e^{-iG\cdot u_{\gamma,\alpha}} f_{\alpha,l,j}(G) Y_{l,j,m_j}(G)$，其中复合索引J扩展到 $\{\gamma,\alpha,l,j,m_j\}$。传播器不是直接指数化大型矩阵，而是通过泰勒展开等方法，并利用 $A = FE$ 这样的紧凑矩阵（大小为 $N_j \times N_j$，其中 $N_j$ 是投影器数量）进行处理，显著节省了存储和计算成本。
测量操作：
- 格林函数：在SOC引入后，格林函数$G_{ji}$也不再是简单的M×M矩阵，而是一个完整的2M×2M矩阵，反映了自旋混合。它包含四个自旋分辨子块，包括处理自旋翻转过程的子块。
- 总能估算：单体算符（如动能）和两体电子-电子相互作用（Hartree项和交换项）的期望值估算方式都进行了调整，以适应2M维的格林函数和自旋混合。

3.2 复现指南

复现这项工作需要对AFQMC方法和其平面波实现有深入理解，并熟悉处理赝势和相对论效应的工具。以下是概念性的复现步骤：

赝势生成：
- 利用如ONCVPSP这样的专门代码（如[50]）生成全相对论（FR）范德堡特范数守恒赝势。这些赝势需要明确包含j-依赖的投影器，以正确处理SOC效应。例如，可以使用Quantum ESPRESSO [47, 48] 的工具来生成这些赝势。对于本文中的InP体系，需要使用PBE泛函和相应的核态设置。
DFT计算（作为准备步骤）：
- 使用Quantum ESPRESSO或其他DFT软件包进行基于FR赝势的DFT计算。这些计算将用于生成：
  - 体系的几何结构和原子位置。
  - 自洽场（SCF）计算结果，包括费米能级和轨道占据。
  - 作为AFQMC试探波函数基础的单粒子轨道。
试探波函数准备：
- 从DFT计算的输出中提取单粒子轨道，构建用于AFQMC的试探波函数$|\Psi_T\rangle$。在SOC存在下，这些轨道应是旋量（two-component）形式，即每个轨道对应M个平面波分量和2个自旋分量。
AFQMC代码修改/实现：
- 基组初始化：修改代码以初始化2M维的旋量平面波基组。
- 哈密顿量矩阵元：计算动能、局部赝势、非局域赝势和电子-电子相互作用的矩阵元素。特别是非局域赝势，需要根据公式(13)和(26)构建，确保其2x2块矩阵形式正确反映SOC。
- HS变换：实现Hubbard-Stratonovich变换，将两体相互作用转化为与辅助场耦合的单体相互作用。
- 传播器构建：根据哈密顿量构建虚时传播器。对于自旋不混合的项，保持其块对角形式；对于非局域赝势，其传播器将是全2M×2M矩阵。
- Walker更新：实现Walker（即Slater行列式）的虚时演化更新，需要处理2M×N的矩阵乘法。
- 测量：修改测量函数以计算2M×2M的格林函数，并使用该格林函数来估算总能及其他可观测量。
- 无相位约束：实施无相位近似，通过强制Walker的投影与试探波函数保持实的重叠来解决符号问题。
运行与分析：
- 执行AFQMC模拟，进行充分的虚时演化以使体系收敛到基态。进行统计采样以减少随机误差。
- 对于I₂和Pb，计算不同键长或晶格常数下的总能，拟合得到解离能或内聚能。
- 对于InP，计算不同体积下的总能，拟合物态方程，并通过共同切线法确定相变压力。
- 对比无SOC和含SOC的计算结果，量化SOC的影响。

3.3 所用的软件包及开源 repo link

本研究主要使用了以下软件包：

Quantum ESPRESSO [47, 48]：这是一个广泛用于电子结构计算的开源软件包，用于：
- 进行密度泛函理论（DFT）计算，为AFQMC提供单粒子轨道作为试探波函数的基础。
- 生成并处理优化的范德堡特范数守恒（ONCV）赝势。论文明确指出，所有DFT计算均使用Quantum ESPRESSO完成。
ONCVPSP [50]：这是一个用于生成优化范数守恒赝势的独立代码。论文指出，该代码支持生成j-依赖的投影器，这对于整合SOC至关重要。虽然Quantum ESPRESSO也内置了赝势处理功能，但ONCVPSP是一个专门的工具，可以生成符合AFQMC要求的赝势。

AFQMC代码：论文中提及“our phaseless pw-AFQMC code”，表明作者使用了内部开发或修改过的AFQMC代码。目前，论文中并未直接提供该特定SOC-enabled pw-AFQMC代码的开源仓库链接。然而，现有一些开源的AFQMC实现项目，虽然可能不直接包含SOC功能或平面波基组，但可以作为参考和开发基础，例如：

QMCLAB (由Motta和Zhang等人开发，其中Zhang是本文作者之一)：这是一个基于高斯基组的AFQMC代码，通常用于分子体系。虽然基组不同，但其AFQMC核心逻辑和无相位近似的实现具有参考价值。链接：通常在相关论文中引用，但没有一个统一的GitHub仓库。
QMCPACK：一个功能强大的开源量子蒙特卡罗软件包，支持多种QMC方法，包括变分蒙特卡罗（VMC）和扩散蒙特卡罗（DMC）。它主要关注连续空间和原子基组。其对赝势的处理和并行计算策略具有借鉴意义。链接：https://www.qmcpack.org/
Dice：一个Python实现的AFQMC框架，主要用于格点模型。链接：https://github.com/Quantum-AFQMC/Dice

对于想复现本文工作的研究人员，可能需要基于现有的pw-AFQMC代码（或从头开始）进行开发，并参考论文中详细描述的哈密顿量、传播器和测量算符的SOC泛化形式。特别是，对赝势文件格式的解析和对j-依赖投影器的处理是关键。

4. 关键引用文献，以及你对这项工作局限性的评论

4.1 关键引用文献

本研究建立在量子蒙特卡罗（QMC）方法、赝势理论以及自旋轨道耦合（SOC）处理的深厚基础之上。以下是一些在论文中被引用且对该工作至关重要的文献，它们代表了AFQMC、赝势理论和SOC处理领域的里程碑式贡献：

[24] M. Motta and S. Zhang, WIRES Computational Molecular Science 8, e1364 (2018).
- 重要性：这篇综述文章（由本文作者之一S. Zhang参与）全面介绍了量子蒙特卡罗方法，特别是辅助场QMC的理论基础、发展和应用。它是理解AFQMC方法，包括无相位近似、其计算效率以及在强关联体系中表现的关键起点。
- 评论：对于初学者和希望深入了解AFQMC原理的研究人员来说，这是一篇必读的文献。它为理解本文将SOC整合到pw-AFQMC框架中的基本原理提供了宏观视角。
[30] S. Zhang and H. Krakauer, Phys. Rev. Lett. 90, 136401 (2003).
- 重要性：这篇论文首次提出了将无相位近似引入辅助场QMC方法，有效地解决了费米子符号问题，使AFQMC能够处理更大的系统。这是现代无相位AFQMC的奠基性工作，没有它，本文所讨论的计算将难以实现。
- 评论：理解无相位近似的数学和物理含义对于评估AFQMC结果的可靠性至关重要。本文在很大程度上依赖于这一框架，并将其扩展到包含SOC的旋量基组。
[38] D. R. Hamann, Phys. Rev. B 88, 085117 (2013).
- 重要性：这篇论文详细介绍了Hamann等人开发的优化的范德堡特范数守恒（ONCV）赝势。这些赝势旨在实现更高的转移性，并提供更准确的原子间势。本文利用ONCV赝势的全相对论（FR）版本来处理重元素中的SOC效应。
- 评论：赝势的质量直接影响电子结构计算的准确性。ONCV赝势在准确性、传输性和计算效率之间取得了良好平衡。将其扩展到FR形式是本文工作的基础，因为它提供了准确处理原子核附近区域相对论效应的工具。
[45] L. Kleinman and D. M. Bylander, Phys. Rev. Lett. 48, 1425 (1982).
- 重要性：这篇论文提出了非局域赝势的Kleinman-Bylander分离形式。这种形式使得非局域势的矩阵元素可以高效计算，对于平面波基组方法尤其重要。本文在将SOC引入非局域赝势时，也利用了这种分离形式的思想，尽管形式上更为复杂。
- 评论：Kleinman-Bylander形式是处理非局域赝势的标准方法之一。理解其原理有助于把握本文如何将其泛化到SOC情况下的j-依赖投影器。
[64] J. Liu and L. Cheng, The Journal of Chemical Physics 148, 144108 (2018).
- 重要性：这篇论文专注于计算重元素分子（如I₂）的相对论效应，包括SOC。它为本文中I₂分子的解离能基准测试提供了重要的比较数据和背景信息，验证了SOC在这些体系中的关键作用。
- 评论：通过比较不同方法的计算结果（例如Coupled Cluster方法），这篇文献可以帮助评估AFQMC在处理分子体系SOC效应时的相对准确性。
[77] A. Mujica, A. Rubio, A. Muñoz, and R. J. Needs, Rev. Mod. Phys. 75, 863 (2003).
- 重要性：这篇综述深入探讨了压力诱导的相变理论和计算方法，对于理解本文中InP的相变压力计算至关重要。它提供了关于物态方程、相变机制以及相关计算挑战的广泛背景知识。
- 评论：相变压力的精确预测是一项严峻的挑战，需要对体系在不同晶体结构下的能量进行高精度计算。这篇文献为InP相变压力的分析提供了理论框架。

4.2 对这项工作局限性的评论

尽管本研究在将SOC整合到pw-AFQMC方法中取得了显著进展，但仍存在一些局限性，值得未来的工作进一步探索：

计算成本：
- 高维度希尔伯特空间：SOC的引入使得有效希尔伯特空间维度翻倍，从M增加到2M。尽管AFQMC的计算标度通常为N³，但常数因子显著增加，导致计算成本更高，特别是对于大规模系统或需要高精度采样的金属体系。论文中也提到了对于InP的RS金属相，需要更密集的扭曲角采样。
- 时间步长：为了保证Trotter-Suzuki分解的精度，通常需要使用非常小的时间步长$\Delta\tau$，这也增加了总的计算迭代次数。
有限尺寸效应（Finite-size errors）：
- 块体体系：在I₂分子和Pb块体的基准测试中，论文提到了有限尺寸误差对结果的影响。例如，对于Pb，使用了单个Baldereschi平均值k点和相对较小的超胞。对于InP，论文指出残余的有限尺寸误差仍然存在，并且对ZB和RS相的影响趋势相反，导致相变压力预测值与实验值存在偏差。要完全消除这些误差，通常需要进行系统性的有限尺寸外推，并可能涉及更大的超胞和更密集的扭曲平均边界条件（Twist-averaged boundary conditions），特别是对于金属体系，这将进一步增加计算负担。
赝势的完善性：
- 半芯态处理：论文指出，将In的4d半芯态纳入赝势中可能会进一步改善InP的计算结果。目前使用的In赝势保留了5s²5p¹价态，而4d态被视为核态。对于一些体系，将半芯态作为价态处理（“大核”赝势）对于精确捕获所有相对论效应至关重要。
- 赝势的普适性：尽管ONCV赝势表现良好，但不同赝势在不同体系中仍可能存在差异。未来可能需要更广泛地测试不同FR赝势的性能。
试探波函数的选择与质量：
- 无相位近似依赖性：无相位AFQMC的准确性在很大程度上取决于试探波函数$|\Psi_T\rangle$的质量。通常使用DFT或Hartree-Fock生成的Slater行列式作为试探波函数。对于强关联体系，更高级的试探波函数（如多行列式波函数或Jastrow-Slater波函数）可能会提供更好的精度，但这也会增加计算的复杂性。
- 试探波函数的相对论效应：当前试探波函数通常来自FR-DFT计算，其质量已经包含了部分相对论效应。但其是否能完全捕捉强关联和SOC的复杂协同效应仍是未来研究方向。
对激发态和非平衡态的扩展：
- 本文主要关注基态能量的计算。将SOC整合到AFQMC框架中对于研究激发态特性（如激子、光学光谱）和非平衡态过程（如自旋动力学）具有巨大潜力，但这需要进一步的理论和算法发展。
K-对称性与GPU加速：
- 论文最后指出，为了提高计算效率，未来可以引入k-对称性并实现GPU加速。目前，这些优化尚未完全整合到报告的成果中。一旦实现，将有助于缓解部分计算成本的局限性。

总的来说，这项工作是向着更精确模拟重元素体系迈出的重要一步，但上述局限性也为未来的研究指明了方向，包括进一步优化计算效率、更精细地处理系统模型和扩展应用范围。

5. 其他你认为必要的补充

5.1 SOC在新兴量子技术中的关键作用

本研究将SOC纳入pw-AFQMC的努力，不仅对传统材料科学至关重要，而且对新兴的量子技术领域具有深远影响。SOC是许多前沿量子现象的核心驱动力，例如：

拓扑量子计算：拓扑材料，如拓扑绝缘体和拓扑超导体，其独特的边缘态和表面态对SOC高度敏感。SOC可以打开拓扑带隙，并诱导受拓扑保护的量子态，这些态对局部扰动具有鲁棒性，是构建容错量子计算机的潜在载体。精确模拟这些材料中的SOC效应对于发现新的拓扑相和设计拓扑量子器件至关重要。
量子传感器：基于自旋的量子传感器（如金刚石NV色心）利用电子自旋态的相干性进行高精度测量。SOC可以通过调控自旋态之间的相互作用，影响传感器的灵敏度和相干时间。理解和控制SOC有助于优化量子传感器的性能，例如在磁场、电场或温度测量中的应用。
自旋电子学与磁存储：SOC在自旋电子器件中扮演着核心角色，例如自旋霍尔效应、逆自旋霍尔效应和拉什巴效应。这些效应允许在没有磁场的情况下实现电荷电流到自旋电流的转换，为低功耗、高速的自旋存储和逻辑器件提供了新的范式。随着数据存储需求的增长，开发具有更好性能的磁存储材料，需要精确理解SOC如何影响磁各向异性、磁畴壁运动和自旋重取向转变。

因此，本文的方法为深入研究这些复杂体系的量子特性和设计下一代量子器件提供了强大的计算工具。

5.2 与其他多体方法的比较

在凝聚态物理和量子化学中，有多种多体方法能够处理电子关联，例如动力学平均场理论（DMFT）、GW近似、密度矩阵重整化群（DMRG）、耦合簇理论（CC）和蒙特卡罗方法。pw-AFQMC方法与这些方法各有优劣：

与DMFT和GW的比较：DMFT和GW通常用于处理局域或准粒子激发问题。DMFT在处理强局域关联方面表现出色，而GW则擅长计算准粒子能隙和能带结构。然而，它们通常依赖于DFT作为基准，并且在处理长程关联或复杂基态关联方面可能不如AFQMC全面。AFQMC能够直接计算基态总能，并且可以更好地处理具有不同关联强度的区域。
与DMRG的比较：DMRG在处理一维和准一维系统中的强关联方面非常成功，并且能够提供高精度的基态能量和激发态信息。但DMRG的计算成本通常随系统维度增加而急剧上升，使其难以直接应用于二维或三维周期性体系。相比之下，AFQMC的N³标度使其更适用于三维大体系。
与耦合簇理论（CC）的比较：CC理论是量子化学中最精确的方法之一，特别是CCDT(Q)等高阶方法。它在处理弱到中等关联体系方面表现出色。然而，CC理论通常在处理强关联和金属体系时面临挑战，且计算成本随系统尺寸呈高次幂增长。AFQMC在处理金属和强关联体系方面具有独特优势。
pw-AFQMC的优势：
- 处理强关联：AFQMC能够有效处理强电子关联效应，这是DFT等平均场理论的痛点。
- 平面波基组：对于扩展周期性体系，平面波基组提供了无偏且系统收敛的基组，易于控制收敛性。
- 低次幂标度：N³的计算标度使其适用于比其他高精度多体方法更大的体系。
- 统一处理：通过本次工作，pw-AFQMC能够统一处理电子关联和SOC效应，为研究重元素强关联材料提供了一个强大的平台。

5.3 未来展望与方法通用性

本研究为pw-AFQMC方法未来的发展和应用开辟了广阔前景：

更大更复杂的体系：通过进一步的算法优化（如k-对称性、更高效的有限尺寸校正）和计算硬件的进步（如GPU加速），该方法有望应用于更大规模、更复杂的材料体系，例如具有复杂拓扑结构或多功能特性的材料。
多体激发态：当前工作主要集中于基态性质。将SOC引入激发态AFQMC（如GW+AFQMC）将是未来激动人心的方向，可用于研究自旋分辨的光谱和激发态动力学。
材料设计与发现：高精度地模拟重元素材料的性质，将有助于加速新材料的发现和设计，特别是在自旋电子学、热电材料和催化剂等领域。通过预测材料在不同外部条件（如压力、应变）下的响应，可以指导实验合成。
与机器学习的结合：将AFQMC的高精度结果作为训练数据，结合机器学习模型，可以构建更高效的预测模型，从而在保持高精度的前提下，加速材料性质的筛选和设计。

方法通用性：论文强调，本文概述的理论框架和相应表达式普遍适用于AFQMC框架内的其他系统（或不同基组）。这意味着虽然本工作是基于平面波基组实现的，但其核心思想和SOC整合策略原则上可以推广到其他局部基组（如高斯基组或数值原子轨道），从而进一步扩展AFQMC的应用范围。

通过这次SOC整合，无相位pw-AFQMC方法已经从一个处理轻元素的工具，蜕变为一个能够精确揭示重元素体系中复杂量子现象的强大模拟平台。这无疑将推动凝聚态物理、材料科学和量子信息技术领域的发展。