来源论文: https://arxiv.org/pdf/2309.13774 生成时间: Mar 22, 2026 05:50

费曼图的组合求和：多体量子系统计算的高效组合数学框架深度解析

0. 执行摘要

在现代多体物理学中，费曼图级数是描述相互作用量子系统最通用且形式上精确的理论语言。然而，随着扰动阶数 $n$ 的增加，图表数量呈阶乘级（$n!$）增长，这成为了制约计算精度和效率的“维数灾难”。由伦敦国王学院 Evgeny Kozik 教授在 2024 年发表的这项研究中，提出了一种创新的“组合求和”（Combinatorial Summation, CoS）框架。该方法的核心贡献在于利用动态规划（Dynamic Programming）技术，显式地构建了所有连通图（Connected Diagrams）或骨架图（Skeleton Diagrams）的被积函数之和。在经典计算机上，该算法将计算成本从 $O(n!)$ 降低到了指数级；而在未来的量子计算机上，则有望实现多项式级的复杂度。通过对 2D SU(6) 哈伯德模型（Hubbard Model）的物态方程进行基准测试，该方法证明了其在处理实验相关、强相关区域（传统数值方法难以企及）的卓越能力。

1. 核心科学问题，理论基础，技术难点，方法细节

1.1 核心科学问题：超越阶乘爆炸的求和难题

费曼图技术自 20 世纪 40 年代问世以来，一直是量子场论和多体物理的基石。在计算物理学中，主要的挑战在于如何精确求和高阶贡献。虽然图论蒙特卡洛（DiagMC）通过随机采样级数在一定程度上缓解了这一问题，但在强相关区域，由于图表数量庞大且符号振荡（Sign Problem），蒙特卡洛方差会随阶数剧增，导致收敛极其缓慢。

本研究旨在回答：是否存在一种确定性的求和方法，能够避开显式列举所有拓扑结构的步骤，从而显著提高高阶图表的计算效率？

1.2 理论基础：行列式的循环分解与组合结构

该方法的理论起点是行列式（Determinant）。在有限尺寸系统中，$n$ 个相互作用顶点对应的所有费曼图的总和，可以表示为一个 $2n \times 2n$ 矩阵的行列式。然而，行列式求和会包含大量的“不连通图”（Disconnected Diagrams），这些图在物理上是不必要的，甚至会引入虚假的系统尺寸依赖性。传统上，消除不连通图需要额外的指数级步骤。

Kozik 教授引入了循环分解（Cycle Decomposition）的概念。行列式可以写为所有排列循环覆盖（Cycle Covers）的加权和：

$$\text{det}\{g_{\alpha\beta}\} = \sum_{\mathcal{C}} \text{sign} \mathcal{C} \cdot \text{weight} \mathcal{C}$$

其中 $\mathcal{C}$ 代表由单粒子格林函数 $G^0$ 构成的费曼环路。文章的核心灵感源于 1997 年 Mahajan 和 Vinay 的算法，该算法证明了通过动态规划，可以在多项式时间内计算不含除法的行列式。

1.3 技术难点：如何“只保留”连通图？

将动态规划应用于费曼图，面临的最棘手问题是维持“连通性约束”。在生成求和图的过程中，算法必须确保所有的费曼环路最终都被相互作用线（Interaction Lines）连接在一起。

技术难点包括：

节点状态空间的定义：为了识别连通性，每个计算节点必须存储当前已访问顶点的连接状态。这种“状态记录”如果不加控制，会导致状态空间呈阶乘级爆炸。
SU(N) 对称性的处理：在多组分系统中，每个费曼环路携带一个 $N$ 的乘子。如何在求和过程中高效地跟踪并应用这些拓扑相关的因子？
计算图的去重与剪枝：如何保证每条路径生成的费曼图是不重不漏的？

1.4 方法细节：CoS-1 与 CoS-2 架构

文章提出了两种主要的组合求和路径：

CoS-1（行列式修正法）：这是对现有行列式算法的直接改进。通过在节点标签中引入额外的记录 $\mathcal{R}$（包含已访问顶点的分组信息），算法能够在构建过程中识别出哪些路径会导致不连通图。在生成过程中，一旦发现某部分闭合且不与外界连接，该路径即被丢弃。通过对节点进行“复制”和“重定向”，可以显式地从求和中减去不连通项。
CoS-2（从头构建连通图法）：这是更为通用的方案。算法不再依赖行列式的形式，而是通过有序的格林函数步进（Steps）来构建环路。其关键规则是：每一个新的费曼环路必须从一个通过相互作用线连接到已访问顶点的元素开始。这种策略确保了从初始步起，生成的所有结构在拓扑上都是连通的。文中证明，这种方法在 $n \gtrsim 5-6$ 阶时比 CoS-1 更高效，其计算开销约为 $O(n^3 4^n)$。
动态规划的具体实现：计算被组织成一个有向图（Directed Graph）。图中的每个节点存储了截至当前步的部分求和结果。边（Edges）代表乘法操作（格林函数值 $g_{ee'}$）。通过合并具有相同物理状态（如阶数、头部元素、当前元素及连接记录 $\mathcal{R}$）的路径，极大地减少了重复计算。这就是“最大程度因子分解”的本质。

2. 关键 benchmark 体系，计算所得数据，性能数据

2.1 Benchmark 体系：2D SU(N) 哈伯德模型

研究选择了 SU(6) 哈伯德模型 作为主要基准。该体系具有极高的物理研究价值，因为它直接对应于实验中的超冷碱土金属原子（如 $^{173}$Yb）在光晶格中的行为。SU(N) 对称性的存在使得 Hilbert 空间随 $N$ 指数增长，对于传统的行列式量子蒙特卡洛（DQMC）而言，其符号问题随 $N$ 的增加而迅速恶化。

2.2 性能数据（FLOP 复杂度分析）

文章在图 2 和图 3 中详尽展示了算法的浮点运算次数（FLOP）：

与 CDet 算法对比：在 $SU(2)$ 情况（图 2a）下，CoS-1 表现出与当前最先进的 CDet 算法相当甚至更优的性能。对于阶数 $n=10$，CoS 算法的 FLOP 约为 $10^6$ 级别。
SU(N) 的优势：在 $SU(N)$ 情况下（图 2b），由于 CoS 算法不再受行列式刚性结构的限制（行列式在 $SU(N)$ 时需要额外的 $(N^2/2)^n$ 因子），其计算成本在 $N > 4$ 时与 $N$ 无关。对于 $n=8$，CoS-2 的运算量约为 $10^5$ FLOP。
全序化加速：如果仅求和非对称化的费曼图（即固定顶点顺序），计算复杂度可以进一步降低到 $O(n^{2} 2^{n})$。这虽然增加了蒙特卡洛采样的方差，但在特定积分框架（如 Tensor Train 降维）中极具潜力。

2.3 物理计算数据：物态方程 (EoS)

研究计算了 $SU(6)$ 哈伯德模型在不同温度和耦合强度下的平均粒子数 $\langle n \rangle$ 随化学势 $\mu$ 的变化：

低温高精度匹配：在 $T/t=0.3$ 和 $U/t=2.3$ 的条件下，CoS-DiagMC 的结果与 Pasqualetti 等人的实验数据及 DQMC 基准数据完全吻合。
突破极限区域：在更高耦合（$U/t=8, 12$）和更低温度（$T/t=0.15$）下，CoS 算法成功捕捉到了物态方程中的“平台区”（Plateau），这预示着系统进入了强相关的类能隙（Pseudo-gapped）状态。在这一区域，传统的 DQMC 因严重的符号问题已无法给出可靠数据。
奇点分析：利用 Dlog-Padé 逼近技术，研究分析了级数收敛半径外的奇点位置 $U_c$。结果显示，对于吸引势（Negative $U$），系统在 $U_c/t \approx -0.9$ 处可能发生向超流态的相变。

3. 代码实现细节，复现指南，所用的软件包及开源 repo link

3.1 算法实现逻辑指南

复现 CoS 算法的核心在于构建动态规划的计算图。以下是具体步骤建议：

定义节点数据结构：

struct Node {
    int level; // 当前阶数 l
    int head;  // 当前循环的起始顶点 h
    int current; // 当前所在的顶点 e
    ConnectivityRecord R; // 存储已连接分组的位掩码或并查集
    double value; // 部分求和值
};

构建有向图：
- 初始化节点 [0, 1, 1] 值为 1。
- 遍历层级 $l = 0 \dots 2n-1$。
- 应用推进规则：
  - 内循环推进：从 e1 到 e2 ($e2 > h$)，权重乘以 $g_{e1,e2}$。
  - 闭合循环并开启新循环：从 e1 回到 h，权重乘以 $-g_{e1,h}$，并在 $R$ 中检查连通性，然后选择新的 $h'$。
剪枝（Pruning）：每一层计算完成后，合并具有相同 (level, head, current, R) 标识符的节点。这是保证算法复杂性不退化为阶乘级的关键。

3.2 向量化与量子实现潜力

文中提到了一种“向量变体”（Section II.D），这对于高性能计算（HPC）复现至关重要：

将状态空间映射为 $2n$ 个量子比特的基矢量 $|R\rangle$。
使用算符 $\hat{P}_e^0$ 和 $\hat{P}_e^1$ 表示顶点 $e$ 是否被访问。
这种形式化描述非常适合使用 GPU 矩阵操作 或在 量子模拟器（如 Qiskit/Cirq）上验证多项式级加速的理论可行性。

3.3 开源资源与数据

原始数据：作者在 Nature 相关期刊要求的 Source Data 文件中提供了所有图表背后的 FLOP 计数和 EoS 数据点。
相似参考实现：虽然本文的特定 CoS 框架代码未直接给出 GitHub 链接，但其基础——行列式图表蒙特卡洛（CDet）的相关代码可以在 Riccardo Rossi 的开源项目中找到（见引用 [10]）。
建议工具链：推荐使用 C++20 处理大规模有向图构建，并结合 boost::hash 对复杂记录进行缓存。

4. 关键引用文献，以及你对这项工作局限性的评论

4.1 关键引用文献

[10] R. Rossi, Phys. Rev. Lett. 119, 045701 (2017)：提出了 CDet 算法，是本文对比的核心基准，也是连通费曼图决定性求和的先驱工作。
[11] R. Rossi et al., Europhys. Lett. 118, 10004 (2017)：证明了费曼级数求和的时间复杂度与精度的多项式关系，为本文的算法优化提供了理论底气。
[38] G. Pasqualetti et al., Phys. Rev. Lett. 132, 083401 (2024)：提供了最新的 $SU(6)$ 实验物态方程数据，是本文最主要的物理验证来源。
[44] M. Mahajan and V. Vinay (1997)：提供了动态规划计算行列式的组合数学基础。

4.2 工作局限性评论

内存压力：虽然时间复杂度降至指数级，但由于需要存储复杂的连通性记录 $R$，空间复杂度在极高阶（$n > 12$）时可能会成为瓶颈。对于经典硬件，存储大量的 DP 表需要极高的内存带宽。
级数收敛性依赖：CoS 算法本质上是在计算级数的系数。如果级数本身是强发散的（如哈伯德模型在某些区域的表现），即使求和到了第 10 阶，仍需依赖 Dlog-Padé 等重求和技术。重求和过程引入的系统误差有时会超过统计误差。
顶点的局域性假设：目前的优化显著受益于哈伯德相互作用在空间和时间上的局域性。对于长程相互作用（如库仑力）， $R$ 的记录可能会变得更加复杂，导致效率下降。
量子硬件门深限制：尽管论文勾勒了量子加速的蓝图，但实现 $O(n^4)$ 有向图对应的量子线路在当前 NISQ（嘈杂中型量子）时代仍面临巨大的逻辑门深度挑战。

5. 其他必要补充：方法学的深远意义

5.1 骨架级数（Skeleton Series）的扩展

本文最令人兴奋的扩展之一是其处理 GW 近似或骨架图 的能力（图 2b 中的 CoS-GW 曲线）。在传统的骨架图求和中，为了避免双重计数（Double Counting），需要极复杂的图拓扑筛选。CoS 框架通过简单的记录修正，证明了求和骨架图的成本与求和普通连通图几乎相同。这意味着我们可以直接在重整化后的格林函数 $G$ 和筛选相互作用 $W$ 基础上构建级数，从而极大地提高级数在强耦合区的收敛性。

5.2 对超冷原子实验的“温度计”作用

在量子模拟实验中，测量系统的真实温度一直是一个难题。本文展示的计算能力意味着，理论物理学家现在可以提供在 $T/t < 0.2$ 区域的高精度物态方程参考曲线。通过将实验观测到的粒子数分布与 CoS-DiagMC 的曲线进行比对，实验学家可以获得更准确的系统温标，这对于寻找反铁磁有序态或非费米液体行为至关重要。

5.3 结论

Evgeny Kozik 的这项工作标志着“费曼图计算几何化/图论化”的一个里程碑。它不仅为经典的高性能并行计算提供了新的算法思路，更重要的是，它为费曼图求和这一经典的物理问题与现代计算机科学中的有向无环图（DAG）优化、动态规划以及量子电路理论之间架起了一座桥梁。随着算法的进一步优化和开源实现，我们有理由期待在未来几年内，能够看到更多关于 SU(N) 磁性与拓扑物态的精确数值发现。