量子飞跃：在数字量子处理器上实现大规模费米-哈伯德模型的快速、准确与高分辨率模拟

来源论文: https://arxiv.org/abs/2605.04025v1 生成时间: May 06, 2026 10:55

0. 执行摘要

理解强关联电子系统是凝聚态物理学的核心挑战之一，而费米-哈伯德模型作为其范式性描述，因其希尔伯特空间的指数级增长，其非平衡态动力学模拟在经典计算机上极其困难。尽管量子计算机被视为解决这一计算瓶颈的潜在工具，但其发展一直受限于机器规模以及硬件噪声和误差的影响。

本文报告了一项在超导量子处理器上对一维费米-哈伯德模型进行数字量子模拟的实验性工作，其规模不仅超越了精确状态向量模拟的极限，也对最先进的张量网络方法构成了严峻挑战。我们通过引入高效的费米子-量子比特映射策略，将电路复杂性降至最低，从而在多达 120 个量子比特（对应 60 个格点）的系统上进行模拟。同时，结合无额外开销的运行时误差抑制技术，模拟精度得到了显著提升，支持长达 90 个 Trotter 步长的动力学演化。

核心科学发现包括：从一个在 L=31（62 个量子比特）Néel 初始态中心引入空位缺陷的场景出发，我们直接观测到了自旋-电荷分离现象，并在自然单位下演化至 t=9，横跨 90 个 Trotter 步长。通过量化提取电荷/自旋波前的传播速度比率，结果与一系列模型参数下的经典模拟结果高度吻合。进一步，我们将实验扩展到 L=60（120 个量子比特）的更大系统规模，并在 t=6 的长时间演化下进行了 30 个 Trotter 步长的模拟。量子处理器输出与通过时间依赖变分原理（TDVP）求解器进行的近似经典模拟结果在量化上高度一致，在 TDVP 键维度 χ=4096 的情况下，其均方根误差（RMSE）在演化时间 t≈5.2（以逆跳跃幅度单位计）之前保持在约 1% 的水平，随后经典模拟开始发散。值得注意的是，在量子/经典一致性达到极限的模拟演化时间（t≥5）下，量子处理器的挂钟运行时间比优化后的 TDVP 模拟（使用 χ=4096）快了 高达 3000 倍。

这些突破性成果确立了当代数字量子处理器作为一种多功能、定量准确且具有竞争力的平台，有望用于研究费米子多体动力学中经典方法计算成本过高的难题领域。本文的工作不仅推动了量子模拟的边界，也为利用量子技术解决实际凝聚态物理问题开辟了新的道路。

1. 核心科学问题，理论基础，技术难点，方法细节

1.1. 核心科学问题

强关联电子系统是凝聚态物理领域的核心研究对象，其丰富的物理现象涵盖了从莫特绝缘体-金属转变、非常规超导性到奇异金属输运和量子磁性等。费米-哈伯德模型以最少的参数集捕捉了动能与局域库仑排斥之间的相互作用，为研究这些物态提供了规范的理论框架。尽管其重要性显而易见，但精确模拟其非平衡态动力学，尤其是在大规模系统下，由于希尔伯特空间的指数级增长，仍然是计算上的巨大挑战。例如，一维费米-哈伯德模型的精确对角化模拟通常受限于 L≤14 个格点，而二维模型则缺乏精确解，其有限掺杂下的相图仍未完全理解。

为了克服经典模拟的限制，研究人员开发了多种近似数值方法，如量子蒙特卡洛（QMC）、动力学平均场理论（DMFT）和张量网络方法（如 TDVP）。然而，这些近似方法在处理长时间演化和高纠缠态时，计算成本仍会呈指数级增长。量子计算机被视为解决这些计算瓶颈的有效工具，但实际应用一直受限于量子比特数量和硬件噪声的影响。

本研究的核心科学问题是：如何在当前中等规模、有噪声的数字量子处理器上，实现对大规模费米-哈伯德模型动力学的快速、准确和高分辨率模拟，并验证其在经典方法难以企及的区域的有效性，从而为探索强关联物理提供新的工具。

1.2. 理论基础

费米-哈伯德模型 (Fermi-Hubbard Model) 该模型描述了电子在晶格上的跳跃（动能）和局域相互作用（库仑排斥）。其哈密顿量定义为：

H = -th Σ(c†i,σci+1,σ + h.c.) + UΣni,↑ni,↓ - μΣni,σ

其中，c†i,σ 和 ci,σ 分别是格点 i 和自旋 σ 电子的产生和湮灭算符，ni,σ = c†i,σci,σ 是粒子数算符。th 是跳跃强度，U 是局域库仑排斥强度，μ 是化学势。在本文中，我们主要关注 th=1 的均匀一维链情况。

Jordan-Wigner 变换 (Jordan-Wigner Transformation) 为了在量子比特上模拟费米子系统，需要将费米子算符映射到量子比特 Pauli 算符。Jordan-Wigner 变换特别适用于一维模型，因为它能保持最近邻项的局域性。对于有序的费米子模式 J ∈ {0, ..., 2L-1}，变换定义为：

cJ = (Πk=0 to J-1 Zk) (XJ + iYJ)/2

Trotter 化 (Trotterization) 时间演化算符 e^(-iHt) 被分解为一系列离散的 Trotter 步 U_k。本研究采用二阶 Trotter 分解，其误差尺度为 O(Δt³)（对于偶数步）和 O(Δt²)（对于奇数步）。这种镜像（mirrored）的 Trotter 步方案有效减少了误差积累。

自旋-电荷分离 (Spin-Charge Separation) 在某些一维强关联系统中，基本激发不再是电子，而是分裂为携带不同量子数且以不同速度传播的准粒子：自旋子（spinons，电荷为 0，自旋为 1/2）和空穴子（holons，电荷为 ±e，自旋为 0）。这种现象是本研究关注的核心物理效应之一。

时间依赖变分原理 (Time-Dependent Variational Principle, TDVP) TDVP 是一种经典的张量网络方法，用于模拟量子系统的长时间演化。它通过将薛定谔方程投影到变分流形（如矩阵乘积态 MPS 的切空间）上，来近似演化量子态。它能处理比精确对角化更大的系统，但其计算成本随系统纠缠度（键维度 χ）的增加而呈指数增长，限制了其在长时间演化和高纠缠态下的应用。TDVP 在本文中作为量子模拟结果的“高精度”经典基线。

Pauli 路径传播 (Pauli Path Propagation, PPP) PPP 是一种评估算符在 Heisenberg 绘景中演化的经典方法。它通过将算符分解为 Pauli 基并跟踪每个 Pauli 算符的演化来计算期望值。然而，在通用动力学中，Pauli 算符的支撑会迅速增长，导致指数级多的项。PPP 通常采用截断方案来控制项的数量，但这引入了非受控的近似误差。

1.3. 技术难点

本研究面临的主要技术难点包括：

大规模系统下的硬件噪声与误差积累：当前 NISQ（Noisy Intermediate-Scale Quantum）量子处理器的门保真度有限，量子相干时间短，导致随着电路深度和量子比特数量的增加，误差迅速积累，限制了模拟的有效时间。如何在大规模系统和深度电路下获取有意义的物理信号是核心挑战。
高效的费米子-量子比特映射：Jordan-Wigner 变换虽然直接，但对于非局域的费米子相互作用，可能在量子比特映射后产生高权重（多体）的 Pauli 字符串，导致电路复杂性剧增。如何在硬件拓扑结构（如 IBM Heron 的重六边形）上实现低深度、局域性的映射至关重要。
深度 Trotter 电路的编译与优化：将抽象的哈密顿量演化操作转化为量子比特上的原生逻辑门序列，同时最小化门数量和电路深度，需要高度优化的编译策略。特别是对于长程跳跃项，如何避免昂贵的量子比特路由（fSWAP gates）是一个关键问题。
无容错时代的误差抑制与缓解：在尚未实现容错量子计算的背景下，必须结合多种技术来对抗误差。这包括运行时的误差抑制（如动态解耦、Pauli Twirling）和后处理阶段的误差缓解（如读出误差缓解、衰减恢复、对称性后选择）。这些技术需要精心设计和校准，以确保在不引入额外计算开销的情况下提升结果保真度。
缺乏大规模精确经典基线：由于经典计算的限制，对于本研究中模拟的大规模系统和长时间演化，往往没有精确的经典解作为“黄金标准”。因此，需要依赖先进的近似经典方法（如 TDVP）进行基准测试，并理解这些近似方法的局限性及其发散行为。

1.4. 方法细节

本研究通过一系列创新性的应用感知编译、误差抑制和后处理技术，成功克服了上述挑战。

1.4.1. 费米子到量子比特映射 (Jordan-Wigner, Pair-interleaved Ordering)

为了最小化在 IBM Heron 等重六边形（heavy-hex）设备拓扑上的路由开销，我们引入了对交错序 (pair-interleaved ordering) 进行 Jordan-Wigner 变换。传统 JW 变换可能导致哈密顿量中出现非局域的 Pauli 字符串，增加电路深度。对交错序 {c₀↓, c₀↑, c₁↑, c₁↓, c₂↓, c₂↑, …} (Eq. S3) 将每个格点的自旋向上和自旋向下模式交错排列，这使得所有跳跃和相互作用门都可以映射到相邻的量子比特对上，从而显著降低了电路复杂性。这种映射产生了权重为 2 的“短程跳跃”项（XX+YY）和权重为 4 的“长程跳跃”项（XZZX+YZZY）。

1.4.2. Trotter 化电路构建 (Second-order Trotter, fSWAP network)

我们采用二阶 Trotter 分解，将总时间演化算符分解为一系列小时间步长的演化。其主要特点是：

镜像 Trotter 步：通过对两个相邻 Trotter 步进行镜像对称组合，实现了 O(Δt³) 的二阶精度（对于偶数步，Eq. S16）。
fSWAP 网络: 这是减少电路深度的关键创新。为了实现长程跳跃项，我们引入了费米子交换（fSWAP）网络 (Eq. S8)。fSWAP 门可以在相邻量子比特之间交换费米子模式。通过在一个 Trotter 步中插入一层 fSWAP 门，可以将复杂的长程跳跃项（XZZX+YZZY）有效地转换为更简单的短程跳跃项（XX+YY）(Eq. S10)，从而使用更少的门实现。这种策略显著降低了总电路深度。
电路深度和门计数: 通过这种高效的结构，双量子比特电路深度 D₂Q = 5n_step + 2 与系统尺寸 L 无关，仅线性依赖于 Trotter 步数 n_step (Eq. S18)。双量子比特门总数 N₂Q = (5L - 2)n_step + 2(L - 1) - 1 则线性依赖于 L 和 n_step (Eq. S19)。这使得模拟能够扩展到更大的系统尺寸，而不会导致执行时间随系统尺寸指数级增长。

1.4.3. 应用感知编译与布局选择 (Q-CTRL Fire Opal, Heavy-hex topology, A-Motif)

我们将 Q-CTRL 的 Fire Opal 编译管道 [56-58] 应用于电路编译和调度，以优化在 IBM Heron 处理器上的执行。

原生门分解: 将 Trotter 电路中的门（如 Rxx/Ryy 和 Rzz 旋转）分解为 IBM Heron 原生门集中的操作，包括分数 Rx(θ)、Rzz(θ) 门以及固定角度的 X、√X 和 CZ 门。
重六边形拓扑映射: 采用“蛇形路径”布局 (snaking path layout) (Fig. 1d, S2)，将一维费米子链嵌入到 IBM Heron 处理器的重六边形连接拓扑中，确保了所需的连接性，同时最小化了量子比特路由开销。
高保真布局选择: 对于小规模系统（2L < 60 量子比特），采用 VF2++ 算法 [3, 4] 识别高保真布局。对于大规模系统（2L > 60 量子比特，如 120 量子比特），我们采用了改进的 A-Motif 算法变体 [5]。这种算法能够详尽地识别并评分所有可能的 1D 链布局，避免使用门保真度或读出保真度显著低于设备中位数的量子比特，从而确保整体模拟保真度。

1.4.4. 误差抑制技术 (Dynamical Decoupling, Pauli Twirling)

为了对抗硬件噪声，我们采用了无额外执行开销的运行时误差抑制策略：

动态解耦 (Dynamical Decoupling)：作为 Q-CTRL Fire Opal 管道的一部分，该技术优化了硬件门波形，以在执行期间抑制退相干效应 [7]。
Pauli Twirling (随机化编译)：在编译阶段集成 Pauli Twirling [12, 13]，通过在每个双量子比特门前后随机插入单量子比特 Pauli 门，将相干门误差转换为随机 Pauli 误差。这有助于抑制相干误差的累积，并且不会引入额外的测量开销。实验结果显示，Pauli Twirling 将总均方根误差降低了 21.7%（在最可靠的演化时间 [0, 5.2] 区间内降低了 34.5%），并在整个量子比特寄存器上均匀分布了噪声缓解效果 (Fig. S3)。

1.4.5. 后处理误差缓解 (Readout Error Mitigation, Decay Recovery, Symmetry Post-selection)

除了运行时的抑制，还在后处理阶段应用了多种误差缓解技术：

读出误差缓解 (Readout Error Mitigation, REM) [6, 38-40]：通过执行表征电路，我们为每个量子比特构建了独立的单量子比特混淆矩阵 C_i (Eq. S29)。这些矩阵用于校正测量结果中由读出噪声引起的偏差。由于策略性地选择布局，我们避免了具有异常高读出误差的量子比特，并将全局 REM 修正应用于边缘化后的测量分布，以估计低权重 Pauli-Z 可观测量。
衰减恢复 (Decay Recovery)：为了补偿硬件退相干导致的信号衰减，我们采用了一种基于 n-th 回波电路 (n-th echo circuit) 的经验性方法 (Fig. S12)。回波电路测量了经验性的衰减率 d_n (Eq. S31)。然后，我们通过一个正则化的重标定过程 (P)_mit = (P)_hw / (c d_n + (1-c)) 来恢复期望值。信心参数 c=0.5 经过小型系统校准后固定用于所有大规模实验。在 L=10 的小型系统上，该方法将均方根误差从 2.2×10⁻² 降低到 1.3×10⁻²，提升了 41% (Fig. S13)。
对称性后选择 (Symmetry Post-selection)：费米-哈伯德模型的动力学保持自旋向上和自旋向下粒子的总数守恒。我们可以通过丢弃那些不遵守初始态粒子数守恒的测量结果，将测量数据限制在物理相关的希尔伯特子空间中 (Fig. S14)。这种方法作为诊断硬件噪声的指标非常有用。然而，我们的研究发现，在 NISQ 机器上，对称性后选择并不能改善结果，并且由于有效样本量的减少，往往会降低准确性 (Fig. S15)。因此，本研究的主要结果并未采用对称性后选择。

2. 关键 Benchmark 体系，计算所得数据，性能数据

2.1. Benchmark 体系

本研究的核心 benchmark 体系是一个一维费米-哈伯德链。我们关注其弛豫动力学，特别是从一个半满 Néel 初始态（表示为 |↓↑↓↑...>）开始，其中在链的中心位置引入了一个空位缺陷（一个空穴子）。

关键的可观测量包括：

单位格点电子密度：n_i,↑(t) + n_i,↓(t)，它反映了电荷分布的变化。
单位格点 z-自旋：(n_i,↑(t) - n_i,↓(t))/2，它反映了自旋分布的变化。

为了清晰地追踪这些物理量的传播，我们引入了示踪关联函数 (tracer correlators)：

电荷示踪关联函数 C^c(t)：定义为 (n_i,↑(t) + n_i,↓(t)) - (n_i,↑(0) + n_i,↓(0)) (Eq. S36)，即单位格点电子密度随时间的变化。
自旋示踪关联函数 C^s(t)：定义为 4(<S^z_i*(t)S^z_i(t)> - <S^z_i*(t)><S^z_i(t)>) (Eq. S37)，即中心缺陷 i* 处的连通自旋-自旋关联。由于初始 Néel 态缺乏连通关联，该函数在 t=0 时为零，能够直接捕捉传播的自旋扰动。

经典基线方面，我们主要使用了时间依赖变分原理（TDVP），其通过 ITensorMPS.jl 库（Julia 实现）进行，最高键维度 χ=4096。此外，还使用了**Pauli 路径传播（PPP）**方法进行对比验证。

2.2. 核心科学结果：自旋-电荷分离

本研究的一个核心亮点是对自旋-电荷分离现象的直接观测和量化验证。

L=31 链上的自旋-电荷分离（62 量子比特，t=9，90 Trotter 步）：我们从一个在 L=31 链中心引入空位缺陷的 Néel 初始态开始模拟。在哈密顿量的时间演化下，缺陷会产生电荷和自旋扰动，并以不同的速度向外传播 (Fig. 2a-f)。我们清晰地观测到了电荷（空穴子）和自旋（自旋子）波前的弹道式传播，它们从初始局域化位置以不同的速率运动。为了量化这一现象，我们开发了一个波前检测算法 (Algorithm 1, Fig. S16)。该算法通过高斯平滑处理示踪关联函数，识别信号下降到峰值某个比例（30%）的内侧位置，从而确定波前位置。然后，使用 Theil-Sen 估计器进行线性回归，提取波前速度 v_c 和 v_s。 量化一致性：提取的电荷/自旋速度比率 v_c/v_s 在广泛的相互作用参数 U/t_h 范围内，与经典 TDVP 模拟结果高度吻合 (Fig. 2g-i)。虽然存在少量系统性偏差，但这主要归因于硬件噪声对波前提取的潜在影响。这项结果展示了在深层电路中（最深达 90 个 Trotter 步长）量子处理器仍能保持相干动力学，并能直接观测到凝聚态物理中的基本现象。

2.3. 大尺度模拟：L=60 链

为了进一步推动量子模拟的边界，我们将实验扩展到L=60 链（120 量子比特），这是当前数字量子模拟所能达到的最大规模之一，超越了此前 L=52 的演示 [17]。

系统规模与演化时间：在 L=60 链上，我们模拟了初始 Fock 态（Néel 态，包含或不包含中心空位缺陷）的弛豫动力学，总模拟时间达到 t=6（以逆跳跃幅度单位计），对应 30 个 Trotter 步。
动力学观测：数字量子模拟结果展示了电荷密度复杂的动力学演化，包括交错自旋态的显著振荡、边界效应以及局域空位的传播 (Fig. 3a, 3e, 以及 3b-d, 3f-h)。这些观测到的动力学现象在最长演化时间下仍然清晰可见。
与经典 TDVP 的精度对比：量子模拟结果与使用 χ=4096 键维度的经典 TDVP 模拟结果相比，在均方根误差（RMSE）方面表现出高精度一致性。在演化时间 t ≈ 5.2 之前，RMSE 保持在 ≤1% 的水平。在此之后，经典 TDVP 模拟开始发散，RMSE 在 t ≈ 6 时达到约 4% (Fig. 4c)。尽管存在这种发散，数字量子模拟结果在所有格点上的视觉连续性（Fig. 3a, 3e）表明，累积的退相干或门错误不太可能完全破坏数字量子模拟结果的潜在正确性。

2.4. 性能数据与经典对比

本研究还对量子模拟的计算性能进行了详细分析，并与经典 TDVP 进行了对比。

量子处理器运行时：对于 L=60，30 个 Trotter 步的模拟，总共 20,000 次测量，量子处理器（QPU）的实际挂钟执行时间约为 2 分 46 秒 (Table S1)。值得注意的是，QPU 的运行时间与系统尺寸 L 无关，仅线性依赖于模拟的 Trotter 步数。
TDVP 运行时：经典 TDVP 的运行时间随系统尺寸 L 和键维度 χ 的增加呈 O(Lχ³) 增长。对于 L=60，当 χ=4096 时，在 t=5.2 的演化时间下，TDVP 模拟的运行时间超过 100 小时。而当演化时间达到 t=6 时，运行时间更是超过了 160 小时 (Fig. 4d)。
性能提升：在量子/经典模拟结果开始发散（RMSE > 2%）的临界点（即 t ≈ 5.2 左右，TDVP 使用 χ=4096），数字量子处理器的挂钟运行时间比优化后的 TDVP 模拟快了高达 3000 倍。这表明在 NISQ 时代，量子处理器在处理特定复杂问题时已具备显著的性能优势。
TDVP 并行化效率：对 TDVP 的 CPU 并行化分析表明，在多核 CPU 上获得的加速效果有限 (Fig. S5, Table S2)。这主要是因为 TDVP 算法中的瓶颈（如奇异值分解 SVD 和张量收缩）的结构特点，以及 U(1)×U(1) 对称性导致的块稀疏张量结构，限制了大规模并行化带来的收益。

3. 代码实现细节，复现指南，所用的软件包及开源 Repo Link

本研究的成功得益于一套端到端的方法流程，涵盖了从费米子到量子比特的映射、Trotter ized 时间演化电路的构建，以及针对 IBM 重六边形设备进行优化的编译。

3.1. 编译与执行流程

费米子到量子比特映射 (Jordan-Wigner Transformation)：
- 采用对交错序 {c₀↓, c₀↑, c₁↑, c₁↓, ...} (Eq. S3) 进行 Jordan-Wigner 变换。这种排序方式被精心设计以最小化在 IBM Heron 等重六边形拓扑结构上的路由开销。
- 该映射将哈密顿量中的动能项 H_K 分裂为“短程跳跃” H_s (XX+YY 型) 和“长程跳跃” H_L (XZZX+YZZY 型) (Eq. S4a, S4b)。
Trotter 化电路构建：
- 采用标准 Trotter 化技术将时间演化算符 e^(-iHFHt) 离散为 n_step 个持续时间为 Δt 的 Trotter 步。每个 Trotter 步使用二阶 Trotter 分解，通过镜像 Trotter 分解 (mirrored Trotter decomposition) 实现了 O(Δt³) 的高阶精度 (Eq. S14, S16)。
- fSWAP 网络应用：这是电路深度优化的核心。长程跳跃项 H_L 无法直接高效地在硬件上实现。通过在每个 Trotter 步中插入一层费米子交换 (fSWAP) 门 F (Eq. S8, S9)，可以利用 F H_s F† = H_L (Eq. S10) 的性质，将长程跳跃转换为短程跳跃，从而显著减少电路深度。最终，一个 Trotter 步由 U_step = e^(-i H₁Q)e^(-iΔtHs) F e^(-iΔtHu,2Q)e^(-iΔtHs)e^(-i H₁Q) 组成 (Eq. S15, Fig. S1)。
- 总双量子比特电路深度 D₂Q = 5n_step + 2，总双量子比特门计数 N₂Q = (5L - 2)n_step + 2(L - 1) - 1 (Eq. S18, S19)。
应用感知编译与布局选择：
- 使用 Q-CTRL 的 Fire Opal 管道 [56-58] 进行电路转译和调度，适配 IBM Heron 设备的原生门集。原生门集包括分数 Rx(θ) 和 Rzz(θ) 门，以及固定角度的 X、√X 和 CZ 门。
- 布局选择：采用“蛇形路径”布局 (Fig. 1d, S2) 将费米子链嵌入到 IBM Heron 处理器的重六边形拓扑中。对于 L>30 的系统（如 62 和 120 量子比特实验），由于搜索空间复杂性增加，传统的 VF2++ 算法可能收敛到次优解。因此，我们采用了一种改进的 A-Motif 算法变体 [5]，通过穷举搜索和评分的方式，识别并选择高保真度的 1D 链布局，避免使用具有低门或读出保真度的量子比特 (Fig. S2)。
硬件平台与执行：
- 所有实验均在 IBM 的 ibm_boston 设备上执行，这是一个 156 量子比特的 IBM Heron 处理器。
- 每个电路执行 20,000 次 shots。

3.2. 误差抑制与后处理实现

运行时误差抑制：
- 动态解耦 (Dynamical Decoupling)：作为 Fire Opal 管道的内置功能，它在硬件层面优化门波形，抑制退相干。
- Pauli Twirling：在编译阶段集成。通过对 N_twirl = 10 个随机化的电路变体进行执行（每个变体 N_shot / N_twirl 次 shots），然后聚合结果，将相干误差转换为随机误差，有效抑制了误差累积，且无额外测量开销 (Fig. S3)。
后处理误差缓解：
- 读出误差缓解 (Readout Error Mitigation, REM)：执行独立的表征电路，测量每个量子比特的混淆矩阵 C_i (Eq. S29)。利用这些矩阵对原始测量分布进行校正。
- 衰减恢复 (Decay Recovery)：使用 n-th 回波电路 C_n = (U^n/2_step) (U^n/2_step)† S_init (Fig. S12) 测量经验性衰减率 d_n = (P)_echo,hw / (P)_echo,ideal (Eq. S31)。然后，将测量的期望值 (P)_hw 通过正则化重标定 (P)_mit = (P)_hw / (c d_n + (1-c)) 进行校正，其中信心参数 c=0.5 经过校准 (Fig. S13)。
- 对称性后选择 (Symmetry Post-selection)：根据粒子数守恒（[H, N_σ]=0）原则，识别并丢弃违反对称性的测量结果 (Fig. S14)。尽管发现该方法并未提升本研究结果的准确性，但它提供了一个间接诊断硬件噪声的指标 (Fig. S15)。

3.3. 经典基线实现

时间依赖变分原理 (TDVP)：
- 使用 ITensorMPS.jl [20, 25] Julia 实现，在 AWS c7i.8xlarge 实例（32vCPU，64GB RAM）上运行。
- 采用两格点 TDVP (two-site TDVP)，键维度 χ 适应性增长，最大值设为 4096。奇异值分解 (SVD) 截断容差设置为 ε = 10⁻⁸。
- TDVP 模拟的时间步长 Δt_TDVP 与量子 Trotter 步长 Δt_Trotter 保持一致，以实现逐点比较。
Pauli 路径传播 (PPP)：
- 使用 PauliPropagation.jl 库 (v0.4.1) [27] 进行实现。采用一阶 Trotter 化。
- 截断方案基于最大权重阈值 m_w 和系数阈值 d_min = 10⁻⁵。
- 对 XY 项进行不对称处理，以优化 Z-基测量。

3.4. 软件包与潜在开源链接

本研究依赖多个商业和开源软件库，这些库是实现量子模拟和经典基线计算的关键：

量子电路编译与执行：
- Q-CTRL Fire Opal：这是本研究中使用的核心编译管道 [58]。Fire Opal 是 Q-CTRL 开发的专有软件，用于执行应用感知编译、误差抑制和优化量子电路。该平台提供了针对特定硬件（如 IBM Heron）的深度优化功能。
- Qiskit：IBM 的开源量子计算 SDK [66]。虽然论文中没有明确说明 Qiskit 在编译流程中的直接角色，但它通常用于与 IBM 量子硬件进行交互、电路构建和结果检索。
经典基线模拟：
- ITensorMPS.jl：这是 Julia 语言编写的用于张量网络计算的开源库 [20, 25]。它是实现 TDVP 模拟的核心工具。其源代码通常可以在 GitHub 上找到，例如 ITensor 项目的官方仓库 https://itensor.github.io/ITensors.jl/。
- PauliPropagation.jl：这是用于 Pauli 路径传播的 Julia 库 [27]。其源代码也应在 GitHub 上提供。
- NVIDIA cuTensorNet：针对 GPU 加速的张量网络库 [22]。虽然论文指出其对本研究中使用的对称性 TDVP 模拟的加速效果有限，但它代表了 GPU 在张量计算领域的最新进展。

需要注意的是，论文中并未提供本研究特定实验代码的开源仓库链接，因此上述链接指向的是相关工具和库的官方项目页面或概括性描述。如果读者希望复现论文中的具体结果，可能需要自行实现论文中描述的编译和误差缓解策略，并结合这些现有的开源库。

4. 关键引用文献，以及你对这项工作局限性的评论

4.1. 关键引用文献

本研究建立在量子计算、凝聚态物理和计算方法的多个前沿领域之上，引用了大量关键文献。以下列举了一些对理解本文工作至关重要的文献类别及其代表性引用：

费米-哈伯德模型的物理重要性与挑战：
- [1] M. Imada et al., Rev. Mod. Phys. 70, 1039 (1998): 综述了强关联电子系统的莫特转变。
- [2] P. A. Lee et al., Rev. Mod. Phys. 78, 17 (2006): 综述了高温超导。
- [3] B. Keimer et al., Nature 518, 179 (2015): 描述了超导与莫特绝缘体之间的联系。
自旋-电荷分离理论：
- [6] E. H. Lieb and F. Y. Wu, Phys. Rev. Lett. 20, 1445 (1968): 提供了费米-哈伯德模型的一维精确解。
- [7] F. H. L. Essler et al., The One-Dimensional Hubbard Model (2005): 详细阐述了一维哈伯德模型。
- [8] F. D. M. Haldane, J. Phys. C 14, 2585 (1981): 引入了 Tomonaga-Luttinger 液体理论，解释了一维系统中的低能物理。
经典张量网络方法与 TDVP：
- [23] J. Haegeman et al., Phys. Rev. B 94, 165116 (2016): 描述了时间依赖变分原理 (TDVP)。
- [24] S. Paeckel et al., Ann. Phys. 411, 167998 (2019): 综述了张量网络方法。
- [25] M. Fishman et al., SciPost Phys. Codebases, 4 (2022): 介绍了 ITensorMPS.jl 库。
数字量子模拟的理论基础与早期实验：
- [35] S. Stanišić et al., Nat. Commun. 13, 5743 (2022): 讨论了 Trotter 化误差缩放。
- [42] C. Cade et al., Phys. Rev. B 102, 235122 (2020): 讨论了 Trotter 化的优化策略。
- [46-51] 近期的数字量子模拟实验，包括超导和囚禁离子平台上的费米-哈伯德模型模拟。
- [52] P. Jordan and E. Wigner, Z. Phys. 47, 631 (1928): 首次提出了 Jordan-Wigner 变换。
误差抑制与缓解技术：
- [56] P. S. Mundada et al., Phys. Rev. Appl. 20, 024034 (2023): Q-CTRL Fire Opal 管道的早期工作。
- [12] J. J. Wallman and J. Emerson, Phys. Rev. A 94, 052325 (2016): 讨论了 Pauli Twirling。
- [38] F. B. Maciejewski et al., Quantum 4, 257 (2020): 关于读出误差缓解的综述。
- [44] H. Liao et al., PRX Quantum 6, 020331 (2025): 对称性后选择作为误差检测的策略。
对比工作：
- [17] T. A. Chowdhury et al., Appl. Phys. Rev. 13, 011434 (2026): IBM Heron 设备上使用交错序的 1D 费米-哈伯德模拟。

4.2. 对这项工作局限性的评论

尽管本研究在数字量子模拟大规模费米-哈伯德模型方面取得了显著进展，但仍存在一些局限性，值得深入探讨和未来研究的关注：

误差源的复杂性与“正确性”的界限：论文指出，在最长演化时间下，数字量子模拟结果与经典 TDVP 模拟结果开始发散，均方根误差从约 1% 增加到 4% 左右。在这种情况下，无法确定哪种模拟方法最能准确反映真实系统动力学。这突显了在无容错量子计算时代，全面理解和控制所有误差源（包括 Trotter 误差、硬件噪声、采样误差等）的复杂性。虽然量子模拟结果在视觉上保持连续性，但仍不能完全排除未被检测到的误差积累。未来的工作需要开发更强大的验证和交叉验证方法，以在缺乏“黄金标准”的情况下评估 NISQ 设备的准确性。
可观测量类型和噪声敏感性：目前，研究主要集中于相对局域和简单的可观测量，如格点粒子占用数（Fock 态）。论文明确指出，测量更高阶的关联函数，例如单粒子谱函数 (single-particle spectral function) 和动力学结构因子 (dynamical structure factor)，需要更低的噪声水平。这些更复杂的关联函数对于深入理解强关联物理至关重要，但对当前硬件的噪声更敏感，仍是未来需要克服的挑战。
对称性后选择的有效性：论文中发现，尽管费米-哈伯德模型具有粒子数守恒的对称性，但通过对称性后选择（即丢弃违反对称性的测量结果）并不能改善结果，反而可能因为有效样本量的显著减少而降低准确性 (Fig. S15)。这表明，在 NISQ 设备上，简单地利用对称性进行错误检测和过滤，可能无法直接转化为性能提升，甚至可能适得其反，需要更精细的后选择或误差检测策略。
经典基线的局限性： TDVP 作为高精度经典基线，其计算成本随系统纠缠度（键维度 χ）的增加而呈指数级增长，最终会发散。Pauli 路径传播 (PPP) 方法也存在非受控的截断误差，且在计算成本和准确性方面竞争力不如 TDVP。这意味着在量子模拟结果开始发散的区域，经典基线本身也变得不可靠，使得评估量子模拟的“真实”性能变得更加困难。
硬件通用性与可迁移性：本研究的许多优化，如对交错序和蛇形路径布局，是针对 IBM Heron 的重六边形拓扑结构量身定制的。虽然这种特定于架构的优化带来了显著的性能提升，但将这些策略迁移到具有不同拓扑或原生门集的其他量子硬件上时，可能需要重新设计和优化。
未解决的二维问题：尽管一维模型的成功模拟令人鼓舞，但费米-哈伯德模型在二维中与高温超导等更复杂的物理现象紧密相关。将这些技术扩展到二维模型将面临更大的计算和硬件挑战，因为二维系统通常具有更高的纠缠度和更复杂的连接需求。目前的工作是迈向这一目标的重要一步，但二维模型的模拟仍需进一步探索。

5. 其他必要的补充

5.1. 创新点总结

本研究在数字量子模拟领域取得了一系列突破，其主要创新点和贡献可总结如下：

大规模、高分辨率模拟：首次在超导量子处理器上实现了对多达 120 个量子比特（对应 60 个格点）费米-哈伯德模型动力学的模拟，总演化时间达到 t=9（对应 90 个 Trotter 步），超越了现有经典精确模拟和大部分张量网络方法的极限，并达到了前所未有的分辨率。
高效的费米子-量子比特映射与电路编译：
- 对交错序 (Pair-interleaved Ordering)：引入了一种新颖的费米子到量子比特映射方式，与 Jordan-Wigner 变换结合，显著降低了在 IBM Heron 重六边形拓扑上的量子比特路由开销和电路复杂性。
- fSWAP 网络与二阶 Trotter 分解：策略性地将 fSWAP 门集成到二阶 Trotter 分解中，将难以实现的“长程跳跃”项转化为易于实现的“短程跳跃”项，从而大幅减少了电路深度，实现了 D₂Q = 5n_step + 2 的与系统尺寸无关的深度扩展。
- 应用感知编译与 A-Motif 布局选择：利用 Q-CTRL Fire Opal 管道，针对 IBM Heron 原生门集进行深度优化编译，并为大规模系统（>60 量子比特）开发了改进的 A-Motif 算法变体，以穷举搜索并选择高保真度的物理量子比特布局，有效避免了高噪声量子比特。
全面的误差抑制与缓解：
- 运行时误差抑制：集成了硬件优化的动态解耦和 Pauli Twirling（随机化编译），后者将相干误差转化为随机误差，显著提升了结果的保真度，且无额外计算开销。实验表明，Pauli Twirling 将总 RMSE 降低了 21.7%。
- 后处理误差缓解：结合了读出误差缓解和基于回波电路的衰减恢复方法，进一步校正了测量结果。
核心物理现象的量化验证：在 L=31 链上，直接观测并量化验证了自旋-电荷分离现象，提取的电荷/自旋速度比率与经典 TDVP 模拟结果高度吻合，证明了量子模拟在研究基本凝聚态物理现象上的能力。
超越经典方法的性能优势：在量子模拟结果与经典 TDVP 模拟结果开始发散的临界点（即经典方法已接近极限），量子处理器的挂钟运行时间比优化后的经典 TDVP 模拟快了高达 3000 倍，展示了数字量子处理器在解决特定计算密集型物理问题上的卓越潜力。

5.2. 对未来研究方向的展望

本研究的成功为利用数字量子处理器探索强关联物理开辟了广阔前景，以下是一些值得关注的未来研究方向：

探索更复杂的物理可观测量：当前工作主要集中于局域的占用数。未来应致力于在当前硬件噪声水平下，精确测量如单粒子谱函数和动力学结构因子等非局域、高阶关联函数。这将需要更强大的误差抑制和缓解技术，以及可能对硬件进行专门优化。
扩展到二维费米-哈伯德模型：二维费米-哈伯德模型与高温超导等核心凝聚态物理难题紧密相关。将本研究的方法和技术扩展到二维系统将是下一个重大里程碑。这需要解决二维拓扑下的量子比特映射、更高纠缠度的处理以及更复杂的电路编译和误差控制问题。
发展更先进的误差缓解与校正技术：虽然本文采用了全面的误差抑制和缓解策略，但在更长时间和更深电路下，误差仍是挑战。未来的研究应探索新的误差缓解范式，特别是针对非局域误差、系统误差以及如何更有效地利用物理对称性进行误差检测和校正。
算法与硬件的协同优化：本研究证明了应用感知编译的巨大优势。未来应进一步深化算法与硬件之间的协同设计和优化，例如探索特定哈密顿量演化的硬件原生门集，或开发能动态适应硬件性能波动的编译策略。
异构计算的融合：在 NISQ 时代，量子处理器和经典高性能计算的异构融合将是常态。如何高效地将量子模拟任务的计算瓶颈部分分配给量子硬件，而将其他部分留给经典计算，是未来提升整体性能和解决更大规模问题的关键。
探索非平衡态物理 beyond Hubbard：除了费米-哈伯德模型，还可以将这些方法应用于其他重要的强关联模型，如海森堡模型、自旋液体或非阿贝尔规范理论，以揭示更广泛的非平衡态物理现象。

5.3. 实验硬件细节

本研究的所有实验均在 IBM 的 ibm_boston 量子处理器上进行。以下是关于该硬件的一些关键细节：

处理器类型：ibm_boston 是一款基于超导量子比特的 IBM Heron 系列处理器。Heron 架构旨在支持大规模的量子计算实验，拥有高连接度和相对较低的交叉谈话。
量子比特数量：ibm_boston 总共有 156 个量子比特。本研究利用了其中多达 120 个量子比特来模拟 L=60 的费米-哈伯德链。
拓扑结构：Heron 处理器采用重六边形 (heavy-hex) 拓扑。这种拓扑结构意味着每个量子比特通常与三到四个其他量子比特连接，形成一个网格状结构。对于一维链的模拟，需要在这种拓扑上嵌入线性连接，本研究通过“蛇形路径”布局实现了这一点 (Fig. 1d, S2)。
量子比特选择：为了优化模拟性能，我们利用 Q-CTRL Fire Opal 管道的布局选择功能，根据设备最新的校准数据（包括门误差率、相干时间 T1/T2 和读出保真度）避免使用性能较差的量子比特。对于大规模模拟，我们使用改进的 A-Motif 算法变体来穷举搜索高保真度的量子比特子集 (Fig. S2)。
shots 数量：每个量子电路执行 20,000 次 shots。这对于统计采样和获得足够准确的期望值是必要的。

5.4. 误差分析与硬件稳定性

本研究对数字量子模拟中的主要误差源进行了详细分析，并评估了硬件的稳定性。

Trotter 误差：
- 我们使用的二阶 Trotter 化方案，对于偶数 Trotter 步，误差缩放为 O(Δt³)；对于奇数步，误差缩放为 O(Δt²)。Trotter 步长 Δt 的选择是一个关键的权衡：较大的 Δt 可以模拟更长的总演化时间 T = n_step Δt，但会增加 Trotter 误差。
- 通过在小型系统上与精确对角化对比，我们发现选定的 Δt 值在保证足够长的演化时间的同时，使 Trotter 误差保持在合理范围内 (Fig. S8)。
- 在小型系统（L=10）中，Trotter 误差可以占到总硬件误差的高达约 60% (Fig. S9)。然而，对于更大的系统，硬件噪声预计将成为主导误差源。
硬件稳定性与时间漂移：
- 为了量化硬件性能的时间变异性，我们在数周内收集了多个数据集，这些数据点独立于硬件的校准计划。
- 结果显示，在不同时间点收集的数据集之间，均方根误差 (RMSE) 的波动非常小，L=30 的波动约为 2.7%，L=60 的波动约为 0.8% (Fig. S10)。这表明 IBM ibm_boston 硬件在实验期间表现出良好的稳定性，本研究的结果对硬件的时间漂移具有鲁棒性。
Pauli Twirling 的效果：
- Pauli Twirling 持续有效地抑制了整个时间域内的 RMSE，平均降低了约 1%。在模拟结果最可靠的区域（即 t ∈ [0, 5.2] ），RMSE 降低了 34.5% (Fig. S3)。这证实了 Pauli Twirling 在抑制相干误差积累方面的有效性。
对称性后选择的影响：
- 尽管费米-哈伯德模型具有粒子数守恒的对称性，但我们的实验发现，对称性后选择并不能改善结果。事实上，在中间演化时间，它显著恶化了与 TDVP 的一致性，将 RMSE 增加了两到三倍 (Fig. S15c)。这主要是因为后选择会大幅减少有效样本量，从而增加统计不确定性，抵消了潜在的误差缓解收益。

5.5. 总结

本研究通过一系列创新的方法和严格的实验验证，在数字量子处理器上实现了对大规模费米-哈伯德模型动力学的快速、准确和高分辨率模拟。我们不仅成功地在多达 120 个量子比特的系统上观测到自旋-电荷分离等核心物理现象，并与经典理论结果进行了量化对比，还在特定场景下展示了量子计算相对于经典方法的显著性能优势。

这项工作标志着数字量子处理器在解决复杂凝聚态物理问题方面迈出了关键一步，证明了 NISQ 设备在无容错时代下具备“有用”的模拟能力。未来，随着量子硬件技术的不断进步和软件编译优化策略的进一步完善，我们有望利用量子计算更深入地探索强关联电子系统的奥秘，揭示新的物理规律，最终推动材料科学和量子技术的发展。