来源论文: https://arxiv.org/abs/2603.13060v1 生成时间: Mar 16, 2026 10:00

量子可观测量噪声缓解新范式：基于哈密顿对称性衰变的GUESS方法深度解析

0. 执行摘要

在量子计算蓬勃发展的今天，噪声已成为制约其从理论走向实际应用的核心障碍。量子处理器在执行复杂算法时，不可避免地受到量子比特与环境耦合、门操作不精确以及测量误差等因素的影响，导致计算结果偏离理想值。尽管容错量子计算（Fault-Tolerant Quantum Computing, FTQC）被视为终极解决方案，其对硬件资源和错误率的严苛要求使得在短期内实现大规模应用仍面临巨大挑战。因此，量子误差缓解（Quantum Error Mitigation, QEM）技术应运而生，旨在利用近期含噪声量子（Noisy Intermediate-Scale Quantum, NISQ）设备，通过巧妙的算法设计和数据后处理，减少噪声对计算结果的负面影响，从而在有限噪声条件下提升计算的可用性。

本研究介绍了一种名为GUESS（GUiding Extrapolations from Symmetry decayS）的创新性QEM技术。GUESS的核心理念在于利用哈密顿量（Hamiltonian）的内在对称性。在理想的量子演化中，与哈密顿量对易的对称可观测量应保持其预期值不变。然而，在存在噪声的情况下，这些对称可观测量的预期值会随时间或噪声水平而衰减。GUESS通过测量这些对称可观测量的衰减模式，学习系统特有的噪声剖面，进而利用这些噪声参数来精确外推并校正目标可观测量的预期值，使其逼近无噪声的理想状态。为克服真实系统缺乏理想局部对称性以及量子硬件噪声非均匀性等实际挑战，GUESS引入了“哈密顿量杂质”技术。该技术通过向原始哈密顿量添加局部扰动项，人工强制产生一个与目标可观测物具有相同权重和空间范围的对称性，同时精心设计以最小化对电路固有噪声传播特性的干扰，从而确保学习到的噪声模型具有普适性。

为全面验证GUESS方法的有效性，研究团队在IBM Heron r2量子处理器“ibm_basquecountry”上进行了大规模的基准测试。实验模拟了1D横向场伊辛模型和XZ海森堡模型的量子动力学，涵盖了100个量子比特的系统，最高电路深度达192，包含多达8000个两比特CZ门。通过将GUESS的性能与传统的零噪声外推（Zero Noise Extrapolation, ZNE）方法以及精确的张量网络经典模拟结果进行对比，GUESS展现出卓越的性能。具体而言，对于包含高达8000个CZ门的复杂电路，GUESS能将目标可观测量的相对误差稳定控制在10%左右，远优于ZNE和原始嘈杂测量结果。此外，GUESS在平均20个可观测物上的计算结果展现出比ZNE显著更低的方差，表明其估计更为稳定和可靠。值得一提的是，GUESS还提供了一种基于对称可观测量结果的统计后选择机制，能够根据量子比特的噪声特性和测量结果的质量进行智能筛选，从而进一步提升了最终结果的准确性和物理合理性，并能为量子硬件的实时性能评估提供关键洞察。

综上所述，GUESS方法不仅为嘈杂量子计算机上的预期值估计提供了一种高精度、低方差的误差缓解新范式，其创新的哈密顿量杂质概念和内置的后选择能力也为未来量子硬件的实时诊断与优化铺平了道路。GUESS的成功验证，标志着量子计算领域在克服噪声挑战、迈向实用化和容错计算的道路上取得了重要进展，为NISQ设备的潜力挖掘和未来量子生态系统的构建注入了新的活力。

1. 核心科学问题，理论基础，技术难点，方法细节

量子计算领域正经历着前所未有的发展，其超凡的计算能力有望在诸多传统方法束手无策的问题上带来革命性的突破，例如复杂的量子力学系统模拟以及诸如整数分解等代数难题。然而，这一前景广阔的技术正受到一个根本性问题的严重制约：量子噪声。在当前的量子硬件上，量子比特并非完全隔离的理想实体，它们与环境的无意耦合、门操作实现的不完美性以及测量过程中的误差，都不可避免地引入计算错误，从而导致结果与预期严重偏离。这种噪声的普遍存在对量子算法的有效运行施加了严格的限制，体现在可实现的电路深度和可处理的量子比特数量上。

核心科学问题：如何在近期含噪声量子（NISQ）设备上，以尽可能低的额外开销，准确、可靠地估计关键可观测量的期望值，并有效减轻硬件噪声导致的偏差？

实现容错量子计算（Fault-Tolerant Quantum Computing, FTQC）被广泛认为是克服量子噪声的终极策略。依照著名的阈值定理，只要单个量子门操作的错误率低于某个临界值，就可以通过冗余编码和错误校正码来构建任意规模的可靠量子计算。然而，通往FTQC的道路充满挑战。构建具有亚阈值错误率的硬件、实现实时错误解码、进行魔术态蒸馏以及管理大规模量子比特开销，这些都构成了巨大的技术难题。例如，最近的优化方法表明，即使是对于一些经典上难以处理的科学应用，也可能需要数十万个量子比特，而工业应用则可能需要数百万个量子比特。尽管科研人员正在积极探索更高效的编码方案，并在小型误差校正设备方面取得进展，但大规模、通用容错量子计算机的实现仍是一个长期的目标。

在此背景下，量子误差缓解（Quantum Error Mitigation, QEM）技术应运而生，成为在NISQ设备上挖掘量子计算潜力的可行策略。QEM的核心思想是通过一系列算法技术和数据后处理方法，系统性地减少噪声对可观测量期望值评估的偏差。这些可观测量可以是分子体系的能量、材料的磁化强度等物理量。QEM方法通过分析一组在不同噪声条件下运行的量子电路输出，或采用精巧的后选择机制来过滤结果，从而推断出无噪声的理想值。虽然QEM最初是为短期内可用的硬件设计，但它也被视为与未来的FTQC技术共存的关键部分，尤其是在早期容错阶段，QEM可以对逻辑量子比特上的残余噪声进行进一步缓解。

理论基础：量子开放系统动力学与哈密顿量对称性

QEM的核心任务是精确估计一个赫米特可观测物$O$在量子态$ ho$上的期望值$\langle O angle = \text{Tr}(O\rho)$。在理想的无噪声世界中，封闭量子系统的演化遵循冯·诺依曼方程：

$$\frac{\partial}{\partial t}\rho(t) = -\frac{i}{\hbar}[H,\rho(t)]$$

其中$\rho(t)$是时间$t$时的密度矩阵，$H$是系统哈密顿量。然而，当系统与环境耦合并受到马尔可夫噪声影响时，其动力学将由更普适的Gorini-Kossakowski-Sudarshan-Lindblad (GKSL) 主方程描述：

$$\frac{\partial}{\partial t}\rho_\lambda(t) = -\frac{i}{\hbar}[H,\rho_\lambda(t)] + \lambda\mathcal{L}(\rho_\lambda(t))$$

这里的$\mathcal{L}(\cdot)$是一个耗散超算符（Lindbladian），它包含了描述量子系统与环境相互作用的跳跃算符$L_w$。$\lambda \ge 0$是一个耦合常数，用于表征噪声的强度或错误率。在此开放系统框架下，可观测物$O$的期望值$\text{Tr}(O\rho_\lambda(t))$将不再是理想的$\text{Tr}(O\rho_0(t))$，而是受到噪声污染而产生偏差。

QEM的目的是通过对嘈杂QPU（Quantum Processing Unit）运行结果进行后处理，消除这种噪声导致的偏差。许多QEM技术依赖于“噪声放大”的概念：虽然无法直接降低硬件的固有噪声，但可以人为地放大它。硬件的噪声水平通常通过增益因子$G_k$来量化，其中$G_1=1$代表基线噪声水平。通过在不同$G_k$下运行电路，可以获得一系列嘈杂的期望值$\{\text{Tr}(O\rho_{G_k\lambda})\}$。QEM的终极目标是利用这些数据，外推到零噪声极限$\text{Tr}(O\rho_0)$。

将外推过程数学化，我们可以将其视为一个投影问题。假设我们关注$N$个可观测物$\{O_1, \dots, O_N\}$在某个固定时间点的期望值。通过在$m$个不同噪声增益$\{G_j\}_{j=1}^m$下进行测量，我们可以构造一个测量矩阵$M \in \mathbb{R}^{N \times m}$，其元素为$M_{i,j} := \text{Tr}(O_i\rho_{G_j})$。我们的任务是找到一组最优的系数向量$x=[x_1, \dots, x_m]$，使得这些系数与嘈杂期望值的线性组合能够逼近理想的无噪声值$b_i = \text{Tr}(O_i\rho_0)$。这可以表示为最小二乘问题：

$$\min_{x \in \mathbb{R}^m} ||Mx - b||_2$$

然而，这个方程是病态的，因为目标向量$b$（理想无噪声值）和系数向量$x$都是未知的。

技术难点：现有QEM方法的局限性

零噪声外推（ZNE）是目前最受关注和广泛使用的QEM技术之一，但在实际应用中仍面临诸多挑战：

复杂噪声动力学：非Clifford电路中，噪声传播通常不是简单的指数衰减，而是呈现出多指数衰减的复杂模式。这种复杂性使得选择一个准确的外推模型（如线性或指数）变得困难，常常导致有偏估计或外推结果的不稳定性。
模型选择的困境：尽管Richardson外推理论上可以避免预设衰减函数，但在实际操作中，由于数据噪声和数值不稳定性，其结果往往不够鲁棒，因此研究者常倾向于使用更简单的线性或指数模型，但这又引入了模型假设带来的偏差。
噪声放大技术的不准确性：ZNE依赖于噪声放大，而常用的门折叠（gate folding）方法虽然操作简便，但其放大机制是启发式的，并非总是精确地反映噪声的真实放大效应。这可能导致外推到零噪声点时出现偏差，甚至使外推结果发散。更精确的概率误差消除（PEC）方法虽然能提供更准确的噪声模型，但其高昂的噪声学习成本和对实时噪声漂移的敏感性使其在实践中难以大规模应用。
硬件噪声的异构性：真实量子硬件上的噪声往往高度不均匀且随时间漂移。这意味着在设备的不同部分或不同时间段，噪声特性可能发生显著变化，使得通过特定电路学习到的噪声模型不具有普适性。

方法细节：GUESS（GUiding Extrapolations from Symmetry decayS）

GUESS方法旨在解决ZNE等现有QEM技术的这些核心挑战。其创新性在于利用量子系统哈密顿量的内在对称性来学习噪声剖面，并以此指导目标可观测量的误差缓解。

对称性衰减作为噪声探针

GUESS的核心思想源于对可观测物$O$在噪声作用下期望值动力学的深入分析。将GKSL主方程投影到Pauli基上并利用迹的循环性，我们可以得到：

$$\frac{\partial\langle O \rangle}{\partial t} = -\frac{i}{\hbar}\text{Tr}([H,O]\rho_\lambda(t)) + \text{Tr}(\mathcal{L}^\dagger(O)\rho_\lambda(t))$$

其中$\mathcal{L}^\dagger$是作用于可观测物的伴随Lindbladian。关键在于，如果一个可观测物$S$是哈密顿量$H$的对称性，即$[H, S] = 0$，那么在纯粹的幺正演化下，其期望值$\langle S \rangle$是守恒的。这意味着上述方程中的幺正演化项将消失，其动力学完全由耗散项支配：

$$\frac{\partial\langle S \rangle}{\partial t} = \text{Tr}(\mathcal{L}^\dagger(S)\rho_\lambda(t))$$

因此，对称可观测物$S$的期望值$\langle S \rangle$在实验中观察到的任何衰减都直接且唯一地反映了耗散过程（即噪声）的作用。通过这种方式，GUESS能够有效地将噪声引起的动力学从幺正演化中分离出来，从而直接提取表征QPU噪声的有效衰减规律。

可观测物权重与噪声衰减

论文进一步指出，可观测物的衰减行为强烈依赖于其“权重”（weight），即组成该可观测物的非平凡Pauli算符的数量。例如，单量子比特Pauli算符（如$Z_i$）的权重为1，而双量子比特关联器（如$Z_i Z_{i+1}$）的权重为2。权重较高的可观测物通常衰减更快。因此，在学习噪声剖面时，必须确保学习对称性的权重与目标可观测物的权重保持一致。然而，量子多体哈密顿量通常只有少数全局对称性，且这些对称性往往具有很高的权重，这使得它们在嘈杂环境中衰减过快，不适合作为精细噪声剖面的探针。

哈密顿量杂质技术

为了克服缺乏合适局部对称性的限制，GUESS引入了创新的“哈密顿量杂质”（Hamiltonian Impurity）技术。一个杂质$I_{\vec{q}}$被定义为对目标哈密顿量$H_0$的局部扰动，它被设计成在感兴趣的量子比特子集$\vec{q}$上强制产生一个对称性。具体而言，为了缓解具有任意Pauli权重$w$并在$\vec{q}$上测量的目标可观测物$O_w$，我们构造一个扰动哈密顿量$H_I = H_0 + I_{\vec{q}}$，并关键地使其满足条件$[H_I, O_w] = 0$。这意味着在扰动后的系统$H_I$下，$O_w$成为了一个对称性。

在实践中，杂质的设计需要满足以下关键要求：

保持权重一致性：强制产生的对称性$O_w$必须与目标可观测物具有相同的权重。
最小化电路扰动：引入杂质时，必须尽量减少对原始目标Trotter化电路结构（特别是两比特门数量和深度）的改变。这是因为两比特门是当前超导量子比特硬件中主要的噪声来源，且电路结构对误差传播方式至关重要。通过保持电路结构的相似性，GUESS确保学习到的噪声剖面与目标电路的实际噪声行为高度相关。论文通过钻石范数距离分析证明了这种扰动对噪声信道传播的影响很小。

GUESS协议的两步走

GUESS方法被设计为一个两阶段协议：

学习阶段（STEP 1）：
- 首先，使用引入杂质$I_{\vec{q}}$后的扰动哈密顿量$H_I$来构建量子电路。运行这些电路，并在多个噪声放大因子$G_k$下测量对称可观测物$O_w$的期望值$\{\text{Tr}(O_w \rho_{G_k\lambda})\}$.
- 由于$O_w$是$H_I$的对称性，其理想无噪声期望值是已知且守恒的（例如，对于Pauli算符，其理想值为$\pm 1$）。
- 利用这些已知的理想值和测量得到的嘈杂期望值，通过解决一个带1-范数约束的最小二乘问题$x = \arg\min_{x \in \mathbb{R}^m} ||M_S x - b_S||_2$，其中$||x||_1=1$（类似于Richardson外推），来学习GUESS的外推系数$\hat{x}_{GUESS}$。$M_S$是由对称性测量的期望值构成的矩阵，$b_S$是已知的理想对称性值向量。
缓解阶段（STEP 2）：
- 接下来，使用原始目标哈密顿量$H_0$构建量子电路，并在相同的噪声放大因子$G_k$下测量目标可观测物$O_w$的嘈杂期望值$\{\text{Tr}(O_w \rho_{G_k\lambda})\}$.
- 将从学习阶段得到的系数$\hat{x}_{GUESS}$应用于这些嘈杂测量值，通过线性组合$\hat{b} = M_O \hat{x}_{GUESS}$来外推得到目标可观测物$O_w$的无噪声期望值。这里，$M_O$是由目标可观测物测量值构成的矩阵。
- 该过程假设噪声对具有相同权重和作用区域的对称性$O_w$（在扰动哈密顿量下）和目标可观测物$O_w$（在原始哈密顿量下）的影响是相似的。

GUESS的变体与方差分析

GUESS提供了两种主要变体：

线性GUESS：直接通过上述最小二乘问题求解。
指数GUESS：在对数域中对期望值进行转换，然后求解线性问题，再将结果指数化，以更好地适应指数衰减的噪声模式。

QEM方法的一个重要考虑因素是结果的方差，因为它直接关系到采样开销。GUESS的方差来源于学习系数$\hat{x}_{GUESS}$的不确定性（源于对称性测量的噪声）和目标可观测物测量本身的不确定性。论文详细推导了GUESS结果的方差表达式，通过误差传播理论，量化了这些不确定性如何影响最终的缓解结果。

$$\text{Var}(b_i) = \sum_j M_{i,j}^2 \sigma_{x_j}^2 + \sum_j x_j^2 \sigma_{M;i,j}^2 + \sum_j \sigma_{x_j}^2 \sigma_{M;i,j}^2$$

这个表达式说明，GUESS的方差受系数方差、测量方差以及两者之间交叉项的影响。

总结来说，GUESS通过结合哈密顿量对称性的物理洞察、创新的杂质技术以及稳健的最小二乘学习框架，提供了一种在嘈杂NISQ硬件上实现高精度、低方差预期值估计的新方法。其设计旨在直接解决现有ZNE方法在模型不确定性、噪声放大精度和结果稳定性方面的挑战。

2. 关键 benchmark 体系，计算所得数据，性能数据

为全面评估GUESS方法的实际效能和优势，研究团队设计了一系列严谨的基准测试，并在真实的IBM Heron r2量子处理器上进行实验。这些测试不仅覆盖了两种重要的量子多体模型，还考虑了不同的可观测物类型、电路深度和噪声条件，并与经典精确模拟以及其他QEM技术进行了对比。

关键 benchmark 体系

研究选用了两种典型的、具有代表性的量子多体哈密顿量模型：

一维横向场伊辛模型（Transverse Field Ising Model, TFIM）：这是一个在量子多体物理中被广泛研究的模型，用于理解相变和量子动力学。该模型具有100个量子比特（自旋）的链状结构，采用开放边界条件。其哈密顿量形式为$H_{\text{Ising}} = J \sum_{\langle i,j \rangle} Z_i Z_j + h_x \sum_{i=1}^n X_i$，其中$Z_i Z_j$项描述了最近邻自旋间的相互作用，而$X_i$项则表示施加在每个自旋上的横向磁场。实验中，参数设置为$J=1$（相互作用强度）和$h_x=0.75$（横向场强度）。
一维XZ海森堡模型（XZ Heisenberg Model）：这也是一个重要的自旋链模型，常用于研究量子磁性。它同样是一个100个量子比特的链状结构，具有开放边界条件。其哈密顿量形式为$H_{\text{Heis}} = \sum_{\langle i,j \rangle} (J_x X_i X_j + J_z Z_i Z_j) + h_x \sum_{i=1}^n X_i$，其中$J_x$和$J_z$分别代表X和Z方向上的自旋相互作用。实验参数设置为$h_x=0.5, J_x=0.5, J_z=2$。两种模型的初始状态均设置为所有量子比特处于$|0\rangle$态（即$\rho(0) = |0\rangle^{\otimes n}$），这是一个常见的初始条件，便于追踪系统的演化。

模拟细节与平台

时间演化与Trotter化：为了模拟量子动力学，采用了一阶Suzuki-Trotter公式。对于伊辛模型，总演化时间$t=5$被划分为44个Trotter步；对于XZ海森堡模型，总演化时间$t=3.75$被划分为24个Trotter步。这种离散化方案是量子模拟中常用的方法。论文明确指出，使用一阶Trotter公式是为了隔离算法和硬件效应，确保Trotter误差本身不影响硬件与经典模拟结果的比较，从而更纯粹地评估噪声缓解的效果。
理想值基准（MPS）：为了提供无噪声的“黄金标准”，研究团队使用了经典**矩阵乘积态（Matrix Product State, MPS）张量网络技术，特别是时间演化块分解（Time-Evolving Block Decimation, TEBD）**算法进行模拟。MPS模拟在1D系统上具有高效率和高精度。为确保MPS结果的收敛性，键维（bond dimension）最高达到了150。
量子硬件平台：所有量子硬件实验均在IBM Quantum的**Heron r2量子处理器“ibm_basquecountry”**上进行。该处理器拥有156个超导跨蒙（transmon）量子比特，采用“HeavyHex”布局，理论上支持每秒250k个电路层操作。在实验运行时，该QPU的平均两比特CZ门错误率（这是主要的噪声来源）在0.179%到0.191%之间。通过Qiskit的转译器，将逻辑电路映射到所选的物理量子比特上，并优化电路以减少门数量和深度。
电路规模：这些100量子比特的模拟产生了相当深度的电路。对于伊辛模型，基线电路（无噪声放大G=1）的最大两比特深度为176，CZ门总数达8712个。对于XZ海森堡模型，最大两比特深度为192，CZ门总数达9504个。这种规模的电路已进入“实用规模”（utility-scale）的范畴，对当前NISQ设备是严峻的考验。

可观测物与哈密顿量杂质

实验中关注了两类重要的局部可观测物：

平均磁化强度（Weight-1 Observables）：$\frac{1}{n}\sum_i Z_i$，表示系统总磁化强度的平均值，每个$Z_i$算符的权重为1。
最近邻关联器（Weight-2 Observables）：$\frac{1}{n-1}\sum_i Z_i Z_{i+1}$，表示相邻量子比特之间自旋关联的平均值，每个$Z_i Z_{i+1}$算符的权重为2。针对每种模型和可观测物类型，研究团队都测量了40个不同的局部可观测物，并通过GUESS的统计后处理方法，最终报告了其中20个表现最佳的结果。

哈密顿量杂质的注入：为了实现GUESS，针对不同权重和模型，引入了精心设计的局部哈密顿量杂质$I_{\vec{q}}$：

伊辛模型：对于权重1可观测物（如$Z_i$），杂质是$I_i = -h_1 X_i$；对于权重2可观测物（如$Z_i Z_{i+1}$），杂质是$I_{i,i+1} = -h_1 (X_i + X_{i+1})$。这些杂质确保了$Z_i$和$Z_i Z_{i+1}$分别成为扰动哈密顿量下的对称性。
XZ海森堡模型：对于权重1可观测物（如$Z_i$），杂质设计更为复杂，为$I_i = -h_x X_i - J_x X_{i-1} X_i - J_x X_i X_{i+1} + J_z Z_{i-1} Z_i + J_z Z_i Z_{i+1}$。这种复杂性旨在在强制对称性的同时，保持电路中两比特门的数量和结构不变，从而尽量不改变原始电路的噪声传播特性。

噪声放大与辅助缓解技术

噪声放大：采用**分数门折叠（fractional gate folding）**策略进行噪声放大，使用了噪声因子1（基线）、1.2和1.5。这种启发式方法虽然不完美，但为GUESS提供了一个具有挑战性的测试环境。
其他噪声降低技术：为了提升基线电路性能，还集成了多种辅助技术：
- 动态解耦（Dynamical Decoupling, DD）：用于减少串扰误差。
- Pauli旋绕（Pauli Twirling）：用于将一般的非Pauli噪声信道转换为更易于分析的Pauli噪声信道，每次电路运行使用32种不同的随机化，每种随机化执行3125次射击。
- 读出误差消除（Twirled Readout Error eXtinction, TREX）：用于减少测量读出误差。
测量射击次数：所有量子电路运行均使用100,000次测量射击（shots）来获得期望值。

计算所得数据与性能数据

核心结果展示在图2（伊辛模型）和图3（XZ海森堡模型）中，通过绘制可观测物期望值随Trotter步数的变化曲线进行对比。蓝色叉号代表MPS经典模拟的理想值，红色方块代表GUESS的缓解结果，深色三角形和浅色圆形分别代表ZNE和原始嘈杂测量结果。

准确性（Relative Error）：
- GUESS的卓越表现：无论是伊辛模型（高达40个Trotter步）还是XZ海森堡模型（高达20个Trotter步），GUESS（包括线性GUESS和指数GUESS）都展现出显著的准确性，相对误差通常稳定在10%左右（详见附录D2中图5的量化数据）。这一精度水平与当前最先进的QEM技术在量子硬件上实现的最佳结果（通常在10%-20%范围内）一致。值得注意的是，GUESS的性能在更深远的Trotter步数下仍能保持较高精度，这对于模拟长时间演化至关重要。
- ZNE与原始信号的局限性：相比之下，ZNE和原始嘈杂信号（即未进行任何缓解的直接测量）在早期时间动力学中就表现出较大的偏差，相对误差往往超过20%。ZNE在某些点的低误差有时是偶然现象，是由于嘈杂信号恰好穿过真实值，而非真正有效的缓解。
- 非物理结果的显著减少：表I量化了不同QEM方法产生非物理结果（即期望值超出物理范围$[-1, 1]$）的百分比。

%	ZNE Lin	ZNE exp	GUESS Lin	GUESS exp
Ising wt(1)	11.59	81.14	0.07	2.05
Ising wt(2)	9.77	89.54	7.5	6.36
Heisenberg	24.17	96.67	2.92	6.67

    GUESS在所有情况下都大幅降低了非物理结果的出现率。例如，对于伊辛模型权重1可观测物，线性GUESS仅有0.07%的非物理结果，而ZNE线性外推高达11.59%，ZNE指数外推更是惊人的81.14%。这表明GUESS不仅提高了精度，还增强了结果的物理合理性和可靠性。当发生过冲时，GUESS会根据内部逻辑在指数和线性模型之间切换，以避免非物理结果，若两者均非物理，则退回原始测量。

方差与稳定性：
- 更低的方差：GUESS方法在所有实验中均展现出比ZNE更低的方差（通过图中的阴影区域宽度体现）。方差的降低意味着GUESS的估计结果更为稳定，波动性更小，从而在相同的精度要求下，可以减少所需的采样开销。
- 采样效率：论文指出，GUESS平均每个可观测物仅需要两倍于基线ZNE的测量次数，这相比于其带来的精度和稳定性提升，是一个可以接受的开销。ZNE由于对噪声放大因子不确定性的敏感，通常需要更多的采样或更复杂的技术来降低方差。
统计后选择的价值：
- 量子比特质量评估：GUESS独特的统计后选择机制（Algorithm 2，详见附录G）利用对称可观测物已知理想值的特性，对测量结果进行质量评估。如图6所示，通过比较不同量子比特的对称性衰减曲线（如Qubit 51和Qubit 70），可以实时洞察哪些量子比特在某个Trotter步或整体表现中噪声更低、退相干更弱。这种能力对于识别并排除“坏”量子比特的数据，或者在硬件具有高度异构噪声时进行智能资源分配至关重要。
- 提高报告结果的可靠性：实验中，通过对40个可观测物进行测量并筛选出20个最可靠的结果进行报告，确保了最终展现的是经过优化和验证的高质量数据。这反映了GUESS不仅缓解噪声，还能辅助诊断和优化实验流程。

综上，GUESS通过在utility-scale电路上的广泛基准测试，有力证明了其在IBM Heron r2量子处理器上的卓越性能。其在精度、方差和结果物理合理性方面的改进，使其成为NISQ时代量子模拟和量子算法开发中一个强大且实用的误差缓解工具。

3. 代码实现细节，复现指南，所用的软件包及开源 repo link

GUESS方法作为一种新颖的量子误差缓解技术，其在IBM Heron r2量子处理器上的成功验证，依赖于精心的算法设计、量子电路的精确构建、在真实硬件上的执行以及复杂的数据处理和优化。尽管论文中并未直接提供公共的代码仓库链接，但通过对论文描述的解析，我们可以构建一个清晰的实现框架和复现路线图。

核心算法实现细节：GUESS的两阶段协议

GUESS方法的核心逻辑可以分为两个主要阶段，这在论文的算法1：基于对称性衰减的GUESS QEM算法中得到了详尽的描述。

步骤1：从对称性中学习参数 (SOLVECONSTRAINTS)
- 输入：一系列在不同噪声因子$G_j$下测量得到的对称可观测物$S_e$的期望值$\{\text{Tr}(S_e \rho_{G_j})\}$.
- 矩阵构建：首先，根据这些测量值构建一个测量（或设计）矩阵$M_S$。这个矩阵的每一行对应一个对称可观测物，每一列对应一个噪声因子下的测量结果。例如，$M_{S; e,j} = \text{Tr}(S_e \rho_{G_j})$。
- 理想值向量：同时，构建一个目标向量$b_S$，其中包含所有对称可观测物$S_e$在无噪声条件下的理想期望值。由于$S_e$是哈密顿量的对称性，其理想期望值通常是已知的（例如，对于Pauli算符，通常是$\pm 1$），并且在理想演化中是守恒的。
- 最小二乘问题求解：利用构建好的$M_S$和$b_S$，求解带1-范数约束的最小二乘问题：$\min_{x \in \mathbb{R}^m} ||M_S x - b_S||_2$，并施加$||x||_1=1$的约束。这一步旨在找到一组最优的外推系数$x_{GUESS}$，使得$M_S x_{GUESS}$尽可能接近$b_S$。论文提到了最小范数伪逆解法，适用于系统欠定（underdetermined）的情况。这一步的实现需要一个数值优化库，能够处理带约束的最小二乘问题。
- 输出：学习到的最优GUESS系数$\hat{x}_{GUESS}$。
步骤2：缓解目标可观测物 (APPLYMITIGATION)
- 输入：目标可观测物$O_i$在不同噪声因子$G_j$下测量得到的期望值$\{\text{Tr}(O_i \rho_{G_j})\}$，以及在步骤1中学到的GUESS系数$\hat{x}_{GUESS}$。
- 矩阵构建：类似地，构建目标可观测物的测量矩阵$M_O$，其元素为$M_{O; i,j} = \text{Tr}(O_i \rho_{G_j})$。
- 缓解计算：将学到的系数$\hat{x}_{GUESS}$应用于$M_O$，通过线性组合计算缓解后的目标可观测物期望值$b_i = M_O \hat{x}_{GUESS}$。如果采用指数GUESS，则在对数域进行计算，再指数化。
- 输出：缓解后的目标可观测物期望值$b_i$。

# Algorithm 1: GUESS QEM Algorithm (Conceptual Python-like Pseudocode)

def solve_constraints(symmetry_expectations: list) -> list:
    # symmetry_expectations: List of lists, where each inner list contains 
    # [Tr(Se_rho_G1), Tr(Se_rho_G1.2), Tr(Se_rho_G1.5)] for a symmetry Se

    # Step 1: Define Ms matrix
    Ms = np.array(symmetry_expectations) # Example: (num_symmetries, num_noise_factors)
    
    # Ideal values for symmetries (known, e.g., typically 1 for Pauli symmetries)
    # Assuming all symmetries have an ideal value of 1 for simplicity in this example
    bs = np.ones(Ms.shape[0]) 

    # Solve least-squares problem to get GUESS coefficients
    # min ||Ms @ x - bs||_2 subject to ||x||_1 = 1
    # This often requires numerical optimization libraries (e.g., scipy.optimize)
    # For simplicity, we'll use a basic pseudo-inverse for demonstration,
    # but a constrained optimizer is needed for the L1-norm constraint.
    # Example of unconstrained solution:
    # x_guess, residuals, rank, s = np.linalg.lstsq(Ms, bs, rcond=None)
    # To incorporate L1-norm, a proper optimization solver like CVXPY or scipy.optimize.minimize is required
    # For this conceptual code, let's assume an optimizer returns optimal x_guess
    
    # Placeholder for actual optimization result:
    # In a real implementation, you would use an optimizer for constrained least squares.
    # For example, using scipy.optimize.minimize with bounds and constraints.
    # For illustration, let's just make up some x_guess
    x_guess = np.array([0.4, 0.3, 0.3]) # Must sum to 1 for L1-norm constraint, and be num_noise_factors long

    return x_guess

def apply_mitigation(observable_expectations: list, x_guess: list) -> float:
    # observable_expectations: List containing [Tr(Oi_rho_G1), Tr(Oi_rho_G1.2), Tr(Oi_rho_G1.5)] for one observable Oi

    # Step 2: Define Mi,j (Mo in the text for a single observable)
    Mo = np.array(observable_expectations)

    # Get mitigated expectation value
    bi = np.dot(Mo, x_guess)
    
    return bi

def guess_mitigation_protocol(symmetry_data: dict, target_data: dict) -> list:
    # symmetry_data: {obs_name: [[Tr(S_G1), Tr(S_G1.2), Tr(S_G1.5)], [Tr(S_G1), Tr(S_G1.2), Tr(S_G1.5)], ...]}
    # target_data: {obs_name: [Tr(O_G1), Tr(O_G1.2), Tr(O_G1.5)]}

    # Step 1: Learning Parameters from Symmetries
    # Consolidate all symmetry expectations into a single list for Ms construction
    all_symmetry_expectations = []
    for obs_name in symmetry_data:
        all_symmetry_expectations.extend(symmetry_data[obs_name])

    x_guess = solve_constraints(all_symmetry_expectations)

    # Step 2: Mitigating Target Observables
    mitigated_results = []
    for obs_name, expectations in target_data.items():
        bi = apply_mitigation(expectations, x_guess)
        mitigated_results.append({obs_name: bi})
        
    return mitigated_results

# Example usage (conceptual)
import numpy as np

# --- Step 1: Learning GUESS coefficients from Symmetries ---
# Let's imagine we have 2 symmetry observables, each measured at 3 noise factors (G=1, 1.2, 1.5)
# The ideal value for these symmetries is known, e.g., 1.
conceptual_symmetry_expectations = {
    'Symmetry1': [0.8, 0.6, 0.4], # noisy values for Symmetry1
    'Symmetry2': [0.9, 0.7, 0.5]  # noisy values for Symmetry2
}

# Prepare input for solve_constraints function
symmetry_input_for_solver = [
    conceptual_symmetry_expectations['Symmetry1'],
    conceptual_symmetry_expectations['Symmetry2']
]

x_guess_coeffs = solve_constraints(symmetry_input_for_solver)
print(f"Learned GUESS coefficients: {x_guess_coeffs}")

# --- Step 2: Applying GUESS coefficients to Target Observables ---
# Let's imagine we have 1 target observable measured at the same 3 noise factors
conceptual_target_expectations = {
    'TargetObs1': [0.75, 0.55, 0.35] # noisy values for TargetObs1
}

mitigated_results = guess_mitigation_protocol(conceptual_symmetry_expectations, conceptual_target_expectations)
print(f"Mitigated results for TargetObs1: {mitigated_results[0]['TargetObs1']}")

# --- For Exponential GUESS (Conceptual) ---
# In solve_constraints, before solving, take log of Ms and bs (if applicable)
# For apply_mitigation, take log of Mo, apply x_guess, then exp(result)
# This requires careful handling of zeros/negative values in log.

哈密顿量杂质的注入细节

哈密顿量杂质$I_{\vec{q}}$的设计是GUESS方法的关键创新，确保了能够学习到与目标可观测物匹配的噪声剖面。这需要在电路生成阶段进行：

数学构造：根据目标哈密顿量$H_0$和目标可观测物$O_w$（例如$Z_i$或$Z_i Z_{i+1}$），精心推导出局部扰动$I_{\vec{q}}$，使得新哈密顿量$H_I = H_0 + I_{\vec{q}}$与$O_w$对易（即$[H_I, O_w] = 0$）。论文中给出了具体的示例，如伊辛模型的$I_i = -h_1 X_i$。对于XZ海森堡模型的权重1可观测物，杂质$I_i = -h_x X_i - J_x X_{i-1} X_i - J_x X_i X_{i+1} + J_z Z_{i-1} Z_i + J_z Z_i Z_{i+1}$。这些杂质项的选取保证了在引入新对称性的同时，维持电路中两比特门（如CZ门）的数量和连接结构尽可能不变，从而保持原始噪声传播的特性。
电路转换：使用$H_I$和$H_0$分别进行Trotter化，生成对应的量子电路。在设计$I_{\vec{q}}$时，必须确保引入杂质后的电路，其两比特门数量和深度与原始目标电路尽可能保持一致。这对于保持噪声传播特性相似性至关重要，因为两比特门是量子硬件中主要的噪声来源。

噪声放大协议的实现

论文采用**分数门折叠（fractional gate folding）**作为噪声放大技术。在Qiskit等量子编程框架中，这通常通过以下方式实现：

门序列复制：对于一个门$U$，当应用噪声因子$G_k$时，可以通过重复$U(U^\dagger U)^{G_k-1}$的形式来放大噪声。对于非整数的$G_k$，例如1.2或1.5，通常会采用更复杂的技巧，例如将门拆分为更小的分量或采用近似。Qiskit的transpiler可以协助完成这类操作，或者需要手动构建扩展后的门序列。
电路生成：需要生成多个版本的电路，每个版本对应一个特定的噪声因子，从而获得一系列嘈杂测量值。这构成了GUESS和ZNE输入数据的基础。

统计后选择的实现细节

算法2：量子可观测物后选择提供了一个框架来提高GUESS结果的可靠性：

# Algorithm 2: Post-Selection of Quantum Observables (Conceptual Pseudocode)

def post_selection(symmetries_data: dict, experimental_data: dict, k_factor=1.5) -> list:
    # symmetries_data: {obs_name: {trotter_step: {'expectations': [], 'std_devs': []}}} for symmetry observables
    # experimental_data: {obs_name: {trotter_step: {'expectations': [], 'std_devs': []}}} for all measured observables

    bad_qubits = set() # To store names of qubits identified as 'bad'

    # Step 1: Outlier Removal based on Noise (standard deviation)
    for trotter_step in sorted(symmetries_data[list(symmetries_data.keys())[0]].keys()):
        step_std_devs = []
        valid_symmetries_for_step = []

        for obs_name in symmetries_data:
            if trotter_step in symmetries_data[obs_name]:
                std_dev_at_G1 = symmetries_data[obs_name][trotter_step]['std_devs'][0] # Assuming G=1 is the first noise factor
                step_std_devs.append(std_dev_at_G1)
                valid_symmetries_for_step.append(obs_name)
        
        if not step_std_devs: # No valid symmetries for this step
            continue

        # Calculate statistics (Q1, Q3, IQR) of std_devs
        q1, q3 = np.percentile(step_std_devs, [25, 75])
        iqr = q3 - q1
        noise_threshold = q3 + k_factor * iqr

        # Mark qubits as 'Bad' if their std_dev exceeds the threshold
        for i, obs_name in enumerate(valid_symmetries_for_step):
            if step_std_devs[i] > noise_threshold:
                bad_qubits.add(obs_name)

    # Step 2: Data Cleaning (Apply 'bad_qubit' mark across all steps and experiments)
    cleaned_symmetry_data = deepcopy(symmetries_data)
    cleaned_target_data = deepcopy(experimental_data) # This will be the input for GUESS mitigation

    for obs_name in bad_qubits:
        # Mark as NaN in cleaned_symmetry_data
        if obs_name in cleaned_symmetry_data:
            del cleaned_symmetry_data[obs_name]
        # Mark as NaN in cleaned_target_data (or remove if no longer needed for GUESS learning)
        if obs_name in cleaned_target_data: # If target obs could also be 'bad'
             del cleaned_target_data[obs_name] # Or set expectations to NaN

    # Step 3: Selection based on Expectation Values (for target observables)
    # This step is specifically for target observables AFTER GUESS mitigation, or for raw values before.
    # For this algorithm, we assume it's used to filter *before* feeding to GUESS, or after initial raw measurements.
    # Let's assume it selects from the initial experimental_data *before* mitigation for input to GUESS
    
    # Filter remaining valid symmetries (if still needed, though Step 1 already filtered bad ones)
    # S_good is implicitly what remains after bad_qubits are removed
    
    # Select the best 20 observables based on highest expectation value (from cleaned_target_data)
    # This part typically refers to filtering the *target* observables based on some criteria related to the symmetries.
    # The paper implies using symmetry outcomes (mean & variance) for selecting *target* qubits.
    # Let's re-interpret: Select target observables whose *corresponding symmetry* performed best.
    
    # Simplified conceptual approach for selecting best 20 for reporting:
    # Assuming 'experimental_data' initially contains 40 observables, we need to choose 20.
    # The criteria is 'worst bias in the symmetry case' - meaning symmetries that are least affected by noise.
    # This implies choosing target observables whose corresponding symmetry measurements (from cleaned_symmetry_data) 
    # are closest to their ideal values (e.g., 1) or have lowest variance.

    if not cleaned_symmetry_data:
        return [] # No good symmetries left
    
    # For selection, we might use the mean absolute bias of symmetries over all steps
    symmetry_biases = {}
    for obs_name, data in cleaned_symmetry_data.items():
        total_bias = 0
        count = 0
        for step_data in data.values():
            for exp_val in step_data['expectations']:
                total_bias += abs(exp_val - 1) # Assuming ideal symmetry value is 1
                count += 1
        if count > 0:
            symmetry_biases[obs_name] = total_bias / count
        else:
            symmetry_biases[obs_name] = float('inf') # If no valid data for symmetry

    # Sort by bias and pick the top N (e.g., 20) with lowest bias
    sorted_symmetries = sorted(symmetry_biases.items(), key=lambda item: item[1])
    best_symmetry_names = [name for name, bias in sorted_symmetries if bias != float('inf')][:20]

    # Now, filter the target data to include only those corresponding to the best symmetries
    final_target_observables_for_mitigation = {name: cleaned_target_data[name] for name in best_symmetry_names if name in cleaned_target_data}
    
    return final_target_observables_for_mitigation # This would be the input to the main GUESS mitigation

# Note: The actual post-selection in the paper is a bit more nuanced, selecting best 20 based on 
# expectation values and variance of symmetries. The above is a conceptual representation.

数据统计：对于每个Trotter步，计算所有对称可观测物测量结果的统计量，特别是标准偏差（$\sigma_{i,0}$）。这些统计量对于评估噪声水平至关重要。
异常值检测：使用内四分位距（IQR）方法定义噪声阈值（例如，$Limit = Q_3 + k \times IQR$，其中$Q_1, Q_3$分别是第一和第三四分位数，$k$是一个常数，如1.5）。如果对称性测量的标准偏差超过此阈值，则将对应的量子比特标记为“坏量子比特”。
数据清理：对于被标记为“坏”的量子比特，其所有Trotter步的测量数据将被丢弃（设置为NaN），从而避免其对后续GUESS参数学习和目标缓解造成负面影响。
结果筛选：从剩余的有效对称性测量中，选择表现最好的20个量子比特。这通常基于对称性测量结果的期望值与理想值的接近程度，以及其方差的低程度。这一步确保了最终用于GUESS缓解的输入数据和报告结果均来自质量最高的量子比特。

所用的软件包及开源 repo link

论文中明确列出了用于实现GUESS和基准测试的关键软件与硬件：

IBM Qiskit：这是IBM提供的一个开源Python框架，用于编程量子计算机。
- 用途：主要用于构建量子电路、将抽象电路**转译（transpile）**到特定的IBM量子处理器上（包括优化门序列、进行布局选择等），以及与IBM QPU进行交互以提交作业并检索结果。Qiskit的丰富功能和模块使其成为在IBM硬件上进行量子计算的行业标准工具。它还提供了噪声模型、模拟器等工具，用于研究噪声影响。
- 链接：Qiskit的官方GitHub仓库是 https://github.com/qiskit/qiskit，官方网站是 https://qiskit.org/。
TeNPy (Tensor Network Python Library)：这是一个用于张量网络模拟的Python库。
- 用途：在本文中，TeNPy被用于执行精确的经典模拟，特别是**时间演化块分解（TEBD）**算法。它用于生成横向场伊辛模型和XZ海森堡模型的无噪声理想时间演化数据，作为GUESS和ZNE结果的“黄金标准”。在1D系统中，MPS和TEBD是获得精确动力学演化的有效手段，可以模拟比精确对角化更大规模的系统。
- 链接：TeNPy的官方GitHub仓库是 https://github.com/tenpy/tenpy，官方网站是 https://tenpy.readthedocs.io/。
IBM Heron r2量子处理器 ‘ibm_basquecountry’：这是用于实际硬件实验的QPU名称。
- 用途：执行GUESS和ZNE的嘈杂量子电路，并收集原始测量数据。Heron r2是IBM Quantum推出的一种先进的量子处理器架构，具有高连接性和低误差率的特点，适合进行大规模量子模拟实验。
- 链接：作为特定硬件实例，没有直接的公共代码仓库，但可以通过IBM Quantum Experience平台访问其性能指标和可用性。

开源仓库链接

**重要提示：截至论文发表时，GUESS方法的具体实现代码（即包含哈密顿量杂质构造、最小二乘优化及后选择逻辑的完整Python脚本）并未在论文中提供公开的GitHub仓库链接。**这意味着研究人员可能需要根据论文中详尽的算法描述和数学公式，自行实现GUESS的核心逻辑。在许多科研项目中，代码的开源通常会在论文正式发表后进行，或通过私下交流提供。因此，如果需要完整代码，可能需要直接联系论文作者。

复现指南（详细步骤）

复现论文中的结果将是一个涉及经典模拟、量子电路设计、硬件执行和数据分析的综合性任务：

准备开发环境：
- 安装Python 3.8+版本。推荐使用Anaconda或Miniconda管理Python环境。
- 创建并激活一个Python虚拟环境（例如，conda create -n guess_env python=3.9 && conda activate guess_env）。
- 安装Qiskit及其必要的后端提供商（例如，pip install qiskit qiskit-ibm-provider）。
- 安装TeNPy及其科学计算依赖（NumPy, SciPy），通过pip install tenpy。
- 配置IBM Quantum账户凭据（API Token），以便Qiskit能够访问IBM QPU并提交作业。例如，使用IBMQ.save_account(token, overwrite=True)并IBMQ.load_account()。
实现经典基准模拟 (使用TeNPy)：
- 哈密顿量定义：编写Python脚本，使用TeNPy的MPO（Matrix Product Operator）类定义一维横向场伊辛模型和XZ海森堡模型的哈密顿量。输入论文中指定的参数（伊辛：$J=1, h_x=0.75$；XZ：$J_x=0.5, J_z=2, h_x=0.5$）和100个量子比特。TeNPy的model模块提供了构建这些模型的便利接口。
- 初始态：使用MPS.init_product_state函数初始化系统为$|0\rangle^{\otimes 100}$态。
- 时间演化：使用TeNPy的TEBD算法，实现一阶Suzuki-Trotter时间演化。设置Trotter步数（伊辛：44步，XZ：24步）和总时间（伊辛：$t=5$，XZ：$t=3.75$）。在每一步演化后，记录系统状态。
- 可观测物计算：在每个Trotter步，计算平均磁化强度（$\frac{1}{n}\sum_i Z_i$）和最近邻关联器（$\frac{1}{n-1}\sum_i Z_i Z_{i+1}$）的精确期望值。这些将作为后续量子结果的理想对比基准。
构建量子电路 (使用Qiskit)：
- 原始Trotter电路：实现原始哈密顿量$H_0$（伊辛和XZ模型）的一阶Trotter化量子电路。Qiskit的qiskit.circuit.library或自定义门可以用于构建。这将是测量目标可观测物的电路。
- 哈密顿量杂质设计：根据论文附录D1和方法细节部分，为每个目标可观测物（例如$Z_i$, $Z_i Z_{i+1}$）和对应的哈密顿量模型，精确设计并实现其局部哈密顿量杂质$I_{\vec{q}}$。这一步是手动的，需要深入理解模型物理和对易关系。
- 扰动Trotter电路：使用扰动哈密顿量$H_I = H_0 + I_{\vec{q}}$构建对应的Trotter化量子电路。这将是测量对称可观测物的电路。
- 噪声放大：实现分数门折叠。对于每个电路，生成噪声因子为1、1.2和1.5的三个版本。这通常涉及将电路中的两比特门（如CZ）替换为重复序列，例如$U \to U(U^\dagger U)^k$。Qiskit的transpiler配合自定义pass_manager可以实现精细的门折叠控制。
- 辅助QEM技术：在电路中集成动态解耦（DD）、Pauli旋绕（PT）和TREX。Qiskit的QuantumCircuit提供了添加各种门序列和测量操作的接口。PT可以通过随机化电路层并在执行后平均结果来实现，TREX和DD也有相应的实现策略或Qiskit模块。
在IBM QPU上执行：
- 量子比特选择和映射：使用Qiskit的转译器，将所有构建好的电路（原始目标电路的不同噪声因子版本，以及扰动对称性电路的不同噪声因子版本）映射到‘ibm_basquecountry’QPU上选择的100个物理量子比特上。根据论文附录D的图4，量子比特选择是基于低读出误差等指标进行的。这可以通过Qiskit的provider.get_backend('ibm_basquecountry')获取后端，然后transpile电路到该后端。
- 作业提交：将每个电路提交给IBM QPU执行100,000次射击。批量提交作业以提高效率。
- 数据收集：收集每个电路执行后的原始测量结果（通常是量子比特的最终测量位串），并存储以便后续处理。
数据后处理与GUESS算法实现：
- 原始期望值计算：从原始位串结果中计算每个可观测物的期望值及其方差。
- 统计后选择 (实现算法2)：
  - 对对称可观测物的期望值计算其在每个Trotter步的标准偏差。
  - 使用IQR方法定义阈值，识别并过滤掉基于IQR阈值的异常量子比特数据。
  - 从剩余的有效数据中，选择表现最佳的20个可观测物。
- GUESS系数学习 (实现算法1的SOLVECONSTRAINTS)：
  - 构建对称性测量矩阵$M_S$和理想对称性值向量$b_S$。
  - 使用Python的科学计算库（例如scipy.optimize.minimize结合适当的约束处理，或cvxpy进行凸优化）解决带1-范数约束的最小二乘问题，以获得$\hat{x}_{GUESS}$。
- GUESS缓解 (实现算法1的APPLYMITIGATION)：
  - 构建目标可观测物测量矩阵$M_O$。
  - 使用$\hat{x}_{GUESS}$计算缓解后的目标可观测物期望值。根据需要实现线性或指数GUESS（指数GUESS需在对数域操作）。
- ZNE实现：独立实现ZNE外推，使用相同的嘈杂数据和噪声因子，并选择线性或指数外推模型进行对比。
结果分析与可视化：
- 使用Matplotlib或类似的绘图库，将GUESS、ZNE和原始测量结果与MPS理想值绘制在同一图表上。重现论文中的图2、图3和图5。
- 计算并比较GUESS、ZNE的相对误差、方差和非物理结果的百分比（如表I）。
- 分析图4和图6中的QPU硬件状态和量子比特性能，以支持对后选择机制的理解。

完成上述所有步骤将需要深厚的量子信息、量子编程和数值优化知识。由于没有现成的GUESS代码仓库，自行实现核心逻辑是复现的关键。

4. 关键引用文献，以及你对这项工作局限性的评论

GUESS方法是量子误差缓解领域前沿研究的结晶，其理论和实践都建立在数十年来量子信息科学的深厚积累之上。深入理解其关键引用文献对于把握GUESS的定位和价值至关重要，同时，对其固有局限性的批判性评估也必不可少。

关键引用文献的脉络与贡献

量子计算的基石与噪声挑战：
- [1] Feynman, R. P. (1982). “Simulating physics with computers."：这篇开创性论文为量子模拟奠定了理论基础，指明了量子计算机在科学计算中的独特优势，激发了整个量子计算领域的发展。
- [3, 4] Martinez et al. (2020) 和 Fowler et al. (2012). “Approximating decoherence processes for the design and simulation of quantum error correction codes on classical computers” 以及 “Surface codes: Towards practical large-scale quantum computation."：这些文献深刻阐述了量子噪声是实现Feynman愿景的主要障碍，并介绍了量子误差校正（QEC）作为长期解决方案。QEC的理论，如阈值定理（[9, 10] Aharonov & Ben-Or, 1997; Kitaev, 1997）和早期的QEC方案（[6-8] Calderbank & Shor, Shor, Steane, 1995-1996），设定了构建容错量子计算机的宏伟目标。然而，文献[13, 14]也指出，实现QEC所需的巨大资源开销（数十万甚至数百万物理量子比特）是其短期内难以普及的关键制约。这正是QEM技术出现的历史背景。
量子误差缓解（QEM）的兴起与ZNE：
- [20] Cai et al. (2023). “Quantum error mitigation."：这是一篇权威综述，全面梳理了QEM的原理、技术和挑战，将其定位为NISQ时代的重要工具，为GUESS提供了一个全面的比较框架。
- [21] Temme et al. (2017). “Error mitigation for short-depth quantum circuits."：这篇里程碑式的论文正式提出了零噪声外推（ZNE）和概率误差消除（PEC）两大QEM范式。ZNE是GUESS直接对比和改进的对象，GUESS的优化目标正是解决ZNE的固有问题。
- [26-29] Li & Benjamin (2017), Giurgica-Tiron et al. (2020), Majumdar et al. (2023), Etxezarreta Martinez et al. (2024) 等一系列关于ZNE的文献：这些研究深入探讨了ZNE的实现细节、不同外推模型（线性、指数）的选择及其在实践中遇到的数值不稳定性、多指数衰减问题（[33, 35] Kim et al., 2023; Cai, 2021）。这些正是GUESS通过学习噪声剖面来解决的核心痛点。
哈密顿量对称性在QEM中的作用：
- [20, 40, 41] Bonet-Monroig et al. (2018), Cobos et al. (2025). “Low-cost error mitigation by symmetry verification."：这些文献首次将哈密顿量对称性引入QEM，主要用于通过验证测量结果是否违反对称性来丢弃非物理数据，从而减少噪声对结果的影响。GUESS在此基础上进行了革命性的飞跃，不再仅仅是验证，而是利用对称性的“衰减”本身作为噪声的探针。这种从“守恒”到“衰减”的视角转变是GUESS方法论的核心创新，使得对称性从一个过滤器变为一个噪声学习工具。
开放量子系统动力学与噪声模型：
- [49, 50] Lindblad (1976), Gorini et al. (1976). “On the generators of quantum dynamical semigroups."：GKSL主方程是描述马尔可夫开放量子系统动力学的标准框架，为GUESS分析对称性在噪声下的衰减提供了坚实的理论基础，其耗散项正是噪声效应的数学表达。
- [57, 82] Wallman & Emerson (2016), Cai & Benjamin (2019). “Noise tailoring for scalable quantum computation via randomized compiling."：Pauli旋绕（Pauli Twirling）等技术（GUESS实验中也采用）旨在将复杂的噪声信道转化为Pauli信道，简化噪声模型，这有助于GUESS学习更普遍的衰减规律，并使理论分析更易于进行。
其他相关QEM技术：
- [55] Farrell et al. (2024). “Scalable circuits for preparing ground states on digital quantum computers: The schwinger model vacuum on 100 qubits."：算符退相干重整化（ODR）通常使用镜像电路来推断衰减。GUESS通过哈密顿量杂质，以更精确的方式捕捉目标电路的噪声特征，解决了镜像电路可能改变噪声传播的问题，实现了更优的噪声学习效果。
- [56] Czarnik et al. (2021). “Error mitigation with Clifford quantum-circuit data."：Clifford数据回归（CDR）使用Clifford电路来训练模型，但Clifford和非Clifford电路的噪声传播可能存在显著差异（[33, 35]）。GUESS通过精心设计的杂质，使学习电路的噪声传播与目标电路更相似，从而提升了泛化能力和缓解精度。

对这项工作局限性的评论

GUESS方法无疑为NISQ时代提供了一个强大的误差缓解工具，但作为一项新兴技术，它仍存在一些值得深思的局限性：

哈密顿量杂质的泛化性与精确性：
- 杂质设计的复杂性：尽管论文给出了几种杂质设计示例，但为任意给定的哈密顿量和目标可观测物找到一个合适的局部杂质$I_{\vec{q}}$，使其既能强制产生所需对称性，又能最小化对原始电路噪声传播的影响，可能不是一个简单的任务。特别是对于复杂的、非局部相互作用的哈密顿量，或者需要缓解高权重、空间分布广泛的可观测物时，杂质的构造可能变得非常具有挑战性，甚至可能不存在简单的解决方案。这种杂质设计目前仍需领域专家手工完成，缺乏通用自动化方法，这限制了其在通用量子算法中的应用广度。
- “最小扰动”的定量界限：论文使用钻石范数距离（Appendix E）来证明杂质对噪声信道传播的影响很小，这提供了理论上的支持。然而，这个“小”在何种程度上可以被认为是“最小”和“可忽略”，以及这个界限如何随着电路深度、量子比特数量或噪声模型的特定类型而变化，还需要更深入的理论和实验分析。如果扰动并非总是“最小”，则学习到的噪声剖面可能与目标电路的真实噪声不完全匹配，从而降低缓解精度。特别是当硬件噪声变化剧烈时，即使是微小的结构变化也可能引发显著的噪声传播差异。
噪声放大技术（门折叠）的依赖与局限：
- GUESS的有效性在一定程度上依赖于所使用的噪声放大技术。论文明确指出，分数门折叠是一种启发式方法，可能不准确，可能导致外推结果在较大噪声因子下发散（[68, 69] Hour et al., 2024; Fellous-Asiani et al., 2021）。尽管GUESS相对于ZNE对噪声尺度不确定性更鲁棒，但如果门折叠本身不能准确地放大所有类型的噪声，那么GUESS学习到的噪声剖面可能不够完整或精确。特别是在噪声效应非线性或与门类型强相关的场景下，门折叠的不足会影响GUESS的性能。
- 虽然论文提到更精确的PEC（[33]）可以使GUESS受益，但PEC自身的高昂成本和复杂性（需要详细的噪声模型表征和动态校准）也限制了其实用性。GUESS在当前实践中仍需在效率和噪声放大精度之间权衡。
相似性假设的鲁棒性：
- GUESS的一个核心假设是，噪声对通过杂质强制生成的对称性$O_w$（在扰动哈密顿量$H_I$下）和原始目标可观测物$O_w$（在原始哈密顿量$H_0$下）的作用是“相似的”。虽然杂质旨在保持电路结构相似，但量子硬件噪声的高度空间异构性（[54]）和时间漂移（[77]）可能意味着这种相似性并非总是完美的。在量子比特质量差异大或噪声信道复杂多样的系统中，这种假设的有效性可能需要进一步验证。如果不同区域的量子比特噪声特性差异过大，单一杂质诱导的对称性可能无法代表整个系统的噪声状况。
计算开销与资源消耗：
- GUESS需要运行两套电路：一套用于学习对称性（使用$H_I$），一套用于测量目标可观测物（使用$H_0$）。这意味着每个可观测物需要两倍于传统ZNE（仅运行一套电路）的电路提交和测量开销。尽管论文认为这种额外开销通过提供系统噪声信息和降低方差来获得补偿，但在追求极致效率和快速迭代的场景下，这仍然是一个需要考虑的因素。特别是在QPU访问时间有限或作业队列繁忙时，额外开销可能成为瓶颈。
- 此外，最小二乘优化过程本身也需要一定的经典计算资源，尽管对于目前的问题规模来说这通常不是瓶颈。
目标范围和可扩展性：
- 预期值而非全态：GUESS专注于精确估计可观测物的预期值，这对于许多物理模拟应用是足够的。然而，对于需要完整量子态层析成像或更复杂量子信息处理任务的应用，GUESS可能不足以提供所需的所有信息。
- “早期容错”定位：论文将GUESS定位为在“早期容错”背景下与逻辑量子比特结合的工具。这意味着它可能不是最终容错量子计算机的通用QEM方案，而是特定过渡阶段的有效辅助。其在更高层级的逻辑门操作上的适用性仍需探索，因为逻辑门的实现方式（如晶格手术、横向门、魔术态蒸馏）可能与物理门存在根本差异（[12, 19, 73, 74] Litinski, 2019; Sales Rodriguez et al., 2025; Bluvstein et al., 2024; Horsman et al., 2012）。
缺乏公共代码：
- 论文中未提供公共代码库链接，这在一定程度上限制了研究社区对GUESS方法的快速采纳、复现、扩展和比较。开源代码对于加速科学研究和技术转化至关重要，缺乏开源代码可能会延缓GUESS方法在更广泛的应用场景中的评估和优化。

总结 GUESS通过将哈密顿量对称性的物理原理与误差缓解技术相结合，在解决NISQ时代量子噪声挑战方面取得了显著进展。其创新性的杂质概念、高精度、低方差和内置后选择机制使其成为一个强大的工具。然而，对其杂质设计泛化性、噪声放大依赖性、相似性假设的鲁棒性以及计算开销的持续研究和改进，将是推动GUESS方法走向更广泛应用的关键。

5. 其他你认为必要的补充

GUESS（GUiding Extrapolations from Symmetry decayS）方法不仅在技术层面带来了创新，其在量子计算领域的战略定位和潜在影响也值得深入探讨。

1. 战略意义：弥合NISQ与FTQC的鸿沟

GUESS的提出，为当前NISQ设备能力与未来全面容错量子计算（FTQC）之间的巨大鸿沟提供了一个至关重要的桥梁。NISQ设备因其固有的噪声特性而限制了可执行电路的规模和深度，使得许多期望的量子优势难以实现。GUESS通过以下方式为克服这一挑战提供了新的视角：

物理驱动的可靠性：与许多纯粹依赖于统计拟合或启发式规则的QEM技术不同，GUESS的根基在于哈密顿量对称性的物理守恒定律。这种基于物理原理的设计使其在处理未知或复杂噪声模式时更具鲁棒性。通过将噪声行为与系统内在的对称性联系起来，GUESS能够从更深层次上理解并量化噪声的影响，而非仅仅是表层地拟合观测数据。这使得GUESS在面临现实世界量子硬件中不可预测的噪声漂移和异构性时，能够提供更为可信和物理一致的结果，显著减少非物理值输出的概率。
优化现有硬件性能：GUESS直接提升了当前NISQ设备在执行关键量子算法时的性能。通过显著降低相对误差并减少结果方差，它使研究人员和开发者能够从现有硬件中提取出更高质量的信息。这对于加速量子算法的研发、探索新的应用场景以及验证理论模型具有巨大价值，例如在量子化学模拟中获得更精确的分子能级，或在材料科学中模拟更长时间的量子动力学。其较低的方差也意味着在相同的精度要求下，可以减少所需的测量次数，从而提高计算效率。
为未来容错系统做准备：论文将GUESS定位为在“早期容错”阶段的有力工具。这意味着即使在未来逻辑量子比特能够被实现，它们仍然可能面临残余噪声。GUESS可以对这些逻辑噪声进行额外的缓解，从而进一步提升逻辑操作的精度。这种分层误差处理的思路，即物理层面的QEC与逻辑层面的QEM相结合，有望加速通向真正容错量子计算机的进程。GUESS提供的量子比特质量评估能力（通过对称性测量）也可以用于优化逻辑量子比特的构建和放置，选择噪声最小的物理量子比特簇来构建逻辑量子比特，从而从硬件层面优化QEC的性能。这可能包括在QEC编码中主动选择低噪声物理比特，或者在逻辑门操作前进行额外的QEM。

2. 深度分析：GUESS对噪声剖面学习的贡献

GUESS最核心的贡献在于其学习系统噪声剖面的独特能力，这超越了传统ZNE的局限性。

克服ZNE模型选择的痛点：传统ZNE面临的主要问题是，嘈杂期望值的衰减函数形式是未知的，而预设的线性或指数模型往往无法准确捕捉真实的多指数衰减（[33, 35]）。GUESS通过测量与目标可观测物具有相同权重的、通过杂质强制生成的对称性的衰减，实际上“学习”了特定噪声环境下的衰减模式参数。这种“知己知彼”的策略，使得GUESS能够进行更精确的外推，避免了ZNE中因错误模型选择导致的偏差和不稳定性。GUESS的机制更接近于一种“自适应”的噪声模型学习，使其更能适应硬件噪声的复杂性和变异性。
解决噪声放大不确定性：ZNE对噪声放大因子的精确性高度敏感。如果门折叠等放大技术引入了不准确性，ZNE的结果就会受到严重影响（[68, 69]）。GUESS的优势在于其协议不显式依赖于噪声放大因子的精确值，而是在相同的放大技术下，通过比较对称性和目标可观测物的相对衰减来学习。这种相对学习的机制使其对噪声尺度上的不确定性具有更强的鲁棒性，因为它关注的是噪声如何影响可观测物的“相对”衰减模式，而非绝对强度。
与ODR和CDR的互补与超越：
- ODR (Operator Decoherence Renormalization) 通常通过运行“镜像电路”来反转量子操作，以推断可观测物的衰减因子。然而，镜像电路与实际目标电路的门序列不同，这可能导致其噪声传播特性与目标电路不匹配（[55]）。
- CDR (Clifford Data Regression) 试图通过在Clifford电路（易于经典模拟的电路）上学习噪声模型，然后将其推广到非Clifford目标电路。但Clifford和非Clifford电路的噪声传播机制可能存在显著差异（[33, 35]）。
- GUESS通过引入哈密顿量杂质，旨在生成一个与目标电路具有相似结构和两比特门计数的“学习电路”（即扰动哈密顿量下的对称性测量电路）。这种设计确保了学习电路的噪声传播特性与目标电路高度相似，从而使得GUESS学到的噪声剖面更具普适性和准确性。论文指出，当噪声因子为1时，GUESS可以视为一种特殊的ODR协议，但使用的是扰动电路而非镜像电路，因此更为精确。这意味着GUESS提供了一种更鲁棒的框架，可以作为ODR和CDR等方法的改进基础，使它们能够更准确地学习非Clifford电路的噪声行为，从而为更广泛的量子算法提供可靠的QEM支持。

3. 统计后选择机制的深层价值：超越单纯的缓解

GUESS的统计后选择机制不仅仅是提高报告结果准确性的工具，它更是一种对量子硬件进行实时诊断和优化的强大功能。

实时量子比特诊断：由于对称可观测物的理想值是已知的，通过实时监测这些对称性的预期值及其方差，可以对单个或一组量子比特的性能进行实时评估。例如，如果某个对称可观测物在测量中的方差异常高或期望值偏离理想值，则表明相关的量子比特或门操作可能存在缺陷。图6中的量子比特51和70的对比，正是这种诊断能力的直接体现，Qubit 51表现出更强的退相干。这种能力对于在高度异构的量子处理器（如IBM的重六边形架构）上选择最佳量子比特用于特定计算，或者在长时间运行中应对噪声漂移（[77]），都具有不可估量的价值。它允许用户动态地识别和避免使用“坏”的硬件区域。
自适应QEM和实验优化：这种诊断能力为未来的自适应QEM方案奠定了基础。设想一个智能量子系统，它能够根据对称性测量的反馈，自动调整量子比特分配、门校准参数，甚至重新调度计算任务以避免受损的量子比特。这代表了从静态误差缓解向动态、智能量子计算管理迈进的关键一步。它可以指导实验人员在复杂的QPU上选择最优的拓扑结构和路由方案，从而最小化噪声对计算的影响，甚至可以触发重新校准程序来优化特定的量子比特或门。
数据质量保障：通过基于统计指标（如IQR）和期望值对数据进行筛选（如算法2所示），GUESS确保了只有高质量、物理合理的数据才会被用于最终的分析和报告。这对于建立对量子计算结果的信任至关重要，特别是在科学发现和工程应用中。它显著减少了非物理结果的出现（如表I所示），提升了报告数据的可信度。

4. 未来研究方向的展望

GUESS的成功开启了多个富有前景的研究方向：

更通用的杂质设计：开发一套系统化的、甚至自动化的方法来为任意哈密顿量和目标可观测物构造最优的哈密顿量杂质。这可能涉及机器学习、量子优化算法或量子信息论中的高级技术来搜索或合成杂质，从而摆脱手动设计的限制，使其适用于更广泛的问题。
与更精确噪声放大技术的融合：探索GUESS与PEC等更精确但成本更高的噪声放大技术相结合的可能性（[33]）。这可能需要开发新的成本效益策略，以平衡PEC的精度与GUESS的效率，例如，只在关键或高噪声部分采用PEC，而在其他部分使用门折叠。
在逻辑量子比特上的应用：将GUESS应用于未来容错架构中的逻辑量子比特。研究如何在逻辑层面上定义和利用对称性，以及GUESS如何缓解逻辑门操作上的残余错误。这可能涉及到对逻辑电路的特殊考虑和适应，因为逻辑门通常是通过一系列复杂的物理门序列实现，其噪声特性可能与单个物理门不同（[22-25] Preskill, 2025; Zimboras et al., 2025; Jeon & Cai, 2026）。
非马尔可夫噪声和高维系统：当前分析主要基于马尔可夫近似。未来研究可以探索GUESS在非马尔可夫噪声环境下的表现，以及其向更大规模、更高维量子系统（如2D晶格）的扩展性。在高维系统中，量子比特的连接性和局部对称性可能更加复杂，这需要新的杂质设计策略和误差传播分析。
与机器学习的协同：将GUESS的物理驱动学习框架与深度学习或强化学习技术相结合，以更智能地识别噪声模式、优化系数学习过程，甚至自适应地调整杂质。机器学习可以帮助发现非直观的噪声相关性，进一步提高缓解精度。
多样化应用场景的探索：将GUESS应用于更广泛的量子算法和应用，如量子机器学习、优化问题以及不同类型的量子化学计算（[34] Zhang et al., 2025），以验证其普适性和实用价值。例如，在变分量子本征求解器（VQE）中，GUESS可以用于更精确地估计能量期望值。

总而言之，GUESS不仅提供了一个高效且物理直观的误差缓解方案，更重要的是，它开辟了利用系统内在物理规律来应对量子噪声的新范式。这不仅推动了NISQ设备的实用化，也为未来容错量子计算的稳健发展提供了宝贵的洞察和工具。