来源论文: https://arxiv.org/abs/2602.19722v1 生成时间: Feb 25, 2026 08:45

可微分最大似然估计：解锁量子纠错码噪声建模的“黑盒”

0. 执行摘要

在迈向容错量子计算（FTQC）的征途中，量子纠错（QEC）是核心支柱。然而，纠错码的效能高度依赖于解码器对底层物理噪声的理解。传统的噪声估计方法，如关联分析（Correlation Analysis），往往受限于配对相互作用，且在复杂噪声环境下可能产生物理上不合理的负概率值；而基于强化学习（RL）的方法虽然灵活，但缺乏物理可解释性，且极易对特定解码器产生过拟合。

本研究提出了一种创新的**可微分最大似然估计（dMLE）**框架。该框架的核心突破在于将复杂的量子纠错伴随式（Syndrome）似然性计算，转化为统计力学中的配分函数求解问题，并利用可微分编程技术实现了噪声参数的直接梯度下降优化。通过在重复码（Repetition Code）中使用精确平面求解器（Planar Solver）以及在表面码（Surface Code）中使用优化的张量网络（Tensor Network）架构，dMLE 能够以近乎精确的精度恢复模拟中的噪声分布。更具实际意义的是，在谷歌 Sycamore 处理器的实验数据上，dMLE 相比于目前的 SOTA 方法，将重复码的逻辑错误率降低了 30.6%，表面码（d=5）降低了 8.1%。这一成果为量子芯片的噪声诊断与控制提供了一个强大、通用的物理启发式工具。

1. 核心科学问题，理论基础，技术难点，方法细节

1.1 核心科学问题：噪声估计的逆问题

在量子纠错中，我们无法直接观察到物理比特发生的错误（Physical Errors），只能观测到这些错误触发的伴随式（Syndromes）。噪声估计的任务本质上是一个统计推断问题：给定一组观测到的伴随式统计数据，如何推断出最能解释这些数据的探测器错误模型（Detector Error Model, DEM）参数？

对于距离为 $d$ 的码，其错误配置的空间随比特数指数增长。直接计算特定伴随式 $s$ 出现的概率 $p_\theta(s)$ 需要对所有与其一致的错误配置 $e$ 进行求和：

$$p_\theta(s) = \sum_{e \in C(s)} p_\theta(e)$$

这是一个典型的 #P-Hard 问题，在经典计算上通常是不可行的。此前的关联分析方法通过简化为二阶关联来绕过这一难点，但这种简化忽略了高阶噪声相互作用，导致解码性能受限。

1.2 理论基础：统计力学映射

本研究的理论根基在于将概率推断映射为统计力学的配分函数求解。对于重复码（属于平面图情况），其 DEM 可以映射到双重自旋玻璃模型（Dual Spin Glass Model）。耦合强度 $J_i$ 与错误概率 $\theta_i$ 的关系为：

$$J_i = (-1)^{e_i} \frac{1}{2} \log \frac{1-\theta_i}{\theta_i}$$

此时，计算 $p_\theta(s)$ 等价于计算该自旋系统的配分函数 $Z$。利用 Kac-Ward 决定式公式，可以在多项式时间内精确求解平面情况下的配分函数，且该过程完全可微分。

对于更复杂的表面码，其解空间不再具备平面性。研究团队采用了**张量网络（TN）**框架。在探测器图像（Generator Picture）下，每个探测器被表示为一个 XOR 张量，错误机制则表示为携带权重 $\theta_i$ 的概率张量。整个伴随式的似然性通过收缩这个张量网络来获得。

1.3 技术难点与方法细节：dMLE 框架

（1）可微分负对数似然（NLL）损失函数：定义损失函数为观测数据的负对数似然：

$$\mathcal{L}(\theta) = -\mathbb{E}_{s \sim p_{data}(s)} [\log p_\theta(s)]$$

由于整个计算流程（无论是 Kac-Ward 还是 TN 收缩）都是可微分的，研究者可以使用自动微分技术（Backpropagation）直接计算梯度 $\nabla_\theta \mathcal{L}$，并利用 Adam 或 SGD 进行参数更新。

（2）张量网络的结构简化（Walsh-Hadamard 变换）：在处理 $d=5$ 的表面码时，某些 XOR 张量的度数极高，导致显存爆炸。研究团队引入了 Walsh-Hadamard 变换，将高阶 XOR 张量分解为 Hadamard 矩阵和一维向量的组合。这种分解将网络拓扑简化为仅包含 Hadamard 矩阵和 Hyper-indices 的结构，极大地降低了计算复杂度。

（3）路径寻优优化：为了实现 25 轮（Rounds）的大规模表面码似然性计算，团队使用了 OMEinsumContractionOrders.jl，结合模拟退火算法寻找最优的张量收缩路径，将原本需要“数万 CPU 年”的任务缩减至在 NVIDIA H200 GPU 上数秒内完成。这是目前已知最有效的表面码似然性精确计算方案。

2. 关键 Benchmark 体系，计算所得数据，性能数据

2.1 模拟验证：参数恢复精度

研究首先在 $d=3, r=5$ 的重复码和 $d=3, r=5$ 的表面码（去极化噪声模型 $\epsilon_p = 0.001$）上进行了基准测试。结果显示（见论文图 2），即便初始参数偏离真实值 30% 以上，dMLE 也能在约 100-200 个 Epoch 内精确收敛到真实噪声概率。相对误差（Relative Error）随训练线性下降，证明了损失函数与参数精度之间极强的相关性。

2.2 实验验证（BAQIS 重复码）

团队使用了北京量子信息科学研究院（BAQIS）超导平台的重复码数据（$d \in \{3, 5, 7, 9\}$）。

性能提升：使用 dMLE 优化的参数后，Planar 解码器的逻辑错误率最高降低了 30.6(3)%。
超越关联分析：相比传统的关联分析，dMLE 在所有距离下都表现出更低的逻辑错误率，且随着距离 $d$ 的增大，提升幅度愈发显著。

2.3 实验验证（Google Sycamore 表面码）

这是本研究最具挑战性的部分。研究处理了 Google 公开的 $d=5$ 旋转表面码数据，包含 5 到 25 轮纠错。

跨解码器迁移性：dMLE 得到的噪声模型具有极强的通用性。在使用 Tesseract 解码器时，dMLE 优化的模型相比关联分析提升了 6.6(4)%，相比 RL 优化模型提升了 3.2(1)%。
逻辑错误率：在 TN 解码器结合 dMLE 先验的情况下，平均逻辑错误率提升幅度达到了 11.5(3)%。
计算复杂度数据：对于 $d=5, r=25$ 的表面码，TN 收缩的总计算量为 $6.3 \times 10^{11}$ FLOPS，峰值内存占用约 1 GB，这证明了在大规模容错系统上应用该框架的可行性。

3. 代码实现细节，复现指南，所用的软件包及开源 Repo Link

3.1 开源仓库

本项目代码已在 GitHub 开源：

主仓库：https://github.com/CHY-i/DMLE-QEC
张量路径优化工具：OMEinsumContractionOrders.jl

3.2 关键软件包

Stim：用于生成电路级噪声模型和模拟伴随式数据。作为 Google 开发的工业级模拟器，它是本研究的基础数据源。
PyTorch/Zygote：用于实现自动微分。重复码部分多采用 Julia 环境下的 Zygote，而表面码部分则利用 Python 环境结合 GPU 加速。
CUDA/CuPy：核心张量运算后端，用于支撑高性能的 TN 收缩。
Pymatching：用于作为 MWPM 解码器的对比基准。

3.3 复现指南

数据准备：使用 Stim 生成 CSV 格式的检测事件（Detection Events）数据集。对于实验数据，需按照 Stim 的 DEM 格式定义超图结构。
初始化：噪声概率 $\theta$ 可随机初始化或从简单的关联分析结果开始（RL 方法强烈依赖良好初始化，但 dMLE 对此更具鲁棒性）。
损失计算：调用 dMLE 核心类。对于平面码，类内部会构建 Kac-Ward 矩阵并计算其行列式；对于表面码，则会根据预定义的 opt_path 进行张量收缩。
优化循环：建议学习率设为 $0.001$，Batch Size 设为 $10,000$ 以上以减小梯度噪声。对于 $d=5$ 表面码，单张 H200 显卡建议开启并行收缩以提高吞吐量。

4. 关键引用文献，以及对这项工作局限性的评论

4.1 关键引用文献

Google Quantum AI (Nature 2021/2023) [4, 5]：提供了基准数据和关联分析方法的定义。
Cao et al. (PRL 2025) [18]：本研究中重复码精确求解器（Planar Solver）的基础。
Sivak et al. (PRL 2024) [9]：代表了强化学习在噪声估计领域的 SOTA 尝试，是本研究的主要竞争对比对象。
Chubb (Annales Henri Poincaré 2021) [19]：奠定了量子纠错码与统计力学模型映射的理论框架。

4.2 局限性评论

尽管本工作在精确性和效率上取得了突破，但仍存在以下局限：

电路深度限制：目前在表面码上的精确计算仅验证到 $d=5$。随着距离 $d$ 继续增加（如 $d=15$），张量网络的收缩复杂度和树宽（Treewidth）可能会迅速增加，导致精确 MLE 难以为继，未来可能需要引入 MPS（矩阵乘积态）等近似收缩技术。
独立噪声假设：目前的 DEM 模型假设错误机制是相互独立的。然而在实际超导比特中，串扰（Crosstalk）和非马尔可夫噪声普遍存在。dMLE 需要扩展到包含关联错误项的超图模型才能完全描述这些现象。
静态噪声假设：该框架目前主要针对静态噪声参数进行离线训练。对于随时间漂移（Drift）的噪声，需要开发在线（Online）学习版本，以实时更新解码器的先验信息。

5. 补充内容：对量子化学模拟的启示

作为量子化学科研人员，我们必须意识到，量子化学算法（如 VQE 或基态能量制备）的精度不仅取决于变分电路的设计，更取决于纠错层的稳健性。dMLE 的贡献不仅在于提升了纠错成功率，更提供了一种高精度的原位（In-situ）诊断工具。

5.1 噪声感知的变分算法

通过 dMLE 提取的精确物理噪声参数，可以直接反馈到量子化学的噪声补偿（Noise Mitigation）算法中。例如，在推断出特定双比特门的读出噪声偏高后，我们可以调整变分电路的布局，规避低保真度的操作区域。这种“噪声感知”的协同设计是实现近期量子优势（NISQ）应用的关键。

5.2 逻辑算符的保真度评估

在计算分子能量时，逻辑量子比特的“纯度”决定了结果的置信度。dMLE 允许我们通过伴随式统计直接量化逻辑层面的有效噪声，这比通过复杂的量子态断层扫描（QST）要高效得多。对于需要极高精度的化学精度（1 kcal/mol）计算，这种底层噪声模型的精细调节将是必不可少的。