来源论文: https://arxiv.org/abs/2602.19722v1 生成时间: Feb 25, 2026 08:45
可微分最大似然估计:解锁量子纠错码噪声建模的“黑盒”
0. 执行摘要
在迈向容错量子计算(FTQC)的征途中,量子纠错(QEC)是核心支柱。然而,纠错码的效能高度依赖于解码器对底层物理噪声的理解。传统的噪声估计方法,如关联分析(Correlation Analysis),往往受限于配对相互作用,且在复杂噪声环境下可能产生物理上不合理的负概率值;而基于强化学习(RL)的方法虽然灵活,但缺乏物理可解释性,且极易对特定解码器产生过拟合。
本研究提出了一种创新的**可微分最大似然估计(dMLE)**框架。该框架的核心突破在于将复杂的量子纠错伴随式(Syndrome)似然性计算,转化为统计力学中的配分函数求解问题,并利用可微分编程技术实现了噪声参数的直接梯度下降优化。通过在重复码(Repetition Code)中使用精确平面求解器(Planar Solver)以及在表面码(Surface Code)中使用优化的张量网络(Tensor Network)架构,dMLE 能够以近乎精确的精度恢复模拟中的噪声分布。更具实际意义的是,在谷歌 Sycamore 处理器的实验数据上,dMLE 相比于目前的 SOTA 方法,将重复码的逻辑错误率降低了 30.6%,表面码(d=5)降低了 8.1%。这一成果为量子芯片的噪声诊断与控制提供了一个强大、通用的物理启发式工具。
1. 核心科学问题,理论基础,技术难点,方法细节
1.1 核心科学问题:噪声估计的逆问题
在量子纠错中,我们无法直接观察到物理比特发生的错误(Physical Errors),只能观测到这些错误触发的伴随式(Syndromes)。噪声估计的任务本质上是一个统计推断问题:给定一组观测到的伴随式统计数据,如何推断出最能解释这些数据的探测器错误模型(Detector Error Model, DEM)参数?
对于距离为 $d$ 的码,其错误配置的空间随比特数指数增长。直接计算特定伴随式 $s$ 出现的概率 $p_\theta(s)$ 需要对所有与其一致的错误配置 $e$ 进行求和:
$$p_\theta(s) = \sum_{e \in C(s)} p_\theta(e)$$这是一个典型的 #P-Hard 问题,在经典计算上通常是不可行的。此前的关联分析方法通过简化为二阶关联来绕过这一难点,但这种简化忽略了高阶噪声相互作用,导致解码性能受限。
1.2 理论基础:统计力学映射
本研究的理论根基在于将概率推断映射为统计力学的配分函数求解。对于重复码(属于平面图情况),其 DEM 可以映射到双重自旋玻璃模型(Dual Spin Glass Model)。耦合强度 $J_i$ 与错误概率 $\theta_i$ 的关系为:
$$J_i = (-1)^{e_i} \frac{1}{2} \log \frac{1-\theta_i}{\theta_i}$$此时,计算 $p_\theta(s)$ 等价于计算该自旋系统的配分函数 $Z$。利用 Kac-Ward 决定式公式,可以在多项式时间内精确求解平面情况下的配分函数,且该过程完全可微分。
对于更复杂的表面码,其解空间不再具备平面性。研究团队采用了**张量网络(TN)**框架。在探测器图像(Generator Picture)下,每个探测器被表示为一个 XOR 张量,错误机制则表示为携带权重 $\theta_i$ 的概率张量。整个伴随式的似然性通过收缩这个张量网络来获得。
1.3 技术难点与方法细节:dMLE 框架
(1)可微分负对数似然(NLL)损失函数: 定义损失函数为观测数据的负对数似然:
$$\mathcal{L}(\theta) = -\mathbb{E}_{s \sim p_{data}(s)} [\log p_\theta(s)]$$由于整个计算流程(无论是 Kac-Ward 还是 TN 收缩)都是可微分的,研究者可以使用自动微分技术(Backpropagation)直接计算梯度 $\nabla_\theta \mathcal{L}$,并利用 Adam 或 SGD 进行参数更新。
(2)张量网络的结构简化(Walsh-Hadamard 变换): 在处理 $d=5$ 的表面码时,某些 XOR 张量的度数极高,导致显存爆炸。研究团队引入了 Walsh-Hadamard 变换,将高阶 XOR 张量分解为 Hadamard 矩阵和一维向量的组合。这种分解将网络拓扑简化为仅包含 Hadamard 矩阵和 Hyper-indices 的结构,极大地降低了计算复杂度。
(3)路径寻优优化:
为了实现 25 轮(Rounds)的大规模表面码似然性计算,团队使用了 OMEinsumContractionOrders.jl,结合模拟退火算法寻找最优的张量收缩路径,将原本需要“数万 CPU 年”的任务缩减至在 NVIDIA H200 GPU 上数秒内完成。这是目前已知最有效的表面码似然性精确计算方案。
2. 关键 Benchmark 体系,计算所得数据,性能数据
2.1 模拟验证:参数恢复精度
研究首先在 $d=3, r=5$ 的重复码和 $d=3, r=5$ 的表面码(去极化噪声模型 $\epsilon_p = 0.001$)上进行了基准测试。结果显示(见论文图 2),即便初始参数偏离真实值 30% 以上,dMLE 也能在约 100-200 个 Epoch 内精确收敛到真实噪声概率。相对误差(Relative Error)随训练线性下降,证明了损失函数与参数精度之间极强的相关性。
2.2 实验验证(BAQIS 重复码)
团队使用了北京量子信息科学研究院(BAQIS)超导平台的重复码数据($d \in \{3, 5, 7, 9\}$)。
- 性能提升:使用 dMLE 优化的参数后,Planar 解码器的逻辑错误率最高降低了 30.6(3)%。
- 超越关联分析:相比传统的关联分析,dMLE 在所有距离下都表现出更低的逻辑错误率,且随着距离 $d$ 的增大,提升幅度愈发显著。
2.3 实验验证(Google Sycamore 表面码)
这是本研究最具挑战性的部分。研究处理了 Google 公开的 $d=5$ 旋转表面码数据,包含 5 到 25 轮纠错。
- 跨解码器迁移性:dMLE 得到的噪声模型具有极强的通用性。在使用 Tesseract 解码器时,dMLE 优化的模型相比关联分析提升了 6.6(4)%,相比 RL 优化模型提升了 3.2(1)%。
- 逻辑错误率:在 TN 解码器结合 dMLE 先验的情况下,平均逻辑错误率提升幅度达到了 11.5(3)%。
- 计算复杂度数据:对于 $d=5, r=25$ 的表面码,TN 收缩的总计算量为 $6.3 \times 10^{11}$ FLOPS,峰值内存占用约 1 GB,这证明了在大规模容错系统上应用该框架的可行性。
3. 代码实现细节,复现指南,所用的软件包及开源 Repo Link
3.1 开源仓库
本项目代码已在 GitHub 开源:
3.2 关键软件包
- Stim:用于生成电路级噪声模型和模拟伴随式数据。作为 Google 开发的工业级模拟器,它是本研究的基础数据源。
- PyTorch/Zygote:用于实现自动微分。重复码部分多采用 Julia 环境下的 Zygote,而表面码部分则利用 Python 环境结合 GPU 加速。
- CUDA/CuPy:核心张量运算后端,用于支撑高性能的 TN 收缩。
- Pymatching:用于作为 MWPM 解码器的对比基准。
3.3 复现指南
- 数据准备:使用
Stim生成 CSV 格式的检测事件(Detection Events)数据集。对于实验数据,需按照Stim的 DEM 格式定义超图结构。 - 初始化:噪声概率 $\theta$ 可随机初始化或从简单的关联分析结果开始(RL 方法强烈依赖良好初始化,但 dMLE 对此更具鲁棒性)。
- 损失计算:调用
dMLE核心类。对于平面码,类内部会构建 Kac-Ward 矩阵并计算其行列式;对于表面码,则会根据预定义的opt_path进行张量收缩。 - 优化循环:建议学习率设为 $0.001$,Batch Size 设为 $10,000$ 以上以减小梯度噪声。对于 $d=5$ 表面码,单张 H200 显卡建议开启并行收缩以提高吞吐量。
4. 关键引用文献,以及对这项工作局限性的评论
4.1 关键引用文献
- Google Quantum AI (Nature 2021/2023) [4, 5]:提供了基准数据和关联分析方法的定义。
- Cao et al. (PRL 2025) [18]:本研究中重复码精确求解器(Planar Solver)的基础。
- Sivak et al. (PRL 2024) [9]:代表了强化学习在噪声估计领域的 SOTA 尝试,是本研究的主要竞争对比对象。
- Chubb (Annales Henri Poincaré 2021) [19]:奠定了量子纠错码与统计力学模型映射的理论框架。
4.2 局限性评论
尽管本工作在精确性和效率上取得了突破,但仍存在以下局限:
- 电路深度限制:目前在表面码上的精确计算仅验证到 $d=5$。随着距离 $d$ 继续增加(如 $d=15$),张量网络的收缩复杂度和树宽(Treewidth)可能会迅速增加,导致精确 MLE 难以为继,未来可能需要引入 MPS(矩阵乘积态)等近似收缩技术。
- 独立噪声假设:目前的 DEM 模型假设错误机制是相互独立的。然而在实际超导比特中,串扰(Crosstalk)和非马尔可夫噪声普遍存在。dMLE 需要扩展到包含关联错误项的超图模型才能完全描述这些现象。
- 静态噪声假设:该框架目前主要针对静态噪声参数进行离线训练。对于随时间漂移(Drift)的噪声,需要开发在线(Online)学习版本,以实时更新解码器的先验信息。
5. 补充内容:对量子化学模拟的启示
作为量子化学科研人员,我们必须意识到,量子化学算法(如 VQE 或基态能量制备)的精度不仅取决于变分电路的设计,更取决于纠错层的稳健性。dMLE 的贡献不仅在于提升了纠错成功率,更提供了一种高精度的原位(In-situ)诊断工具。
5.1 噪声感知的变分算法
通过 dMLE 提取的精确物理噪声参数,可以直接反馈到量子化学的噪声补偿(Noise Mitigation)算法中。例如,在推断出特定双比特门的读出噪声偏高后,我们可以调整变分电路的布局,规避低保真度的操作区域。这种“噪声感知”的协同设计是实现近期量子优势(NISQ)应用的关键。
5.2 逻辑算符的保真度评估
在计算分子能量时,逻辑量子比特的“纯度”决定了结果的置信度。dMLE 允许我们通过伴随式统计直接量化逻辑层面的有效噪声,这比通过复杂的量子态断层扫描(QST)要高效得多。对于需要极高精度的化学精度(1 kcal/mol)计算,这种底层噪声模型的精细调节将是必不可少的。