来源论文: https://arxiv.org/abs/2605.28040v1 生成时间: May 28, 2026 16:41

滤波器辅助量子子空间对角化(FSQD)深度解析:通过波函数稀疏性工程突破采样瓶颈

0. 执行摘要

在强关联量子多体系(如过渡金属催化剂、非常规超导体以及复杂的分子激发态)的模拟中,寻找基态能量和波函数是量子化学与凝聚态物理研究的圣杯。随着噪声中等规模量子(NISQ)时代的到来,变分量子本征求解器(VQE)等变分算法因其对硬件相干时间要求相对较低而备受关注。然而,VQE 在实际应用中面临着“贫瘠高原”(Barren Plateaus)以及繁重测量开销的严峻挑战。

作为一种极具前景的替代方案,基于量子采样的子空间对角化技术(如量子选择组态相互作用 QSCI 和采样量子对角化 SQD)近年来迅速崛起。这类方法的基本逻辑是:利用量子计算机强大的态准备和采样能力,在全希尔伯特空间中提取出最具代表性的计算基矢,然后在经典计算机上对投影后的子空间哈密顿矩阵进行精确对角化。这种“量子采样,经典对角化”的混合架构,不仅能确保本征值求解的变分收敛性,还极大地减轻了对量子相干门深度的依赖。

然而,传统的 SQD/QSCI 方法受制于一个根本性的物理痛点:采样效率与基态波函数稀疏性之间的固有权衡(Trade-off)。如果目标系统的基态波函数在计算基下高度稀疏(如弱关联系统),采样会频繁命中极少数的主导组态,导致难以探索到用于子空间扩展的新基矢;反之,若系统处于强关联区域,波函数极其弥散,此时要达到化学精度,子空间所需的维度 $N_R$ 和测量采样数 $N_S$ 将随系统尺寸呈指数级增长,使得量子优势荡然无存。

为了彻底解决这一瓶颈,日本理化学研究所(RIKEN)计算科学研究中心(R-CCS)的 Han Xu、Tomonori Shirakawa 和 Seiji Yunoki 等人在其最新力作中,提出了一种突破性的框架——滤波器辅助量子子空间对角化(Filter-Assisted Quantum Subspace Diagonalization, FSQD)。该方法首次引入了“波函数稀疏性工程”(Wavefunction Sparsity Engineering)的概念,通过在经典端利用张量网络(MPS)方法预先构建一个近似基态,并将其逆向转化为量子滤波器(Unitary Filter),对原始哈密顿量进行相似变换。这一变换将弥散的基态波函数重新浓缩(Concentrate)到极少数的计算基矢(主要是全零态 $|0\rangle^{\otimes n}$)上。为了攻克浓缩后导致子空间难以扩展的次级难题,研究团队进一步设计了“投影采样器”(Projected Sampler)技术,成功滤除了占绝对主导的全零态成分,使得采样能够高效探索高阶关联基矢。

本文将对该项工作进行全方位、深度的技术剖析,涵盖其底层数学原理、洛伦兹曲线与基尼系数的稀疏性度量理论、张量网络电路编码算法细节,以及在真实 IBM 100-Qubit 硬件(ibm_kobe)上的突破性实验表现,并客观探讨其当前的局限性与未来的量子化学应用前景。


1. 核心科学问题,理论基础,技术难点与方法细节

1.1 核心科学问题:稀疏性与采样效率的硬骨头

在标准采样子空间对角化(SQD)协议中,我们首先在量子处理器上准备一个近似基态 $|\tilde{\psi}_g\rangle$,并在计算基下进行 $N_S$ 次测量,得到一系列比特串。根据出现频率的高低,筛选出 $N_R$ 个最频繁的比特串(即最重要的 Slater 决定式或自旋组态),以此作为基矢构建一个截断的子空间。随后,在经典计算机上计算该子空间内的哈密顿矩阵元素 $H_{IJ} = \langle x_I | \hat{H} | x_J \rangle$ 和重叠矩阵元素 $S_{IJ} = \langle x_I | x_J \rangle$,并求解广义本征值问题:

$$\mathbf{H}\mathbf{C} = E \mathbf{S}\mathbf{C}$$

该方法的物理精度直接取决于所选子空间是否包含了基态波函数的大部分权重。这带来了一个棘手的两难境地:

  1. 极度稀疏极限:当基态波函数仅由极少数决定式主导(如接近 Hartree-Fock 状态)时,有限的采样 $N_S$ 会不断重复输出这几个主导比特串。此时,量子计算机很难通过采样产生新的、携带弱关联效应(如双激发项)的基矢来拓展子空间,导致动力学关联(Dynamical Correlation)难以被精确捕获。
  2. 弥散(强关联)极限:在强关联系统(如过渡金属氧化物或拉伸化学键)中,波函数在计算基下的分布极其平坦。此时,没有任何一个或几个组态占据主导地位。要收集到足够多的关联基矢以重建基态,所需的采样次数 $N_S$ 和对应的子空间大小 $N_R$ 都会随着系统比特数 $n$ 的增加而呈指数级飙升。此时,经典的对角化过程将因矩阵规模过大而崩溃,测量开销也将变得不可承受。

因此,如何打破采样概率分布与物理波函数自身分布的绑定,设计一个既能保持波函数高稀疏度、又能高效探测关键关联组态的采样策略,是量子子空间对角化走向实际应用的必答题。

1.2 理论基础:基于相似变换的哈密顿量滤波器

FSQD 的底层理论逻辑非常优雅。既然基态波函数在原始表象下太弥散或太局域都不利于采样,我们是否可以通过某种幺正变换,人工干预并重塑(Reshape)其采样概率分布?

根据量子力学的基本原理,物理可观测量的期望值(例如能量)在幺正相似变换下保持不变。如果我们设计一个幺正算符 $\hat{U}_Q$,将原始哈密顿量 $\hat{H}$ 变换为“滤波哈密顿量” $\hat{H}'$:

$$\hat{H}' = \hat{U}_Q^\dagger \hat{H} \hat{U}_Q$$

那么,滤波哈密顿量 $\hat{H}'$ 的基态波函数 $|\psi_g'\rangle$ 将与原始基态波函数 $|\psi_g\rangle$ 通过相同的幺正变换相联系:

$$|\psi_g'\rangle = \hat{U}_Q^\dagger |\psi_g\rangle$$

两者的基态能量本征值完全相同:$\langle \psi_g' | \hat{H}' | \psi_g' \rangle = \langle \psi_g | \hat{H} | \psi_g \rangle = E_0$。如果我们能够精心设计 $\hat{U}_Q$,使得变换后的基态波函数 $|\psi_g'\rangle$ 在计算基上表现出极其完美的高度稀疏性——即绝大部分概率权重都浓缩在全零态 $|0\rangle^{\otimes n}$ 上,那么我们就可以围绕 $|0\rangle^{\otimes n}$ 这个绝对核心,构建极度紧凑且高效的子空间。

在 FSQD 框架中,算符 $\hat{U}_Q$ 的物理意义就是量子滤波器(Quantum Filter)。只要我们先通过某种经典的近似方法(如张量网络 DMRG)计算出系统基态的一个粗糙近似 $|\psi_Q\rangle$,并将其编码为一个量子线路 $\hat{U}_Q |0\rangle = |\psi_Q\rangle$,那么其伴随算符 $\hat{U}_Q^\dagger$ 就能充当完美的逆向滤波器。当它作用于真实的强关联基态 $|\psi_g\rangle$ 时,就会把 $|\psi_g\rangle$ 中与 $|\psi_Q\rangle$ 重合的部分全部映射回 $|0\rangle^{\otimes n}$,而残余的微扰、高阶关联项则映射到靠近 $|0\rangle^{\otimes n}$ 的极少数激发态比特串上。这就完美实现了“波函数稀疏性工程”。

1.3 技术难点之一:零态独霸与“投影采样器”的引入

将波函数高度浓缩到 $|0\rangle^{\otimes n}$ 后,立刻会引发一个新的严重问题。由于滤波后的基态波函数 $|\psi_g'\rangle$ 中,全零态 $|0\rangle$ 占据了压倒性的权重(例如 $>95\%$),如果我们直接对变换后的采样器状态 $|\tilde{\psi}_g'\rangle = \hat{U}_Q^\dagger |\tilde{\psi}_g\rangle$ 进行物理测量,几乎每一次采样返回的都是全零串 000...00。这导致采样效率降到冰点,量子计算器无法通过采样发掘出那些隐藏在低概率区、但对关联能量至关重要的微扰比特串 $x_I \neq 0$。

为了攻克这一由稀疏度过高引发的“零态独霸”难点,作者提出了一种极其巧妙的投影分解架构。首先,我们引入一个非幺正的投影算符 $\hat{P}_{|\bar{0}\rangle}$,它负责将全零态 $|0\rangle\langle 0|$ 从全空间中滤除:

$$\hat{P}_{|\bar{0}\rangle} = \hat{I} - |0\rangle\langle 0|$$

通过在相似变换公式中插入完备性关系 $\hat{I} = |0\rangle\langle 0| + \hat{P}_{|\bar{0}\rangle}$,我们可以将滤波哈密顿量的期望值精确重构为:

$$\langle \psi_g | \hat{H} | \psi_g \rangle = \langle \psi_g' | \hat{H}' | \psi_g' \rangle = \langle \psi_g' | \hat{H}' | 0\rangle\langle 0 | \psi_g' \rangle + \langle \psi_g' | \hat{H}' \hat{P}_{|\bar{0}\rangle} | \psi_g' \rangle$$

这一公式在物理上意味着:我们可以将子空间对角化分为两个独立的角色:

  1. 固定的核心基矢:始终手动将全零态 $|0\rangle$ 纳入子空间(承载最主要的一阶能量近似)。
  2. 扩展的关联基矢:通过采样投影后的状态 $\hat{P}_{|\bar{0}\rangle} |\psi_g'\rangle$(即滤除了 $|0\rangle$ 后的状态)来发掘。由于最强大的全零态信号被物理性地屏蔽了,投影采样器将被迫探索那些原本被全零态压制、带有物理关联特征的其他比特串 $x_I \neq 0$。

在硬件实现上,非幺正投影算符 $\hat{P}_{|\bar{0}\rangle}$ 无法直接由单一量子门执行。作者提出了三种在 NISQ 硬件上可行的变通路径(如图1所示):

  • 块编码(Block-Encoding):将非幺正算符嵌入到一个高维的辅助幺正算符中,在硬件上通过辅助比特测量实现对投影状态的制备。

  • 变分 Ansatz 拟合:直接构建一个变分状态 $|\Psi_s\rangle$,通过经典优化手段,使其逼近归一化后的投影状态 $\mathcal{N} \hat{P}_{|\bar{0}\rangle} \hat{U}_Q^\dagger |\tilde{\psi}_g\rangle$。

  • 幺正投影逼近(Unitary Projection Approximation):寻找一个幺正算符 $\hat{U}_{|\bar{0}\rangle}$,使得其作用在滤波状态上时,最大程度地重合于投影过滤后的目标状态:

    $$\hat{U}_{|\bar{0}\rangle} \hat{U}_Q^\dagger |\tilde{\psi}_g\rangle \approx \mathcal{N} \hat{P}_{|\bar{0}\rangle} \hat{U}_Q^\dagger |\tilde{\psi}_g\rangle$$

通过这套投影采样技术,FSQD 彻底消除了采样阶段的冗余,实现了前所未有的高关联比特串搜索效率。

1.4 技术难点之二:洛伦兹曲线与基尼系数的数学定边界

为了给 FSQD 提供坚实的理论基石,必须量化“波函数稀疏性”与“SQD 算法计算资源(子空间维度 $N_R$ 和测量采样数 $N_S$)”之间的对应关系。为此,作者从经济学中的贫富差距度量工具中汲取灵感,首次将**洛伦兹曲线(Lorenz Curve)基尼系数(Gini Coefficient)**引入到量子信息领域。

设一个 $n$ 比特系统的波函数在计算基下展开为 $|\psi\rangle = \sum_{I=1}^{N} c_I |x_I\rangle$,其中 $N=2^n$。我们将所有的测量概率 $p_I = |c_I|^2$ 按非递减顺序排列:

$$p_1 \le p_2 \le \dots \le p_N$$

定义其累积概率权重函数 $L(x)$ 为:

$$L\left(\frac{I}{N}\right) = \sum_{J=1}^I |c_J|^2, \quad L(0) = 0$$

绘制出以 $x=I/N$ 为横轴、以 $L(x)$ 为纵轴的曲线,即为该量子态的洛伦兹曲线(如图2所示)。如果量子态是最大均匀叠加态 $|+\rangle^{\otimes n}$,其洛伦兹曲线就是斜率为 1 的对角线(绝对平等线);而如果量子态是极度稀疏的单计算基态,其曲线将无限贴近横轴,并在 $x=1$ 处陡峭升至 1。

基尼系数 $G$ 则定义为对角线与洛伦兹曲线之间面积的两倍:

$$G = 1 - 2 \sum_{I=1}^N |c_I|^2 \left( \frac{N - I + 1/2}{N} \right)$$

基尼系数 $G \in [0, 1 - 2^{-n}]$。$G$ 越接近 1,代表波函数稀疏度越高,概率分布越集中。基于这一数学框架,作者推导出了至关重要的 Theorem 1 及其推论 Corollary 1.1。设目标能量估算精度为 $\varepsilon$,系统谱范数为 $\rho(\hat{H})$,定义无量纲误差 $\tilde{\varepsilon} = \varepsilon / (2\sqrt{2}\rho(\hat{H}))$,则保证 SQD 偏离度 $\Delta_{SQD} \le \varepsilon$ 的子空间维度 $N_R$ 理论下限以及测量采样数 $N_S$ 的理论下限满足:

$$N_R \ge (1 - G) N (1 - \tilde{\varepsilon}^2)$$$$N_S \ge (1 - G) N (1 - \tilde{\varepsilon}^2) \log \left[ \frac{(1 - G) N (1 - \tilde{\varepsilon}^2)}{\eta} \right]$$

其中 $1-\eta$ 为置信概率。这两个极其关键的数学不等式,无情地揭示了为什么标准 SQD 在强关联系统下会面临指数崩溃:因为随着比特数 $n$ 增加,其波函数的基尼系数 $G(n)$ 随之衰减,导致关键项 $(1-G)N$ 呈指数级增长 $2^{gn}$(对于一维 Ising 模型,$g \approx 0.7$)。而 FSQD 的物理本质,就是通过幺正滤波器将基尼系数 $G$ 强行拉高到极度逼近 1 的极限,使得 $1-G \approx 2^{-n}$,从而将 $(1-G)N$ 降为常数,彻底抹平了资源开销的指数墙!

1.5 方法细节:基于矩阵乘积态(MPS)的量子线路自动编码算法

为了在经典端快速计算出作为滤波器的幺正算符 $\hat{U}_Q$,作者采用了一种优雅的张量网络到量子线路的映射算法(如算法1及图3所示)。

  1. 步骤一:DMRG 获取目标 MPS: 首先利用经典密度矩阵重整化群(DMRG)方法,在有限键维度 $\chi$ 下求解原始哈密顿量 $\hat{H}$ 的近似基态,得到其矩阵乘积态(MPS)表示 $|\psi_{MPS}\rangle$。

  2. 步骤二:双向扫频变分优化(Bidirectional Sweep): 我们构建一个由局部双量子位幺正门 $\hat{U}_m$ 组成的砖墙(Brick-wall)结构量子线路 $C_{MPS}$。优化的目标是让全零初态经此线路作用后,与目标态 $|\psi_{MPS}\rangle$ 的重叠(Fidelity)达到最大,即最大化:

    $$f_m = \text{tr} (\hat{F}_m \hat{U}_m)$$

    其中,保真度张量 $\hat{F}_m$ 定义为滤除第 $m$ 个局部幺正门后,左侧已收缩状态 $|\Psi_m^L\rangle$ 与右侧目标状态 $|\Psi_m^R\rangle$ 的重叠。通过对 $F_m$ 进行奇异值分解(SVD):

    $$F_m = X D Y$$

    我们可以得到局部最优幺正更新公式:

    $$U_m = Y^\dagger X^\dagger$$

    在经典端交替进行前向(Forward)和后向(Backward)扫频迭代,直至保真度收敛(通常一到两层砖墙线路即可达到极高保真度,如图9所示)。最后,所得的 $C_{MPS}$ 其逆电路 $C_{MPS}^\dagger$ 即作为量子滤波器 $\hat{U}_Q^\dagger$ 部署在硬件上。


2. 关键 Benchmark 体系、计算数据与性能分析

2.1 测试基准:一维强关联横向/纵向场量子 Ising 模型

为了对 FSQD 协议进行最严苛的物理检验,研究团队选择了具有开放边界条件(OBC)的一维自旋-1/2 横向及纵向场量子 Ising 模型。该模型的哈密顿量形式为:

$$\hat{H} = -J \sum_i \hat{\sigma}_z^i \hat{\sigma}_z^{i+1} - h^x \sum_i \hat{\sigma}_x^i - h^z \sum_i \hat{\sigma}_z^i$$
  • 参数设置:固定最近邻铁磁耦合强度 $J = 1$,横场强度 $h^x = 1$,纵场微扰强度 $h^z = 0.05$。
  • 物理特性:当 $h^z = 0$ 且 $h^x = J = 1$ 时,系统处于经典的量子临界点。纵向场 $h^z$ 的引入不仅打破了该模型的自由费米子可积性,还诱发了极其复杂的强关联自旋激发动力学。该体系在临界区附近具有极高的纠缠度和非平凡的量子涨落,是检验波函数稀疏化算法性能的完美试金石。

2.2 稀疏性工程性能:基尼系数与逆洛连兹曲线的非凡表现

研究团队首先在数值模拟中评估了滤波变换对基态波函数稀疏性的重塑效果。计算了比特数 $n = 12 \sim 24$ 的基尼系数偏离度 $1 - G$ 随系统尺寸的变化(如图5(a)所示):

  • 原始基态 $|\psi_g\rangle$:其偏离度遵循典型的指数增长规律:$(1 - G)N \propto 2^{0.7n}$。这意味着,若不采用任何滤波器,子空间扩展所需的物理资源必然随系统尺寸指数级膨胀,直接证实了传统 SQD 的局限。
  • 单层滤波器 $U_{MPS,I}$ 的滤波基态:其 $1-G$ 的增长趋势被显著压制,表现出极弱的尺寸依赖性。
  • 双层滤波器 $U_{MPS,II}$ 的滤波基态:其数值极其惊人,完美贴合了极稀疏极限的理论底线($G = 1 - 2^{-n}$,即图中黑虚线),表明几乎整个波函数的权重都被完美地浓缩到了单个零态分量上!

图5(b)展示了逆洛伦兹曲线 $1 - L^{-1}(\tilde{\varepsilon}^2)$ 在不同精度要求下的缩放行为。对于标准 SQD,随着误差限制 $\tilde{\varepsilon}^2$ 的降低,所需子空间维度 $N_R$ 迅速逼近全希尔伯特空间维度 $N$(对应参数 $g \to 1$);而在 FSQD 的辅助下,即便对于极高精度的物理要求(如 $\tilde{\varepsilon}^2 \le 10^{-6}$),在极宽的比特数范围内,$g$ 参数依然能保持在接近 0 的极低水平。这直接证明了 FSQD 成功地将一个指数级困难的采样问题转化为弱尺寸依赖的准常数级任务。

2.3 能量收敛速度与衰减指数 $\tau$ 的数量级超越

接下来,研究团队在无噪声数值模拟中,对比了不同协议下基态能量估算绝对误差 $\epsilon = E_{SQD} - E_{exact}$ 随测量采样数 $N_S$ 的收敛曲线(如图6(a)-(c)所示,涉及 $n=20, 50, 100$ 三种尺度):

  • 误差收敛拟合:采用经典经验公式 $\epsilon/n \propto N_S^{-\tau}$ 对采样大于 1000 次之后的区域进行拟合。衰减指数 $\tau$ 越大,代表采样收敛速度越快。
  • 数据对比(见表1经典模拟部分)
    • 在 $n=100$ 的超大尺寸下,标准 SQD 的能量误差在达到 $N_S=10^5$ 时依然高达 $\sim 10^{-1}$ 量级,其衰减指数 $\tau$ 已经衰减到几近于零的 0.04(2),意味着继续增加采样已几乎无法提高精度。
    • 相比之下,配合单层投影滤波器 $P_{|\bar{0}\rangle}U_{MPS,I}^\dagger$ 的 FSQD,在相同采样数下的能量误差直接暴跌了 2 到 3 个数量级,其 $\tau$ 指数仍高达 0.195(2)
    • 而采用双层投影滤波器 $P_{|\bar{0}\rangle}U_{MPS,II}^\dagger$ 的 FSQD,其收敛速度表现更是堪称惊艳。在所有测试尺度($n=20, 50, 100$)下,其 $\tau$ 指数均雷打不动地保持在 0.518(4) 到 0.559(5) 之间的极高水平。这意味着,FSQD 的能量误差收敛效率不仅比传统 SQD 快了一个数量级,而且其收敛效率完全不随系统尺寸的增加而退化!

2.4 能量-方差外推(Energy-Variance Extrapolation)的精细化验证

在量子蒙特卡洛及张量网络计算中,利用能量关于哈密顿量方差 $\text{Var}(H) = \langle \nu_0 | \hat{H}^2 | \nu_0 \rangle - \langle \nu_0 | \hat{H} | \nu_0 \rangle^2$ 的线性或二次关系进行外推,是获取无限精确本征值的重要物理手段。研究团队对 $n=100$ 系统的数值模拟数据进行了系统的方差外推分析(如图7所示):

  • 标准 SQD:由于波函数采样严重不充分,即使在最大采样下,子空间基态的方差依然极大($\sim 1.0$),且外推所得零方差截距具有极大的不确定性($\epsilon_0/n = -0.113 \pm 0.007$),无法提供任何物理可信的预测。
  • 单层 / 双层 FSQD:子空间基态方差被直接压制到 $10^{-3}$ 甚至 $10^{-4}$ 以下。通过极其稳健的二次外推,外推能量误差直接收敛至令人叹为观止的极高精度:
    • 单层 FSQD 外推残余误差:$\epsilon_0/n = (0.56 \pm 1.99) \times 10^{-7}$
    • 双层 FSQD 外推残余误差:$\epsilon_0/n = (-1.28 \pm 1.30) \times 10^{-5}$

这一结果表明,FSQD 与能量-方差外推技术的结合,能够以极低的测量代价,榨取出几近完美的基态能量。

2.5 100比特真实量子处理器(ibm_kobe)实验结果

为了验证该算法在真实喧嚣量子硬件上的生存能力,研究团队在 IBM Heron R2 处理器 ibm_kobe 上对 $n = 20, 50, 100$ 系统进行了全流程的实验部署。由于真实 QPU 上存在物理噪声,团队测试了四种不同的采样器构造:

  1. 标准 SQD:准备近似基态 $|\tilde{\psi}_g\rangle$ 并直接采样。
  2. 直接过滤采样器(直接 FSQD):未进行零态投影的状态 $\hat{U}_{MPS,I}^\dagger |\tilde{\psi}_g\rangle$。
  3. 幺正逼近投影采样器:通过幺正逼近非幺正投影的序列编码状态 $\hat{U}_{|\bar{0}\rangle}\hat{U}_{MPS,I}^\dagger |\tilde{\psi}_g\rangle$。
  4. 直接编码投影采样器:直接变分构建的归一化投影状态 $|\Psi_s\rangle$。

表1:能量估算误差衰减指数 $\tau$ 的实验与模拟对比表

算法协议采样器构造 (Sampler)$n = 20$$n = 50$$n = 100$
数值模拟
标准 SQD$\psi_g\rangle$0.235(7)0.120(5)
FSQD$P_{\bar{0}\rangle}U_{MPS,I}^\dagger |\psi_g\rangle$0.40(2)0.274(4)
FSQD$P_{\bar{0}\rangle}U_{MPS,II}^\dagger |\psi_g\rangle$0.559(5)0.553(8)
QPU 实验 (ibm_kobe)
标准 SQD$\tilde{\psi}_g\rangle$0.328(3)0.149(7)
直接 FSQD$\hat{U}_{MPS,I}^\dagger \|\tilde{\psi}_g\rangle$0.68(3)0.51(3)0.18(2)
投影 FSQD (幺正逼近)$\hat{U}_{\bar{0}\rangle}\hat{U}_{MPS,I}^\dagger |\tilde{\psi}_g\rangle$0.62(2)0.57(2)
投影 FSQD (直接变分)$\Psi_s\rangle$0.60(3)0.61(4)

实验数据深度剖析(如图8所示):

  • 20-Qubit 极精细控制:在 $n=20$ 的小尺度下,两种投影采样器(直接变分 $|\Psi_s\rangle$ 和幺正逼近型)表现出无可争议的优越性,能量误差显著低于未投影的直接过滤采样器。这印证了滤除全零态对于提升小尺度硬件子空间发掘效率的价值。
  • 50-Qubit 规模化显威:在 $n=50$ 的中等规模下,所有 FSQD 变体均对标准 SQD 实现了降维打击。标准 SQD 的收敛指数 $\tau$ 已跌至 0.149(7),而直接变分投影 FSQD $|\Psi_s\rangle$ 的 $\tau$ 指数仍旧高悬在 0.61(4),能量精度领先标准方法近两个数量级。
  • 100-Qubit 百比特大考:当面临 100 比特的硬件大考时,情况发生了微妙且极其有趣的物理转变。此时,由于硬件噪声(退相干、电荷涨落和交叉存取误差等)的累积,复杂的投影采样器由于增加了额外的量子门操作(如图13所示,其 CZ 门数和电路深度均高于不带投影的直接过滤状态),其门误差累积逐渐掩盖了理论上的投影优势。令人意外的是,最简单的直接过滤采样器 $\hat{U}_{MPS,I}^\dagger |\tilde{\psi}_g\rangle$ 在 $n=100$ 下取得了全场最佳的实验表现,其 $\tau$ 指数仍保持在 0.18(2),而此时的标准 SQD 指数已彻底归零(0.002(2))。这主要是因为在极度嘈杂的硬件环境下,自然存在的环境噪声在某种程度上充当了“去相干和概率平滑剂”的角色,自然地帮我们拓宽了未投影状态的采样分布,反而促成了最优的子空间扩展。这一发现为 NISQ 时代的算法选择提供了极其重要且宝贵的工程实践启示。

3. 代码实现细节、复现指南与开源工具链

要复现本项工作所展示的卓越性能,需要搭建一套无缝衔接经典高精度张量网络模拟与量子硬件编译运行的软件流水线。以下是基于论文提供的方法学所整理的系统级复现指南。

3.1 经典前处理模块:基于 Julia ITensors.jl 的高精度 DMRG 求解与 MPS 提取

首先,在经典端我们需要对目标 1D 强关联量子 Ising 模型进行精确求解以获取其 MPS 表示。Julia 语言的 ITensors.jl 软件包是目前执行此类任务效率最高、底层优化最成熟的平台。

核心复现步骤代码逻辑(Julia):

using ITensors

function solve_ising_mps(n::Int, J::Float64, hx::Float64, hz::Float64; maxdim=20)
    # 1. 构造一维自旋 1/2 希尔伯特空间位置基矢
    sites = siteinds("S=1/2", n; conserve_qns=false)
    
    # 2. 运用 OpSum 构建横向和纵向场磁性哈密顿量
    am = OpSum()
    for j in 1:(n-1)
        am += -J, "Sz", j, "Sz", j+1
    end
    for j in 1:n
        am += -hx, "Sx", j
        am += -hz, "Sz", j
    end
    H = MPO(am, sites)
    
    # 3. 设置高精度 DMRG 收敛参数扫频步数
    sweeps = Sweeps(6)
    maxdim!(sweeps, 10, 20, maxdim)
    cutoff!(sweeps, 1e-12)
    
    # 4. 执行 DMRG 本征求解,提取高保真基态 MPS
    init_state = [isodd(n) ? "Up" : "Dn" for n in 1:n]
    psi_init = MPS(sites, init_state)
    energy, psi_mps = dmrg(H, psi_init, sweeps)
    
    return psi_mps, sites, H
end

3.2 滤波器电路变分编码模块:实现双向扫频 SVD 更新(Algorithm 1)

在获得高精度 MPS 后,需要执行论文核心的 Algorithm 1,将该状态变分编码到砖墙结构的幺正量子电路上。

双向扫频优化的核心 Python/Julia 实现逻辑:

# 双向扫频算法 1 (Algorithm 1) 伪代码算法核
function bidirectional_mps_circuit_encoding(psi_mps::MPS, sites; num_layers=2, n_iter=10)
    n = length(psi_mps)
    # 初始化所有局部双量子位幺正门为单位矩阵
    M_gates = (n - 1) * num_layers
    U_gates = [Matrix{ComplexF64}(I, 4, 4) for m in 1:M_gates]
    
    # 构建左右环境边界张量 Psi_L 和 Psi_R
    # Psi_L[1] 初始化为 |000...0>
    # Psi_R[M] 初始化为 <psi_mps|
    
    for iter in 1:n_iter
        # 前向扫频 (Forward Sweep)
        for m in 1:M_gates
            # A. 收缩环境张量,提取局部保真度算符 F_m
            # F_m = contract(Psi_L[m], Psi_R[m+1] ...)
            
            # B. 对 4x4 的矩阵表示 Fm 进行标准 SVD 分解
            # X, D, Y = svd(Fm)
            
            # C. 运用极值定理,更新第 m 个局部幺正门电路参数
            # U_gates[m] = Y' * X'
            
            # D. 更新前向边界状态 Psi_L[m+1]
        end
        
        # 后向扫频 (Backward Sweep)
        for m in M_gates:-1:1
            # 执行完全对称的逆向 SVD 更新过程
            # U_gates[m] = Y' * X'
            # 更新后向边界状态 Psi_R[m]
        end
    end
    return U_gates
end

3.3 量子硬件端编译运行:基于 IBM Qiskit 的转译优化

在获得优化后的 $\{U_m\}$ 门集合后,需要通过 IBM Qiskit 工具链将其转译(Transpile)为 ibm_kobe Heron R2 处理器的原生单位旋转门(如 $\text{R}_z$, $\text{R}_x$)及两电极物理 CZ 门。

  • 编译推荐指令

    from qiskit import transpile
    from qiskit_ibm_runtime import QiskitRuntimeService
    
    # 1. 载入云端高性能量子计算服务
    service = QiskitRuntimeService()
    backend = service.backend("ibm_kobe")
    
    # 2. 调用三级极致转译器优化物理门数量和电路深度
    transpiled_qc = transpile(your_fsqd_circuit, 
                              backend=backend, 
                              optimization_level=3, 
                              seed_transpiler=42)
    
  • 重要开源工具及软件包仓库链接

    1. ITensors.jl (Julia Tensor Network Library) —— 用于超高效率运行 DMRG 并获取基础物理 MPS 状态的最优工具。
    2. Qiskit SDK —— IBM 官方开源量子程序开发包,用于物理硬件编译、优化和误差抑制措施(如 Dynamical Decoupling)的部署。

4. 关键引用文献与前沿批判性学术评论

4.1 核心引用文献

  1. QSCI (Quantum Selected Configuration Interaction):
    • K. Kanno, et al., “Quantum-selected configuration interaction: classical diagonalization of Hamiltonians in subspaces selected by quantum computers,” arXiv:2302.11320 (2023). [Ref 18]
  2. SQD (Sample-based Quantum Diagonalization):
    • J. Robledo-Moreno, et al., “Chemistry beyond the scale of exact diagonalization on a quantum-centric supercomputer,” Sci. Adv. 11, eadu9991 (2025). [Ref 19]
  3. MPS-based Circuit Encoding:
    • T. Shirakawa, H. Ueda, and S. Yunoki, “Automatic quantum circuit encoding of a given arbitrary quantum state,” Phys. Rev. Res. 6, 043008 (2024). [Ref 38]
  4. Lorenz Curve & Gini Coefficient in Economy:
    • M. O. Lorenz, “Methods of measuring the concentration of wealth,” J. Am. Stat. Assoc. 9, 209 (1905). [Ref 32]
    • C. Gini, “Measurement of inequality of incomes,” Econ. J. 31, 124 (1921). [Ref 34]

4.2 深度学术评论与技术局限性分析

尽管 FSQD 协议在这一论文中展现出了无与伦比的理论优雅度和令人瞩目的百比特硬件表现,但本着客观严谨的学术态度,我们必须指出,在将其全面推广到复杂的真实量子化学计算(如过渡金属催化剂主活性空间的非绝热本征求解)之前,该方案仍面临着以下几项本质性的技术制约:

1. 经典前处理“套牢”:对 DMRG 初始态质量的严重依赖性

FSQD 算法的核心优势建立在经典端能够先算出一个“足够合理”的近似 MPS 的前提之上。如果我们面对的是纠缠度极高的二维体系(PEPS 难以处理的极限)或极高维度的三维活性空间,经典的 DMRG 在处理这类非一维拓扑结构的强关联系统时,由于键维度 $\chi$ 指数级爆炸而难以获得可靠的基态 MPS。如果初始的 $U_{MPS}$ 滤波器质量低下,相似变换后的滤波基态波函数 $|\psi_g'\rangle$ 就无法在计算基下有效浓缩至全零态附近,导致基尼系数 $G$ 无法显著拉升。在这样的场景下,该算法对标准 SQD 的超越幅度将会急剧收缩。这给算法的实用化打上了一个问号:如果一个系统我们已经能用经典 DMRG 解得很好了,我们何苦还要大费周折地搬到量子计算机上去做 FSQD?

  • 学术辩解:作者指出,FSQD 的核心在于量子计算机上对子空间的进一步扩展。即使经典 MPS 丢失了高阶动力学关联(如活性空间外的弱电子关联),量子计算机上的采样依然能够发掘这部分经典手段难以覆盖的关联能,起到“点石成金”的修正作用。

2. 非幺正投影操作的硬件开销权衡

为了滤除过分庞大的全零态信号,方案必须引入投影步骤。但无论是在硬件上运行辅助比特测量块编码,还是运行近似幺正变换,都会在无形中成倍地增加量子线路的相干门深度。如本项工作在 100 位的 IBM QPU 实验中显现出来的规律:随着量子芯片规模扩大,投影采样器由于增加了物理电路深度,在目前的超导硬件相干时间和门保真度水平下,噪声引起的错误反而比未投影的直接 FSQD 还要严重。这种“物理效果被硬件噪声反噬”的尴尬物理现状,极大程度上限制了高纯度投影技术在当前 NISQ 阶段大显身手。

3. 哈密顿矩阵元素评估的测量开销挑战

这也是所有子空间对角化(包括 SQD, QSCI)的共性顽疾。即使子空间维度 $N_R$ 可以被 FSQD 极好地限制在极小的规模(例如数十到上百),但在子空间中,我们依然需要精确测量矩阵元素 $H'_{IJ} = \langle x_I | \hat{H}' | x_J \rangle$。虽然 $\hat{H}'$ 是通过张量网络转译的 MPO 形式,但随着比特数增加,这些非对角元素测量的全流程开销仍然不菲。特别是在真实的化学分子哈密顿量中,涉及极其复杂的二体轨道库仑积分项,如何设计高效的量子态重叠测量线路(Overlap Measurement Circuits)依然是后续亟待深入探索的硬工程课题。


5. 补充:数学定理证明与量子化学应用前瞻

5.1 附录定理证明细化推导:子空间能量单调下降性(Appendix A)

为了巩固读者对子空间对角化变分保证的信心,本节对论文 Appendix A 关于子空间维度 $N_R \to N_R + 1$ 时基态能量估计值的单调不增性进行详细推导。

设在 $N_R$ 维度的已采样分子轨道子空间下,截断哈密顿矩阵表示为 $H_{N_R}$,其本征值升序排列为:

$$E_0 \le E_1 \le \dots \le E_{N_R-1}$$

对应的最小能量本征态对应为 $|\nu_0\rangle$。现在,通过量子采样发现了一个全新的激发态比特串(记为第 $N_R+1$ 个基矢 $\vec{e}_{N_R+1}$)。以此扩展后的扩展哈密顿矩阵 $H_{N_R+1}$ 可分块写为:

$$H_{N_R+1} = \begin{pmatrix} H_{N_R} & \vec{h} \\ \vec{h}^\dagger & a_1 \end{pmatrix}$$

其中,分块边缘耦合元素为 $a_1 = \vec{e}_{N_R+1}^\dagger \hat{H} \vec{e}_{N_R+1}$,耦合相互作用项为 $\vec{h} = H \vec{e}_{N_R+1}$。我们定义此时的初始变分态 $|\nu_0\rangle$ 能量为 $a_0 = \langle \nu_0 | \hat{H} | \nu_0 \rangle = E_0$。通过构建与之相连的二维 Krylov 子空间:

$$\text{span}(\{ |\nu_0\rangle, \hat{H} |\nu_0\rangle \})$$

并在该二维子空间内对哈密顿量进行重新投影投影对角化,其局部投影矩阵形式为:

$$H_{Krylov} = \begin{pmatrix} a_0 & b_1 \\ b_1 & a_1 \end{pmatrix}$$

其中耦合积分项 $b_1 = \langle \nu_1 | \hat{H} | \nu_0\rangle$。该 2x2 矩阵的最小特征值为:

$$\check{E}_0 = \frac{1}{2} \left[ a_0 + a_1 - \sqrt{(a_0 - a_1)^2 + 4b_1^2} \right]$$

利用数学不等式 $\sqrt{(a_0 - a_1)^2 + 4b_1^2} \ge |a_0 - a_1|$,容易得到:

$$\check{E}_0 \le \frac{1}{2} \left[ a_0 + a_1 - |a_0 - a_1| \right] = \min(a_0, a_1) \le a_0 = E_0$$

由于真正的扩展大子空间特征值 $E_{0, N_R+1}^{new}$ 的变分界必然低于或等于这一在 Krylov 二维约束子空间下的局部本征值 $\check{E}_0$,因此有:

$$E_{0, N_R+1}^{new} \le \check{E}_0 \le E_0$$

由此用严格的变分法证明了,每多加入一个采样基矢,对角化获得的基态能量只能单调下降或保持不变,绝对不会出现向高能漂移的现象。这也确保了该技术在实际计算中对高阶激发态和微扰能捕获的物理稳定性。

5.2 前沿应用前瞻:在分子强关联体系中的融合策略

尽管本文以 1D 量子 Ising 模型为主要评测体系,但 FSQD 背后展现的物理思想,与量子化学中的强关联问题(如活性空间方法 Active Space Methods)具有极其天然的契合度:

  • CASSCF 结合的前瞻蓝图:在多组态自发场(CASSCF)计算中,经典计算机通常只能处理极小的主活性空间(如 $\text{CAS}(12, 12)$),对于更外层的虚轨道弱纠缠,由于物理空间维度过大而无能为力。此时,我们可以先在经典端基于主活性空间跑一个有限尺寸的 DMRG 或 MPS 近似,然后以此构造幺正滤波器 $\hat{U}_Q$。接着,在量子计算机上将全空间哈密顿量(包含活性空间外的全部弱关联轨道)进行滤波相似变换。最后,在不显著增加硬件电路深度的前提下,通过量子采样,迅速在全体系中筛选出与主活性空间强关联轨道产生物理耦合的外围高激发轨道组态,在量子化学领域带来历史性的精度突破。
  • 多电子化学分子复现展望:未来,基于本文所论述的 Gini 系数度量,我们可以对特定的化学分子(如固氮酶中的铁硫簇 $\text{Fe}_4\text{S}_4$ 或过渡金属配合物)进行波函数稀疏度评估,从而根据基尼系数偏离度精确估算出要在化学精度的前提下复现分子基态所需的量子比特数和测量射数。这将极大推进量子计算在药物分子合成和新能源催化剂筛选领域的工业化落地进程。