来源论文: https://arxiv.org/abs/2606.05050v1 生成时间: Jun 08, 2026 07:24

0. 执行摘要

多相催化（Heterogeneous Catalysis）是现代化学工业的支柱，支撑着全球 80% 以上的化学品生产流程。然而，传统的“试错型”催化剂研发模式高度依赖实验学家的经验和漫长的合成-测试循环，单个催化剂候选者的筛选往往耗时数月。尽管在过去二十年中，基于密度泛函理论（DFT）的计算催化和近年来兴起的机器学习原子间相互作用势（MLIP）为高通量筛选提供了新工具，但在物理保真度和自动化程度之间仍存在巨大的鸿沟：

缺乏条件感知与物理一致性（Coherence）：实际工作中的催化剂表面并非一成不变的“静态晶面”。在反应温度、反应物分压、外加电极电势和 pH 值等复杂工况下，催化剂表面会发生自发重构、吸附质诱导重构、甚至相变。现有的点源计算工具（如单纯的吸附能计算或过渡态搜索）彼此孤立，无法将工况状态在全链路中进行物理一致的传导。
计算复杂度的指数级攀升（Scalability）：一个真实的催化反应网络（CRN）往往包含数十到数千个中间体及反应通道。传统的反应路径搜索要么依赖人工主观指定（极易遗漏非canonical路径），要么依赖穷举法（穷举松弛与过渡态计算的成本随着化学空间维度呈指数级爆炸）。

针对上述挑战，来自香港科技大学的宋执龙、张宗敏和程理雪（Lixue Cheng）等人在最新工作中推出了 CatDT（Catalysis Digital Twin）——一个全新的自演化多智能体数字孪生系统。该系统首次统一了气-固（热催化）和液-固（电催化）的端到端物理模拟，仅需输入本体晶体结构（Bulk Crystal）和自然语言反应描述，即可在单张 GPU 上于 5 至 30 分钟内完成高保真度的催化剂行为模拟。

CatDT 搭载了 8 个高度专业化的 AI 智能体和 27 个确定性科学计算工具。为了突破多相催化模拟中的核心瓶颈，研究团队引入了两个里程碑式的技术创新：

UniMech（通用机构搜索引擎）：采用“智能体引导提案（LLM-guided proposal）”与“基于能量缓存的图搜索（Energy-cached graph search）”融合策略，对反应网络进行剪枝。在保留关键反应路径的同时，将能量评估次数降低了 3 个数量级以上（在 C6 费托合成体系中实现了 >1000 倍的计算成本缩减）。
记忆增强强化学习循环（Memory-augmented RL Loop）：基于 Memento 框架，赋予几何设计智能体持久性的外部案例库和反思机制。在 600 个异构催化表面的复杂过渡态（NEB）计算中，将端点构建的成功率从 41% 飙升至 84%，实现了跨运行的自主经验积累与性能演化。

在包括阶梯金属、单原子催化剂（SAC）、有序金属间化合物（IMC）、富缺陷二维硫化物、二维碳化物以及强金属-载体相互作用（SMSI）界面在内的 7 个严苛的气-固热催化基准（Benchmark）测试中，CatDT 的所有预测动力学观测量（TOF、活化能、选择性、产物比例等）均落在与实验值相差 0.5 到 2 倍的极窄区间内。进一步地，CatDT 作为闭环设计引擎，自主发现并设计了一系列非贵金属丙烷脱氢（PDH）催化剂，其中预测的 Ni@ZrO2 SMSI 包覆层催化剂表现出卓越的活性（TOF = 1.63 s^-1）和 ~100% 的丙烯选择性，性价比比工业 PtSn 标杆提升了 162 倍。这一成果标志着多相催化计算正式跨入“全自主数字孪生”的新时代。

1. 核心科学问题，理论基础，技术难点，方法细节

1.1 核心科学问题与技术挑战

在多相催化的计算模拟中，要建立一个能够与真实反应釜（Reactor）对齐的“数字孪生”，必须克服以下三个底层的科学与工程瓶颈：

表面动力学演化与吸附质共存的多尺度耦合：真实的催化剂表面处于热力学开放体系中。温度 $T$、压力 $P$、电极电势 $U$ 以及 $pH$ 会不断改变表面的物相分布。例如，在电催化条件下，过渡金属表面会发生电化学氧化或羟基化重构；在热催化高压下，吸附质的局部覆盖度（Coverage）会引发吸附质-吸附质横向相互作用（Lateral Interactions），导致吸附位点和吸附能的漂移。若不进行巨正则系综下的动态模拟，直接采用切片晶面进行催化评价，计算结果往往与实验大相径庭。
过渡态（Transition State, TS）搜索的端点构建难题：反应活化能（$E_\text{a}$）是决定反应速率和选择性的指数项（依据阿伦尼乌斯定律 $\text{k} \propto e^{-E_\text{a}/k_\text{B}T}$）。利用爬坡微扰弹性带（CI-NEB）或慢生长分子动力学（Slow-growth MD）寻找过渡态时，计算的收敛性高度依赖于初态（IS）和末态（FS）几何构型的合理性。在复杂的非对称表面（如高指数晶面、多缺陷表面或合金界面）上，如何自动确定反应分子在脱氢、加氢或断键前后的确切吸附位点与三维朝向，是目前计算催化中最耗费人力、失败率最高（传统脚本成功率常低于 50%）的步骤。
大语言模型（LLM）的随机性与科学严谨性的冲突： LLM 擅长生成和推理，但本质上是概率模型，容易产生“幻觉”，无法保证数值计算的确定性和精度。在多相催化这类对能量精度要求极高（1 kcal/mol 的误差即可导致动力学速率常数产生数量级的偏差）的场景中，如何设计一个鲁棒的智能体-工具护栏（Agent-Tool Harness），确保“智能体负责推理与决策，确定性代码和物理引擎负责计算”，是系统构建的软件工程难点。

1.2 理论基础与物理模型

CatDT 将现代量子化学理论、统计热力学方法与最前沿的 AI Interatomic Potentials（原子间相互作用势）进行了深度整合：

万用机器学习原子势（Universal ML Interatomic Potentials）：系统默认采用基于多体对称函数及等变图神经网络（EGNN）构建的万用物理势 UMA (uma-s-1p1)。该势函数在涵盖上百万量级构型的 Open Catalyst Dataset (OC20/OC22/OC25) 上进行了预训练，能够以接近 DFT 的精度（吸附能 MAE ~0.1 eV）和高于 DFT $10^3 \sim 10^4$ 倍的计算速度进行结构优化与 NEB 过渡态搜索。
电化学常电势校正（Constant-Potential MLIP）：针对液-固界面，由于传统 MLIP 无法直接感知外加电势 $U$，CatDT 创制了 CP-MLIP 框架。通过在 MACE、UMA、EquiformerV2 等底层模型中引入电极多余电荷量（Net Charge）的电荷调控网络和电势预测头，实现了巨正则系综下的常电势电催化模拟。
热力学修正（Thermodynamic Corrections）：所有电子结构能量（$E_\text{elec}$）均通过统计热力学配分函数自动转化为吉布斯自由能： $$\Delta G(T, P) = \Delta E_\text{elec} + \Delta E_\text{ZPE} - T\Delta S_\text{vib} + \Delta G_\text{gas}(T, P)$$ 其中气体分子通过理想气体近似计算平动、转动和振动熵，吸附质分子采用简谐振动近似（Harmonic Vibrational Approximation），利用 ASE-Vibrations 计算零点能（ZPE）和振动熵变。

1.3 技术难点与方法细节

1.3.1 枢纽-叶片式多智能体架构（Hub-and-Spoke Architecture）

CatDT 并非单一的智能体，而是一个由 8 个专门化 Agent 协同运作的MAS系统，通过 Agent 7（协调与可视化智能体）进行集中调度，其业务分工极其严密：

Agent 编号与名称	底层调用模型	核心科学职责与物理工具链
Agent 1: SurFF 协调者	DeepSeek V4 Pro	调用 `SurFF` 基础模型预测所有低指数和高指数晶面的表面能，构建 Wulff 晶体形状，筛选出实际暴露的优势晶面及占比。
Agent 2: VSSR-MC 管理器	DeepSeek V4 Pro	运行“两步法”巨正则蒙特卡洛（VSSR-MC）模拟：第一步在工况 $(T, P, U, pH)$ 下进行清洁晶面的 grand-canonical 表面重构；第二步引入吸附质进行吸附质诱导重构。
Agent 3: AdsorbDiff 控制器	DeepSeek V4 Pro	控制条件自回归扩散生成模型 `AdsorbDiff`，在重构后的表面上进行高维非对称势能面的全局吸附位点搜索，替代传统的高对称位点猜测。
Agent M1: UniMech 机构搜索	GPT-5.5	执行通用反应网络构建、剪枝与自由能景观图搜索，输出能量排序的最优反应路径。
Agent 4: 路径几何设计师	GPT-5.5	结合 `Geometry Engine` 几何工具和 `Memento` 历史经验，为过渡态搜索生成 IS 和 FS 的初始三维坐标。
Agent 5: 几何与能量校验员	GPT-5.5	部署物理硬护栏（检测原子重叠 <0.8 Å、元素守恒、路径碰撞）及 UMA 预筛屏障，阻断不合理结构进入 NEB。
Agent 6: KMC/CatMAP 动力学执行器	DeepSeek V4 Pro	调用 `CatMAP` 求解平均场微观动力学模型，或调用 `kMC` 引擎进行空间显式的 Kinetic Monte Carlo 拓扑动力学外推。
Agent 7: 编排与可视化大脑	Codex (GPT-5.5)	驱动状态机运行，生成 3D 渲染图、演化视频和全面的数字孪生动力学报告。

[User Input: Bulk CIF & Reaction string]
       │
       ▼
┌──────────────────────────────────────────────┐
│           Agent 7: Orchestrator              │◄───┐
└──────────────────────┬───────────────────────┘    │
       ┌───────────────┼───────────────┐            │ 反
       ▼               ▼               ▼            │ 馈
┌─────────────┐ ┌─────────────┐ ┌─────────────┐     │ 与
│   Agent 1   │ │   Agent 2   │ │   Agent 3   │     │ 纠
│ (SurFF-Wulff│ │  (VSSR-MC   │ │(AdsorbDiff- │     │ 错
│   Facets)   │ │Reconstruct) │  Adsorbates)  │     │
└──────┬──────┘ └──────┬──────┘ └──────┬──────┘     │
       └───────────────┼───────────────┘            │
                       ▼                            │
┌──────────────────────────────────────────────┐    │
│         Agent M1: UniMech Engine             │    │
│ (16 Bond Ops -> LLM Filter -> Beam/MCTS)     │    │
└──────────────────────┬───────────────────────┘    │
                       ▼                            │
┌──────────────────────────────────────────────┐    │
│         Agent 4 & 5 Loop (Memento RL)        ├────┘
│  (Design IS/FS Geometry -> Physics Check)    │
└──────────────────────┬───────────────────────┘
                       ▼
┌──────────────────────────────────────────────┐
│         CI-NEB / Slow-growth MD              │
└──────────────────────┬───────────────────────┘
                       ▼
┌──────────────────────────────────────────────┐
│   Agent 6: Microkinetics (CatMAP / kMC)      │──► [TOF, Selectivity, Report]
└──────────────────────────────────────────────┘

1.3.2 UniMech（通用机构搜索与能量引导剪枝）

传统的化学反应网络（CRN）生成器（如 CARE）采用硬编码的原子转换规则，其生成复杂度和元素范围受到严重限制。UniMech 采用了一种创新的三阶段混合搜索架构：

Phase 1: 候选生成（Candidate Generation）：
- Agent-guided generator：利用 LLM 中存储的先验化学知识，直接提取文献中经典的反应通道（例如 $\text{CO}_2$ 还原中的 $\text{COOH}^*$ 途径和甲酸盐途径）。
- Systematic generator：基于 RDKit 实现了 16 种无关于元素的单/双键方向性断裂与重组操作（包含解离吸附、表面缔合、Eley-Rideal 机制、表面异构化等，全方位覆盖多相催化基本步骤）。系统并运行两路生成器。
Phase 2: 化学合理性过滤（LLM-based Filtering）：利用 RDKit 进行严格的八隅体价键检查（Valence Checks），滤除物理上不可能存在的自由基和高度不稳定的中间体。之后，由 LLM 对剩余路径进行可行性评级，保留 Top-10 路径进入细致评估。
Phase 3: 共享自由能缓存与树形剪枝搜索（Energy-guided Tree Search）： UniMech 维护了一个全局的 Energy Cache。一旦一个中间体在某条路径中被评估过，其最优吸附构型和吉布斯自由能将被永久缓存。树搜索算法默认采用最佳优先束搜索（Best-first Beam Search，宽度为8，深度为8），伴随同级节点剪枝：若某个分支中间体的吸附自由能高于当前层级最优分支超过 $\Delta_\text{prune} = 0.30$ eV，该分支及其后续所有子步骤将被永久切除。对于包含强烈非单调自由能景观的反应体系，算法将自动切换至基于 UCB1 的蒙特卡洛树搜索（MCTS）。

1.3.3 记忆增强强化学习（Memento-style RL Loop）

由于 NEB 端点构建包含大量的组合可能性，初次猜测构型的失败率极高（例如原子发生相互穿卡导致力场爆炸、原子数目不匹配等）。CatDT 没有诉诸于微调 LLM 这种高昂且易导致灾难性遗忘的手段，而是开发了一个完全位于模型外部的自演化记忆套件（基于 Memento 架构）：

四大交互模块：
- Network：包含一个情节级的 $\epsilon$-greedy 赌博机（Bandit）和参数化的 Q-Network 规划器。在每一次运行前，根据反应类型特征，从“保守（Conservative）”、“平衡（Balanced）”和“探险（Exploratory）”三种工作流策略中选择最佳姿态。
- Bank：存储所有成功的和失败的几何构建轨迹（Trajectory）。包含：CaseBank（存储具体的三维位置映射案例）、KnowledgeBank（由成功案例蒸馏出的通用几何法则，如“加氢步骤中，质子应置于邻近的 Hollow 位点”）、SkillBank（具体几何调整工具的参数模板）。
- Agent：耦合了 Agent 4（设计）与 Agent 5（多重审查：原子重叠度、路径碰撞检测等），形成最多 10 次试错的“设计-验证”内循环。
- Tool：在 UMA 势能下执行几何弛豫与 CI-NEB 计算，并根据物理反馈进行奖励塑造（Reward Shaping）： $$r_\text{iter} = 0.4 \rho_\text{conv} + 0.6 \rho_\text{barrier}$$ 其中 $\rho_\text{conv}$ 表示 NEB 收敛得分，$\rho_\text{barrier}$ 表示计算出的势垒是否符合物理学常规（即非负值且不超过合理阈值）。若 NEB 发散或结构严重畸变，奖励直接归零。

随着强化学习的推进，CaseBank 中的数据累积。当轨迹数超过 200 条时，系统将无参数的余弦检索器自动替换为在监督三元组上训练的参数化检索器（Parametric Retriever），这极大提升了关联经验的提取精度。

2. 关键 Benchmark 体系，计算所得数据，性能数据

为了全面、无偏见地评估 CatDT 的预测性能，研究团队设计了 7 个涵盖极广物理特性的热催化气-固基准体系。每个体系均只输入 Bulk 结构和一句自然语言指令（例如：“CO2 hydrogenation to methanol on Cu1-O3/ZrO2”），所有后续物理演化及计算全部自主进行。

CatDT 7大基准体系预测能力一览（吉布斯自由能/动力学参数）

10^3 ──┬─────────────────────────────────────────────────
       │                                                 [2D-Mo2C Rate]
10^2 ──┼───────────────────────────────── [hcp-PdMo Ea]   ● CatDT
       │                                  ● CatDT        ▲ Exp
10^1 ──┼─────────── [Ni5Ga3 Ratio]        ▲ Exp
       │            ● CatDT
10^0 ──┼───         ▲ Exp              [MoS2 TOF]
       │   [Ru B5]                      ● CatDT
10^-1 ──┼───● CatDT                      ▲ Exp
       │   ▲ Exp
10^-2 ──┴─────────────────────────────────────────────────

2.1 七大热催化气-固基准深入解析

基准 A：助剂促进的金属 Ru 催化剂上的氨合成（N2 离解）

物理背景：Ru 表面上的 $\text{N}_2$ 三键断裂是合成氨反应的决速步。紧密堆积的 $\text{Ru}(0001)$ 平台面上此断键势垒极高（~1.90 eV）。而微量的 B5 阶梯活性位点（Step Ensemble）能大幅度拉低势垒。
CatDT 计算性能：
- 成功预测出 Terrace 晶面上的 $\text{N}_2$ 离解势垒为 2.21 eV（DFT 参照值为 1.90 eV）。
- 自主识别并构建了具有不同局部配位环境的 8 种 B5 阶梯活性位点，计算得出的 B5 势垒分布中位数为 0.85 eV，与经典 DFT 参考资料（中位数 0.76 eV）高度吻合，平均绝对误差仅为 0.10 eV。
- 将该势垒谱带输入动力学引擎，成功复现了 Honkala 等人在 $320\sim 440 ^\circ\text{C}$ 合成氨窗口下的 TOF 温度依赖性，预测活化能为 0.94 eV（DFT-RPBE 理论值为 1.06 eV）。

基准 B：电荷局域化的单原子 $\text{Cu}_1\text{-O}_3/\text{ZrO}_2$ 催化剂上的 $\text{CO}_2$ 加氢制甲醇

物理背景：该单原子体系存在两条经典竞争路径：甲酸盐（$\text{HCOO}^*$）路径与羧基（$\text{COOH}^*$）路径，前者是生成甲醇的主导路径。
CatDT 计算性能：
- UniMech 无需人工干预，通过对 C1O2 空间的自主断键重组搜索，准确识别出 $\text{HCOO}^*$ 分支是热力学和动力学上的优势通道，成功复现了手绘自由能景观的定性趋势。
- 借助 Kozuch 能量跨度分析（Energetic Span Analysis），在 $453\text{ K}$ 下外推得到的甲醇生成速率为 $1.27\text{ h}^{-1}$。这与实验测得的平台速率（$\sim 1.4\text{ h}^{-1}$）极为接近（误差仅 9%），其预测精度甚至超过了原始文献中通过人工搭建模型计算得到的 $2.89\text{ h}^{-1}$（过高估计）。

基准 C：有序金属间化合物 $\text{Ni}_5\text{Ga}_3$ 上的 $\text{CO}/\text{CH}_3\text{OH}$ 选择性分叉

物理背景：金属间化合物由于几何隔离（Site-partitioning）效应，Ga 富集位点倾向于产生甲醇，而 Ni 富集位点由于极强的 $\text{CO}$ 吸附（$\Delta E = -1.60\text{ eV}$）容易发生 $\text{CO}$ 自毒化从而产生高比例的 $\text{CO}$。
CatDT 计算性能：
- 在消融实验中，若采用传统的静态表面切片模拟，得出的 $\text{CO}/\text{CH}_3\text{OH}$ 选择性比例高达 8.5。
- 开启 Agent 1（Wulff 晶面权重校正）后，预测比值降至 5.2。
- 进一步开启 Agent 2 & 3（引入 $500\text{ K}$ 巨正则工况下的自发重构和吸附质诱导的 $\text{CO}$ 饱和中毒状态）后，高活性的 Ni 中毒位点被物理抑制，计算得到的反应比值收敛至 3.1，极好地贴合了实验测得的 $\sim 1.5$ 真实表现。系统完整复现了该合金表面在 $180 \sim 240 ^\circ\text{C}$ 下的选择性演变曲线。

物理背景：该体系无任何先验的 DFT 计算文献，仅有 DRIFT（原位红外）光谱观测到的物种信息，是检验 CatDT 盲测实力的绝佳体系。
CatDT 计算性能：
- CatDT 从 Bulk 结构出发，自主重现了逆水煤气变换与 $\text{CO}$ 连续加氢的物理路径：$\text{CO}_2 \rightarrow \text{CO}^* \rightarrow \text{HCO}^* \rightarrow \text{CH}_3\text{O}^* \rightarrow \text{CH}_3\text{OH}$。这一自主预测的中间体序列得到了原位红外光谱实验的强力证实。
- 计算得到的表现活化能为 $87\text{ kJ/mol}$（实验值为 $28\text{ kJ/mol}$，作为参比的基准材料 $\text{Pd/Mo}_2\text{N}$ 实验值为 $78\text{ kJ/mol}$），系统成功识别出该材料在常温常压下的卓越催化活性区段。

基准 E：富硫空位的二维层状 $\text{MoS}_2$ 催化 $\text{CO}_2$ 加氢

物理背景：一维边界和基面内两种截然不同的缺陷拓扑（Mo-edge vs. In-plane vacancies）会导致产物的逆转（甲醇 vs. 甲烷）。
CatDT 计算性能：
- 成功分别建模了两种空位拓扑。动力学引擎通过空位比例加权计算得到的 TOF 随温度变化的曲线，完美横跨在两种实验标准化测定值（每暴露 Mo 原子和每硫空位）之间。
- 真实再现了随着温度升高，活性位点从面内空位（主导甲醇生成）向边界空位（主导甲烷生成）的选择性逆转行为。

基准 F：二维过渡金属碳化物（2D-$\text{Mo}_2\text{C}$）的多通道产物竞争

物理背景：该催化剂表面会同时并发产生 $\text{CO}$、$\text{CH}_4$、$\text{CH}_3\text{OH}$ 以及发生碳碳偶联形成的 $\text{C}_2 \sim \text{C}_5$ 长链烃，产物相极其复杂。
CatDT 计算性能：
- Agent 1 准确选定能量最低的 Mo 终止（0002）晶面（与实验选区电子衍射 SAED 结果一致）。
- UniMech 精确生成了包含复杂的 $\text{C-C}$ 偶联基本步骤在内的全谱系反应网络。动力学最终给出产物生成速率排序：$\text{CO} \gg \text{CH}_4 > \text{CH}_3\text{OH} \gg \text{C}_2\text{-C}_5$，在数量级上完全契合实验定量数据。

基准 G：强金属-载体相互作用（SMSI）包覆层 Ni@$\text{TiO}_x/\text{Al}_2\text{O}_3$ 上的丙烷脱氢（PDH）

物理背景：在还原气氛下，负载型 Ni 颗粒表面的 $\text{TiO}_2$ 载体会发生微观迁移和部分还原，在 Ni 表面形成一层含 $\text{Ti}^{3+}$ 的非晶态超薄包覆层。该界面不仅阻止了催化剂积碳，还极大地增强了丙烷脱氢活性。
CatDT 计算性能：
- Agents 1-3 自动模拟了还原态下 $\text{Ti}^{3+}$ 物种在 $\text{Ni}(111)$ 上自发扩散重构的过程。
- 预测在 $550 ^\circ\text{C}$ 下的丙烯 TOF 为 $0.16\text{ s}^{-1}$（与经典科学实验测得的 $0.13\text{ s}^{-1}$ 相差无几，误差 < 25%）。
- 准确复现了相对于纯 $\text{Ni}(111)$ 基底（TOF $\sim 0.002\text{ s}^{-1}$）高达 65 倍的活性增强效应。
- 计算所得决速步（$\text{C}_3\text{H}_7^* \rightarrow \text{C}_3\text{H}_6^*$）的表现活化能为 $54\text{ kJ/mol}$（实验值为 $50\text{ kJ/mol}$）。

2.2 闭环自主催化剂发现：PDH 材料的高通量智能设计

利用在基准 G 中建立并验证的物理模型，研究团队将 CatDT 部署为闭环发现引擎，开展非贵金属丙烷脱氢（PDH）催化剂的跨家族自主发掘（图 6）。

设计流程与决策演化：

Round 0 (Seed Batch)：引入了代表 6 个截然不同催化家族的代表性种子材料，涵盖贵金属（如 $\text{Pt}_1\text{Sn}_1$）、非贵金属 IMC（$\text{Ni}_3\text{Ga}$）、SMSI（Ni@$\text{TiO}_x$）等。初轮计算表明：除贵金属和已知 SMSI 催化剂外，普通体系的活性落后工业标杆达 2-3 个数量级。
Round 1 & 2：发现智能体（Discovery Agent）仔细阅读了 CatDT 输出的各体系结构变化、H 覆盖度及势垒数据，进行了多次反思推理，果断舍弃了表现低劣的高温沸石限域活性位和 Mars-van Krevelen（MvK）氧化物体系，指示系统将后续筛选力量集中在 SMSI 包覆层结构和 3d 过渡金属 IMC 家族上。
Round 3 & 4 (The Breakthrough)：在第三轮中，大语言模型提出核心假设：“$\text{TiO}_x$ 包覆层虽然能够极好地压制丙烯的深层裂解（防止积碳），但在活性界面上的电子转移能力可以通过调控底层氧化物载体来进行二次微调。” 据此，智能体自动提出了非贵金属合金/氧化物重构体系：Ni@$\text{ZrO}_2$。

CatDT 丙烷脱氢 (PDH) 催化活性 (TOF) 与成本性价比演化 (R0 -> R4)

  10^1 ──┬─────────────────────────────────────────────────
         │                                  [Ni@ZrO2 SMSI]
         │                                  ● TOF = 1.63 s^-1
  10^0 ──┼──────────────── [PtSn Industrial]  (性价比提升 162x)
         │                 ▲ TOF = 0.30 s^-1
         │  [Ni@TiOx SMSI]
  10^-1 ──┼──● TOF = 0.18 s^-1
         │  (R0 种子)
  10^-2 ──┼──
         │                                      ● Ni@CeO2
  10^-3 ──┼── [R0 其他种子]                       ● Fe@TiOx
         │   (沸石、MvK等)
  10^-4 ──┴─────────────────────────────────────────────────
             R0              R1-R2              R3-R4

发现成果的核心动力学与经济学指标：

超越工业标杆的催化活性：
CatDT 预测 Ni@$\text{ZrO}_2$ 在 $550 ^\circ\text{C}$ 下的丙烯 TOF 高达 $1.63\text{ s}^{-1}$，并伴随接近 100% 的极佳丙烯选择性。这一活性表现是工业 PtSn 催化剂（TOF = $0.30\text{ s}^{-1}$，选择性 95%）的 5.4 倍，也是目前已知的最强非贵金属 PDH 候选催化剂之一。
工业级低成本与超高性价比（Cost-per-Activity Figure of Merit）：
基于 2026 年 5 月的真实大宗商品市场价格和工业贵金属负载量进行测算，新型 Ni@$\text{ZrO}_2$ 的原材料成本比工业 PtSn 骤降 20 到 130 倍。定义性价比指标 $F = c_\text{cat}/\text{TOF}$，结果表明 Ni@$\text{ZrO}_2$ 的经济性价比指标比 PtSn 提升了整整 162 倍，表现出无法抗拒的工业产业化潜力。此外，同批次筛选出的 Ni@$\text{CeO}_2$（TOF = $0.15\text{ s}^{-1}$）和 Fe@$\text{TiO}_x$（TOF = $0.13\text{ s}^{-1}$）亦表现出极佳的开发价值。

3. 代码实现细节，复现指南，所用的软件包及开源 repo link

CatDT 整体采用 Python 高级面向对象编程架构，严格遵循“Agent 负责逻辑编排，Tool 负责数值计算”的物理隔离设计模式，最大程度避免了随机性溢出。

3.1 核心依赖软件包列表

智能体编排层：CAMEL (v0.1.x) 多智能体通信框架（支持 Role-play 角色协同模式）。
科学计算核心库：
- ASE (Atomic Simulation Environment): 用于基本的结构读取、配位数分析、单元胞扩胞及 ASE-Vibrations 简谐振动计算。
- CatMAP: 用于平均场常微分方程（ODE）微观动力学模型的数值求解。
- RDKit: 用于提取分子的 SMILES，运行一维和二维分子图变换及原子的价态（Valence）合理性检验。
人工智能模型与势能引擎：
- SurFF: 表面能与 Wulff 形貌构建框架。
- AdsorbDiff / AdsorbML: 吸附质配置空间概率生成器。
- VSSR-MC: 气-固和液-固界面晶面蒙特卡洛演化包。
- UMA (uma-s-1p1) 与 CP-MACE / CP-MLIP: 底层通用力场与常电势力场计算后端。

3.2 快速复现与部署指南

步骤 1：构建虚拟环境并安装核心依赖

# 创建 Python 3.10 环境
conda create -n catdt_env python=3.10 -y
conda activate catdt_env

# 安装基础科学计算组件
pip install numpy scipy matplotlib pandas sympy
pip install ase rdkit-pypi

# 安装多智能体内核与深度学习框架
pip install camel-ai
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
pip install torch-geometric torch-scatter torch-sparse -f https://data.pyg.org/whl/torch-2.0.0+cu118.html

步骤 2：部署机器学习原子间相互作用势（以 UMA 和 CP-MLIP 为例）

# 克隆并安装 UMA 库及其所需的通用势能模型
git clone https://github.com/AI4QC/UMA.git
cd UMA && pip install -e .
cd ..

# 安装 CP-MLIP 激活学习模型（用于电催化常电势计算后端）
git clone https://github.com/AI4QC/cp-mlip.git
cd cp-mlip && pip install -e .
cd ..

步骤 3：配置 API Keys 及运行参数（`config.yaml`）

CatDT 将模型后端、Token 预算及科学计算常数统一抽象在配置文件中。创建文件 config.yaml 并写入：

system:
  mas_framework: "camel"
  log_level: "INFO"
  max_retries: 5

api_keys:
  openai_api_key: "sk-xxxx..."  # 用于调用 GPT-5.5 后端
  deepseek_api_key: "sk-yyyy..." # 用于高通量调用 DeepSeek V4 Pro 后端

model_assignment:
  surface_and_kinetics_agents: "deepseek-v4-pro"
  geometry_and_reasoning_agents: "gpt-5.5"
  orchestrator_agent: "codex-gpt-5.5"

physics_defaults:
  universal_pot: "uma-s-1p1"
  pruning_threshold_ev: 0.30
  neb_optimizer: "FIRE"
  ci_neb_climbing: true
  vibration_method: "harmonic"

步骤 4：运行首个自主多相催化模拟反应（以 CO2 还原制甲烷为例）

编写运行脚本 run_catdt.py：

import os
from catdt.core import CatDTPipeline
from catdt.utils import load_config

# 1. 加载系统配置与 API 密钥
config = load_config("config.yaml")
os.environ["OPENAI_API_KEY"] = config["api_keys"]["openai_api_key"]
os.environ["DEEPSEEK_API_KEY"] = config["api_keys"]["deepseek_api_key"]

# 2. 初始化 CatDT 数字孪生流水线
pipeline = CatDTPipeline(config=config)

# 3. 指定输入 Bulk CIF 路径及自然语言指令
bulk_structure_path = "data/bulk/Cu_bulk.cif"
reaction_prompt = "CO2 hydrogenation to CH4 on Copper under electrochemical condition (pH=14, U=-1.0 V, T=298K)"

# 4. 启动一键式端到端运行
print("[*] Launching CatDT self-evolving simulation pipeline...")
result = pipeline.run(
    bulk_path=bulk_structure_path,
    prompt=reaction_prompt,
    output_dir="./outputs/cu_co2rr"
)

# 5. 输出关键动力学指标
print("[+] CatDT Digital Twin Simulation Complete!")
print(f" - Dominant Pathway: {result['dominant_pathway']}")
print(f" - Predicted Apparent Activation Energy: {result['apparent_ea_ev']:.2f} eV")
print(f" - Computed Propylene TOF: {result['tof_s_1']:.4e} s^-1")
print(f" - Simulation Report Location: {result['report_pdf_path']}")

3.3 开源 Repository 地址

CatDT 研发团队已在 GitHub 上完全开源了系统的核心构件、预训练模型参数、Memento 自演化数据库、569 种气体和吸附物种的标准热力学数据库：

官方源码库：https://github.com/AI4QC/catdt
Hugging Face 数据及预训练参数包：https://huggingface.co/AI4QC/catdt-models

4. 关键引用文献，以及你对这项工作局限性的评论

4.1 关键参考文献（按系统贡献分类）

多智能体编排与自演化机制：
- Li, G. et al. CAMEL: Communicative agents for “mind” exploration of large language model society. NeurIPS (2023). (系统多智能体基本架构的奠基性工作) [Ref 41]
- Zhou, H. et al. Memento: Fine-tuning LLM agents without fine-tuning LLMs. arXiv:2508.16153 (2025). (CatDT 自适应记忆系统的灵感来源) [Ref 47]
物理势能与通用原子相互作用势：
- Barroso-Luque, L. et al. UMA: A family of universal models for atoms. arXiv:2506.23971 (2025). (CatDT 所采用的万用物理势) [Ref 20]
- Chanussot, L. et al. Open Catalyst Dataset (OC20). ACS Catal. (2021). (力场预训练数据集) [Ref 17]
反应网络生成与位点搜索：
- Morandi, S. et al. An end-to-end framework for reactivity in heterogeneous catalysis (CARE). Nat. Chem. Eng. (2026). (与 UniMech 形成性能对比的穷举反应网络工具) [Ref 26]
- Kolluru, A. & Kitchin, J. R. AdsorbDiff: Adsorbate placement via conditional denoising diffusion. ICML (2024). (Agent 3 寻找全局极小吸附位点的关键底座) [Ref 25]
基准实验与物理对齐源：
- Honkala, K. et al. Ammonia synthesis from first-principles calculations. Science (2005). (基准 A 钌合成氨的数据源) [Ref 53]
- Zhao, H. et al. The role of Cu1–O3 species in single-atom Cu/ZrO2 catalyst for CO2 hydrogenation. Nat. Catal. (2022). (基准 B 单原子加氢的数据源) [Ref 54]
- Chen, S. et al. Defective TiOx overlayers catalyze propane dehydrogenation promoted by base metals. Science (2024). (基准 G 强金属载体相互作用的数据源) [Ref 59]

4.2 本文对 CatDT 系统局限性的客观评论

虽然 CatDT 在系统自动化和保真度上展现出了令人惊叹的跨越，但作为一个前沿的数字孪生系统，其在真正的量子化学物理严谨性和应用覆盖面上仍存在以下显著的科学和技术瓶颈：

对万用机器学习原子势（MLIP）精度的天然继承与误差累积： CatDT 本质上是一个上层编排系统，其计算数值精度深度绑定于底层力场（如 UMA 或 CP-MACE）。当前 UMA 势能虽然在绝大多数体系上表现卓越，但对于涉及强烈电荷转移、非局域激子激发或极化效应的复杂过渡金属氧化物（如锰氧化物析氧催化剂），MLIP 预测吸附能常有 $\sim 0.15$ eV 以上的系统性系统性偏差。由于阿伦尼乌斯速率公式的指数放大效应，吉布斯自由能上 0.15 eV 的误差，会使得微观动力学求解器计算出的 TOF 偏离实验真实值多达 1-2 个数量级。这也解释了在基准 D（hcp-PdMo）中，CatDT 预测的表现活化能（87 kJ/mol）较实验值（28 kJ/mol）偏高的原因。
电催化中溶剂化效应（Solvation Effects）的显式动力学计算开销过大：对于液-固（电催化）电极界面，液态水、水合氢离子及金属离子的动力学波动（双电层动态重构）对电荷转移活化能有决定性影响。CatDT 虽然提供了常电势慢生长分子动力学（Slow-growth MD with explicit solvent）这一高保真解决方案，但分子动力学模拟需要极其昂贵的运行时间（单步通常耗时数小时到数天，远远超过热催化的 30 分钟限制）。因此，在面对电催化剂的大规模高通量闭环发现时，CatDT 被迫退回到简化的隐式溶剂化（Implicit Solvation）模型，这不可避免地损失了氢键网络的物理本质。
多组分 KMC 中 Sabatier 活性火山口过滤的离散性：在基准 G（Ni@TiOx）中，尽管 CatDT 完美给出了表现活化能和活性增强，但在丙烯/短链裂解烃（$\text{C}_3\text{H}_6/\text{C}_2\text{H}_y$）选择性上，计算值相较于实验存在一定的低估。这主要是因为目前的微观动力学引擎在运行多路径显式 kMC 时，其相空间跃迁的速率常数尚未在运行时与 UniMech 导出的全局萨巴蒂尔火山图（Sabatier Volcanic Plot）限幅逻辑进行动态闭环耦合，导致某些在热力学极度不利但动力学速度极快的微观旁路没有被及时判定剪枝。
LLM 高级推理的非确定性残余：尽管设置了严格的“Agent 负责推理，Tool 负责计算”分工，但在极其复杂的非典型反应网络设计中（如涉及多个杂原子的生物质催化加氢脱氧），Agent 4 & 5 内部在提出反应物端点几何重构时，极度依赖大模型（GPT-5.5 / DeepSeek V4 Pro）的逻辑解析能力。由于上下文窗口（Context Window）在长时多轮对话后会发生“上下文漂移（Context Drift）”和“注意力稀释”，偶发性的端点构型错误仍会出现，需要依靠重试（Retry）机制消除，这直接导致了计算成本的不可控波动。

5. 其他必要补充：科学智能体领域的“脚手架”工程哲学与未来演化

CatDT 的成功，不仅在于其发现了几种强力的催化材料，更核心的学术启示在于它向全球 AI-for-Science 研发团队展示了一个前瞻性的软件工程哲学：科学智能体系统的天花板，不取决于底层大语言模型（LLM）的原始逻辑能力，而取决于大模型外部的“工程脚手架（Engineered Harness）”的厚重程度。

5.1 智能体脚手架（Agent Harness）胜于基础模型能力

在过去两年中，业界普遍存在一个误区：只要等待性能更强的 GPT-5、GPT-6 或开源大模型推出，化学 AI Agent 就能自然而然地解决所有的科学难题。然而，CatDT 的消融实验（Ablation Study, 图 2b）以无可辩驳的物理数据打破了这一幻想：

无脚手架状态（No-skill, 仅靠原生大模型进行代码编写和工具调用）：无论是 GPT-5.5 还是最先进的开源代码模型，在面对催化这类涉及高度特异性数据类型的场景时（如读取含有晶体非对称单元的 CIF 文件、处理并判断 NEB 计算的收敛判据），其自主运行的通过率（Pass@5）在 12 个代表性测试中几乎全线为零。大模型经常写出语法正确但毫无物理依据的“垃圾结构”（如让碳原子直接嵌入到晶格格点内部、在金属层间制造 0.5 Å 的严重空间穿卡）。
CatDT 脚手架状态（Loaded-skill, 部署了确定性物理校验网与 Memento 强化学习外部记忆）：系统整体的 Pass@5 跃升至 93%（56 / 60 成功），并且能够在没有人工协助的情况下自主从失败中学习，将 NEB 初始构建的物理收敛率从 41% 跨episode地提升至 84%。

这一结果证明：科学智能体必须是“有约束的智能（Constrained Intelligence）”。用物理定律作为编译期的类型检查（Type Checker），用确定性的科学软件（如 ASE、RDKit）作为运行时环境（Runtime Environment），用持久化且可蒸馏的外部案例库（Memento）作为状态存储器（State Backing Store），方能在大语言模型的随机性汪洋中，铸造出坚不可摧的科学计算灯塔。

CatDT “物理硬护栏”工作模式：

  LLM 原始构型提案 ──► [ 物理边界检验 ] ──┬──► 通过 ──► 提交真实 UMA 计算
                           │                │
                           ├── 相互穿卡? ───┤
                           ├── 元素不守恒? ─┤
                           └── 路径碰撞? ───┼──► 拒绝 ──► 发送几何反馈至 Memento Bank (纠错)

5.2 催化剂“自主理论发现-自动化湿实验室”的终极闭环（Self-driving Lab）

展望未来，CatDT 作为一个成熟的“催化剂数字孪生”，能够完美作为“自动驾驶实验室（Self-driving Labs）”的大脑。其与机械臂自动化合成和原位表征系统的深度对接，将开启科学研究的新纪元：

数字孪生大脑（CatDT）：仅需输入反应，自动进行高通量虚拟仿真，筛选出以 Ni@ZrO2 为代表的超高性价比催化材料，并将推荐的合成路线和底层配方（如载体种类、前驱体比例、还原温度等）参数化输出。
自动化合成执行层：液路配液机器人与无机合成机械臂接收来自 CatDT 的参数指令，自动完成前驱体浸渍、干燥、超声分散、高压反应釜合成、以及微量精准涂覆。
原位光谱物理回传：自动化表征站（原位红外 DRIFTS、同步辐射在线吸收谱 XAS）实时采集反应进行中的真实光谱与中间体演化特征；气相色谱/质谱自动获取反应动力学 TOF 与丙烯选择性数据。
端到端闭环更新：实验端收集到的真实动力学参数和活性位谱图通过网络接口回传，直接转化为 Memento 外部数据库中的 “超高权重 Case 实例”。CatDT 的 Q-Network 规划器和参数化检索器（Retriever）在数小时内自适应重构其几何评估法则，修正机器学习原子间相互作用势的系统偏差。在下一轮材料迭代中，数字孪生的物理逼真度将逼近 $100\%$ 完美实相。

这种“理论与实验相伴而生、自演化自纠错”的闭环系统，在未来将使设计一款新型工业级多相催化剂的耗时，从数十人年、耗资数百万的传统漫长旅程，压缩到在单台自主计算合成机柜上仅需几天时间即可完成的极速通关。多相催化的设计范式，正因 CatDT 的诞生而迎来破晓之光。

自演化多智能体数字孪生系统 CatDT：多相催化剂自主发现与微观动力学计算的范式革命

0. 执行摘要

1. 核心科学问题，理论基础，技术难点，方法细节

1.1 核心科学问题与技术挑战

1.2 理论基础与物理模型

1.3 技术难点与方法细节

1.3.1 枢纽-叶片式多智能体架构（Hub-and-Spoke Architecture）

1.3.2 UniMech（通用机构搜索与能量引导剪枝）

1.3.3 记忆增强强化学习（Memento-style RL Loop）

2. 关键 Benchmark 体系，计算所得数据，性能数据

2.1 七大热催化气-固基准深入解析

基准 A：助剂促进的金属 Ru 催化剂上的氨合成（N2 离解）

基准 B：电荷局域化的单原子 $\text{Cu}_1\text{-O}_3/\text{ZrO}_2$ 催化剂上的 $\text{CO}_2$ 加氢制甲醇

基准 C：有序金属间化合物 $\text{Ni}_5\text{Ga}_3$ 上的 $\text{CO}/\text{CH}_3\text{OH}$ 选择性分叉

基准 D：六方紧密堆积（hcp）$\text{PdMo}$ 合成甲醇的“盲测（Blind Prediction）”

基准 E：富硫空位的二维层状 $\text{MoS}_2$ 催化 $\text{CO}_2$ 加氢

基准 F：二维过渡金属碳化物（2D-$\text{Mo}_2\text{C}$）的多通道产物竞争

基准 G：强金属-载体相互作用（SMSI）包覆层 Ni@$\text{TiO}_x/\text{Al}_2\text{O}_3$ 上的丙烷脱氢（PDH）

2.2 闭环自主催化剂发现：PDH 材料的高通量智能设计

设计流程与决策演化：

发现成果的核心动力学与经济学指标：

3. 代码实现细节，复现指南，所用的软件包及开源 repo link

3.1 核心依赖软件包列表

3.2 快速复现与部署指南

步骤 1：构建虚拟环境并安装核心依赖

步骤 2：部署机器学习原子间相互作用势（以 UMA 和 CP-MLIP 为例）

步骤 3：配置 API Keys 及运行参数（`config.yaml`）

步骤 4：运行首个自主多相催化模拟反应（以 CO2 还原制甲烷为例）

3.3 开源 Repository 地址

4. 关键引用文献，以及你对这项工作局限性的评论

4.1 关键参考文献（按系统贡献分类）

4.2 本文对 CatDT 系统局限性的客观评论

5. 其他必要补充：科学智能体领域的“脚手架”工程哲学与未来演化

5.1 智能体脚手架（Agent Harness）胜于基础模型能力

5.2 催化剂“自主理论发现-自动化湿实验室”的终极闭环（Self-driving Lab）

0. 执行摘要

1. 核心科学问题，理论基础，技术难点，方法细节

1.1 核心科学问题与技术挑战

1.2 理论基础与物理模型

1.3 技术难点与方法细节

1.3.1 枢纽-叶片式多智能体架构（Hub-and-Spoke Architecture）

1.3.2 UniMech（通用机构搜索与能量引导剪枝）

1.3.3 记忆增强强化学习（Memento-style RL Loop）

2. 关键 Benchmark 体系，计算所得数据，性能数据

2.1 七大热催化气-固基准深入解析

基准 A：助剂促进的金属 Ru 催化剂上的氨合成（N2 离解）

基准 B：电荷局域化的单原子 $\text{Cu}_1\text{-O}_3/\text{ZrO}_2$ 催化剂上的 $\text{CO}_2$ 加氢制甲醇

基准 C：有序金属间化合物 $\text{Ni}_5\text{Ga}_3$ 上的 $\text{CO}/\text{CH}_3\text{OH}$ 选择性分叉

基准 D：六方紧密堆积（hcp）$\text{PdMo}$ 合成甲醇的“盲测（Blind Prediction）”

基准 E：富硫空位的二维层状 $\text{MoS}_2$ 催化 $\text{CO}_2$ 加氢

基准 F：二维过渡金属碳化物（2D-$\text{Mo}_2\text{C}$）的多通道产物竞争

基准 G：强金属-载体相互作用（SMSI）包覆层 Ni@$\text{TiO}_x/\text{Al}_2\text{O}_3$ 上的丙烷脱氢（PDH）

2.2 闭环自主催化剂发现：PDH 材料的高通量智能设计

设计流程与决策演化：

发现成果的核心动力学与经济学指标：

3. 代码实现细节，复现指南，所用的软件包及开源 repo link

3.1 核心依赖软件包列表

3.2 快速复现与部署指南

步骤 1：构建虚拟环境并安装核心依赖

步骤 2：部署机器学习原子间相互作用势（以 UMA 和 CP-MLIP 为例）

步骤 3：配置 API Keys 及运行参数（config.yaml）

步骤 4：运行首个自主多相催化模拟反应（以 CO2 还原制甲烷为例）

3.3 开源 Repository 地址

4. 关键引用文献，以及你对这项工作局限性的评论

4.1 关键参考文献（按系统贡献分类）

4.2 本文对 CatDT 系统局限性的客观评论

5. 其他必要补充：科学智能体领域的“脚手架”工程哲学与未来演化

5.1 智能体脚手架（Agent Harness）胜于基础模型能力

5.2 催化剂“自主理论发现-自动化湿实验室”的终极闭环（Self-driving Lab）

步骤 3：配置 API Keys 及运行参数（`config.yaml`）