GQCO作用分析

1. GQCO 的作用？¶

训练好的 GQCO 本质上是一个**“从问题到量子电路”的条件生成模型**，具体作用是：

给定一个组合优化问题（已经写成伊辛哈密顿量形式），GQCO 直接生成一个量子电路，该电路在 \(|0\rangle^{\otimes n}\) 上作用后，通过测量即可**以较高概率得到该问题的近似最优解（基态比特串）**。

使用方式可以概括为：

你准备一个优化问题的伊辛哈密顿量 \(H=\sum_{i<j} J_{ij}\sigma_i^z\sigma_j^z + \sum_i h_i\sigma_i^z\)；
把 \(\{h_i, J_{ij}\}\) 送入已经训练好的 GQCO 编码器；
解码器按条件分布 \(p_\theta(U|x)\) 生成门序列（即量子电路 \(U\)）；
在模拟器或真实量子设备上运行 \(U|0...0\rangle\)，测量若干次，从结果分布中挑选概率最高的比特串，作为该优化问题的解。

因此，训练完的 GQCO 就是一台“问题 → 量子电路 → 近似解”的自动求解器，不再需要为每个新问题单独做 VQA 式的参数优化。

在该工作中，输入限定为：

伊辛形式的组合优化问题参数：
也就是每个比特的外场 \(h_i\) 和每条边的耦合 \(J_{ij}\)。

具体实现上，它们被组织为一个图：

然后论文对节点、边做了特征工程（你如果要自己实现，需要遵守同样的编码方式）：

节点特征 \(v_i\)：包含
本身的场强 \(h_i\)；
与邻居场强的符号关系 \(\text{sgn}(h_i-h_j)\)；
与 \((h_j, J_{ij})\) 的乘积符号等；
边特征 \(e_{ij}\)：包含
\(\text{sgn}(J_{ij})\)、\(\text{sgn}(J_{ij}-h_i)\)、\(\text{sgn}(J_{ij}-h_j)\)、\(\text{sgn}(h_i h_j J_{ij})\)。

编码器是 Graph Transformer，直接吃的就是这样的**图结构 + 特征**。

从应用角度看，你可以输入的就是：

可以分为四类限制：问题类型、规模、分布/编码、门池/结构。

因此，如果你把一个 >10 qubit 的伊辛问题直接丢给这版已训练模型，其行为并没有经过实验验证，很可能不可靠；>20 qubit 在门池定义上都不被支持。

训练数据是**随机生成**的伊辛实例（具体分布由作者设定），因此：
如果你输入的伊辛系数分布与训练分布差异很大（比如极端稀疏/极端强耦合结构），性能可能显著衰减；
必须遵循文章定义的**图特征工程**（节点/边的符号特征等）。
如果你用完全不同的编码方式（例如单纯把 \(h_i, J_{ij}\) flatten 成一个向量），那就不是这篇论文训练出的模型了，需要重新训练对应的编码器。

需要，原则上必须重新训练（至少要重训/微调解码器部分）。

原因可以从模型结构上严格说明：

一旦你“加新门”，就相当于：

因此，不能简单在推理阶段“添加门”而不改模型。

GQCO 是通过 DPO / CPO 优化

\[ p_\theta(U|x) \]

在**给定门池定义的电路空间**上，使得采样到低能量电路的概率变大。你变更门池，相当于变更了整个搜索空间：

这在数学上等价于「换了优化变量的定义域」，原解不再是新问题的解，自然需要重新优化（训练）。

所以，“加更多可训练量子门”本质是改变门池定义，必须重新训练；而“在相同门池下改变目标（如深度惩罚）”可以通过继续训练来实现。

如果你接下来打算自己实现/扩展 GQCO，可以先明确：
是要**换门池**（那就接受重训成本），还是**在现有门池上加约束/改任务**（那只需微调即可）。