

#  图结构学习（Graph Structure Learning, GSL）

---

## 1. 研究背景

---

### 图神经网络的核心假设

图神经网络（GNN）的性能依赖于图结构的准确性，即邻接矩阵 $A$ 提供了真实可靠的节点依赖信息。

但**现实中的图结构常常存在以下问题：**

| 问题     | 描述                   |
| ------ | -------------------- |
| 图结构缺失  | 数据中无显式图（如文本、图像、时序信号） |
| 图结构不完整 | 只观察到部分边，信息不充分        |
| 噪声边    | 图中包含错误连接或无效连接        |
| 静态图假设  | 无法建模语义变化和动态依赖        |

---

### 图结构学习（GSL）的目标

![](./img/5_1.png)


> 在图神经网络训练过程中或训练前**自动构造或优化图结构**，使得图结构更有利于下游任务表现。

---

### GSL 主要研究范式

![](./img/5_2.png)


| 方法     | 思路            | 代表                 |
| ------ | ------------- | ------------------ |
| 基于优化   | 联合学习邻接矩阵与模型参数 | GRCN, IDGL         |
| 基于度量学习 | 学习节点相似度构建图    | SimGNN, ProGNN     |
| 基于生成模型 | 用生成器生成图结构     | GraphGAN, GRCN-VAE |







## 2. 基于优化的图结构学习

---

### 核心思路

将图结构（邻接矩阵）作为**可优化变量**，在模型训练过程中**与 GNN 参数联合优化**：

$$
\min_{A, \Theta} \ \mathcal{L}_{task}(f(X, A; \Theta), Y) + \mathcal{R}(A)
$$

* $A$：学习得到的邻接矩阵
* $\mathcal{R}(A)$：正则项（稀疏性、低秩、非负、对称等）
* $\Theta$：GNN 模型参数

---

### 优点

* 学得任务相关的图结构
* 可处理初始图错误或缺失情况

---

### 代表模型

####  GRCN (Graph Reconstruction Convolutional Network)

* 将邻接矩阵作为变量，使用 reconstruction loss 使其保留输入特征结构，同时提升 GNN 性能

####  IDGL (Implicit Differentiable Graph Learning)

* 使用 attention 模块隐式学习邻接矩阵
* 对 $A$ 加稀疏性和对称性约束

####  ProGNN

* 使用可微优化方法学习图结构，同时增强鲁棒性和解释性



## 3. 基于度量学习的图结构学习

---

### 核心思路

通过**学习一个相似性度量函数** $S(u, v)$，来构造邻接矩阵：

$$
A_{uv} = \text{TopK}(S(u,v)) \quad \text{or} \quad A = \sigma(\text{MLP}(x_u, x_v))
$$

* 构造相似度矩阵，选择 top-k 相似节点作为邻接边
* 可学习的距离度量，如欧氏距离、内积、神经网络

---

### 关键组件

| 模块    | 说明                                    |
| ----- | ------------------------------------- |
| 相似度函数 | 基于特征、结构或组合相似度                         |
| 阈值策略  | top-k、hard-threshold 或 soft-attention |
| 可训练性  | 用神经网络学习距离函数（如 Siamese 网络）             |

---

###  代表方法

####  SimGNN

* 使用图之间的相似性学习度量函数
* 将图结构编码为嵌入，进行图相似性估计

####  PTDNet

* 使用概率门控模块学习每条边的重要性
* 控制图连接保留概率，从而生成子图

####  CoGSL

* 使用对比学习增强结构学习鲁棒性
* 在构造图前通过图对比判别构图质量



## 4. 基于生成模型的图结构学习

---

###  核心思路

使用\*\*生成模型（如 VAE、GAN）\*\*从输入特征中生成潜在图结构。

形式上：

$$
P(A|X) = \text{Decoder}(Z), \quad Z = \text{Encoder}(X)
$$

---

###  常用模型类型

| 模型        | 特点             |
| --------- | -------------- |
| VAE       | 学习潜在空间，生成邻接矩阵  |
| GAN       | 判别器指导图生成质量     |
| Diffusion | 连续采样图结构，建模不确定性 |

---

###  代表方法

####  GRCN-VAE

* 使用变分自编码器生成邻接矩阵
* 与 GCN 共同训练

####  DGLFRM

* 动态图生成网络，考虑时序结构变化

####  GGM-VAE

* 结合高斯图模型与 VAE 推断图依赖结构



## 5. GSL 的最新研究进展

---

###  1. 对比学习与结构学习结合

* 图对比学习（Graph Contrastive Learning）用于增强图结构鲁棒性

  * 方法如 CoGSL, GRACE-Struct
  * 对不同图视图进行对比，提高 GSL 泛化能力

---

###  2. 多视图图结构学习（Multi-View GSL）

* 从多个角度/数据源构造图结构
* 融合多个候选图或不同语义视图
* 示例：MV-GCN, MV-GSL

---

### 3. 神经结构搜索（Neural Graph Structure Search）

* 使用 AutoML 技术从数据中搜索最优图结构或构图策略
* 如 NAS-GNN, AutoGSL

---

### 4. GSL 与自监督预训练结合

* 使用大规模无标签数据预训练结构生成器
* 类似于 GNN-BERT、GraphMAE，GSL 作为数据增强手段

---

### 5. 稀疏图构建与可解释性方向

* 强调**可解释的结构学习过程**
* 加入可视化机制、图注意力分析等

---

## 小结：图结构学习三大范式对比

| 方法类型 | 关键思想       | 优点            | 代表方法              |
| ---- | ---------- | ------------- | ----------------- |
| 优化方法 | 联合优化图结构与模型 | 灵活强大，可控性强     | IDGL, ProGNN      |
| 度量学习 | 学习节点相似度构图  | 高效直观，易解释      | SimGNN, PTDNet    |
| 生成模型 | 建模结构分布，采样图 | 表达能力强，可建模不确定性 | GRCN-VAE, GGM-VAE |

