## 谱方法GCN实现
<img src="../image/5.png">

In [15]:
import torch
import torch.nn.functional as F
from torch_geometric.nn import GCNConv
from torch_geometric.datasets import Planetoid

class GCN(torch.nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = GCNConv(dataset.num_node_features, 16)
        self.conv2 = GCNConv(16, dataset.num_classes)

    def forward(self, data):
        x, edge_index = data.x, data.edge_index

        x = self.conv1(x, edge_index)
        x = F.relu(x)
        x = F.dropout(x, training=self.training)
        x = self.conv2(x, edge_index)

        return F.log_softmax(x, dim=1)

dataset = Planetoid(root='../data/Cora', name='Cora')
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = GCN().to(device)
data = dataset[0].to(device)
optimizer = torch.optim.Adam(model.parameters(), lr=0.01, weight_decay=5e-4)

model.train()
for epoch in range(200):
    optimizer.zero_grad()
    out = model(data)
    loss = F.nll_loss(out[data.train_mask], data.y[data.train_mask])
    loss.backward()
    optimizer.step()
#最后，在测试节点上评估模型：
model.eval()
pred = model(data).argmax(dim=1)
correct = (pred[data.test_mask] == data.y[data.test_mask]).sum()
acc = int(correct) / int(data.test_mask.sum())
print(f'Accuracy: {acc:.4f}')

Downloading https://github.com/kimiyoung/planetoid/raw/master/data/ind.cora.x


URLError: <urlopen error [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应，连接尝试失败。>

In [None]:
## 自定义GraphConvolution
class GraphConvolution(nn.Module):
    def __init__(self, input_dim, output_dim, use_bias=True):
        """图卷积：L*X*\theta

        Args:
        ----------
            input_dim: int
                节点输入特征的维度
            output_dim: int
                输出特征维度
            use_bias : bool, optional
                是否使用偏置
        """
        super(GraphConvolution, self).__init__()
        self.input_dim = input_dim
        self.output_dim = output_dim
        self.use_bias = use_bias
        self.weight = nn.Parameter(torch.Tensor(input_dim, output_dim))
        if self.use_bias:
            self.bias = nn.Parameter(torch.Tensor(output_dim))
        else:
            self.register_parameter('bias', None)
        self.reset_parameters()

    def reset_parameters(self):
        init.kaiming_uniform_(self.weight)
        if self.use_bias:
            init.zeros_(self.bias)

    def forward(self, adjacency, input_feature):
        """邻接矩阵是稀疏矩阵，因此在计算时使用稀疏矩阵乘法
    
        Args: 
        -------
            adjacency: torch.sparse.FloatTensor
                邻接矩阵
            input_feature: torch.Tensor
                输入特征
        """
        support = torch.mm(input_feature, self.weight)
        output = torch.sparse.mm(adjacency, support)
        if self.use_bias:
            output += self.bias
        return output

    def __repr__(self):
        return self.__class__.__name__ + ' ('             + str(self.input_dim) + ' -> '             + str(self.output_dim) + ')'


In [None]:
class GCNNet(nn.Module):
    """
    定义一个包含两层GraphConvolution的模型
    """
    def __init__(self, input_dim=1433):
        super(GcnNet, self).__init__()
        self.gcn1 = GraphConvolution(input_dim, 16)
        self.gcn2 = GraphConvolution(16, 7)
    
    def forward(self, adjacency, feature):
        h = F.relu(self.gcn1(adjacency, feature))
        logits = self.gcn2(adjacency, h)
        return logits

## 消息传播神经网络（Message Passing Neural Network， MPNN）
空域图卷积（注意，图神经网络里的‘卷积’一词，取得是‘特征提取’这个广义意义，跟卷积神经网络里的那个卷积核计算区别开）可以看作是相邻节点之间进行信息传递、融合的过程，论文 https://arxiv.org/abs/609.02907 计算公式可以一般化为：
<img src="../image/2.png">
其中 $x_i^k$ 是当前卷积层的输出， $x_i^{k-1}$ 是上一个卷积层的输出，作为当前卷积层的输入， $x_j^{k-1}$ 是 $i$ 节点相邻节点的信息， $e_{j,i}$ 是其连接边的信息。（建议背下来这个公式，你会发现无论空域图卷积的论文怎么折腾，还是没跑出这个框架，只不过是 $\gamma ,\phi$ 两个函数换了）。  
□ 表示一种可微的、置换不变的函数（也就是后面的聚合模式），比如求和、取均值或者最大值，$\gamma ,\phi$均为可微的函数，比如MLP多层感知机。上述公式相当于就是把一个节点的邻域节点的特征聚合到当前节点上面，最外层的函数就类似于我们常见的非线性激活函数，聚合的信息分为两部分，第一部分是上一层中该节点自身的特征信息，第二部分是上一层中，该节点和邻域节点边上的传递信息。  
Pytorch-Geometric中提供了一个基类torch_geometric.nn.MessagePassing，它自身已经实现了信息传递机制来更有效的创建信息传递机制的图神经网络，只要将其作为一个基类继承创建自己的类即可。使用的时候只需要定义函数$\phi$比如message()，和函数$\gamma$比如update()；同时需要指定聚合方式比如aggr='add'，aggr='mean'或者aggr='max'。在这个基类中比较重要的几个地方如下：  
（1）torch_geometric.nn.MessagePassing(aggr="add", flow="source_to_target")定义三种聚合模式中的一种以及信息传递的方向，默认是从源节点到目标节点，比如一个有向边1->2，源节点是1，目标节点是2。  
（2）torch_geometric.nn.MessagePassing.propagate(edge_index, size=None, dim=0, **kwargs)进行信息的传播计算过程  
（3）torch_geometric.nn.MessagePassing.message()对到达节点i的信息进行构建  
（4）torch_geometric.nn.MessagePassing.update()将聚合函数后的结果作为输入计算出更新值  
GCN的卷积计算公式为：
<img src="../image/3.png">

## 消息传递实现GCN
利用PyG的MessagePassing实现GCN
邻居节点的特征首先通过一个权重矩阵的转换，然后通过它们的度进行标准化，最后进行求和。具体步骤如下：  
1.在邻接矩阵中增加自环。  
2.对节点特征进行一次线性转化（利用linear层实现）。  
3.计算标准化系数。  
4.对节点特征进行标准化（函数）。  
5.对相邻节点特征进行求和（"add"聚合方式）。  
6.得到新的节点嵌入。  

In [9]:
import torch
from torch_geometric.nn import MessagePassing
from torch_geometric.utils import add_self_loops, degree
from torch_geometric.datasets import TUDataset

class GCNConv(MessagePassing):
    # 网络初始化
    def __init__(self, in_channels, out_channels):
        """
        :param in_channels: 节点属性向量的维度
        :param out_channels: 经过图卷积之后，节点的特征表示维度
        """
        # 定义伽马函数为求和函数,aggr='add'
        super(GCNConv, self).__init__(aggr='add')
        # 定义最里面那个线性变换
        # 具体到实现中就是一个线性层
        self.linear_change = torch.nn.Linear(in_channels, out_channels)

    def forward(self, x, edge_index):
        # X: [N, in_channels]
        # edge_index: [2, E]

        # 1.在邻接矩阵中增加自环
        edge_index, _ = add_self_loops(edge_index, num_nodes=x.size(0))

        # 2.对节点特征进行一个非线性转换
        # x的维度会由[N, in_channels]转换为[N, out_channels]
        x = self.linear_change(x)

        # 3.计算标准化系数
        # edge_index的第一个向量作为行坐标，第二个向量作为列坐标
        row, col = edge_index
        # 获取节点的度
        deg = degree(row, x.size(0), dtype=x.dtype)
        # 带入外面的正则化公式
        deg_inv_sqrt = deg.pow(-1/2)
        # norm的第一个元素就是edge_index中的第一列（第一条边）上的标准化系数
        # tensor的乘法为对应元素乘法，tensor1[tensor2]后的维度与tensor2一致
        norm = deg_inv_sqrt[row] * deg_inv_sqrt[col]

        # 4-6步的开始标志，内部实现了message-AGGREGATE-update
        return self.propagate(edge_index, size=(x.size(0), x.size(1)), x=x, norm=norm)

    def message(self, x_j, norm):
        # x_j的维度为[E, out_channels]

        # 4.进行传递消息的构造，将标准化系数乘以邻域节点的特征信息得到传递信息
        return norm.view(-1, 1) * x_j

    def update(self, aggr_out):
        # aggr_out的维度为[N, out_channels]

        # 6.更新新的节点嵌入，这里没有做任何多余的映射过程
        return aggr_out

In [10]:
conv = GCNConv(16, 32)
# 随机生成一个节点属性向量
# 5个节点，属性向量为16维
x = torch.randn(5, 16)
# 随机生成边的连接信息
# 假设有3条边
edge_index = [
    [0, 1, 1, 2, 1, 3],
    [1, 0, 2, 1, 3, 1]
]
edge_index = torch.tensor(edge_index, dtype=torch.long)
# 进行图卷积
output = conv(x, edge_index)
# 输出卷积之后的特征表示矩阵
print(output.data)

tensor([[ 0.6377, -0.8432,  0.1940,  ..., -0.0449, -0.6374, -0.0982],
        [ 0.2975, -0.8193,  0.4576,  ...,  0.0239, -0.2123, -0.3575],
        [ 0.3550, -0.1279,  0.4663,  ...,  0.0978, -0.1275, -0.0223],
        ...,
        [ 0.0000,  0.0000,  0.0000,  ...,  0.0000,  0.0000,  0.0000],
        [ 0.0000,  0.0000,  0.0000,  ...,  0.0000,  0.0000,  0.0000],
        [ 0.0000,  0.0000,  0.0000,  ...,  0.0000,  0.0000,  0.0000]])


## Edge Convolution的实现
在https://arxiv.org/abs/1801.07829 论文中，作者提出的卷积公式为
<img src="../image/4.png">

$h_\theta$ 是一个多层感知机（MLP，前馈神经网络），还是化归到我们上面的一般化空域图卷积公式， $\gamma$ 是求最大值函数， $\phi$ 是一个MLP，实现代码为

In [11]:
import torch
from torch.nn import Sequential as Seq
from torch.nn import Linear, ReLU
from torch_geometric.nn import MessagePassing


# 定义EdgeConv图卷积神经网络
class EdgeConv(MessagePassing):
    # 初始化图卷积神经网络
    def __init__(self, in_channels, out_channels):
        # 定义伽马函数为求最大值函数
        super().__init__(aggr='max')
        # 定义一个前馈神经网络
        self.mlp = Seq(
            # 线性层,后面信息汇聚函数之后的输入是2*in_channels
            Linear(2 * in_channels, out_channels),
            # 激活函数
            ReLU(),
            # 输出层
            Linear(out_channels, out_channels)
        )

    # 定义信息汇聚函数
    def message(self, x_i, x_j):
        tmp = torch.cat([x_i, x_j - x_i], dim=1)
        # cat之后tmp的维度为[边数,2*in_channels]
        return self.mlp(tmp)

    # 前向传递，进行图卷积
    def forward(self, x, edge_index):
        # x是节点属性向量矩阵
        # edge_index是边的连接信息
        # 进行信息的传递、融合
        return self.propagate(edge_index, x=x)