# Instalação

A fim de desenvolver modelos de deep learning para grafos, será necessário instalar o módulo Pytorch Geometric. Para tanto, iremos desinstalar a versão atual do Pytorch pelo seguinte código:

In [None]:
'''
!pip3 uninstall torchtext -y
!pip3 uninstall torchvision -y
!pip3 uninstall torch -y
'''

A partir disso, iremos instalar a versão 1.9.0, anterior a atual:

In [None]:
#!pip3 install torch==1.9.0

Com isso, poderemos baixar o pacote do Pytorch Geometric. Caso não seja instalado, reinicie a máquina, pois a instalação da nova versão do Pytorch pode não ter sido salva corretamente na máquina virtual.

In [None]:
'''
import torch

if torch.__version__ != '1.9.0+cu102':
    print('Versão do pytorch inadequada! Favor reiniciar a máquina virtual.')
else:    
    pytorch_version=f'torch-{torch.__version__}.html'
    !pip3 install --no-index torch-scatter -f https://pytorch-geometric.com/whl/$pytorch_version
    !pip3 install --no-index torch-sparse -f https://pytorch-geometric.com/whl/$pytorch_version
    !pip3 install --no-index torch-cluster -f https://pytorch-geometric.com/whl/$pytorch_version
    !pip3 install --no-index torch-spline-conv -f https://pytorch-geometric.com/whl/$pytorch_version
    !pip3 install torch-geometric
'''

# 1- Representação de um grafo

Como introdução ao PyG, vamos construir o grafo definido pela equação abaixo:

$$ G = \{ V, E \} $$

Em que:

$$ V = \{ \{0, 1, 2 \} \} $$
$$ E = \{ \{0, 1\}, \{1, 2\} \} $$

Note que o grafo G é composto por três vértices {0,1,2} e por duas arestas {{0,1},{1,2}}, sendo não dirigido.

No PyG, um grafo é representado como uma instância da classe <code>torch_geometric.data.Data</code>. Portanto, devemos importá-la de modo a construir o grafo. 

Além disso, importaremos também o módulo <code>torch</code> com a finalidade de utilizar algumas funcionalidades do Pytorch, como os tensores.

In [1]:
import torch
from torch_geometric.data import Data

## 1.1- Representando as arestas

A classe <code>Data</code> espera receber a representação das arestas no formato <code>COO</code> (COOrdinate). Nele, a conectividade do grafo é representada por meio de uma matriz com duas linhas, a primeira se referindo aos vértices de origem; a segunda, aos de destino. Dessa forma, os dois vértices em uma mesma coluna compõem a aresta em questão.

Usualmente,tal matriz é referida como <code>edge_index</code>, sendo implementada por um tensor do tipo <code>torch.long</code>:

In [28]:
edge_index = torch.tensor([[0, 1, 1, 2],
                          [1, 0, 2, 1]], dtype=torch.long)
edge_index

tensor([[0, 1, 1, 2],
        [1, 0, 2, 1]])

Perceba que, na primeria coluna, encontram-se os vértices 0 e 1 respectivamente, representando uma aresta que parte de 0 em direção a 1. Já na segunda coluna, novamente encontramos os vértices 0 e 1, porém na ordem inversa, indicando que agora a aresta parte de 1 em direção a 0. 


Tal notação, embora pareça redundante, é necessária para sinalizar que o grafo é não dirigido. O mesmo padrão se repete para as duas últimas colunas, as quais representam a aresta {1,2}.

Outra forma de definir as arestas seria por meio de uma lista de tuplas. Porém, de modo a manter o formato COO, precisamos realizar a transposição do tensor, por meio do método <code>t</code>, além de aplicar o método <code>contiguous</code> em seguida.

In [30]:
edge_index = torch.tensor([[0,1],
                           [1,0],
                           [1,2],
                           [2,1]], dtype=torch.long)

edge_index = edge_index.t().contiguous()
edge_index

tensor([[0, 1, 1, 2],
        [1, 0, 2, 1]])

## 1.2 - Representando as _features_

Para esse exemplo, cada nó terá apenas uma _feature_. Dessa forma, podemos definir o tensor como uma matriz coluna, em que cada linha representa as _features_ dos nós 0, 1 e 2 respectivamente. 

Como as _features_ são as variáveis independentes do modelo, iremos referenciar tal tensor como <code>x</code>, além de atribuir o tipo de dado <code>torch.float</code>.

In [31]:
x = torch.tensor([[-1], [0], [1]], dtype=torch.float)
x

tensor([[-1.],
        [ 0.],
        [ 1.]])

## 1.3 - Criando a representação do grafo

Por fim, de modo a representar o grafo G, precisamos apenas criar uma instância da classe <code>Data</code>, passando os tensores como argumentos do construtor.

In [4]:
data = Data(x=x, edge_index=edge_index)
data

Data(x=[3, 1], edge_index=[2, 4])

Dessa forma, criamos a representação do grafo G, indicado pela imagem abaixo, no PyG. 

<figure>
    <img src="img/graph.svg" alt="Grafo" width='400'>
    <figcaption style="font-size: 12px; text-align: center;">
        <em> 
            Fonte: 
                <a href="https://pytorch-geometric.readthedocs.io/en/latest/notes/introduction.html"> 
                    Documentação do Pytorch Geometric
                </a> 
        </em> 
    </figcaption>
</figure>


## 1.4 - Atributos e métodos

A classe <code>Data</code> contem diversos parâmetros que retornam informações importantes da representação do grafo. Por exemplo, podemos visualizar a matriz que representa as arestas no formato COO:

In [32]:
data.edge_index

tensor([[0, 1, 1, 2],
        [1, 0, 2, 1]])

A fim da melhor visualização, podemos transpor essa matriz:

In [33]:
data.edge_index.t()

tensor([[0, 1],
        [1, 0],
        [1, 2],
        [2, 1]])

Podemos visualizar também a matriz de _features_ que guarda as variáveis independentes do modelo:

In [34]:
data.x

tensor([[-1.],
        [ 0.],
        [ 1.]])

Podemos saber a quantidade de nós do grafo:

In [35]:
data.num_nodes

3

Bem como o número de arestas:

In [36]:
data.num_edges

4

Além da quantidade de _features_ por nó:

In [37]:
data.num_features

1

Além disso, há métodos que retornnam também outras informações gerais acerca do grafo, como se ele possui nós isolados:

In [38]:
data.has_isolated_nodes()

False

Se possui grafos conectados a si (_self loops_):

In [39]:
data.has_self_loops()

False

Por fim, se o grafo é dirigido:

In [41]:
data.is_directed()

False

# 2- Datasets