<a href="https://colab.research.google.com/github/yukinaga/gnn/blob/main/section_2/02_geometric_basic.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# PyTorch Geometricの基礎
PyTorch Geometricの使い方を少しずつ学んでいきましょう。

## Google ドライブとの連携  
今回はライブラリのサイズが大きく毎回インストールするのが大変なので、Googleドライブに保存します。  
まずは以下のコードを実行し、認証コードを使用してGoogle ドライブをマウントします。

In [None]:
from google.colab import drive
drive.mount("/content/drive/")

Googleドライブ上のパスを指定します。

In [None]:
dir_name = "Live/gnn_live"  # 好きなパスを設定してください
package_path = "/content/drive/MyDrive/" + dir_name + "/packages/"

## PyTorch Geometricのインストール
GNN用のライブラリ「PyTorch Geometric」、および関連ライブラリをGoogle Driveのパスを指定してインストールします。

In [None]:
!pip install pyg-lib torch-scatter torch-sparse -f https://data.pyg.org/whl/torch-1.13.0+cu116.html
!pip install torch-geometric

Google Driveに保存したパッケージをシステムに追加します。  

In [None]:
import sys

sys.path.append(package_path)  

## グラフを作成する
エッジの接続を設定し、有向グラフを作成します。  
各ノードには、「特徴量」と「ラベル」を設定することができます。

In [None]:
import torch
from torch_geometric.data import Data
 
# エッジの接続
edge_from = [0, 1, 2]  # 接続元
edge_to = [2, 0, 1]  # 接続先
edge_index = torch.tensor([edge_from, edge_to], dtype=torch.long)
 
# 各ノードの特徴量
x_0 = [0, 1]
x_1 = [2, 3]
x_2 = [4, 5]
x = torch.tensor([x_0, x_1, x_2], dtype=torch.float)
 
# 各ノードのラベル
y_0 = [0]
y_1 = [1]
y_2 = [2]
y = torch.tensor([y_0, y_1, y_2], dtype=torch.float)
 
data = Data(x=x, y=y, edge_index=edge_index)
print(data)

## グラフの情報を表示
グラフの情報を表示するための関数を設定します。

In [None]:
def graph_info(data):

    print("ノードの数:", data.num_nodes)
    print("エッジの数:", data.num_edges)
    print("特徴量の数:", data.num_node_features)
    print("無向グラフか？:", data.is_undirected())
    print("孤立したノードが有るか？:", data.has_isolated_nodes())
    print("自己ループがあるか？:", data.has_self_loops())

    print()

    print("キー: ", data.keys)
    print("各ノードの特徴量")
    print(data["x"])
    print("各ノードのラベル")
    print(data["y"])
    print("各エッジ")
    print(data["edge_index"])

この関数を使って、グラフの情報を表示します。

In [None]:
graph_info(data)

グラフは、NetworkXのグラフに変換することで可視化できます

In [None]:
from torch_geometric.utils import to_networkx
import networkx as nx

nxg = to_networkx(data)  # networkxのグラフに変換
nx.draw(nxg)

## 既存のデータセット
大学の空手クラブのデータセット、「Karate club」を読み込みます。  
ノードは各メンバーを、エッジは交友関係を表します。  
空手クラブはトラブルによりいくつかのグループに分裂したのですが、各メンバーには所属する分裂後のグループを表すラベルが付いています。  

以下のコードにより、Karate clubのデータセットを読み込みます。

In [None]:
from torch_geometric.datasets import KarateClub

karate_dataset = KarateClub()
karate_data = karate_dataset[0]  # 最初のグラフ

関数を使って、データセットの情報を表示します。  

In [None]:
graph_info(karate_data)

NetworkXとmatplotlibを使ってグラフを可視化します。

In [None]:
import matplotlib.pyplot as plt

karate_nx = to_networkx(karate_data)  # networkxのグラフに変換

plt.figure(figsize=(12, 10))
nx.draw(karate_nx,
        node_color = karate_data.y,
        node_size=1000)
plt.show()

PyTorch Geometricは他にも様々なデータセットを用意しています。  
興味のあるかたは、ぜひ公式ドキュメントを読んでみてください。  
https://pytorch-geometric.readthedocs.io/en/latest/modules/datasets.html