# PyG を用いた GNN

In [2]:
import torch
from torch_geometric.data import Data

## グラフデータの作成
節点 $V = {0, 1, 2}$、枝 $E = {(0,1), (1,2)}$ の無向グラフを作成。それぞれ特徴量 $x$ をもつ。  
有向グラフをもとにした記述に注意。

In [4]:
edge_index = torch.tensor([[0, 1, 1, 2],
                           [1, 0, 2, 1]], dtype=torch.long)
x = torch.tensor([[-1], [0], [1]], dtype=torch.float)

data = Data(x=x, edge_index=edge_index)

枝の記述が気に食わないなら、contiguous を使うとよい。

In [5]:
edge_index = torch.tensor([[0, 1],
                           [1, 0],
                           [1, 2],
                           [2, 1]], dtype=torch.long)
x = torch.tensor([[-1], [0], [1]], dtype=torch.float)

data = Data(x=x, edge_index=edge_index.t().contiguous())

data の内容。データの要素名と tensor の形がわかる

In [14]:
data

Data(x=[3, 1], edge_index=[2, 4])

グラフ構造データの要素名について

In [11]:
print(data.keys)

print('\"edge_attr\" found in data ? : {}'.format('edge_attr' in data))

['x', 'edge_index']
"edge_attr" found in data ? : False


data の要素を取り出す

In [8]:
print(data['x'])

tensor([[-1.],
        [ 0.],
        [ 1.]])


その他グラフを解析するメソッド

In [12]:
print(data.num_nodes)
print(data.num_edges)
print(data.num_node_features)
print(data.has_isolated_nodes())
print(data.has_self_loops())
print(data.is_directed())

3
4
1
False
False
False


In [13]:
data

Data(x=[3, 1], edge_index=[2, 4])

## データセット
ベンチマークの（基礎的な）データが多く用意されている。  
データセット "ENZYMES" のダウンロード

In [15]:
from torch_geometric.datasets import TUDataset

In [16]:
dataset = TUDataset(root='/tmp/ENZYMES', name='ENZYMES')

Downloading https://www.chrsmrrs.com/graphkerneldatasets/ENZYMES.zip
Extracting \tmp\ENZYMES\ENZYMES\ENZYMES.zip
Processing...
Done!


In [17]:
print(len(dataset))
print(dataset.num_classes)
print(dataset.num_node_features)

600
6
3


データセットには多くのグラフデータがおさめられている

In [19]:
print(dataset[0])
print(data.is_undirected())

Data(edge_index=[2, 168], x=[37, 3], y=[1])
True


上の例だと、一番目のグラフデータはノード数 37、枝数 168/2 の無向グラフで、各ノードが３次元の特徴量をもつ

データを操作するメソッド

In [22]:
print('スライス（サンプリング）')
print(dataset[:540])
print(dataset[540:])

print('\nシャッフル')
print(dataset.shuffle()[0])

スライス（サンプリング）
ENZYMES(540)
ENZYMES(60)

シャッフル
Data(edge_index=[2, 94], x=[23, 3], y=[1])


データセット "Cora" のダウンロード

In [23]:
from torch_geometric.datasets import Planetoid

In [24]:
dataset = Planetoid(root='/tmp/Cora', name='Cora')

Downloading https://github.com/kimiyoung/planetoid/raw/master/data/ind.cora.x
Downloading https://github.com/kimiyoung/planetoid/raw/master/data/ind.cora.tx
Downloading https://github.com/kimiyoung/planetoid/raw/master/data/ind.cora.allx
Downloading https://github.com/kimiyoung/planetoid/raw/master/data/ind.cora.y
Downloading https://github.com/kimiyoung/planetoid/raw/master/data/ind.cora.ty
Downloading https://github.com/kimiyoung/planetoid/raw/master/data/ind.cora.ally
Downloading https://github.com/kimiyoung/planetoid/raw/master/data/ind.cora.graph
Downloading https://github.com/kimiyoung/planetoid/raw/master/data/ind.cora.test.index
Processing...
Done!


In [25]:
print(len(dataset))
print(dataset.num_classes)
print(dataset.num_node_features)

1
7
1433
