# Code and log of trainning Graph Transformer

In [2]:
import os
import dgl
import torch
import torch.nn as nn
import torch.optim as optim
import random
import warnings
from dgl.data import AsGraphPredDataset
from dgl.data.utils import Subset
from dgl.dataloading import GraphDataLoader
from tqdm import tqdm

from models_gt import GTModelFeatDense

random.seed(42)
warnings.filterwarnings("ignore", category=UserWarning)

In [3]:
# Define hyperparameters
hparams = {
    'lr': 0.00005,
    'batch_size': 256,
    'pos_enc_size': 8,
}

In [6]:
# Loop for evaluation and training

def compute_acc(out, tgt):
    '''
    out and tgt are 1-d list with same length
    '''
    cor = 0
    tot = 0
    for i, j in zip(out, tgt):
        tot += 1
        if i == j:
            cor += 1
    return cor / tot


@torch.no_grad()
def evaluate(model, dataloader, device):
    model.eval()

    y_true = []
    y_pred = []
    for batched_g, labels in dataloader:
        batched_g, labels = batched_g.to(device), labels.to(device)
        y_hat = model(batched_g, batched_g.ndata["node_attr"], batched_g.ndata["PE"])
        y_true.append(labels.view(y_hat.shape).detach().cpu())
        y_pred.append(y_hat.detach().cpu())
    y_true = torch.cat(y_true, dim=0).squeeze()
    y_pred = torch.cat(y_pred, dim=0).squeeze()

    loss_func = nn.BCEWithLogitsLoss()
    loss = loss_func(y_pred, y_true.float())

    # Compute output
    prob = torch.sigmoid(y_pred)
    out = prob.clone()
    out[out >= 0.5] = 1
    out[out < 0.5] = 0
    out = out.long()
    acc = compute_acc(out, y_true)

    ret = {
        'loss': loss.item(),
        'acc': acc,
    }

    return ret


def train(model, dataset, device):
    train_dataloader = GraphDataLoader(
        Subset(dataset, dataset.train_idx),
        batch_size=hparams['batch_size'],
        shuffle=True,
    )
    valid_dataloader = GraphDataLoader(
        Subset(dataset, dataset.val_idx),
        batch_size=hparams['batch_size'],
    )
    test_dataloader = GraphDataLoader(
        Subset(dataset, dataset.test_idx),
        batch_size=hparams['batch_size'],
    )
    optimizer = optim.Adam(model.parameters(), lr=hparams['lr'])
    num_epochs = 20
    loss_fcn = nn.BCEWithLogitsLoss()

    for epoch in range(num_epochs):
        model.train()
        total_loss = 0.0
        for batched_g, labels in tqdm(train_dataloader):
            batched_g, labels = batched_g.to(device), labels.to(device)  # BS: 256
            logits = model(
                batched_g, batched_g.ndata["node_attr"], batched_g.ndata["PE"]  # batched_g.edata['feat'],
            )
            loss = loss_fcn(logits, labels.float())
            total_loss += loss.item()
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
        avg_loss = total_loss / len(train_dataloader)
        val_metric = evaluate(model, valid_dataloader, device)
        print('Epoch: {:03d}, Loss: {:.4f}, Val loss: {:.4f}, Val acc: {:.4f}'.format(
            epoch, avg_loss, val_metric['loss'], val_metric['acc']))
    test_metric = evaluate(model, test_dataloader, device)
    print('Testing performance: ', test_metric)

In [7]:
dev = torch.device("cuda:1")
data_dir = './data/AIDS'
dataset_path = os.path.join(data_dir, 'dataset.pt')

# Load dataset.
if not os.path.exists(dataset_path):
    dataset = AsGraphPredDataset(
        dgl.data.TUDataset('AIDS', raw_dir='./data/'),
        split_ratio=(0.8, 0.1, 0.1),
    )

    # Laplacian positional encoding.
    indices = torch.cat([dataset.train_idx, dataset.val_idx, dataset.test_idx])
    for idx in tqdm(indices, desc="Computing Laplacian PE"):
        g, _ = dataset[idx]
        g.ndata["PE"] = dgl.laplacian_pe(g, k=hparams['pos_enc_size'], padding=True)

    torch.save(dataset, dataset_path)
else:
    dataset = torch.load(dataset_path)

# Create model.
out_size = dataset.num_tasks
model = GTModelFeatDense(out_size=out_size, pos_enc_size=hparams['pos_enc_size']).to(dev)

# Start training.
train(model, dataset, dev)

100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  3.86it/s]


Epoch: 000, Loss: 0.4080, Val loss: 0.4855, Val acc: 0.9100


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  4.18it/s]


Epoch: 001, Loss: 0.3037, Val loss: 0.3805, Val acc: 0.9350


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  3.98it/s]


Epoch: 002, Loss: 0.2429, Val loss: 0.2760, Val acc: 0.9400


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  4.00it/s]


Epoch: 003, Loss: 0.2310, Val loss: 0.2356, Val acc: 0.9400


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  4.20it/s]


Epoch: 004, Loss: 0.1977, Val loss: 0.2133, Val acc: 0.9450


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  3.92it/s]


Epoch: 005, Loss: 0.1841, Val loss: 0.1924, Val acc: 0.9550


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  3.97it/s]


Epoch: 006, Loss: 0.1508, Val loss: 0.1740, Val acc: 0.9550


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  4.13it/s]


Epoch: 007, Loss: 0.1476, Val loss: 0.1598, Val acc: 0.9550


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  3.86it/s]


Epoch: 008, Loss: 0.1398, Val loss: 0.1462, Val acc: 0.9550


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  3.93it/s]


Epoch: 009, Loss: 0.1362, Val loss: 0.1352, Val acc: 0.9600


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  4.15it/s]


Epoch: 010, Loss: 0.1211, Val loss: 0.1272, Val acc: 0.9650


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  3.93it/s]


Epoch: 011, Loss: 0.1086, Val loss: 0.1172, Val acc: 0.9700


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  3.83it/s]


Epoch: 012, Loss: 0.1029, Val loss: 0.1117, Val acc: 0.9700


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  3.92it/s]


Epoch: 013, Loss: 0.1017, Val loss: 0.1046, Val acc: 0.9700


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  4.16it/s]


Epoch: 014, Loss: 0.1113, Val loss: 0.0988, Val acc: 0.9750


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  3.97it/s]


Epoch: 015, Loss: 0.1031, Val loss: 0.0965, Val acc: 0.9750


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  3.82it/s]


Epoch: 016, Loss: 0.0841, Val loss: 0.0947, Val acc: 0.9750


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  4.24it/s]


Epoch: 017, Loss: 0.0823, Val loss: 0.1052, Val acc: 0.9600


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  3.90it/s]


Epoch: 018, Loss: 0.0931, Val loss: 0.0998, Val acc: 0.9750


100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:01<00:00,  3.92it/s]


Epoch: 019, Loss: 0.0824, Val loss: 0.0903, Val acc: 0.9750
Testing performance:  {'loss': 0.06249335780739784, 'acc': 0.99}
