We load our data.

In [1]:
from torch_geometric_temporal.dataset import WindmillOutputSmallDatasetLoader
#from torch_geometric_temporal.dataset import ChickenpoxDatasetLoader
from torch_geometric_temporal.signal import temporal_signal_split

loader = WindmillOutputSmallDatasetLoader()
#loader = ChickenpoxDatasetLoader()

dataset = loader.get_dataset()

We look at our data.

**How many data points?**

17464

**What does a single datapoint look like?**

A single datapoint has a shape [11,8]

**What are the edge indices?**

The edge index is 2

**What are the edge attributes?**

The edge attributes are 121

**What kind of task is this - regression or classification?**

It is a regression task

In [10]:
print("Number of data points: ", dataset.snapshot_count)
snapshot = dataset[0]
print(snapshot)
print("Features: ", snapshot.num_features, "Edge index: ", len(snapshot.edge_index), "Edge attributes: ", len(snapshot.edge_attr))

Number of data points:  17464
Data(x=[11, 8], edge_index=[2, 121], edge_attr=[121], y=[11])
Features:  8 Edge index:  2 Edge attributes:  121


We split it into train and test. **Note need to be careful with temporal data.**

In [4]:
train_dataset, test_dataset = temporal_signal_split(dataset, train_ratio=0.8)

We define a model.

**What type of model?**

I used the GConvGRU model

In [7]:
import torch
import torch.nn.functional as F
from torch_geometric_temporal.nn.recurrent import GConvGRU

class RecurrentGCN(torch.nn.Module):
    def __init__(self, node_features):
        super(RecurrentGCN, self).__init__()
        self.recurrent = GConvGRU(node_features, 32, 1)
        self.linear = torch.nn.Linear(32, 1)

    def forward(self, x, edge_index, edge_weight):
        h = self.recurrent(x, edge_index, edge_weight)
        h = F.relu(h)
        h = self.linear(h)
        return h

We train the model.

**What optimizer?**

**How many epochs?**

In [8]:
from tqdm import tqdm

model = RecurrentGCN(node_features = 8)

optimizer = torch.optim.Adam(model.parameters(), lr=0.01)

model.train()

for epoch in tqdm(range(25)):
    cost = 0
    for time, snapshot in enumerate(train_dataset):
        y_hat = model(snapshot.x, snapshot.edge_index, snapshot.edge_attr)
        cost = cost + torch.mean((y_hat-snapshot.y)**2)
    cost = cost / (time+1)
    cost.backward()
    optimizer.step()
    optimizer.zero_grad()
    print("MSE: {:.4f}".format(cost))

  4%|███▎                                                                                | 1/25 [00:21<08:37, 21.57s/it]

MSE: 1.0287


  8%|██████▋                                                                             | 2/25 [00:43<08:20, 21.74s/it]

MSE: 1.0144


 12%|██████████                                                                          | 3/25 [01:05<07:57, 21.69s/it]

MSE: 1.0084


 16%|█████████████▍                                                                      | 4/25 [01:26<07:34, 21.66s/it]

MSE: 1.0080


 20%|████████████████▊                                                                   | 5/25 [01:53<07:52, 23.61s/it]

MSE: 1.0092


 24%|████████████████████▏                                                               | 6/25 [02:15<07:15, 22.92s/it]

MSE: 1.0094


 28%|███████████████████████▌                                                            | 7/25 [02:37<06:46, 22.58s/it]

MSE: 1.0082


 32%|██████████████████████████▉                                                         | 8/25 [02:58<06:19, 22.31s/it]

MSE: 1.0066


 36%|██████████████████████████████▏                                                     | 9/25 [03:20<05:53, 22.12s/it]

MSE: 1.0051


 40%|█████████████████████████████████▏                                                 | 10/25 [03:42<05:31, 22.07s/it]

MSE: 1.0042


 44%|████████████████████████████████████▌                                              | 11/25 [04:05<05:11, 22.24s/it]

MSE: 1.0040


 48%|███████████████████████████████████████▊                                           | 12/25 [04:27<04:48, 22.17s/it]

MSE: 1.0042


 52%|███████████████████████████████████████████▏                                       | 13/25 [04:48<04:23, 21.95s/it]

MSE: 1.0046


 56%|██████████████████████████████████████████████▍                                    | 14/25 [05:10<03:59, 21.79s/it]

MSE: 1.0049


 60%|█████████████████████████████████████████████████▊                                 | 15/25 [05:33<03:42, 22.24s/it]

MSE: 1.0048


 64%|█████████████████████████████████████████████████████                              | 16/25 [05:55<03:19, 22.17s/it]

MSE: 1.0045


 68%|████████████████████████████████████████████████████████▍                          | 17/25 [06:17<02:58, 22.28s/it]

MSE: 1.0040


 72%|███████████████████████████████████████████████████████████▊                       | 18/25 [06:39<02:35, 22.22s/it]

MSE: 1.0035


 76%|███████████████████████████████████████████████████████████████                    | 19/25 [07:01<02:12, 22.13s/it]

MSE: 1.0030


 80%|██████████████████████████████████████████████████████████████████▍                | 20/25 [07:24<01:50, 22.19s/it]

MSE: 1.0028


 84%|█████████████████████████████████████████████████████████████████████▋             | 21/25 [07:45<01:28, 22.05s/it]

MSE: 1.0027


 88%|█████████████████████████████████████████████████████████████████████████          | 22/25 [08:07<01:05, 21.96s/it]

MSE: 1.0028


 92%|████████████████████████████████████████████████████████████████████████████▎      | 23/25 [08:29<00:43, 21.82s/it]

MSE: 1.0028


 96%|███████████████████████████████████████████████████████████████████████████████▋   | 24/25 [08:50<00:21, 21.73s/it]

MSE: 1.0028


100%|███████████████████████████████████████████████████████████████████████████████████| 25/25 [09:12<00:00, 22.09s/it]

MSE: 1.0026





We evaluate.

**What is MSE?**

In [17]:
model.eval()
cost = 0
for time, snapshot in enumerate(test_dataset):
    y_hat = model(snapshot.x, snapshot.edge_index, snapshot.edge_attr)
    cost = cost + torch.mean((y_hat-snapshot.y)**2)
cost = cost / (time+1)
cost = cost.item()
print("MSE: {:.4f}".format(cost))

MSE: 0.9848


#### Using AdamW

In [14]:
from tqdm import tqdm

model1 = RecurrentGCN(node_features = 8)

optimizer = torch.optim.AdamW(model1.parameters(), lr=0.01)

model1.train()

for epoch in tqdm(range(25)):
    cost = 0
    for time, snapshot in enumerate(train_dataset):
        y_hat = model1(snapshot.x, snapshot.edge_index, snapshot.edge_attr)
        cost = cost + torch.mean((y_hat-snapshot.y)**2)
    cost = cost / (time+1)
    cost.backward()
    optimizer.step()
    optimizer.zero_grad()
    print("MSE: {:.4f}".format(cost))

  4%|███▎                                                                                | 1/25 [00:22<09:07, 22.83s/it]

MSE: 1.0238


  8%|██████▋                                                                             | 2/25 [00:45<08:44, 22.80s/it]

MSE: 1.0146


 12%|██████████                                                                          | 3/25 [01:08<08:23, 22.91s/it]

MSE: 1.0109


 16%|█████████████▍                                                                      | 4/25 [01:31<08:03, 23.01s/it]

MSE: 1.0089


 20%|████████████████▊                                                                   | 5/25 [01:54<07:38, 22.91s/it]

MSE: 1.0072


 24%|████████████████████▏                                                               | 6/25 [02:17<07:18, 23.06s/it]

MSE: 1.0060


 28%|███████████████████████▌                                                            | 7/25 [02:40<06:52, 22.94s/it]

MSE: 1.0056


 32%|██████████████████████████▉                                                         | 8/25 [03:03<06:29, 22.94s/it]

MSE: 1.0057


 36%|██████████████████████████████▏                                                     | 9/25 [03:26<06:07, 22.97s/it]

MSE: 1.0059


 40%|█████████████████████████████████▏                                                 | 10/25 [03:50<05:47, 23.17s/it]

MSE: 1.0057


 44%|████████████████████████████████████▌                                              | 11/25 [04:13<05:22, 23.06s/it]

MSE: 1.0052


 48%|███████████████████████████████████████▊                                           | 12/25 [04:35<04:56, 22.79s/it]

MSE: 1.0045


 52%|███████████████████████████████████████████▏                                       | 13/25 [04:57<04:32, 22.74s/it]

MSE: 1.0040


 56%|██████████████████████████████████████████████▍                                    | 14/25 [05:20<04:09, 22.68s/it]

MSE: 1.0036


 60%|█████████████████████████████████████████████████▊                                 | 15/25 [05:42<03:46, 22.63s/it]

MSE: 1.0033


 64%|█████████████████████████████████████████████████████                              | 16/25 [06:05<03:22, 22.53s/it]

MSE: 1.0031


 68%|████████████████████████████████████████████████████████▍                          | 17/25 [06:28<03:01, 22.63s/it]

MSE: 1.0028


 72%|███████████████████████████████████████████████████████████▊                       | 18/25 [06:50<02:38, 22.69s/it]

MSE: 1.0025


 76%|███████████████████████████████████████████████████████████████                    | 19/25 [07:13<02:15, 22.65s/it]

MSE: 1.0023


 80%|██████████████████████████████████████████████████████████████████▍                | 20/25 [07:35<01:52, 22.54s/it]

MSE: 1.0022


 84%|█████████████████████████████████████████████████████████████████████▋             | 21/25 [07:57<01:29, 22.45s/it]

MSE: 1.0021


 88%|█████████████████████████████████████████████████████████████████████████          | 22/25 [08:21<01:08, 22.71s/it]

MSE: 1.0021


 92%|████████████████████████████████████████████████████████████████████████████▎      | 23/25 [08:43<00:45, 22.61s/it]

MSE: 1.0020


 96%|███████████████████████████████████████████████████████████████████████████████▋   | 24/25 [09:06<00:22, 22.57s/it]

MSE: 1.0019


100%|███████████████████████████████████████████████████████████████████████████████████| 25/25 [09:28<00:00, 22.75s/it]

MSE: 1.0018





In [18]:
model1.eval()
cost = 0
for time, snapshot in enumerate(test_dataset):
    y_hat = model1(snapshot.x, snapshot.edge_index, snapshot.edge_attr)
    cost = cost + torch.mean((y_hat-snapshot.y)**2)
cost = cost / (time+1)
cost = cost.item()
print("MSE: {:.4f}".format(cost))

MSE: 0.9826


#### Change epoches

In [20]:
from tqdm import tqdm

model2 = RecurrentGCN(node_features = 8)

optimizer = torch.optim.Adam(model2.parameters(), lr=0.01)

model2.train()

for epoch in tqdm(range(20)):
    cost = 0
    for time, snapshot in enumerate(train_dataset):
        y_hat = model2(snapshot.x, snapshot.edge_index, snapshot.edge_attr)
        cost = cost + torch.mean((y_hat-snapshot.y)**2)
    cost = cost / (time+1)
    cost.backward()
    optimizer.step()
    optimizer.zero_grad()
    print("MSE: {:.4f}".format(cost))

  5%|████▏                                                                               | 1/20 [00:22<07:00, 22.14s/it]

MSE: 1.0108


 10%|████████▍                                                                           | 2/20 [00:43<06:29, 21.63s/it]

MSE: 1.0080


 15%|████████████▌                                                                       | 3/20 [01:04<06:05, 21.51s/it]

MSE: 1.0067


 20%|████████████████▊                                                                   | 4/20 [01:25<05:41, 21.36s/it]

MSE: 1.0052


 25%|█████████████████████                                                               | 5/20 [01:47<05:21, 21.43s/it]

MSE: 1.0047


 30%|█████████████████████████▏                                                          | 6/20 [02:08<04:59, 21.40s/it]

MSE: 1.0047


 35%|█████████████████████████████▍                                                      | 7/20 [02:30<04:38, 21.44s/it]

MSE: 1.0044


 40%|█████████████████████████████████▌                                                  | 8/20 [02:52<04:18, 21.54s/it]

MSE: 1.0039


 45%|█████████████████████████████████████▊                                              | 9/20 [03:13<03:57, 21.56s/it]

MSE: 1.0036


 50%|█████████████████████████████████████████▌                                         | 10/20 [03:34<03:34, 21.43s/it]

MSE: 1.0033


 55%|█████████████████████████████████████████████▋                                     | 11/20 [03:56<03:12, 21.43s/it]

MSE: 1.0030


 60%|█████████████████████████████████████████████████▊                                 | 12/20 [04:17<02:51, 21.41s/it]

MSE: 1.0026


 65%|█████████████████████████████████████████████████████▉                             | 13/20 [04:38<02:29, 21.37s/it]

MSE: 1.0022


 70%|██████████████████████████████████████████████████████████                         | 14/20 [05:00<02:08, 21.41s/it]

MSE: 1.0019


 75%|██████████████████████████████████████████████████████████████▎                    | 15/20 [05:22<01:47, 21.48s/it]

MSE: 1.0018


 80%|██████████████████████████████████████████████████████████████████▍                | 16/20 [05:43<01:25, 21.36s/it]

MSE: 1.0016


 85%|██████████████████████████████████████████████████████████████████████▌            | 17/20 [06:04<01:04, 21.42s/it]

MSE: 1.0013


 90%|██████████████████████████████████████████████████████████████████████████▋        | 18/20 [06:25<00:42, 21.33s/it]

MSE: 1.0011


 95%|██████████████████████████████████████████████████████████████████████████████▊    | 19/20 [06:46<00:21, 21.22s/it]

MSE: 1.0010


100%|███████████████████████████████████████████████████████████████████████████████████| 20/20 [07:07<00:00, 21.40s/it]

MSE: 1.0009





In [22]:
model2.eval()
cost = 0
for time, snapshot in enumerate(test_dataset):
    y_hat = model2(snapshot.x, snapshot.edge_index, snapshot.edge_attr)
    cost = cost + torch.mean((y_hat-snapshot.y)**2)
cost = cost / (time+1)
cost = cost.item()
print("MSE: {:.4f}".format(cost))

MSE: 0.9841


#### more epoches

In [26]:
from tqdm import tqdm

model4 = RecurrentGCN(node_features = 8)

optimizer = torch.optim.Adam(model4.parameters(), lr=0.01)

model4.train()

for epoch in tqdm(range(30)):
    cost = 0
    for time, snapshot in enumerate(train_dataset):
        y_hat = model4(snapshot.x, snapshot.edge_index, snapshot.edge_attr)
        cost = cost + torch.mean((y_hat-snapshot.y)**2)
    cost = cost / (time+1)
    cost.backward()
    optimizer.step()
    optimizer.zero_grad()
    print("MSE: {:.4f}".format(cost))

  3%|██▊                                                                                 | 1/30 [00:25<12:33, 25.99s/it]

MSE: 1.0084


  7%|█████▌                                                                              | 2/30 [00:47<10:52, 23.30s/it]

MSE: 1.0067


 10%|████████▍                                                                           | 3/30 [01:10<10:28, 23.28s/it]

MSE: 1.0051


 13%|███████████▏                                                                        | 4/30 [01:34<10:07, 23.36s/it]

MSE: 1.0042


 17%|██████████████                                                                      | 5/30 [01:56<09:31, 22.86s/it]

MSE: 1.0042


 20%|████████████████▊                                                                   | 6/30 [02:19<09:11, 22.98s/it]

MSE: 1.0039


 23%|███████████████████▌                                                                | 7/30 [02:42<08:47, 22.95s/it]

MSE: 1.0033


 27%|██████████████████████▍                                                             | 8/30 [03:05<08:27, 23.07s/it]

MSE: 1.0028


 30%|█████████████████████████▏                                                          | 9/30 [03:28<08:02, 22.97s/it]

MSE: 1.0025


 33%|███████████████████████████▋                                                       | 10/30 [03:51<07:37, 22.90s/it]

MSE: 1.0021


 37%|██████████████████████████████▍                                                    | 11/30 [04:14<07:15, 22.93s/it]

MSE: 1.0016


 40%|█████████████████████████████████▏                                                 | 12/30 [04:37<06:53, 22.96s/it]

MSE: 1.0014


 43%|███████████████████████████████████▉                                               | 13/30 [04:59<06:29, 22.93s/it]

MSE: 1.0012


 47%|██████████████████████████████████████▋                                            | 14/30 [05:22<06:05, 22.86s/it]

MSE: 1.0010


 50%|█████████████████████████████████████████▌                                         | 15/30 [05:45<05:44, 22.95s/it]

MSE: 1.0007


 53%|████████████████████████████████████████████▎                                      | 16/30 [06:09<05:25, 23.26s/it]

MSE: 1.0005


 57%|███████████████████████████████████████████████                                    | 17/30 [06:35<05:13, 24.08s/it]

MSE: 1.0003


 60%|█████████████████████████████████████████████████▊                                 | 18/30 [07:04<05:05, 25.42s/it]

MSE: 1.0001


 63%|████████████████████████████████████████████████████▌                              | 19/30 [07:32<04:48, 26.23s/it]

MSE: 0.9999


 67%|███████████████████████████████████████████████████████▎                           | 20/30 [07:57<04:19, 25.94s/it]

MSE: 0.9997


 70%|██████████████████████████████████████████████████████████                         | 21/30 [08:23<03:52, 25.87s/it]

MSE: 0.9995


 73%|████████████████████████████████████████████████████████████▊                      | 22/30 [08:48<03:25, 25.74s/it]

MSE: 0.9994


 77%|███████████████████████████████████████████████████████████████▋                   | 23/30 [09:16<03:04, 26.36s/it]

MSE: 0.9992


 80%|██████████████████████████████████████████████████████████████████▍                | 24/30 [09:43<02:39, 26.60s/it]

MSE: 0.9990


 83%|█████████████████████████████████████████████████████████████████████▏             | 25/30 [10:10<02:12, 26.57s/it]

MSE: 0.9988


 87%|███████████████████████████████████████████████████████████████████████▉           | 26/30 [10:35<01:44, 26.19s/it]

MSE: 0.9987


 90%|██████████████████████████████████████████████████████████████████████████▋        | 27/30 [11:00<01:17, 25.77s/it]

MSE: 0.9985


 93%|█████████████████████████████████████████████████████████████████████████████▍     | 28/30 [11:25<00:51, 25.69s/it]

MSE: 0.9983


 97%|████████████████████████████████████████████████████████████████████████████████▏  | 29/30 [11:50<00:25, 25.37s/it]

MSE: 0.9982


100%|███████████████████████████████████████████████████████████████████████████████████| 30/30 [12:14<00:00, 24.48s/it]

MSE: 0.9980





In [27]:
model4.eval()
cost = 0
for time, snapshot in enumerate(test_dataset):
    y_hat = model4(snapshot.x, snapshot.edge_index, snapshot.edge_attr)
    cost = cost + torch.mean((y_hat-snapshot.y)**2)
cost = cost / (time+1)
cost = cost.item()
print("MSE: {:.4f}".format(cost))

MSE: 0.9871


#### SGD

In [23]:
from tqdm import tqdm

model3 = RecurrentGCN(node_features = 8)

optimizer = torch.optim.SGD(model3.parameters(), lr=0.01)

model3.train()

for epoch in tqdm(range(25)):
    cost = 0
    for time, snapshot in enumerate(train_dataset):
        y_hat = model3(snapshot.x, snapshot.edge_index, snapshot.edge_attr)
        cost = cost + torch.mean((y_hat-snapshot.y)**2)
    cost = cost / (time+1)
    cost.backward()
    optimizer.step()
    optimizer.zero_grad()
    print("MSE: {:.4f}".format(cost))

  4%|███▎                                                                                | 1/25 [00:20<08:21, 20.89s/it]

MSE: 1.0284


  8%|██████▋                                                                             | 2/25 [00:41<08:01, 20.94s/it]

MSE: 1.0271


 12%|██████████                                                                          | 3/25 [01:03<07:47, 21.25s/it]

MSE: 1.0260


 16%|█████████████▍                                                                      | 4/25 [01:24<07:25, 21.20s/it]

MSE: 1.0249


 20%|████████████████▊                                                                   | 5/25 [01:48<07:21, 22.07s/it]

MSE: 1.0238


 24%|████████████████████▏                                                               | 6/25 [02:10<06:57, 21.99s/it]

MSE: 1.0228


 28%|███████████████████████▌                                                            | 7/25 [02:31<06:32, 21.82s/it]

MSE: 1.0219


 32%|██████████████████████████▉                                                         | 8/25 [02:52<06:07, 21.64s/it]

MSE: 1.0210


 36%|██████████████████████████████▏                                                     | 9/25 [03:14<05:44, 21.55s/it]

MSE: 1.0202


 40%|█████████████████████████████████▏                                                 | 10/25 [03:36<05:26, 21.76s/it]

MSE: 1.0194


 44%|████████████████████████████████████▌                                              | 11/25 [03:57<05:01, 21.55s/it]

MSE: 1.0187


 48%|███████████████████████████████████████▊                                           | 12/25 [04:18<04:39, 21.51s/it]

MSE: 1.0180


 52%|███████████████████████████████████████████▏                                       | 13/25 [04:39<04:16, 21.36s/it]

MSE: 1.0173


 56%|██████████████████████████████████████████████▍                                    | 14/25 [05:00<03:53, 21.25s/it]

MSE: 1.0167


 60%|█████████████████████████████████████████████████▊                                 | 15/25 [05:21<03:31, 21.18s/it]

MSE: 1.0161


 64%|█████████████████████████████████████████████████████                              | 16/25 [05:42<03:10, 21.12s/it]

MSE: 1.0155


 68%|████████████████████████████████████████████████████████▍                          | 17/25 [06:03<02:48, 21.11s/it]

MSE: 1.0150


 72%|███████████████████████████████████████████████████████████▊                       | 18/25 [06:25<02:27, 21.10s/it]

MSE: 1.0145


 76%|███████████████████████████████████████████████████████████████                    | 19/25 [06:46<02:06, 21.08s/it]

MSE: 1.0140


 80%|██████████████████████████████████████████████████████████████████▍                | 20/25 [07:07<01:45, 21.06s/it]

MSE: 1.0135


 84%|█████████████████████████████████████████████████████████████████████▋             | 21/25 [07:28<01:24, 21.05s/it]

MSE: 1.0131


 88%|█████████████████████████████████████████████████████████████████████████          | 22/25 [07:49<01:03, 21.15s/it]

MSE: 1.0127


 92%|████████████████████████████████████████████████████████████████████████████▎      | 23/25 [08:10<00:42, 21.22s/it]

MSE: 1.0123


 96%|███████████████████████████████████████████████████████████████████████████████▋   | 24/25 [08:31<00:21, 21.16s/it]

MSE: 1.0120


100%|███████████████████████████████████████████████████████████████████████████████████| 25/25 [08:53<00:00, 21.32s/it]

MSE: 1.0116





In [24]:
model3.eval()
cost = 0
for time, snapshot in enumerate(test_dataset):
    y_hat = model3(snapshot.x, snapshot.edge_index, snapshot.edge_attr)
    cost = cost + torch.mean((y_hat-snapshot.y)**2)
cost = cost / (time+1)
cost = cost.item()
print("MSE: {:.4f}".format(cost))

MSE: 0.9885
