In [1]:
# 3rd Party dependencies.
import os
import numpy as np
import matplotlib.pyplot as plt
import torch
import torch.nn as nn
import torchvision.transforms.v2 as transforms

from torch.utils.data import DataLoader
from tqdm import tqdm

# 1st Party dependencies.
from dataset.facades_dataset import FacadesDataset
from cyclegan.generator import Generator
from cyclegan.discriminator import Discriminator

%matplotlib inline

In [2]:
# Applying the same transformations as were applied to Pix2Pix train dataset.
train_transforms = transforms.Compose([
    transforms.ToImage(),
    transforms.ToDtype(torch.float32, scale=True),
    # Resizing the 256×256 input images to 286×286.
    transforms.Resize((286, 286)), 
    # Randomly cropping back to size 256×256.
    transforms.RandomCrop(256),
    # Mirroring.
    transforms.RandomHorizontalFlip(),
])

default_transforms = transforms.Compose([
    transforms.ToImage(),
    transforms.ToDtype(torch.float32, scale=True),
])

In [3]:
facades_train_dataset = FacadesDataset(root_dir='dataset/facades', split='train', transformations=train_transforms)
facades_val_dataset = FacadesDataset(root_dir='dataset/facades', split='val', transformations=default_transforms)

train_dataloader = DataLoader(facades_train_dataset, batch_size=1, shuffle=True, num_workers=4)
val_dataloader = DataLoader(facades_val_dataset, batch_size=1, shuffle=True)

In [4]:
def train_one_epoch(
    data_loader,
    generator_x,
    discriminator_x,
    generator_y,
    discriminator_y,
    optimiser_generator,
    optimiser_discriminator,
    l1_loss_func, 
    mse_loss_func,
    lambda_factor,
    device):
    d_losses = []
    g_losses = []
    
    for y, x in tqdm(data_loader):
        y = y.to(device)
        x = x.to(device)

        fake_x = generator_x(y)
        d_x_real = discriminator_x(x)
        d_x_fake = discriminator_x(fake_x.detach())
        d_x_real_loss = mse_loss_func(d_x_real, torch.ones_like(d_x_real))
        d_x_fake_loss = mse_loss_func(d_x_fake, torch.zeros_like(d_x_fake))
        d_x_loss = d_x_real_loss + d_x_fake_loss

        fake_y = generator_y(x)
        d_y_real = discriminator_y(y)
        d_y_fake = discriminator_y(fake_y.detach())
        d_y_real_loss = mse_loss_func(d_y_real, torch.ones_like(d_y_real))
        d_y_fake_loss = mse_loss_func(d_y_fake, torch.zeros_like(d_y_fake))
        d_y_loss = d_y_real_loss + d_y_fake_loss

        d_loss = (d_x_loss + d_y_loss) / 2

        optimiser_discriminator.zero_grad()
        d_loss.backward()
        optimiser_discriminator.step()

        # Adversarial losses.
        d_x_fake = discriminator_x(fake_x)
        d_y_fake = discriminator_y(fake_y)
        loss_g_x = mse_loss_func(d_x_fake, torch.ones_like(d_x_fake))
        loss_g_y = mse_loss_func(d_y_fake, torch.ones_like(d_y_fake))

        # Cycle losses.
        cycle_y = generator_y(fake_x)
        cycle_x = generator_x(fake_y)
        cycle_y_loss = l1_loss_func(y, cycle_y)
        cycle_x_loss = l1_loss_func(x, cycle_x)

        # Total generators loss.
        g_loss = loss_g_y \
            + loss_g_x \
            + cycle_y_loss * lambda_factor \
            + cycle_x_loss * lambda_factor

        optimiser_generator.zero_grad()
        g_loss.backward()
        optimiser_generator.step()

        d_losses.append(d_loss.detach().cpu().item())
        g_losses.append(g_loss.detach().cpu().item())

    return np.mean(g_losses), np.mean(d_losses)

In [None]:
# Setup.
device = ('cuda' if torch.cuda.is_available() else 'cpu')
learning_rate = 1e-5
lambda_cycle = 10
epochs = 100

print('Starting training', device, 'was selected for training')

# X -> Facade Segmentation
# Y -> Real facade image
generator_x = Generator(img_channels=3, num_residuals=9).to(device)
discriminator_x = Discriminator(in_channels=3).to(device)
generator_y = Generator(img_channels=3, num_residuals=9).to(device)
discriminator_y = Discriminator(in_channels=3).to(device)

optimiser_generator = torch.optim.Adam(
    list(generator_x.parameters()) + list(generator_y.parameters()),
    lr=learning_rate,
    betas=(0.5, 0.999),
)

optimiser_discriminator = torch.optim.Adam(
    list(discriminator_x.parameters()) + list(discriminator_y.parameters()),
    lr=learning_rate,
    betas=(0.5, 0.999),
)

l1_loss_function = nn.L1Loss()
mse_loss_function = nn.MSELoss()

generators_history = []
discriminators_history = []

for epoch in range(epochs):
    g_loss, d_loss = train_one_epoch(
        train_dataloader,
        generator_x,
        discriminator_x,
        generator_y,
        discriminator_y,
        optimiser_generator,
        optimiser_discriminator,
        l1_loss_function, 
        mse_loss_function,
        lambda_cycle,
        device)

    generators_history.append(g_loss)
    discriminators_history.append(d_loss)

    print('Epoch:', epoch, 'generators loss:', g_loss, 'discriminators loss:', d_loss)

    weights_dir = os.path.join('out', 'weights', 'cyclegan')
    os.makedirs(weights_dir, exist_ok=True)

    torch.save(generator_x.state_dict(), os.path.join(weights_dir, f"generator-x-{epoch:03d}-{g_loss:.3f}.pt"))
    torch.save(discriminator_x.state_dict(), os.path.join(weights_dir, f"discriminator-x-{epoch:03d}-{d_loss:.3f}.pt"))
    torch.save(generator_y.state_dict(), os.path.join(weights_dir, f"generator-y-{epoch:03d}-{g_loss:.3f}.pt"))
    torch.save(discriminator_y.state_dict(), os.path.join(weights_dir, f"discriminator-y-{epoch:03d}-{d_loss:.3f}.pt"))

100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [02:40<00:00,  2.49it/s]


Epoch: 0 generators loss: 3.991837751865387 discriminators loss: 0.4128294543176889


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:32<00:00,  4.32it/s]


Epoch: 1 generators loss: 2.6924561670422555 discriminators loss: 0.3780030155926943


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [02:04<00:00,  3.22it/s]


Epoch: 2 generators loss: 2.5212734150886535 discriminators loss: 0.3613624747470021


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:32<00:00,  4.31it/s]


Epoch: 3 generators loss: 2.419408208429813 discriminators loss: 0.35256701163947585


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:35<00:00,  4.20it/s]


Epoch: 4 generators loss: 2.369594935774803 discriminators loss: 0.34824463330209254


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:37<00:00,  4.09it/s]


Epoch: 5 generators loss: 2.3400556007027626 discriminators loss: 0.34064897563308477


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:33<00:00,  4.29it/s]


Epoch: 6 generators loss: 2.2930818855762483 discriminators loss: 0.33668723464012146


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:38<00:00,  4.05it/s]


Epoch: 7 generators loss: 2.266579268872738 discriminators loss: 0.32768425546586516


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:34<00:00,  4.23it/s]


Epoch: 8 generators loss: 2.265685320496559 discriminators loss: 0.3180054503306746


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:31<00:00,  4.37it/s]


Epoch: 9 generators loss: 2.229583189189434 discriminators loss: 0.3190692351013422


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:41<00:00,  3.92it/s]


Epoch: 10 generators loss: 2.2442407846450805 discriminators loss: 0.30863597432151435


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:35<00:00,  4.17it/s]


Epoch: 11 generators loss: 2.2262773525714876 discriminators loss: 0.312338212095201


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:37<00:00,  4.12it/s]


Epoch: 12 generators loss: 2.194823996126652 discriminators loss: 0.3134827985242009


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:35<00:00,  4.20it/s]


Epoch: 13 generators loss: 2.17890978038311 discriminators loss: 0.3165985673666


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:33<00:00,  4.29it/s]


Epoch: 14 generators loss: 2.1771991819143297 discriminators loss: 0.3147988158091903


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:37<00:00,  4.10it/s]


Epoch: 15 generators loss: 2.144028995037079 discriminators loss: 0.3213808362931013


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:36<00:00,  4.13it/s]


Epoch: 16 generators loss: 2.1583933195471765 discriminators loss: 0.3105194813013077


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:35<00:00,  4.18it/s]


Epoch: 17 generators loss: 2.151507220566273 discriminators loss: 0.3095408868603408


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:32<00:00,  4.34it/s]


Epoch: 18 generators loss: 2.1189163652062417 discriminators loss: 0.31286070346832273


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:35<00:00,  4.20it/s]


Epoch: 19 generators loss: 2.1368877777457236 discriminators loss: 0.30927706867456434


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:34<00:00,  4.25it/s]


Epoch: 20 generators loss: 2.103707265853882 discriminators loss: 0.31432277416810395


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:28<00:00,  4.50it/s]


Epoch: 21 generators loss: 2.1264209115505217 discriminators loss: 0.3025451753474772


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:38<00:00,  4.05it/s]


Epoch: 22 generators loss: 2.13093146532774 discriminators loss: 0.2975926920026541


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:32<00:00,  4.31it/s]


Epoch: 23 generators loss: 2.127977164685726 discriminators loss: 0.29147438300773504


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:34<00:00,  4.23it/s]


Epoch: 24 generators loss: 2.089751688838005 discriminators loss: 0.29995652981102466


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:33<00:00,  4.28it/s]


Epoch: 25 generators loss: 2.0940506628155706 discriminators loss: 0.2980137595161796


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:39<00:00,  4.01it/s]


Epoch: 26 generators loss: 2.099101981818676 discriminators loss: 0.29560645824298265


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [02:01<00:00,  3.28it/s]


Epoch: 27 generators loss: 2.1322277864813803 discriminators loss: 0.28363443721085785


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:38<00:00,  4.07it/s]


Epoch: 28 generators loss: 2.096635738313198 discriminators loss: 0.2922184557467699


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:29<00:00,  4.47it/s]


Epoch: 29 generators loss: 2.0835605806112287 discriminators loss: 0.29551986254751683


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:30<00:00,  4.42it/s]


Epoch: 30 generators loss: 2.068338131904602 discriminators loss: 0.29496797792613505


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:42<00:00,  3.90it/s]


Epoch: 31 generators loss: 2.064625315666199 discriminators loss: 0.2986093032360077


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [01:46<00:00,  3.75it/s]


Epoch: 32 generators loss: 2.0735966303944586 discriminators loss: 0.2965363108180463


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [03:37<00:00,  1.84it/s]


Epoch: 33 generators loss: 2.065668554902077 discriminators loss: 0.2926729346625507


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [03:47<00:00,  1.76it/s]


Epoch: 34 generators loss: 2.0999893030524253 discriminators loss: 0.28903701558709144


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [03:35<00:00,  1.86it/s]


Epoch: 35 generators loss: 2.0595540967583656 discriminators loss: 0.2956176806055009


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [04:34<00:00,  1.46it/s]


Epoch: 36 generators loss: 2.0491075763106346 discriminators loss: 0.29413580387830734


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [03:56<00:00,  1.69it/s]


Epoch: 37 generators loss: 2.060683910548687 discriminators loss: 0.2839814182184637


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [03:36<00:00,  1.85it/s]


Epoch: 38 generators loss: 2.0821841192245483 discriminators loss: 0.2805484241247177


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [03:26<00:00,  1.93it/s]


Epoch: 39 generators loss: 2.042226146757603 discriminators loss: 0.29049825213849545


100%|█████████████████████████████████████████████████████████████████████████████████| 400/400 [03:07<00:00,  2.13it/s]


Epoch: 40 generators loss: 2.075705952644348 discriminators loss: 0.2848688365332782


 52%|██████████████████████████████████████████                                       | 208/400 [01:50<01:52,  1.70it/s]

In [None]:
fig, ax = plt.subplots(nrows=1, ncols=2, figsize=(10, 10))

ax[0].set_title("Generators loss history")
ax[0].plot(generators_history)

ax[1].set_title("Discriminators loss history")
ax[1].plot(discriminators_history)

plt.tight_layout()
plt.show()