In [1]:
import torch
from utils import save_checkpoint, load_checkpoint, save_some_examples
import torch.nn as nn
import torch.optim as optim
import config
from dataset import MapDataset
from generator_model import Generator
from discriminator_model import Discriminator
from torch.utils.data import DataLoader
from tqdm import tqdm
from torchvision.utils import save_image

In [2]:
def train_fn(disc, gen, loader, opt_disc, opt_gen, l1, bce, g_scaler, d_scaler):
    loop = tqdm(loader, leave=True)
    for idx, (x, y) in enumerate(loop):
        x, y = x.to(config.DEVICE), y.to(config.DEVICE)
        
        # Train Discriminator
        with torch.amp.autocast('cuda'):
            y_fake = gen(x)
            D_real = disc(x, y)
            D_fake = disc(x, y_fake.detach())
            D_real_loss = bce(D_real, torch.ones_like(D_real))
            D_fake_loss = bce(D_fake, torch.zeros_like(D_fake))
            D_loss = (D_real_loss + D_fake_loss) / 2
        
        disc.zero_grad()
        d_scaler.scale(D_loss).backward()
        d_scaler.step(opt_disc)
        d_scaler.update()
        
        # Train Generator
        with torch.amp.autocast('cuda'):
            y_fake = gen(x)  # GENERATE AGAIN (important!)
            D_fake = disc(x, y_fake)  # Pass through discriminator
            G_fake_loss = bce(D_fake, torch.ones_like(D_fake))  # ADD THIS LINE!
            L1 = l1(y_fake, y) * config.L1_LAMBDA
            G_loss = G_fake_loss + L1
        
        opt_gen.zero_grad()
        g_scaler.scale(G_loss).backward()
        g_scaler.step(opt_gen)
        g_scaler.update()

In [3]:
def main():
    disc = Discriminator(in_channels=3).to(config.DEVICE)
    gen = Generator(in_channels=3).to(config.DEVICE)
    opt_disc = optim.Adam(disc.parameters(), lr=config.LEARNING_RATE, betas=(0.5, 0.999))
    opt_gen = optim.Adam(gen.parameters(), lr=config.LEARNING_RATE, betas=(0.5, 0.999))
    BCE = nn.BCEWithLogitsLoss()
    L1_LOSS = nn.L1Loss()
    
    if config.LOAD_MODEL:
        load_checkpoint(config.CHECKPOINT_GEN, gen, opt_gen, config.LEARNING_RATE)
        load_checkpoint(config.CHECKPOINT_DISC, disc, opt_disc, config.LEARNING_RATE)
    
    train_dataset = MapDataset(root_dir="custom_datasets/maps/train")
    train_loader = DataLoader(train_dataset, batch_size=config.BATCH_SIZE, shuffle=True, num_workers=config.NUM_WORKERS)
    
    g_scaler = torch.amp.GradScaler('cuda')
    d_scaler = torch.amp.GradScaler('cuda')
    
    val_dataset = MapDataset(root_dir="custom_datasets/maps/val")
    val_loader = DataLoader(val_dataset, batch_size=1, shuffle=False)  # Define val_loader HERE
    
    for epoch in range(config.NUM_EPOCHS):
        train_fn(disc, gen, train_loader, opt_disc, opt_gen, L1_LOSS, BCE, g_scaler, d_scaler)
        
        if config.SAVE_MODEL and epoch % 5 == 0:
            save_checkpoint(gen, opt_gen, filename=config.CHECKPOINT_GEN)
            save_checkpoint(disc, opt_disc, filename=config.CHECKPOINT_DISC)
        
        save_some_examples(gen, val_loader, epoch, folder="evaluation")  # INDENT THIS LINE (inside the loop)

In [4]:
if __name__ == "__main__":
    main()

=> Checkpoint gen.pth.tar not found, starting from scratch
=> Checkpoint disc.pth.tar not found, starting from scratch


100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:08<00:00,  8.78s/it]


=> Saving checkpoint
=> Saving checkpoint


100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:10<00:00, 10.94s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:09<00:00,  9.55s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:06<00:00,  6.93s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.21s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.32s/it]


=> Saving checkpoint
=> Saving checkpoint


100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:08<00:00,  8.92s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:08<00:00,  8.88s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:06<00:00,  6.10s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.40s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:05<00:00,  5.97s/it]


=> Saving checkpoint
=> Saving checkpoint


100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:05<00:00,  5.99s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:06<00:00,  6.38s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:05<00:00,  5.97s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.69s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.08s/it]


=> Saving checkpoint
=> Saving checkpoint


100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.35s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.18s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.23s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.80s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.47s/it]


=> Saving checkpoint
=> Saving checkpoint


100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:15<00:00, 15.14s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.18s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.65s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:08<00:00,  8.09s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.31s/it]


=> Saving checkpoint
=> Saving checkpoint


100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:08<00:00,  8.78s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.17s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.74s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.16s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.82s/it]


=> Saving checkpoint
=> Saving checkpoint


100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:08<00:00,  8.42s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.25s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:07<00:00,  7.38s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:14<00:00, 14.30s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:11<00:00, 11.83s/it]


=> Saving checkpoint
=> Saving checkpoint


100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:11<00:00, 11.85s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:09<00:00,  9.54s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:09<00:00,  9.46s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:10<00:00, 10.60s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:10<00:00, 10.23s/it]


=> Saving checkpoint
=> Saving checkpoint


100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:08<00:00,  8.99s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:11<00:00, 11.17s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:10<00:00, 10.81s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:12<00:00, 12.93s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:09<00:00,  9.70s/it]


=> Saving checkpoint
=> Saving checkpoint


100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:11<00:00, 11.85s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:09<00:00,  9.97s/it]
100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:11<00:00, 11.59s/it]
  0%|                                                                                            | 0/1 [00:05<?, ?it/s]

KeyboardInterrupt

