In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.datasets as datasets
from torch.utils.data import DataLoader
import torchvision.transforms as transforms
from torch.utils.tensorboard import SummaryWriter
from tqdm import tqdm

In [None]:
# Think to try to improve: 
# 1. What happens if you use larger network
# 2. Better normalization with BatchNorm
# 3. Different learning rate (is there a better one)?
# 4. Change architecture to a CNN

In [2]:
class Discriminator(nn.Module):
    def __init__(self, img_dim):
        super().__init__()
        self.disc = nn.Sequential(
            nn.Linear(img_dim, 128),
            nn.LeakyReLU(0.1),
            nn.Linear(128, 1), # 1 or 0 (Discriminator)
            nn.Sigmoid()
        )

    def forward(self, x):
        return self.disc(x)

In [3]:
class Generator(nn.Module):
    def __init__(self, z_dim, img_dim):
        super().__init__()
        self.gen = nn.Sequential(
            nn.Linear(z_dim, 256),
            nn.LeakyReLU(0.1),
            nn.Linear(256, img_dim), # 28x28x1 -> 784
            nn.Tanh(), # between -1 and 1
        )

    def forward(self, x):
        return self.gen(x)

In [4]:
# Hyperparameters etc.
device = "cuda" if torch.cuda.is_available() else "cpu"
lr = 3e-4
z_dim = 64 # 128, 256
image_dim = 28 * 28 * 1 # 784
batch_size = 32
num_epochs = 50

In [5]:
disc = Discriminator(image_dim).to(device)
gen = Generator(z_dim, image_dim).to(device)
fixed_noise = torch.randn((batch_size, z_dim)).to(device)

In [6]:
transforms = transforms.Compose(
    # [transforms.ToTensor(), transforms.Normalize((0.1307, ), (0.3081, ))]
    [transforms.ToTensor(), transforms.Normalize((0.5, ), (0.5, ))]
)

dataset = datasets.MNIST(root="dataset/", transform=transforms, download=True)
loader = DataLoader(dataset, batch_size=batch_size, shuffle=True)

In [7]:
opt_disc = optim.Adam(disc.parameters(), lr=lr)
opt_gen = optim.Adam(gen.parameters(), lr=lr)
criterion = nn.BCELoss()
writer_fake = SummaryWriter(f"runs/GAN_MNIST/fake")
writer_real = SummaryWriter(f"runs/GAN_MNIST/real")
step = 0

In [8]:
for epoch in range(num_epochs):
    for batch_idx, (real, _) in enumerate(tqdm(loader)):
        real = real.view(-1, 784).to(device)
        batch_size = real.shape[0]

        ### Train Discriminator: max log(D(real)) + log(1 - D(G(z))) # z is random noise
        noise = torch.randn(batch_size, z_dim).to(device)
        fake = gen(noise)
        disc_real = disc(real).view(-1)
        lossD_real = criterion(disc_real, torch.ones_like(disc_real))
        disc_fake = disc(fake).view(-1) # -1 means to flatten
        # disc_fake = disc(fake.detach()).view(-1) # .detach() -> when we run backward pass, we don't clear those intermediate computation
        lossD_fake = criterion(disc_fake, torch.zeros_like(disc_fake))
        lossD = (lossD_real + lossD_fake) / 2
        disc.zero_grad()
        lossD.backward(retain_graph=True) # retain_graph=True -> alternative to fake.detach()
        opt_disc.step()

        ### Train Generator min log(1 - D(G(z))) [slower training] <-> max log(D(G(z))) [better]
        output = disc(fake).view(-1)
        lossG = criterion(output, torch.ones_like(output))
        gen.zero_grad()
        lossG.backward()
        opt_gen.step()

        if batch_idx == 0:
            print(
                f"Epoch [{epoch}/{num_epochs}] "
                f"Loss D: {lossD:.4f}, Loss G: {lossG:.4f}"
            )

            with torch.no_grad():
                fake = gen(fixed_noise).reshape(-1, 1, 28, 28)
                data = real.reshape(-1, 1, 28, 28)
                img_grid_fake = torchvision.utils.make_grid(fake, normalize=True)
                img_grid_real = torchvision.utils.make_grid(data, normalize=True)

                writer_fake.add_image(
                    "Mnist Fake Images", img_grid_fake, global_step=step
                )

                writer_fake.add_image(
                    "Mnist Real Images", img_grid_real, global_step=step
                )

                step += 1

  0%|                                                                                 | 1/1875 [00:00<17:38,  1.77it/s]

Epoch [0/50] Loss D: 0.6747, Loss G: 0.6898


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:41<00:00, 45.66it/s]
  0%|▍                                                                                | 9/1875 [00:00<00:40, 46.18it/s]

Epoch [1/50] Loss D: 0.7606, Loss G: 0.6442


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 75.10it/s]
  1%|▌                                                                               | 13/1875 [00:00<00:28, 65.07it/s]

Epoch [2/50] Loss D: 0.4104, Loss G: 1.1931


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 77.92it/s]
  0%|▏                                                                                | 5/1875 [00:00<00:41, 45.14it/s]

Epoch [3/50] Loss D: 0.8529, Loss G: 0.7746


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 78.10it/s]
  1%|▌                                                                               | 13/1875 [00:00<00:29, 62.64it/s]

Epoch [4/50] Loss D: 0.8242, Loss G: 0.8192


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 75.74it/s]
  1%|▌                                                                               | 13/1875 [00:00<00:29, 63.10it/s]

Epoch [5/50] Loss D: 0.5529, Loss G: 0.9604


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 77.00it/s]
  1%|▌                                                                               | 13/1875 [00:00<00:29, 62.67it/s]

Epoch [6/50] Loss D: 1.0138, Loss G: 0.4651


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 77.18it/s]
  1%|▌                                                                               | 12/1875 [00:00<00:32, 58.07it/s]

Epoch [7/50] Loss D: 0.5209, Loss G: 1.0181


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:25<00:00, 73.96it/s]
  1%|▍                                                                               | 10/1875 [00:00<00:35, 51.91it/s]

Epoch [8/50] Loss D: 0.4759, Loss G: 1.4094


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 76.66it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:27, 66.71it/s]

Epoch [9/50] Loss D: 0.8286, Loss G: 0.6517


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 78.15it/s]
  1%|▌                                                                               | 12/1875 [00:00<00:31, 59.80it/s]

Epoch [10/50] Loss D: 0.6804, Loss G: 0.8738


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 77.59it/s]
  1%|▌                                                                               | 12/1875 [00:00<00:31, 58.34it/s]

Epoch [11/50] Loss D: 0.5878, Loss G: 1.3196


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:25<00:00, 73.91it/s]
  1%|▌                                                                               | 13/1875 [00:00<00:29, 63.57it/s]

Epoch [12/50] Loss D: 0.5498, Loss G: 1.3122


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 77.88it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:28, 66.25it/s]

Epoch [13/50] Loss D: 0.5135, Loss G: 1.2402


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 78.33it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:28, 65.38it/s]

Epoch [14/50] Loss D: 0.4901, Loss G: 1.1397


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 77.67it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:26, 69.43it/s]

Epoch [15/50] Loss D: 0.4923, Loss G: 1.2880


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 79.64it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:26, 69.56it/s]

Epoch [16/50] Loss D: 0.5903, Loss G: 1.1170


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 76.14it/s]
  1%|▌                                                                               | 13/1875 [00:00<00:30, 62.00it/s]

Epoch [17/50] Loss D: 0.7250, Loss G: 1.1986


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 76.93it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:26, 69.39it/s]

Epoch [18/50] Loss D: 0.6171, Loss G: 0.8729


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:25<00:00, 74.99it/s]
  1%|▌                                                                               | 12/1875 [00:00<00:33, 55.50it/s]

Epoch [19/50] Loss D: 0.6807, Loss G: 1.0159


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 78.72it/s]
  0%|▎                                                                                | 6/1875 [00:00<00:36, 51.86it/s]

Epoch [20/50] Loss D: 0.5956, Loss G: 0.9858


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 76.20it/s]
  0%|▎                                                                                | 6/1875 [00:00<00:34, 53.62it/s]

Epoch [21/50] Loss D: 0.6770, Loss G: 1.1218


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 79.23it/s]
  1%|▌                                                                               | 13/1875 [00:00<00:28, 64.96it/s]

Epoch [22/50] Loss D: 0.6043, Loss G: 0.9787


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 78.47it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:27, 68.00it/s]

Epoch [23/50] Loss D: 0.7941, Loss G: 0.8505


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:25<00:00, 74.96it/s]
  0%|▎                                                                                | 6/1875 [00:00<00:34, 54.57it/s]

Epoch [24/50] Loss D: 0.6483, Loss G: 0.9830


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:25<00:00, 73.40it/s]
  1%|▌                                                                               | 13/1875 [00:00<00:30, 61.38it/s]

Epoch [25/50] Loss D: 0.6780, Loss G: 0.9183


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 75.51it/s]
  0%|▎                                                                                | 6/1875 [00:00<00:34, 53.87it/s]

Epoch [26/50] Loss D: 0.5467, Loss G: 1.0163


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 79.16it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:27, 66.73it/s]

Epoch [27/50] Loss D: 0.7872, Loss G: 0.7252


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 77.91it/s]
  1%|▌                                                                               | 12/1875 [00:00<00:33, 55.19it/s]

Epoch [28/50] Loss D: 0.6165, Loss G: 1.0233


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 76.21it/s]
  1%|▌                                                                               | 12/1875 [00:00<00:32, 57.69it/s]

Epoch [29/50] Loss D: 0.5933, Loss G: 1.1260


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 77.70it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:27, 66.85it/s]

Epoch [30/50] Loss D: 0.7589, Loss G: 0.8922


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 79.31it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:26, 69.39it/s]

Epoch [31/50] Loss D: 0.5307, Loss G: 1.2100


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 80.39it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:26, 68.96it/s]

Epoch [32/50] Loss D: 0.6471, Loss G: 0.8338


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 79.46it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:27, 67.49it/s]

Epoch [33/50] Loss D: 0.7588, Loss G: 0.9341


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:25<00:00, 72.41it/s]
  1%|▌                                                                               | 13/1875 [00:00<00:29, 64.08it/s]

Epoch [34/50] Loss D: 0.7159, Loss G: 0.9186


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 78.62it/s]
  0%|▎                                                                                | 6/1875 [00:00<00:34, 54.92it/s]

Epoch [35/50] Loss D: 0.6973, Loss G: 0.9677


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:25<00:00, 74.30it/s]
  1%|▌                                                                               | 13/1875 [00:00<00:28, 65.15it/s]

Epoch [36/50] Loss D: 0.7242, Loss G: 0.8564


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 79.09it/s]
  0%|▎                                                                                | 6/1875 [00:00<00:34, 53.94it/s]

Epoch [37/50] Loss D: 0.6306, Loss G: 1.0488


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 78.61it/s]
  0%|▏                                                                                | 5/1875 [00:00<00:42, 44.32it/s]

Epoch [38/50] Loss D: 0.6602, Loss G: 0.8645


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 76.59it/s]
  1%|▌                                                                               | 12/1875 [00:00<00:32, 56.77it/s]

Epoch [39/50] Loss D: 0.5694, Loss G: 1.1991


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:24<00:00, 77.73it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:26, 69.34it/s]

Epoch [40/50] Loss D: 0.6480, Loss G: 1.0921


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 79.68it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:27, 68.30it/s]

Epoch [41/50] Loss D: 0.5053, Loss G: 1.1212


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 78.18it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:27, 66.63it/s]

Epoch [42/50] Loss D: 0.6847, Loss G: 0.8424


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 79.84it/s]
  1%|▌                                                                               | 13/1875 [00:00<00:29, 63.97it/s]

Epoch [43/50] Loss D: 0.6600, Loss G: 0.8631


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 78.78it/s]
  1%|▋                                                                               | 15/1875 [00:00<00:26, 70.83it/s]

Epoch [44/50] Loss D: 0.5393, Loss G: 0.9549


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 79.48it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:26, 69.27it/s]

Epoch [45/50] Loss D: 0.7457, Loss G: 0.9203


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:25<00:00, 72.21it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:27, 68.81it/s]

Epoch [46/50] Loss D: 0.5560, Loss G: 1.1192


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:26<00:00, 72.06it/s]
  1%|▌                                                                               | 14/1875 [00:00<00:28, 65.77it/s]

Epoch [47/50] Loss D: 0.5062, Loss G: 1.1945


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:23<00:00, 78.53it/s]
  1%|▌                                                                               | 12/1875 [00:00<00:32, 56.95it/s]

Epoch [48/50] Loss D: 0.7151, Loss G: 0.8898


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:29<00:00, 64.22it/s]
  0%|▎                                                                                | 8/1875 [00:00<00:46, 40.34it/s]

Epoch [49/50] Loss D: 0.6640, Loss G: 1.0886


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:31<00:00, 60.07it/s]
