Використовуючи бібліотеку PyTorch, створіть генератовно-змагальну мережу (GAN) для генерації зображень цифр MNIST.

Завантажте набір даних MNIST з використанням torchvision.datasets.
Створіть генератор, який приймає на вхід випадковий вектор з шумом та генерує зображення цифр MNIST.
Створіть дискримінатор, який приймає на вхід зображення цифр MNIST та визначає, чи є це реальне зображення чи згенероване генератором.
Обидві моделі повинні мати декілька шарів зі зменшенням розмірності зображення, використовуючи згортувальні та пулінгові шари.
Навчіть моделігенерувати нові зображення цифр MNIST, використовуючи взаємодію генератора та дискримінатора з використанням функції втрат GAN (adversarial loss).
Після навчання виведіть кілька згенерованих зображень та порівняйте їх з оригінальними зображеннями з набору даних MNIST.

In [1]:
import time
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader
from torchvision import datasets
from torchvision.transforms import transforms

import numpy as np
import matplotlib.pyplot as plt

In [4]:
# Визначаємо, чи доступні графічні процесори
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

In [7]:
# Налаштування гіперпараметрів
epochs = 100
lr = 2e-4
batch_size = 64
loss = nn.BCELoss()

In [2]:
# архітектури дискримінатора та генератора
class discriminator(nn.Module):
    def __init__(self):
        super(discriminator, self).__init__()
        self.fc1 = nn.Linear(784, 512)
        self.fc2 = nn.Linear(512, 1)
        self.activation = nn.LeakyReLU(0.1)

    def forward(self, x):
        x = x.view(-1, 784)
        x = self.activation(self.fc1(x))
        x = self.fc2(x)
        return nn.Sigmoid()(x)


class generator(nn.Module):
    def __init__(self):
        super(generator, self).__init__()
        self.fc1 = nn.Linear(128, 1024)
        self.fc2 = nn.Linear(1024, 2048)
        self.fc3 = nn.Linear(2048, 784)
        self.activation = nn.ReLU()

    def forward(self, x):
        x = self.activation(self.fc1(x))
        x = self.activation(self.fc2(x))
        x = self.fc3(x)
        x = x.view(-1, 1, 28, 28)
        return nn.Tanh()(x)

In [5]:
# Модель
G = generator().to(device)
D = discriminator().to(device)

In [8]:
G_optimizer = optim.Adam(G.parameters(), lr=lr, betas=(0.5, 0.999))
D_optimizer = optim.Adam(D.parameters(), lr=lr, betas=(0.5, 0.999))

In [9]:
# Трансформація зображення та створення завантажувача даних
transform = transforms.Compose([transforms.ToTensor(),
                                transforms.Normalize((0.5,), (0.5,))])

In [10]:
# Завантажити дані
train_set = datasets.MNIST('mnist/', train=True, download=True, transform=transform)
train_loader = DataLoader(train_set, batch_size=batch_size, shuffle=True)

Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz to mnist/MNIST\raw\train-images-idx3-ubyte.gz


100.0%


Extracting mnist/MNIST\raw\train-images-idx3-ubyte.gz to mnist/MNIST\raw


100.0%


Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz to mnist/MNIST\raw\train-labels-idx1-ubyte.gz



2.0%

Extracting mnist/MNIST\raw\train-labels-idx1-ubyte.gz to mnist/MNIST\raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz to mnist/MNIST\raw\t10k-images-idx3-ubyte.gz


100.0%
100.0%

Extracting mnist/MNIST\raw\t10k-images-idx3-ubyte.gz to mnist/MNIST\raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz to mnist/MNIST\raw\t10k-labels-idx1-ubyte.gz
Extracting mnist/MNIST\raw\t10k-labels-idx1-ubyte.gz to mnist/MNIST\raw






In [11]:
# Процедура навчання мережі
for epoch in range(epochs):
    for idx, (imgs, _) in enumerate(train_loader):
        idx += 1

        # Навчання дискримінатора
        real_inputs = imgs.to(device)
        real_outputs = D(real_inputs)
        real_label = torch.ones(real_inputs.shape[0], 1).to(device)

        noise = (torch.rand(real_inputs.shape[0], 128) - 0.5) / 0.5
        noise = noise.to(device)
        fake_inputs = G(noise)
        fake_outputs = D(fake_inputs)
        fake_label = torch.zeros(fake_inputs.shape[0], 1).to(device)

        outputs = torch.cat((real_outputs, fake_outputs), 0)
        targets = torch.cat((real_label, fake_label), 0)

        D_loss = loss(outputs, targets)
        D_optimizer.zero_grad()
        D_loss.backward()
        D_optimizer.step()

        # Навчання генератора
        noise = (torch.rand(real_inputs.shape[0], 128)-0.5)/0.5
        noise = noise.to(device)

        fake_inputs = G(noise)
        fake_outputs = D(fake_inputs)
        fake_targets = torch.ones([fake_inputs.shape[0], 1]).to(device)
        G_loss = loss(fake_outputs, fake_targets)
        G_optimizer.zero_grad()
        G_loss.backward()
        G_optimizer.step()

        if idx % 100 == 0 or idx == len(train_loader):
            print('Epoch {} Iteration {}: discriminator_loss {:.3f} generator_loss {:.3f}'.format(epoch, idx, D_loss.item(), G_loss.item()))

    if (epoch+1) % 10 == 0:
        torch.save(G, 'Generator_epoch_{}.pth'.format(epoch))
        print('Model saved.')

Epoch 0 Iteration 100: discriminator_loss 0.657 generator_loss 0.909
Epoch 0 Iteration 200: discriminator_loss 0.683 generator_loss 0.744
Epoch 0 Iteration 300: discriminator_loss 0.656 generator_loss 0.798
Epoch 0 Iteration 400: discriminator_loss 0.612 generator_loss 0.827
Epoch 0 Iteration 500: discriminator_loss 0.582 generator_loss 0.839
Epoch 0 Iteration 600: discriminator_loss 0.542 generator_loss 0.922
Epoch 0 Iteration 700: discriminator_loss 0.476 generator_loss 0.971
Epoch 0 Iteration 800: discriminator_loss 0.583 generator_loss 0.987
Epoch 0 Iteration 900: discriminator_loss 0.424 generator_loss 1.077
Epoch 0 Iteration 938: discriminator_loss 0.433 generator_loss 1.059
Epoch 1 Iteration 100: discriminator_loss 0.445 generator_loss 1.241
Epoch 1 Iteration 200: discriminator_loss 0.479 generator_loss 1.141
Epoch 1 Iteration 300: discriminator_loss 0.409 generator_loss 1.265
Epoch 1 Iteration 400: discriminator_loss 0.456 generator_loss 1.553
Epoch 1 Iteration 500: discriminat

Epoch 11 Iteration 938: discriminator_loss 0.648 generator_loss 0.789
Epoch 12 Iteration 100: discriminator_loss 0.629 generator_loss 0.808
Epoch 12 Iteration 200: discriminator_loss 0.666 generator_loss 0.724
Epoch 12 Iteration 300: discriminator_loss 0.634 generator_loss 0.824
Epoch 12 Iteration 400: discriminator_loss 0.679 generator_loss 1.176
Epoch 12 Iteration 500: discriminator_loss 0.666 generator_loss 1.034
Epoch 12 Iteration 600: discriminator_loss 0.617 generator_loss 0.823
Epoch 12 Iteration 700: discriminator_loss 0.621 generator_loss 0.937
Epoch 12 Iteration 800: discriminator_loss 0.644 generator_loss 0.898
Epoch 12 Iteration 900: discriminator_loss 0.644 generator_loss 0.845
Epoch 12 Iteration 938: discriminator_loss 0.657 generator_loss 0.970
Epoch 13 Iteration 100: discriminator_loss 0.658 generator_loss 0.633
Epoch 13 Iteration 200: discriminator_loss 0.644 generator_loss 0.863
Epoch 13 Iteration 300: discriminator_loss 0.696 generator_loss 0.730
Epoch 13 Iteration 4

Epoch 23 Iteration 700: discriminator_loss 0.698 generator_loss 0.962
Epoch 23 Iteration 800: discriminator_loss 0.685 generator_loss 0.579
Epoch 23 Iteration 900: discriminator_loss 0.688 generator_loss 0.867
Epoch 23 Iteration 938: discriminator_loss 0.695 generator_loss 0.696
Epoch 24 Iteration 100: discriminator_loss 0.691 generator_loss 0.773
Epoch 24 Iteration 200: discriminator_loss 0.653 generator_loss 0.744
Epoch 24 Iteration 300: discriminator_loss 0.674 generator_loss 0.690
Epoch 24 Iteration 400: discriminator_loss 0.690 generator_loss 0.757
Epoch 24 Iteration 500: discriminator_loss 0.683 generator_loss 0.721
Epoch 24 Iteration 600: discriminator_loss 0.677 generator_loss 0.814
Epoch 24 Iteration 700: discriminator_loss 0.657 generator_loss 0.626
Epoch 24 Iteration 800: discriminator_loss 0.688 generator_loss 0.612
Epoch 24 Iteration 900: discriminator_loss 0.692 generator_loss 0.537
Epoch 24 Iteration 938: discriminator_loss 0.656 generator_loss 0.856
Epoch 25 Iteration 1

Epoch 35 Iteration 400: discriminator_loss 0.687 generator_loss 0.679
Epoch 35 Iteration 500: discriminator_loss 0.680 generator_loss 0.705
Epoch 35 Iteration 600: discriminator_loss 0.681 generator_loss 0.823
Epoch 35 Iteration 700: discriminator_loss 0.670 generator_loss 0.795
Epoch 35 Iteration 800: discriminator_loss 0.680 generator_loss 0.786
Epoch 35 Iteration 900: discriminator_loss 0.677 generator_loss 0.603
Epoch 35 Iteration 938: discriminator_loss 0.736 generator_loss 0.870
Epoch 36 Iteration 100: discriminator_loss 0.670 generator_loss 0.829
Epoch 36 Iteration 200: discriminator_loss 0.666 generator_loss 0.655
Epoch 36 Iteration 300: discriminator_loss 0.682 generator_loss 0.758
Epoch 36 Iteration 400: discriminator_loss 0.656 generator_loss 0.791
Epoch 36 Iteration 500: discriminator_loss 0.665 generator_loss 0.777
Epoch 36 Iteration 600: discriminator_loss 0.667 generator_loss 0.619
Epoch 36 Iteration 700: discriminator_loss 0.688 generator_loss 0.748
Epoch 36 Iteration 8

Epoch 47 Iteration 100: discriminator_loss 0.667 generator_loss 0.992
Epoch 47 Iteration 200: discriminator_loss 0.693 generator_loss 0.889
Epoch 47 Iteration 300: discriminator_loss 0.654 generator_loss 0.849
Epoch 47 Iteration 400: discriminator_loss 0.693 generator_loss 0.901
Epoch 47 Iteration 500: discriminator_loss 0.675 generator_loss 0.687
Epoch 47 Iteration 600: discriminator_loss 0.666 generator_loss 0.736
Epoch 47 Iteration 700: discriminator_loss 0.687 generator_loss 0.786
Epoch 47 Iteration 800: discriminator_loss 0.639 generator_loss 0.632
Epoch 47 Iteration 900: discriminator_loss 0.650 generator_loss 0.726
Epoch 47 Iteration 938: discriminator_loss 0.677 generator_loss 0.839
Epoch 48 Iteration 100: discriminator_loss 0.708 generator_loss 0.652
Epoch 48 Iteration 200: discriminator_loss 0.674 generator_loss 0.689
Epoch 48 Iteration 300: discriminator_loss 0.667 generator_loss 0.821
Epoch 48 Iteration 400: discriminator_loss 0.696 generator_loss 0.721
Epoch 48 Iteration 5

Epoch 58 Iteration 800: discriminator_loss 0.689 generator_loss 0.738
Epoch 58 Iteration 900: discriminator_loss 0.685 generator_loss 0.838
Epoch 58 Iteration 938: discriminator_loss 0.683 generator_loss 0.832
Epoch 59 Iteration 100: discriminator_loss 0.700 generator_loss 0.863
Epoch 59 Iteration 200: discriminator_loss 0.672 generator_loss 0.700
Epoch 59 Iteration 300: discriminator_loss 0.669 generator_loss 0.800
Epoch 59 Iteration 400: discriminator_loss 0.703 generator_loss 0.652
Epoch 59 Iteration 500: discriminator_loss 0.656 generator_loss 0.694
Epoch 59 Iteration 600: discriminator_loss 0.678 generator_loss 0.882
Epoch 59 Iteration 700: discriminator_loss 0.647 generator_loss 0.759
Epoch 59 Iteration 800: discriminator_loss 0.697 generator_loss 0.742
Epoch 59 Iteration 900: discriminator_loss 0.654 generator_loss 0.753
Epoch 59 Iteration 938: discriminator_loss 0.683 generator_loss 0.930
Model saved.
Epoch 60 Iteration 100: discriminator_loss 0.650 generator_loss 0.805
Epoch 6

Epoch 70 Iteration 500: discriminator_loss 0.667 generator_loss 0.717
Epoch 70 Iteration 600: discriminator_loss 0.671 generator_loss 0.765
Epoch 70 Iteration 700: discriminator_loss 0.652 generator_loss 0.749
Epoch 70 Iteration 800: discriminator_loss 0.688 generator_loss 0.750
Epoch 70 Iteration 900: discriminator_loss 0.683 generator_loss 0.675
Epoch 70 Iteration 938: discriminator_loss 0.661 generator_loss 0.792
Epoch 71 Iteration 100: discriminator_loss 0.682 generator_loss 0.859
Epoch 71 Iteration 200: discriminator_loss 0.695 generator_loss 0.630
Epoch 71 Iteration 300: discriminator_loss 0.679 generator_loss 0.911
Epoch 71 Iteration 400: discriminator_loss 0.724 generator_loss 0.701
Epoch 71 Iteration 500: discriminator_loss 0.689 generator_loss 0.926
Epoch 71 Iteration 600: discriminator_loss 0.714 generator_loss 0.896
Epoch 71 Iteration 700: discriminator_loss 0.673 generator_loss 0.827
Epoch 71 Iteration 800: discriminator_loss 0.682 generator_loss 0.708
Epoch 71 Iteration 9

Epoch 82 Iteration 200: discriminator_loss 0.679 generator_loss 0.721
Epoch 82 Iteration 300: discriminator_loss 0.688 generator_loss 0.767
Epoch 82 Iteration 400: discriminator_loss 0.684 generator_loss 0.731
Epoch 82 Iteration 500: discriminator_loss 0.653 generator_loss 0.783
Epoch 82 Iteration 600: discriminator_loss 0.671 generator_loss 0.821
Epoch 82 Iteration 700: discriminator_loss 0.691 generator_loss 0.690
Epoch 82 Iteration 800: discriminator_loss 0.654 generator_loss 0.877
Epoch 82 Iteration 900: discriminator_loss 0.671 generator_loss 0.686
Epoch 82 Iteration 938: discriminator_loss 0.640 generator_loss 0.753
Epoch 83 Iteration 100: discriminator_loss 0.682 generator_loss 0.710
Epoch 83 Iteration 200: discriminator_loss 0.680 generator_loss 0.798
Epoch 83 Iteration 300: discriminator_loss 0.679 generator_loss 0.887
Epoch 83 Iteration 400: discriminator_loss 0.680 generator_loss 0.781
Epoch 83 Iteration 500: discriminator_loss 0.676 generator_loss 0.827
Epoch 83 Iteration 6

Epoch 93 Iteration 900: discriminator_loss 0.689 generator_loss 0.833
Epoch 93 Iteration 938: discriminator_loss 0.705 generator_loss 0.680
Epoch 94 Iteration 100: discriminator_loss 0.657 generator_loss 0.717
Epoch 94 Iteration 200: discriminator_loss 0.685 generator_loss 0.709
Epoch 94 Iteration 300: discriminator_loss 0.687 generator_loss 0.612
Epoch 94 Iteration 400: discriminator_loss 0.689 generator_loss 0.879
Epoch 94 Iteration 500: discriminator_loss 0.659 generator_loss 0.769
Epoch 94 Iteration 600: discriminator_loss 0.679 generator_loss 0.649
Epoch 94 Iteration 700: discriminator_loss 0.711 generator_loss 0.809
Epoch 94 Iteration 800: discriminator_loss 0.720 generator_loss 0.704
Epoch 94 Iteration 900: discriminator_loss 0.725 generator_loss 0.771
Epoch 94 Iteration 938: discriminator_loss 0.675 generator_loss 0.686
Epoch 95 Iteration 100: discriminator_loss 0.692 generator_loss 0.767
Epoch 95 Iteration 200: discriminator_loss 0.659 generator_loss 0.793
Epoch 95 Iteration 3

In [12]:
# Згенеруємо кілька зображень за допомогою навченого генератора
n_images = 10
noise = torch.randn(n_images, 128).to(device)
fake_images = G(noise)

In [13]:
# Денормалізуємо створені зображення
fake_images = (fake_images * 0.5) + 0.5

In [14]:
# Перетворємо створені зображення в масиви numpy
fake_images = fake_images.cpu().detach().numpy()

In [None]:
# Виведемо створені зображення
fig, axs = plt.subplots(1, n_images, figsize=(15, 15))
for i in range(n_images):
    axs[i].imshow(np.squeeze(fake_images[i]), cmap='gray')
    axs[i].axis('off')
plt.show()

В мене пише, що "мертве ядро". В чому проблема, поки не зрозумів. Должно працювати.