In [1]:
'''
GAN (generative adversarial network) : 적대적 생성 신경망
GAN은 생성하는 모델
GAN은 적대적으로 학습 - 가짜 이미지를 생성하는 생성자와 이미지의 진위를 판별하는 판별자
GAN은 인공 신경망 모델 - 생성자, 판별자 모두 신경망
비지도 학습
'''

'''
여러가지 가짜 이미지를 생성하는 생성자, 진짜 이미지와 가짜 이미지를 구분하는 판별자 존재
'''

'\n여러가지 가짜 이미지를 생성하는 생성자, 진짜 이미지와 가짜 이미지를 구분하는 판별자 존재\n'

In [2]:
import os
import torch
import torchvision
import torch.nn as nn
import torch.optim as optim
from torchvision import transforms, datasets
from torchvision.utils import save_image
import matplotlib.pyplot as plt

In [3]:
# 하이퍼파라미터
EPOCHS = 500
BATCH_SIZE = 100
USE_CUDA = torch.cuda.is_available()
DEVICE = torch.device("cuda" if USE_CUDA else "cpu")
print("다음 장치를 사용합니다 : ", DEVICE)

다음 장치를 사용합니다 :  cpu


In [6]:
# Fashine MNIST 데이터셋
trainset = datasets.FashionMNIST('./data',
                                train=True,
                                download=True,
                                transform=transforms.Compose([
                                    transforms.ToTensor(),
                                    transforms.Normalize((0.5,), (0.5,))
                                ]))
train_loader = torch.utils.data.DataLoader(
                dataset = trainset,
                batch_size = BATCH_SIZE,
                shuffle = True)

26427392it [01:10, 1446848.32it/s]                              

In [7]:
# Tanh 활성화 함수는 결괏값을 -1, 1사이로 압축하는 역할
# 무작위 텐서를 입력하는 이유는 생성자가 실제 데이터의 분포를 배우는 것이기 때문

# 생성자 (Generator)
G = nn.Sequential(
    nn.Linear(64, 256),
    nn.ReLU(),
    nn.Linear(256, 256),
    nn.ReLU(),
    nn.Linear(256, 784),
    nn.Tanh()
)

# 판별자 (Discriminator)
D = nn.Sequential(
    nn.Linear(784, 256),
    nn.LeakyReLU(0.2),
    nn.Linear(256, 256),
    nn.LeakyReLU(0.2),
    nn.Linear(256, 1),
    nn.Sigmoid()
)

In [8]:
# 모델의 가중치를 지정한 장치로 보내기
D = D.to(DEVICE)
G = G.to(DEVICE)

# 이진 교차 엔트로피 오차 함수와
# 생성자와 판별자를 최적화할 Adam 모듈
criterion = nn.BCELoss()
d_optimizer = optim.Adam(D.parameters(), lr=0.0002)
g_optimizer = optim.Adam(G.parameters(), lr=0.0002)

In [None]:
# 학습
total_step = len(train_loader)
for epoch in range(EPOCHS):
    for i, (images, _) in enumerate(train_loader):
        images = images.reshape(BATCH_SIZE, -1).to(DEVICE)
        
        # 진짜와 가짜 레이블 생성
        real_labels = torch.ones(BATCH_SIZE, 1).to(DEVICE)
        fake_labels = torch.zeros(BATCH_SIZE, 1).to(DEVICE)
        
        # 판별자가 진짜 이미지를 진짜로 인식하는 오차 계산
        outputs = D(images)
        d_loss_real = criterion(outputs, real_labels)
        real_score = outputs
        
        # 무작위 텐서로 가짜 이미지 생성
        z = torch.randn(BATCH_SIZE, 64).to(DEVICE)
        fake_images = G(z)
        
        # 판별자가 가짜 이미지를 가짜로 인식하는 오차 계산
        outputs = D(fake_images)
        d_loss_fake = criterion(outputs, fake_labels)
        fake_score = outputs
        
        # 진짜와 가짜 이미지를 갖고 낸 오차를 더해서 판별자의 오차 계산
        d_loss = d_loss_real + d_loss_fake
        
        # 역전파 알고리즘으로 판별자 모델의 학습을 진행
        d_optimizer.zero_grad()
        g_optimizer.zero_grad()
        d_loss.backward()
        d_optimizer.step()
        
        # 생성자가 판별자를 속였는지에 대한 오차 계산
        fake_images = G(z)
        outputs = D(fake_images)
        g_loss = criterion(outputs, real_labels)
        
        # 역전파 알고리즘으로 생성자 모델의 학습을 진행
        d_optimizer.zero_grad()
        g_optimizer.zero_grad()
        g_loss.backward()
        g_optimizer.step()
        
    # 학습 진행 알아보기
    print('이폭 [{}/{}] d_loss:{:.4f} g_loss:{:.4f} D(x):{:.2f} D(G(z)):{:.2f}'
          .format(epoch, EPOCHS, d_loss.item(), g_loss.item(), real_score.mean().item(), fake_score.mean().item()))

# 생성자가 만든 이미지 시각화 하기
z = torch.randn(BATCH_SIZE, 64).to(DEVICE)
fake_images = G(z)
for i in range(10):
    fake_images_img = np.reshape(fake_images.data.cpu().numpy()[i], (28, 28))
    plt.imshow(fake_images_img, cmap='gray')
    plt.show()

이폭 [0/500] d_loss:0.0227 g_loss:5.6821 D(x):1.00 D(G(z)):0.02
이폭 [1/500] d_loss:0.0268 g_loss:11.1073 D(x):0.99 D(G(z)):0.00
이폭 [2/500] d_loss:0.0387 g_loss:6.1597 D(x):0.99 D(G(z)):0.01
이폭 [3/500] d_loss:0.3628 g_loss:4.9568 D(x):0.89 D(G(z)):0.03
이폭 [4/500] d_loss:0.0641 g_loss:7.0832 D(x):0.97 D(G(z)):0.00
이폭 [5/500] d_loss:0.0808 g_loss:7.1467 D(x):0.98 D(G(z)):0.02
이폭 [6/500] d_loss:0.1067 g_loss:5.8809 D(x):0.96 D(G(z)):0.02
이폭 [7/500] d_loss:0.1559 g_loss:4.8728 D(x):0.95 D(G(z)):0.03
이폭 [8/500] d_loss:0.0735 g_loss:8.2212 D(x):0.97 D(G(z)):0.01
이폭 [9/500] d_loss:0.3304 g_loss:3.4643 D(x):0.93 D(G(z)):0.11
이폭 [10/500] d_loss:0.1598 g_loss:5.5439 D(x):0.95 D(G(z)):0.02
이폭 [11/500] d_loss:0.2470 g_loss:4.7903 D(x):0.92 D(G(z)):0.03
이폭 [12/500] d_loss:0.3400 g_loss:3.7512 D(x):0.94 D(G(z)):0.16
이폭 [13/500] d_loss:0.2231 g_loss:4.4818 D(x):0.93 D(G(z)):0.08
이폭 [14/500] d_loss:0.3378 g_loss:4.8997 D(x):0.90 D(G(z)):0.08
이폭 [15/500] d_loss:0.2534 g_loss:4.4047 D(x):0.96 D(G(z)):0.11
이

In [None]:
# 생성자 (Generator)
class Generator(nn.Module):
    def __init__(self):
        super().__init__()
        
        self.embed = nn.Embedding(10, 10)
        
        self.model = nn.Sequential(
                    nn.Linear(110, 256),
                    nn.LeakyReLU(0.2, inplace=True),
                    nn.Linear(256, 512),
                    nn.LeakyReLU(0.2, inpalce=True),
                    nn.Linear(512, 1024),
                    nn.LeakyReLU(0.2, inplace=True),
                    nn.Linear(1024, 784),
                    nn.Tanh()
        )
    
    def forward(self, z, labels):
        c = self.embed(labels)
        x = torch.cat([z,c], 1)
        return self.model(x)
    
    

In [None]:
# 판별자 (Discriminator)
class Discriminator(nn.Module):
    def __init__(self):
        super().__init__()
        
        self.embed = nn.Embedding(10, 10)
        
        self.model = nn.Sequential