### Chapter 13

# **GAN 모델 이미지 생성**

> ## 학습 목표

- GAN(Generative Adversarial Network)의 기본 개념과 구조를 이해하고 실무에 적용할 수 있다. 
- 생성자(Generator)와 판별자(Discriminator)의 역할 및 상호작용을 이해하고, PyTorch를 사용하여 GAN 모델을 구축, 훈련시킬 수 있다.
- GAN의 다양한 변형 및 응용 사례를 탐색하고 실습하며, 생성된 샘플의 품질을 평가하고, 모델의 성능을 개선하기 위한 전략을 제시할 수 있다.

## `GAN(Generative Adversarial Network)`

**■ GAN의 정의** : GAN은 생성적 적대 신경망(Generative Adversarial Network)으로, 데이터를 생성하는 데 사용되는 모델입니다. 
- Goodfellow, lan et al. (2014) 논문에 게재된 내용입니다.
- **Generative Adversarial Networks는 편의상 GAN, 겐, 또는 간**으로도 부른다. 
- CNN의 창시자이자, 현재 facebook AI 총괄을 담당하는 얀 루큰은 GAN은 최근 10년간 머신러닝 분야에서 가장 멋진 아이디어가 Adversarial Network는 적대적인 신경망이 서로 경쟁하면서 가짜 모델의 성능을 개선하는 것이라고 합니다.

**■ 목적** : GAN은 현실감 있는 데이터를 생성하는 생성자와, 실제 데이터와 생성된 데이터를 구별하려는 판별자의 두 네트워크로 구성됩니다.

## 13.1 GAN 모델 구조

GAN(Generative Adversarial Network)은 두 개의 신경망 모델, 즉 생성자(Generator)와 판별자(Discriminator)가 경쟁하는 구조로 이루어져 있습니다. 

생성자는 데이터를 생성하고, 판별자는 생성된 데이터가 실제 데이터인지 아닌지를 구별하려고 합니다. 

이 두 네트워크는 서로 경쟁하면서 성능을 개선해 나가고, 결국 생성자는 매우 사실적인 데이터를 만들어내게 됩니다.

### 1) 기본원리
-   **생성자 (Generator, G)**
    
    -   **역할** : 생성자는 무작위 노이즈(잠재 공간 벡터)를 입력받아 실제 데이터와 유사한 가짜 데이터를 생성하는 역할을 맡습니다.
    -   **구조** : 일반적으로 다수의 레이어로 구성되어 있으며, 완전 연결층과 합성곱층을 포함합니다. 출력층은 생성하려는 데이터의 차원에 맞춰 설계됩니다.
    -   **입력** : 랜덤 노이즈(일반적으로 잠재 벡터 z)를 받아, 이를 변환하여 새로운 샘플을 만들어냅니다.
    -   **목표** : 생성자는 판별자가 진짜 데이터인지 가짜 데이터인지 구별할 수 없게끔, 판별자를 속일 수 있는 질 높은 가짜 데이터를 생산하는 것을 목표로 합니다.
    
-   **판별자 (Discriminator, D)**
    
    -   **역할** : 판별자는 입력된 데이터가 진짜 데이터인지 생성자가 만든 가짜 데이터인지 구별하는 역할을 수행합니다.
    -   **구조** : 여러 개의 레이어로 이루어져 있으며, 마지막 출력층은 입력된 데이터가 진짜일 확률을 이진 형태로 제공합니다.
    -   **입력** : 실제 데이터와 생성자가 생산한 가짜 데이터를 모두 받아들이며, 이를 판별하여 정확한 결과를 도출합니다.
    -   **목표** : 판별자는 주어진 데이터가 진짜인지 가짜인지 정확히 분류하는 것을 목표로 하며, 이를 통해 생성자의 성과를 평가하는 기준 역할을 합니다.
    
-   **훈련 과정**
    
    -   **적대적 훈련 (Adversarial Training)** : 생성자와 판별자는 서로 적대적인 관계를 유지하며 학습합니다. 생성자는 판별자를 속이려 하고, 판별자는 생성자가 만든 가짜 데이터를 더 잘 구별하려 노력합니다.
    -   **경쟁적 학습** : 두 네트워크는 지속적인 경쟁을 통해 발전하게 되며, 결과적으로 생성자는 점점 더 현실감 있는 데이터를 생성할 수 있게 됩니다. 이 과정에서 각 네트워크는 서로의 성능을 개선하기 위한 피드백을 주고받으며, 각자의 능력을 극대화합니다.

### 2) GAN 작동 원리

-   **훈련 단계**:
    
    1.  판별자는 실제 데이터와 생성자가 만든 데이터를 입력받아 두 데이터를 구별합니다.
    2.  생성자는 판별자의 피드백을 바탕으로 자신의 출력을 개선합니다.
    3.  이 과정을 반복하여 두 모델이 서로 발전합니다.

### 3) GAN의 손실 함수

-   **손실 함수**:
    
    -   생성자의 목표는 판별자를 속이는 것이고, 판별자의 목표는 생성자가 만든 가짜 데이터를 잘 구별하는 것입니다. 
    
        각각의 손실 함수는 이 목표에 맞춰 정의됩니다.


- **GAN의 손실 함수는 두 가지**로 구성됩니다:

  - **생성자 손실** : 생성자가 판별자를 속일 수 있도록 학습하는 과정입니다.

    생성자가 만든 데이터 𝐺(𝑧)에 대해 판별자가 1을 예측하도록 유도.

  - **판별자 손실** : 판별자가 실제 데이터와 가짜 데이터를 잘 구별하도록 학습하는 과정입니다.

    실제 데이터 𝑥에 대해 판별자가 1을 예측하도록 유도.

    생성된 가짜 데이터 𝐺(𝑧)에 대해 판별자가 0을 예측하도록 유도.

`GAN을 처음 제안한 Ian Goodfellow는 <경찰과 위조지폐범>으로 비유`하였다. 

-  지폐위조범이 처음에는 돈을 제대로 못 만들어 경찰이 위조지폐를 제대로 구분하여 검거에 성공했다. 

   이후, 지폐위조범은 더욱 발전된 기술로 지폐를 위조한다. 

-  위조지폐범은 진짜 같은 위조지폐를 만들어(생성, gnerater) 경찰을 속이고, 경찰은 진짜와 가짜 화폐를 구분(분류, discriminator)하기 노력한다.

   결국 위조지폐범은 구분하기 어려운 위조지폐를 만들게 된다. 경찰은 이게 진짜인지 가짜인지 구별하기 가장 어려운 50% 확률에 수렴하게 된다.

#### `The GAN Objective Function`

<table style="border-collapse: collapse; width: 100%;" border="1" data-ke-align="alignLeft"><tbody><tr><td style="width: 30%;">D should maximize V(D, G)&nbsp;<br>: D 입장에서 V가 최댓값</td><td style="width: 70%; text-align: left;">1. D가 구분을 잘하는 경우, 만약 Real data가 들어오면<br><b>D(x) = 1,&nbsp;D(G(z)) = 0<br></b>: 진짜면 1, 가짜면 0을 내뱉음. (G(z)에 가짜가 들어온 경우, 가짜를 잘 구분한 것임)&nbsp;&nbsp;<br>- D의 입장에서는 minmaxV(D, G) = 0&nbsp; - Maximize를 위해 0으로 보내는 게 D의 입장에서는 가장 좋음&nbsp;<br>&nbsp;</td></tr><tr><td style="width: 30%;">D should minimize V(D, G)<br>: G 입장에서 V가 최솟값</td><td style="width: 70%; text-align: left;">2. D가 구분을 못하는 경우, 만약 Real data가 들어오면<br><b>D(G(z)) = 1<br></b>: 진짜를 0, 가짜를 1로 내뱉음 (진짜를 구분하지 못하고 가짜를 진짜로 착각함)&nbsp;<br>- log 안의 D 값이 0이 되어, V 값이&nbsp;-∞로 됨&nbsp;<br>- Minimize를 위해&nbsp;-∞로 보내는 게 G 입장에서는 가장 좋음</td></tr><tr><td style="width: 100%; text-align: left;" colspan="2">- x : real 이미지<br>- z : latent code&nbsp;<br>- G(z) : fake 이미지<br>- D(x) : real 이미지라고 분류한 확률<br>- D(G(z)) : D가 fake라고 분류한 확률<br><br>-&gt;<b>&nbsp;G(z)는 D(G(z))가 1로 판단하도록 학습하고, D(G(z))는 0으로 판단하도록 학습함</b></td></tr></tbody></table>

<img src="./image/gan.png" width="800" height="" >
<figcaption>그림. GAN논문 리뷰 이미지</figcaption>

모델 관점에서 다시 해석하면, Generater에서 input에서 쓰레기(garbage) 값을 보내도 

output(위조지폐, 실제는 이미지)은 실제와 가짜를 구분할 수 없게끔(adversarial) 만들게 된다.

- Generator는 기존 샘플(training, real) 분포를 파악하여 새로운 샘플(fake)을 생성함
- Discriminator는 샘플이 Generator 또는 Training 중 어디에서 온건지 확률을 평가함 (Minimax tow-player game)
- Genertaor가 Discriminator 분포를 완벽한 수준으로 복원하면 Discriminator가 Generator의 산출물(fake)와 Training(real)을 구분할 확률은 1/2가 됨

-   Q\_model(x|z) : 정의하고자 하는 z값을 줬을 때 x 이미지를 내보내는 모델
-   P\_data(x) : x라는 data distribution은 있지만 어떻게 생긴지는 모르므로, P 모델을 Q 모델에 가깝게 가도록 함
-   **파란 점선 ---**  : discriminator distribution (분류 분포) > 학습을 반복하다보면 가장 구분하기 어려운 구별 확률인 1/2 상태가 됨
-   **녹색 선 ⎻** : generative distribution (가짜 데이터 분포)
-   **검은색 점선 ---** : data generating distribution (실제 데이터 분포)

<img src="./image/gan2.png" width="800" height="" >
<figcaption>그림. GAN 학습 과정 (출처 : Generative Adversarial Nets Goodfellow, Ian et al. 2014)</figcaption>

### 4) GAN의 변형

-   **Conditional GAN (cGAN)** :
    -   특정 조건에 맞춰 데이터를 생성할 수 있는 GAN입니다. 예를 들어, 특정 클래스에 속하는 이미지를 생성하는 데 사용될 수 있습니다.
    
-   **CycleGAN** :
    -   두 도메인 간의 이미지 변환을 위한 GAN으로, 예를 들어 사진을 그림 스타일로 바꾸는 데 사용할 수 있습니다.
    
-   **StyleGAN** :
    -   고품질 이미지 생성을 위한 모델로, 스타일 전이 기능을 추가하여 다양한 스타일로 이미지를 생성할 수 있습니다.
    

### 5) GAN의 응용 사례 

-   **이미지 생성** : 고해상도 이미지를 실시간으로 생성해내는 데 활용됩니다.
-   **데이터 증강** : 부족한 데이터셋을 보완하기 위해 새로운 데이터를 생성할 수 있습니다.
-   **예술 및 디자인** : 예술 작품을 생성하거나 디자인 아이디어를 시각적으로 표현하는 데 사용될 수 있습니다.

____

## 13.2 GAN(Generative Adversarial Network) 모델 구현

https://vis-www.cs.umass.edu/lfw/#deepfunnel-anchor

<img src="./image/13.4_lfw.png" width="800" height="" >
<figcaption>그림 13.4 lfw(Labeled Faces in the Wild) </figcaption>

- CUDA 설치와 CUDA 버전 확인

<img src="./image/gpu.png" width="800"/>


<img src="./image/gpu2.png" width="800"/>

- LFW(Labeled Faces in the Wild) 데이터셋
- LFW (Labeled Faces in the Wild) 데이터셋은 얼굴 인식 및 분류를 위한 유명한 데이터셋입니다.
- LFW 데이터셋을 사용해 얼굴을 생성하는 GAN을 학습하고, 학습 과정에서 생성된 이미지를 확인

**1. 라이브러리 설치**

**2. LFW 데이터셋 로딩**
- torchvision 라이브러리를 사용하여 LFW 데이터셋을 로드할 수 있습니다.

**3. GAN 모델 설계**
- Generator (생성자): 노이즈 벡터를 입력받아 가짜 이미지를 생성합니다.
- Discriminator (판별자): 이미지를 입력받아 진짜인지 가짜인지를 판별합니다.  

In [None]:
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision.transforms as transforms
from torchvision import datasets
from torch.utils.data import DataLoader
import matplotlib.pyplot as plt

# 1. 생성자(Generator) 모델 정의
class Generator(nn.Module):
    def __init__(self):
        super(Generator, self).__init__()
        self.model = nn.Sequential(
            nn.Linear(100, 256),   # 잠재 벡터 z의 길이를 100으로 설정
            nn.ReLU(),
            nn.Linear(256, 512),
            nn.ReLU(),
            nn.Linear(512, 1024),
            nn.ReLU(),
            nn.Linear(1024, 28 * 28),  # MNIST 이미지 크기
            nn.Tanh()  # 출력 값을 -1~1로 정규화
        )

    def forward(self, x):
        return self.model(x).view(-1, 1, 28, 28)  # 28x28 이미지로 변환


# 2. 판별자(Discriminator) 모델 정의
class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()
        self.model = nn.Sequential(
            nn.Flatten(),
            nn.Linear(28 * 28, 1024),
            nn.LeakyReLU(0.2),
            nn.Linear(1024, 512),
            nn.LeakyReLU(0.2),
            nn.Linear(512, 256),
            nn.LeakyReLU(0.2),
            nn.Linear(256, 1),  # 진짜/가짜를 판단하기 위한 출력
            nn.Sigmoid()  # 확률값으로 변환
        )

    def forward(self, x):
        return self.model(x)


# 3. 데이터셋 준비
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))  # 데이터 정규화
])

train_dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
train_loader = DataLoader(dataset=train_dataset, batch_size=64, shuffle=True)


# 4. GAN 훈련 함수 정의
def train_gan(generator, discriminator, train_loader, num_epochs=50):
    criterion = nn.BCELoss()  # 이진 교차 엔트로피 손실 함수
    optimizer_g = optim.Adam(generator.parameters(), lr=0.0002)
    optimizer_d = optim.Adam(discriminator.parameters(), lr=0.0002)

    for epoch in range(num_epochs):
        for real_images, _ in train_loader:
            batch_size = real_images.size(0)
            real_labels = torch.ones(batch_size, 1)
            fake_labels = torch.zeros(batch_size, 1)

            # 판별자 학습
            optimizer_d.zero_grad()
            outputs = discriminator(real_images)
            d_loss_real = criterion(outputs, real_labels)
            d_loss_real.backward()

            noise = torch.randn(batch_size, 100)  # 랜덤 노이즈 생성
            fake_images = generator(noise)
            outputs = discriminator(fake_images.detach())
            d_loss_fake = criterion(outputs, fake_labels)
            d_loss_fake.backward()
            optimizer_d.step()

            # 생성자 학습
            optimizer_g.zero_grad()
            outputs = discriminator(fake_images)
            g_loss = criterion(outputs, real_labels)  # 생성자 손실
            g_loss.backward()
            optimizer_g.step()

        print(f'Epoch [{epoch + 1}/{num_epochs}], d_loss: {d_loss_real.item() + d_loss_fake.item():.4f}, g_loss: {g_loss.item():.4f}')


# 5. 결과 확인을 위한 이미지 출력 함수 정의
def show_generated_images(generator, num_images=16):
    noise = torch.randn(num_images, 100)
    generated_images = generator(noise)
    generated_images = generated_images.detach().numpy()

    plt.figure(figsize=(8, 8))
    for i in range(num_images):
        plt.subplot(4, 4, i + 1)
        plt.imshow(generated_images[i][0], cmap='gray')
        plt.axis('off')
    plt.show()


# 6. 모델 인스턴스 생성 및 훈련 시작
generator = Generator()
discriminator = Discriminator()
train_gan(generator, discriminator, train_loader)  # train_loader 추가

# 7. 생성된 이미지 확인
show_generated_images(generator)

In [None]:
%pip install torch torchvision matplotlib scikit-learn

In [None]:
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
from torch.utils.data import DataLoader
from torchvision import datasets, transforms
from torchvision.utils import save_image
import os
import matplotlib.pyplot as plt

# Hyperparameters
batch_size = 128
z_dim = 100
lr = 0.0002
epochs = 200
sample_interval = 500

# 데이터셋 로딩 및 전처리
transform = transforms.Compose([
    transforms.Resize(64),
    transforms.CenterCrop(64),
    transforms.ToTensor(),
    transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
])

lfw_dataset = datasets.LFWPeople(root='./data', split='train', transform=transform, download=True)
dataloader = DataLoader(lfw_dataset, batch_size=batch_size, shuffle=True)

# Generator 모델
class Generator(nn.Module):
    def __init__(self, z_dim):
        super(Generator, self).__init__()
        self.fc = nn.Sequential(
            nn.Linear(z_dim, 128),
            nn.ReLU(True),
            nn.Linear(128, 256),
            nn.ReLU(True),
            nn.Linear(256, 512),
            nn.ReLU(True),
            nn.Linear(512, 1024),
            nn.ReLU(True),
            nn.Linear(1024, 3*64*64),
            nn.Tanh()
        )

    def forward(self, z):
        x = self.fc(z)
        return x.view(-1, 3, 64, 64)

# Discriminator 모델
class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()
        self.fc = nn.Sequential(
            nn.Linear(3*64*64, 1024),
            nn.LeakyReLU(0.2, inplace=True),
            nn.Linear(1024, 512),
            nn.LeakyReLU(0.2, inplace=True),
            nn.Linear(512, 256),
            nn.LeakyReLU(0.2, inplace=True),
            nn.Linear(256, 1),
            nn.Sigmoid()
        )

    def forward(self, x):
        x = x.view(-1, 3*64*64)
        return self.fc(x)

# 모델 초기화
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
generator = Generator(z_dim).to(device)
discriminator = Discriminator().to(device)

# 손실 함수 및 최적화 함수
criterion = nn.BCELoss()
optimizer_g = optim.Adam(generator.parameters(), lr=lr, betas=(0.5, 0.999))
optimizer_d = optim.Adam(discriminator.parameters(), lr=lr, betas=(0.5, 0.999))

# 이미지 저장 폴더 생성
os.makedirs('./output', exist_ok=True)

# 학습 루프
for epoch in range(epochs):
    for i, (imgs, _) in enumerate(dataloader):
        batch_size = imgs.size(0)
        real_imgs = imgs.to(device)

        # 진짜 이미지 레이블 1, 가짜 이미지 레이블 0
        real_labels = torch.ones(batch_size, 1).to(device)
        fake_labels = torch.zeros(batch_size, 1).to(device)

        # -------------------------
        #  Discriminator 학습
        # -------------------------
        optimizer_d.zero_grad()

        # 진짜 이미지에 대해 손실 계산
        real_output = discriminator(real_imgs)
        d_loss_real = criterion(real_output, real_labels)

        # 가짜 이미지에 대해 손실 계산
        z = torch.randn(batch_size, z_dim).to(device)
        fake_imgs = generator(z)
        fake_output = discriminator(fake_imgs.detach())
        # detach()로 generator가 학습되지 않도록 함
        d_loss_fake = criterion(fake_output, fake_labels)

        # 총 discriminator 손실
        d_loss = d_loss_real + d_loss_fake
        d_loss.backward()
        optimizer_d.step()

        # -------------------------
        #  Generator 학습
        # -------------------------
        optimizer_g.zero_grad()

        # generator의 목표는 판별자가 가짜 이미지를 진짜로 분류하게 만드는 것
        fake_output = discriminator(fake_imgs)
        g_loss = criterion(fake_output, real_labels)
        # fake 이미지를 진짜로 판별하도록 함
        g_loss.backward()
        optimizer_g.step()

        if i % 100 == 0:
            print(f'Epoch [{epoch}/{epochs}], Step [{i}/{len(dataloader)}], D Loss: {d_loss.item()}, G Loss: {g_loss.item()}')

        # 이미지 생성 및 저장 (sample_interval마다)
        if (epoch * len(dataloader) + i) % sample_interval == 0:
            save_image(fake_imgs.data[:25], f'./output/fake_images_epoch_{epoch+1}_step_{i}.png', nrow=5, normalize=True)

# 학습 후 최종 생성된 이미지 시각화
z = torch.randn(25, z_dim).to(device)
fake_imgs = generator(z)

# 생성된 이미지 시각화
grid_img = torchvision.utils.make_grid(fake_imgs, nrow=5, normalize=True)
plt.figure(figsize=(5,5))
plt.imshow(grid_img.permute(1, 2, 0).cpu().detach().numpy())
plt.axis('off')
plt.show()


In [None]:
import torch
torch.use_deterministic_algorithms(False)
# Deterministic Algorithms 비활성화: PyTorch의 결정론적 알고리즘 모드를 비활성화 할 수 있습니다. 해당 코드나 스크립트에서 아래와 같은 코드를 추가하여 비활성화할 수 있습니다.

import torch.nn as nn
import torch.optim as optim
import torchvision
from torch.utils.data import DataLoader
from torchvision import datasets, transforms
from torchvision.utils import save_image
import os
import matplotlib.pyplot as plt

# Hyperparameters
batch_size = 128
z_dim = 100
lr = 0.0002
epochs = 200
sample_interval = 500

# 데이터셋 로딩 및 전처리
transform = transforms.Compose([
    transforms.Resize(64),
    transforms.CenterCrop(64),
    transforms.ToTensor(),
    transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
])

lfw_dataset = datasets.LFWPeople(root='./data', split='train', transform=transform, download=True)
dataloader = DataLoader(lfw_dataset, batch_size=batch_size, shuffle=True)

# Generator 모델
class Generator(nn.Module):
    def __init__(self, z_dim):
        super(Generator, self).__init__()
        self.fc = nn.Sequential(
            nn.Linear(z_dim, 256),
            nn.ReLU(True),
            nn.BatchNorm1d(256),
            nn.Linear(256, 512),
            nn.ReLU(True),
            nn.BatchNorm1d(512),
            nn.Linear(512, 1024),
            nn.ReLU(True),
            nn.BatchNorm1d(1024),
            nn.Linear(1024, 3*64*64),
            nn.Tanh()
        )

    def forward(self, z):
        x = self.fc(z)
        return x.view(-1, 3, 64, 64)

# Discriminator 모델
class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()
        self.fc = nn.Sequential(
            nn.Linear(3*64*64, 1024),
            nn.LeakyReLU(0.2, inplace=True),
            nn.Linear(1024, 512),
            nn.LeakyReLU(0.2, inplace=True),
            nn.Linear(512, 256),
            nn.LeakyReLU(0.2, inplace=True),
            nn.Linear(256, 1),
            nn.Sigmoid()
        )

    def forward(self, x):
        x = x.view(-1, 3*64*64)
        return self.fc(x)

# 모델 초기화
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
generator = Generator(z_dim).to(device)
discriminator = Discriminator().to(device)

# 손실 함수 및 최적화 함수
criterion = nn.BCELoss()
optimizer_g = optim.Adam(generator.parameters(), lr=lr, betas=(0.5, 0.999))
optimizer_d = optim.Adam(discriminator.parameters(), lr=lr, betas=(0.5, 0.999))

# 이미지 저장 폴더 생성
os.makedirs('./output', exist_ok=True)

# 학습 루프
for epoch in range(epochs):
    for i, (imgs, _) in enumerate(dataloader):
        batch_size = imgs.size(0)
        real_imgs = imgs.to(device)

        # 진짜 이미지 레이블 1, 가짜 이미지 레이블 0
        real_labels = torch.ones(batch_size, 1).to(device)
        fake_labels = torch.zeros(batch_size, 1).to(device)

        # -------------------------
        #  Discriminator 학습
        # -------------------------
        optimizer_d.zero_grad()

        # 진짜 이미지에 대해 손실 계산
        real_output = discriminator(real_imgs)
        d_loss_real = criterion(real_output, real_labels)

        # 가짜 이미지에 대해 손실 계산
        z = torch.randn(batch_size, z_dim).to(device)
        fake_imgs = generator(z)
        fake_output = discriminator(fake_imgs.detach())
        # detach()로 generator가 학습되지 않도록 함
        d_loss_fake = criterion(fake_output, fake_labels)

        # 총 discriminator 손실
        d_loss = d_loss_real + d_loss_fake
        d_loss.backward()
        optimizer_d.step()

        # -------------------------
        #  Generator 학습
        # -------------------------
        # Generator는 여러 번 업데이트
        if i % 2 == 0:  # Discriminator를 2회 업데이트 후 Generator 업데이트
            optimizer_g.zero_grad()
            fake_output = discriminator(fake_imgs)
            g_loss = criterion(fake_output, real_labels)
            # fake 이미지를 진짜로 판별하도록 함
            g_loss.backward()
            optimizer_g.step()

        if i % 100 == 0:
            print(f'Epoch [{epoch}/{epochs}], Step [{i}/{len(dataloader)}], D Loss: {d_loss.item()}, G Loss: {g_loss.item()}')

        # 이미지 생성 및 저장 (sample_interval마다)
        if (epoch * len(dataloader) + i) % sample_interval == 0:
            save_image(fake_imgs.data[:25], f'./output/fake_images_epoch_{epoch+1}_step_{i}.png', nrow=5, normalize=True)

# 학습 후 최종 생성된 이미지 시각화
z = torch.randn(25, z_dim).to(device)
fake_imgs = generator(z)

# 생성된 이미지 시각화
grid_img = torchvision.utils.make_grid(fake_imgs, nrow=5, normalize=True)
plt.figure(figsize=(5,5))
plt.imshow(grid_img.permute(1, 2, 0).cpu().detach().numpy())
plt.axis('off')
plt.show()

4. 데이터 로딩 및 전처리
- LFW 데이터셋은 torchvision.datasets.LFWPeople 클래스를 통해 로드됩니다.
이미지는 64x64 크기로 리사이즈되고, ToTensor()를 사용해 텐서로 변환됩니다. Normalize()로 픽셀 값을 [-1, 1] 범위로 정규화합니다.

5. Generator 모델
- Generator는 z_dim 크기의 랜덤 노이즈 벡터를 입력받아 (3, 64, 64) 크기의 이미지를 생성합니다. 여기서는 FC layers로 구성된 모델을 사용합니다.

6. Discriminator 모델
- Discriminator는 이미지가 진짜인지 가짜인지를 판별하는 모델입니다. 이미지는 (3, 64, 64) 크기이므로 이를 평탄화하여 FC layers로 처리합니다.
- 
7. 학습 과정
- Discriminator 학습: 진짜 이미지를 1로, 가짜 이미지를 0으로 판별하여 손실을 계산하고, 그라디언트를 업데이트합니다.
- Generator 학습: Generator는 Discriminator를 속이도록 학습합니다. 즉, 가짜 이미지가 진짜로 판별되도록 학습합니다.

8. 시각화
- 각 epoch마다 생성된 이미지를 save_image()로 저장합니다.
- 학습이 완료된 후, 최종적으로 생성된 이미지를 matplotlib를 사용해 시각화합니다.
  
9. 시각화 결과
- 학습 진행 중에 생성된 이미지는 ./output/ 폴더에 저장됩니다.
- 학습 후에는 matplotlib을 사용하여 최종적으로 생성된 이미지를 시각화합니다.



In [None]:
class Generator(nn.Module):
    def __init__(self, z_dim):
        super(Generator, self).__init__()
        self.fc = nn.Sequential(
            nn.Linear(z_dim, 128),
            nn.ReLU(),
            nn.Linear(128, 784),
            nn.Tanh()  # MNIST 데이터는 일반적으로 [-1, 1] 범위로 정규화
        )

    def forward(self, x):
        x = self.fc(x)
        x = x.reshape(-1, 1, 28, 28)  # 28x28 이미지 형태로 재구성
        return x

class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()
        self.fc = nn.Sequential(
            nn.Linear(784, 128),
            nn.LeakyReLU(0.2),
            nn.Linear(128, 1),
            nn.Sigmoid()
        )

    def forward(self, x):
        x = x.view(-1, 784)  # 이미지를 일련의 벡터로 평탄화
        x = self.fc(x)
        return x


In [None]:
# 하이퍼파라미터 설정
batch_size = 128
z_dim = 100
learning_rate = 0.0002
num_epochs = 50

# 데이터 로더
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))  # 데이터를 [-1, 1] 범위로 정규화
])
train_dataset = torchvision.datasets.MNIST(root='./data', train=True, transform=transform, download=True)
train_loader = DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)

# 모델 초기화
generator = Generator(z_dim)
discriminator = Discriminator()

# 손실 함수와 옵티마이저
criterion = nn.BCELoss()
g_optimizer = torch.optim.Adam(generator.parameters(), lr=learning_rate)
d_optimizer = torch.optim.Adam(discriminator.parameters(), lr=learning_rate)

# 학습
for epoch in range(num_epochs):
    for i, (images, _) in enumerate(train_loader):
        b_size = images.size(0)

        # 레이블 데이터 생성
        real_labels = torch.ones(b_size, 1)
        fake_labels = torch.zeros(b_size, 1)

        # 판별자 훈련
        d_optimizer.zero_grad()
        outputs = discriminator(images)
        d_loss_real = criterion(outputs, real_labels)
        real_score = outputs

        z = torch.randn(b_size, z_dim)
        fake_images = generator(z)
        outputs = discriminator(fake_images.detach())
        d_loss_fake = criterion(outputs, fake_labels)
        fake_score = outputs

        d_loss = d_loss_real + d_loss_fake
        d_loss.backward()
        d_optimizer.step()

        # 생성자 훈련
        g_optimizer.zero_grad()
        outputs = discriminator(fake_images)
        g_loss = criterion(outputs, real_labels)
        g_loss.backward()
        g_optimizer.step()

    print(f'Epoch [{epoch+1}/{num_epochs}], d_loss: {d_loss.item():.4f}, g_loss: {g_loss.item():.4f}')


In [None]:
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms
import matplotlib.pyplot as plt

# 하이퍼파라미터 설정
batch_size = 64
latent_dim = 100
num_epochs = 100
learning_rate = 0.0002

# GPU 사용 설정
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# 데이터 로딩
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])

train_dataset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)

# 생성자 모델 정의
class Generator(nn.Module):
    def __init__(self):
        super(Generator, self).__init__()
        self.model = nn.Sequential(
            nn.Linear(latent_dim, 256),
            nn.ReLU(),
            nn.Linear(256, 512),
            nn.ReLU(),
            nn.Linear(512, 1024),
            nn.ReLU(),
            nn.Linear(1024, 28 * 28),
            nn.Tanh()
        )

    def forward(self, z):
        return self.model(z).view(-1, 1, 28, 28)

# 판별자 모델 정의
class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()
        self.model = nn.Sequential(
            nn.Flatten(),
            nn.Linear(28 * 28, 512),
            nn.LeakyReLU(0.2),
            nn.Linear(512, 256),
            nn.LeakyReLU(0.2),
            nn.Linear(256, 1),
            nn.Sigmoid()
        )

    def forward(self, img):
        return self.model(img)

# 모델 초기화 및 GPU로 이동
generator = Generator().to(device)
discriminator = Discriminator().to(device)

# 손실 함수 및 최적화 함수 설정
criterion = nn.BCELoss()
optimizer_G = optim.Adam(generator.parameters(), lr=learning_rate)
optimizer_D = optim.Adam(discriminator.parameters(), lr=learning_rate)

# 훈련 루프
for epoch in range(num_epochs):
    for i, (imgs, _) in enumerate(train_loader):
        imgs = imgs.to(device)  # 배치 데이터를 GPU로 이동

        # 진짜 및 가짜 레이블 생성
        real_labels = torch.ones(imgs.size(0), 1, device=device)
        fake_labels = torch.zeros(imgs.size(0), 1, device=device)

        # 판별자 훈련
        optimizer_D.zero_grad()
        real_outputs = discriminator(imgs)
        d_loss_real = criterion(real_outputs, real_labels)
        d_loss_real.backward()

        z = torch.randn(imgs.size(0), latent_dim, device=device)  # Latent space 벡터를 GPU로 이동
        fake_images = generator(z)
        fake_outputs = discriminator(fake_images.detach())
        d_loss_fake = criterion(fake_outputs, fake_labels)
        d_loss_fake.backward()

        optimizer_D.step()
        d_loss = d_loss_real + d_loss_fake

        # 생성자 훈련
        optimizer_G.zero_grad()
        outputs = discriminator(fake_images)
        g_loss = criterion(outputs, real_labels)
        g_loss.backward()
        optimizer_G.step()

    print(f'Epoch [{epoch}/{num_epochs}], d_loss: {d_loss.item():.4f}, g_loss: {g_loss.item():.4f}')

    # 생성된 이미지 출력
    if (epoch + 1) % 10 == 0:
        with torch.no_grad():
            z = torch.randn(25, latent_dim, device=device)
            # Latent space 벡터를 GPU로 이동
            fake_images = generator(z).detach().cpu()
            # 생성된 이미지를 CPU로 이동
            fake_images = fake_images.view(-1, 28, 28)
            # 이미지 형태로 변환

            plt.figure(figsize=(5, 5))
            for i in range(25):
                plt.subplot(5, 5, i + 1)
                plt.imshow(fake_images[i], cmap='gray')
                plt.axis('off')  # 축 표시 제거
            plt.tight_layout()
            plt.show()

In [None]:
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms
import matplotlib.pyplot as plt
import numpy as np

# 하이퍼파라미터 설정
batch_size = 64
latent_dim = 100
num_epochs = 50
learning_rate = 0.0002

# 데이터 로딩
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])

train_dataset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)

# 생성자 모델 정의
class Generator(nn.Module):
    def __init__(self):
        super(Generator, self).__init__()
        self.model = nn.Sequential(
            nn.Linear(latent_dim, 256),
            nn.ReLU(),
            nn.Linear(256, 512),
            nn.ReLU(),
            nn.Linear(512, 1024),
            nn.ReLU(),
            nn.Linear(1024, 28 * 28),
            nn.Tanh()
        )

    def forward(self, z):
        return self.model(z).view(-1, 1, 28, 28)

# 판별자 모델 정의
class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()
        self.model = nn.Sequential(
            nn.Flatten(),
            nn.Linear(28 * 28, 512),
            nn.LeakyReLU(0.2),
            nn.Linear(512, 256),
            nn.LeakyReLU(0.2),
            nn.Linear(256, 1),
            nn.Sigmoid()
        )

    def forward(self, img):
        return self.model(img)

# 모델 초기화
generator = Generator()
discriminator = Discriminator()

# 손실 함수 및 최적화 함수 설정
criterion = nn.BCELoss()
optimizer_G = optim.Adam(generator.parameters(), lr=learning_rate)
optimizer_D = optim.Adam(discriminator.parameters(), lr=learning_rate)

# 훈련 루프
for epoch in range(num_epochs):
    for i, (imgs, _) in enumerate(train_loader):
        # 진짜 및 가짜 레이블 생성
        real_labels = torch.ones(imgs.size(0), 1)
        fake_labels = torch.zeros(imgs.size(0), 1)

        # 판별자 훈련
        optimizer_D.zero_grad()
        real_outputs = discriminator(imgs)
        d_loss_real = criterion(real_outputs, real_labels)
        d_loss_real.backward()

        z = torch.randn(imgs.size(0), latent_dim)
        fake_images = generator(z)
        fake_outputs = discriminator(fake_images.detach())
        d_loss_fake = criterion(fake_outputs, fake_labels)
        d_loss_fake.backward()

        optimizer_D.step()
        d_loss = d_loss_real + d_loss_fake

        # 생성자 훈련
        optimizer_G.zero_grad()
        outputs = discriminator(fake_images)
        g_loss = criterion(outputs, real_labels)
        g_loss.backward()
        optimizer_G.step()

    print(f'Epoch [{epoch}/{num_epochs}], d_loss: {d_loss.item():.4f}, g_loss: {g_loss.item():.4f}')

    # 생성된 이미지 출력
    if (epoch + 1) % 10 == 0:
        with torch.no_grad():
            z = torch.randn(25, latent_dim)
            fake_images = generator(z).detach().cpu()
            fake_images = fake_images.view(-1, 28, 28)  # 이미지 형태로 변환

            plt.figure(figsize=(5, 5))
            for i in range(25):
                plt.subplot(5, 5, i + 1)
                plt.imshow(fake_images[i], cmap='gray')
                plt.axis('off')  # 축 표시 제거
            plt.tight_layout()
            plt.show()


In [None]:
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms
import matplotlib.pyplot as plt
import numpy as np

# 하이퍼파라미터 설정
batch_size = 64
latent_dim = 100
num_epochs = 100
learning_rate = 0.0002

# 데이터 로딩
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])

train_dataset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)

# 생성자 모델 정의
class Generator(nn.Module):
    def __init__(self):
        super(Generator, self).__init__()
        self.model = nn.Sequential(
            nn.Linear(latent_dim, 256),
            nn.ReLU(),
            nn.Linear(256, 512),
            nn.ReLU(),
            nn.Linear(512, 1024),
            nn.ReLU(),
            nn.Linear(1024, 28 * 28),
            nn.Tanh()
        )

    def forward(self, z):
        return self.model(z).view(-1, 1, 28, 28)

# 판별자 모델 정의
class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()
        self.model = nn.Sequential(
            nn.Flatten(),
            nn.Linear(28 * 28, 512),
            nn.LeakyReLU(0.2),
            nn.Linear(512, 256),
            nn.LeakyReLU(0.2),
            nn.Linear(256, 1),
            nn.Sigmoid()
        )

    def forward(self, img):
        return self.model(img)

# 모델 초기화
generator = Generator()
discriminator = Discriminator()

# 손실 함수 및 최적화 함수 설정
criterion = nn.BCELoss()
optimizer_G = optim.Adam(generator.parameters(), lr=learning_rate)
optimizer_D = optim.Adam(discriminator.parameters(), lr=learning_rate)

# 훈련 루프
for epoch in range(num_epochs):
    for i, (imgs, _) in enumerate(train_loader):
        # 진짜 및 가짜 레이블 생성
        real_labels = torch.ones(imgs.size(0), 1)
        fake_labels = torch.zeros(imgs.size(0), 1)

        # 판별자 훈련
        optimizer_D.zero_grad()
        real_outputs = discriminator(imgs)
        d_loss_real = criterion(real_outputs, real_labels)
        d_loss_real.backward()

        z = torch.randn(imgs.size(0), latent_dim)
        fake_images = generator(z)
        fake_outputs = discriminator(fake_images.detach())
        d_loss_fake = criterion(fake_outputs, fake_labels)
        d_loss_fake.backward()

        optimizer_D.step()
        d_loss = d_loss_real + d_loss_fake

        # 생성자 훈련
        optimizer_G.zero_grad()
        outputs = discriminator(fake_images)
        g_loss = criterion(outputs, real_labels)
        g_loss.backward()
        optimizer_G.step()

    print(f'Epoch [{epoch}/{num_epochs}], d_loss: {d_loss.item():.4f}, g_loss: {g_loss.item():.4f}')

    # 생성된 이미지 출력
    if (epoch + 1) % 10 == 0:
        with torch.no_grad():
            z = torch.randn(25, latent_dim)
            fake_images = generator(z).detach().cpu()
            fake_images = fake_images.view(-1, 28, 28)  # 이미지 형태로 변환

            plt.figure(figsize=(5, 5))
            for i in range(25):
                plt.subplot(5, 5, i + 1)
                plt.imshow(fake_images[i], cmap='gray')
                plt.axis('off')  # 축 표시 제거
            plt.tight_layout()
            plt.show()

---

# **13.3 파이토치 한국 사용자 커뮤니티 튜토리얼 예제 소개**

<img width="400" height="" src="./image/kr_pytorch.png" >

파이토치 한국 사용자 모임은 한국 사용자를 위한 비공식 사용자 모임으로, 한국어를 사용하시는 많은 분들께 PyTorch를 소개하고 함께 배우며 성장하는 것을 목표로 하고 있습니다.

Google Colab에서 노트북을 실행하실 때에는 
https://tutorials.pytorch.kr/beginner/colab 를 참고하세요.


# DCGAN 튜토리얼

**저자**: [Nathan Inkawhich](https://github.com/inkawhich)
**번역**: [조민성](https://github.com/miNept)


## 개요

본 튜토리얼에서는 예제를 통해 DCGAN을 알아보겠습니다. 우리는 실제 유명인들의 사진들로 적대적 생성 신경망(GAN)을 학습시켜,
새로운 유명인의 사진을 만들어보겠습니다.
사용할 대부분의 코드는 [pytorch/examples](https://github.com/pytorch/examples)_ 의 DCGAN 구현에서 가져왔으며,
본 문서는 구현에 대한 설명과 함께, 어째서 이 모델이 작동하는지에 대해 설명을 해줄 것입니다.
처음 읽었을때는, 실제로 모델에 무슨일이 일어나고 있는지에 대해 이해하는 것이 조금 시간을 소요할 수 있으나,
그래도 GAN에 대한 사전지식이 필요하지는 않으니 걱정하지 않으셔도 됩니다.
추가로, GPU 1-2개를 사용하는 것이 시간절약에 도움이 될겁니다. 그럼 처음부터 천천히 시작해봅시다!

## 적대적 생성 신경망(Generative Adversarial Networks)

### 그래서 GAN이 뭘까요?

GAN이란 학습 데이터들의 분포를 학습한 뒤, 동일한 분포를 갖는 새로운 데이터를
생성하도록 딥러닝 모델을 학습시키는 프레임워크입니다.
GAN은 2014년 Ian Goodfellow가 개발했으며,
[Generative Adversarial Nets](https://papers.nips.cc/paper/5423-generative-adversarial-nets.pdf)_ 논문에서
처음 소개되었습니다.
GAN은 *생성자(Generator)* 와 *구분자(Discriminator)* 라는 두 개의 서로
다른(distinct) 모델들로 구성되어 있습니다.
생성자(Generator)의 역할은 학습한 이미지들과 같아 보이는 `가짜(fake)`
이미지를 만드는 것이고, 구분자(Discriminator)는 이미지를 보고 이것이
실제 학습 데이터에서 가져온 것인지, 또는 생성자에 의해 만들어진 가짜
이미지인지 판별하는 것입니다.
모델을 학습하는 동안 생성자는 더 진짜 같은 가짜 이미지를 만들어내며
구분자를 속이려 하고, 구분자는 진짜 이미지와 가짜 이미지를 더 정확히
판별할 수 있도록 노력합니다.
이러한 과정은 생성자가 마치 학습 데이터에서 가져온 것처럼 보이는
완벽한 가짜 이미지를 생성해내고, 판별자는 항상 50%의 신뢰도로
생성자의 출력이 진짜인지 가짜인지 판별할 수 있을 때 균형 상태(equilbrium)에
도달하게 됩니다.

그럼 이제부터 본 튜토리얼에서 사용할 표기들을 구분자부터 정의해보겠습니다.
$x$ 는 이미지로 표현되는 데이터라고 하겠습니다.
$D(x)$ 는 구분자의 신경망을 나타내며, 실제 학습 데이터에서 가져온
$x$ 를 통과시켜 확률 값(scalar)을 결과로 출력합니다.
여기에서는 이미지 데이터를 다루고 있으므로,
$D(x)$ 의 입력으로는 3x64x64 크기의 CHW 이미지가 주어집니다.
직관적으로 $D(x)$ 는 $x$ 가 학습 데이터에서 가져왔을 때 출력이 크고(HIGH),
생성자가 만들어낸 $x$ 일 때는 작을(LOW) 것입니다.
$D(x)$ 는 전통적인 이진 분류기(binary classification)로도 생각할 수도 있습니다.

이번엔 생성자의 표기들을 살펴보겠습니다. $z$ 를 정규분포에서 뽑은
잠재공간 벡터(laten space vector)라고 하겠습니다
(번역 주. laten space vector는 쉽게 생각해 정규분포를 따르는 n개의 원소를 가진 vector라 볼 수 있습니다.
다르게 얘기하면 정규분포에서 n개의 원소를 추출한 것과 같습니다). $G(z)$ 는 $z$
벡터를 원하는 데이터 차원으로 대응시키는 신경망으로 둘 수 있습니다. 이때 $G$ 의 목적은 $p_{data}$
에서 얻을 수 있는 학습 데이터들의 분포를 추정하여, 모사한 $p_g$ 의 분포를 이용해 가짜 데이터들을 만드는 것입니다.

이어서, $D(G(z))$ 는 $G$ 가 출력한 결과물이 실제 이미지 여부를
나타내는 0~1 사이의 확률 값(scalar)입니다.
[Goodfellow의 논문](https://papers.nips.cc/paper/5423-generative-adversarial-nets.pdf)_
에 기술되어 있듯이, $D$ 와 $G$ 는 일종의 최대-최소 게임(minimax game)을
하고 있는 것과 같습니다. 이는 $D$ 는 이미지가 진짜인지 가짜인지 여부를 판별하는 확률인
$logD(x)$ 를 최대화하려고 하고, $G$ 는 $D$ 가 가짜라고 판별할 확률인 $log(1-D(G(z)))$ 를
최소화시키려고 하기 때문입니다.
논문에 따르면, GAN의 손실함수는 아래와 같습니다.

\begin{align}\underset{G}{\text{min}} \underset{D}{\text{max}}V(D,G) = \mathbb{E}_{x\sim p_{data}(x)}\big[logD(x)\big] + \mathbb{E}_{z\sim p_{z}(z)}\big[log(1-D(G(z)))\big]\end{align}

이론적으로는, 이 최대-최소 게임의 답(solution)은 $p_g = p_{data}$
일 때이며, 이 때 구분자는 입력이 진짜인지 가짜인지를 무작위로 추측하게
됩니다. 하지만 GAN의 수렴 이론(convergence theory)에 대해서는 아직도
활발히 연구가 진행 중이며, 실제 모델들을 학습할 때에는 항상 이러한
이론적인 최적 상태에 도달하지는 못합니다.

### 그렇다면 DCGAN은 뭘까요?

DCGAN은 위에서 기술한 GAN에서 직접적으로 파생된 모델로, 생성자와 구분자에서
합성곱 신경망(convolution)과 전치 합성곱 신경망(convolution-transpose)을 사용했다는 것이 차이점입니다
Radford와 그 외가 저술한 [Unsupervised Representation Learning With
Deep Convolutional Generative Adversarial
Networks](https://arxiv.org/pdf/1511.06434.pdf)_ 논문에서 처음 모델이 소개되었고, 지금은 대부분의 GAN모델이
DCGAN을 기반으로 만들어지는 중입니다. 이전 GAN과 모델의 구조가 실제로 어떻게 다른지 확인을 해보자면, 먼저 구분자에서는
[convolution](https://pytorch.org/docs/stable/nn.html#torch.nn.Conv2d)_
계층, [batch
norm](https://pytorch.org/docs/stable/nn.html#torch.nn.BatchNorm2d)_
계층, 그리고
[LeakyReLU](https://pytorch.org/docs/stable/nn.html#torch.nn.LeakyReLU)_
활성함수가 사용되었습니다. 클래식한 GAN과 마찬가지로, 구분자의 입력 데이터는 3x64x64 의 이미지이고,
출력값은 입력 데이터가 실제 데이터일 0~1사이의 확률값입니다.
다음으로, 생성자는
[convolutional-transpose](https://pytorch.org/docs/stable/nn.html#torch.nn.ConvTranspose2d)_
계층, 배치 정규화(batch norm) 계층, 그리고
[ReLU](https://pytorch.org/docs/stable/nn.html#relu)_ 활성함수가 사용되었습니다.
입력값은 역시나 정규분포에서 추출한 잠재공간 벡터 $z$ 이고, 출력값은 3x64x64 RGB 이미지입니다.
이 때, 전치 합성곱 계층(strided conv-transpose layer)은 잠재공간 벡터로 하여금 이미지와 같은 차원을 갖도록 변환시켜주는 역할을 합니다.
(번역 주. 전치 합성곱 신경망은 합성곱 신경망의 반대적인 개념이라 이해하면 쉽습니다. 입력된 작은 CHW 데이터를 가중치들을 이용해 더 큰 CHW로 업샘플링해주는 계층입니다.)
논문에서는 각종 최적화 방법이나 손실함수의 계산, 모델의 가중치 초기화 방법등에 관한 추가적인 정보들도 적어두었는데,
이 부분은 다음 섹션에서 설명하도록 하겠습니다.



In [None]:
#%matplotlib inline
import argparse
import os
import random
import torch
import torch.nn as nn
import torch.nn.parallel
import torch.backends.cudnn as cudnn
import torch.optim as optim
import torch.utils.data
import torchvision.datasets as dset
import torchvision.transforms as transforms
import torchvision.utils as vutils
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.animation as animation
from IPython.display import HTML

# 코드 실행결과의 동일성을 위해 무작위 시드를 설정합니다
manualSeed = 999
#manualSeed = random.randint(1, 10000) # 만일 새로운 결과를 원한다면 주석을 없애면 됩니다
print("Random Seed: ", manualSeed)
random.seed(manualSeed)
torch.manual_seed(manualSeed)
torch.use_deterministic_algorithms(True) # 결과 재현을 위해 필요합니다

## 설정 값

몇 가지 설정 값들을 살펴보겠습니다:

-  ``dataroot`` - 데이터셋 폴더의 경로입니다. 데이터셋에 대해서는 다음 섹션에서
   더 자세히 설명하겠습니다.
-  ``workers`` - ``DataLoader`` 에서 데이터를 불러올 때 사용할 워커 쓰레드의
   수입니다.
-  ``batch_size`` - 학습에 사용할 배치 크기입니다. DCGAN에서는 배치 크기를
   128으로 사용했습니다.
-  ``image_size`` - 학습에 사용하는 이미지의 크기입니다.
   이 튜토리얼에서는 64x64의 크기를 기본으로 하나, 만일 다른 크기의 이미지를
   사용한다면 D와 G의 구조 또한 변경되어야 합니다.
   이에 대해서는 [여기](https://github.com/pytorch/examples/issues/70)_ 를 참고하여
   더 자세한 정보를 확인할 수 있습니다.
-  ``nc`` - 입력 이미지의 색상의 채널 수입니다. RGB 컬러 이미지의 경우
   이 값은 3입니다.
-  ``nz`` - 잠재공간 벡터의 원소들의 수입니다.
-  ``ngf`` - 생성자를 통과할 때 만들어질 특징 데이터의 채널 수입니다.
-  ``ndf`` - 구분자를 통과할 때 만들어질 특징 데이터의 채널 수입니다.
-  ``num_epochs`` - 학습시킬 에폭(epoch) 수입니다. 학습을
   길게하는 경우 대부분 좋은 결과를 보이지만, 이러한 경우 시간 또한
   오래 걸립니다.
-  ``lr`` - 모델의 학습률(learning rate)입니다. DCGAN 논문에서와 같이 0.0002로
   설정합니다.
-  ``beta1`` - Adam 옵티마이저에서 사용할 beta1 하이퍼파라미터 값입니다.
   논문에서와 같이 0.5로 설정했습니다.
-  ``ngpu`` - 사용 가능한 GPU의 개수입니다. 0인 경우에는 코드는 CPU에서 동작합니다.
   만약 이 값이 0보다 큰 경우에는 주어진 수 만큼의 GPU를 사용하여 학습을
   진행합니다.




In [None]:
# 데이터셋의 경로
dataroot = "data/celeba"

# dataloader에서 사용할 쓰레드 수
workers = 2

# 배치 크기
batch_size = 128

# 이미지의 크기입니다. 모든 이미지를 변환하여 64로 크기가 통일됩니다.
image_size = 64

# 이미지의 채널 수로, RGB 이미지이기 때문에 3으로 설정합니다.
nc = 3

# 잠재공간 벡터의 크기 (예. 생성자의 입력값 크기)
nz = 100

# 생성자를 통과하는 특징 데이터들의 채널 크기
ngf = 64

# 구분자를 통과하는 특징 데이터들의 채널 크기
ndf = 64

# 학습할 에폭 수
num_epochs = 5

# 옵티마이저의 학습률
lr = 0.0002

# Adam 옵티마이저의 beta1 하이퍼파라미터
beta1 = 0.5

# 사용가능한 gpu 번호. CPU를 사용해야 하는경우 0으로 설정하세요
ngpu = 1

## 데이터

본 튜토리얼에서 사용할 데이터는 [Celeb-A Faces
dataset](http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html)_ 로, 해당 링크를 이용하거나 [Google
Drive](https://drive.google.com/drive/folders/0B7EVK8r0v71pTUZsaXdaSnZBZzg)_ 에서 데이터를 받을 수 있습니다.

데이터를 받으면 ``img_align_celeba.zip`` 라는 파일을 보게될 겁니다. 

다운로드가 끝나면
``celeba`` 이라는 폴더를 새로 만들고, 해당 폴더에 해당 zip 파일을 압축해제 해주시면 됩니다.

압축 해제 후, 위에서 정의한 ``dataroot`` 변수에 방금 만든 ``celeba`` 폴더의 경로를 넣어주세요.

위의 작업이 끝나면 ``celeba`` 폴더의 구조는 다음과 같아야 합니다:

```sh
/path/to/celeba
    -> img_align_celeba
        -> 188242.jpg
        -> 173822.jpg
        -> 284702.jpg
        -> 537394.jpg
           ...
```
이 과정들은 프로그램이 정상적으로 구동하기 위해서는 중요한 부분입니다.

이때 ``celeba`` 폴더 안에 다시 폴더를 두는 이유는,
``ImageFolder`` 클래스가 데이터셋의 최상위 폴더에 서브폴더를 요구하기 때문입니다.

이제 ``Dataset`` 과 ``DataLoader`` 의 설정을 끝냈습니다.

최종적으로 학습 데이터들을 시각화해봅시다.

In [None]:
# 우리가 설정한 대로 이미지 데이터셋을 불러와 봅시다
# 먼저 데이터셋을 만듭니다
dataset = dset.ImageFolder(root=dataroot,
                            transform=transforms.Compose([
                                transforms.Resize(image_size),
                                transforms.CenterCrop(image_size),
                                transforms.ToTensor(),
                                transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)),
                            ]))
# dataloader를 정의해봅시다
dataloader = torch.utils.data.DataLoader(dataset, batch_size=batch_size,
                                            shuffle=True, num_workers=workers)

# GPU 사용여부를 결정해 줍니다
device = torch.device("cuda:0" if (torch.cuda.is_available() and ngpu > 0) else "cpu")

# 학습 데이터들 중 몇가지 이미지들을 화면에 띄워봅시다
real_batch = next(iter(dataloader))
plt.figure(figsize=(8,8))
plt.axis("off")
plt.title("Training Images")
plt.imshow(np.transpose(vutils.make_grid(real_batch[0].to(device)[:64], padding=2, normalize=True).cpu(),(1,2,0)))
plt.show()

## 구현

모델의 설정값들과 데이터들이 준비되었기 때문에, 드디어 모델의 구현으로
들어갈 수 있을 것 같습니다. 

먼저 가중치 초기화에 대해 이야기 해보고,
순서대로 생성자, 구분자, 손실 함수, 학습 방법들을 알아보겠습니다.

### 가중치 초기화

DCGAN 논문에서는, 평균이 0( ``mean=0`` )이고 분산이 0.02( ``stdev=0.02`` )인
정규분포을 시용해, 구분자와 생성자 모두 무작위 초기화를 진행하는 것이 좋다고 합니다.

``weights_init`` 함수는 매개변수로 모델을 입력받아,
모든 합성곱 계층, 전치 합성곱 계층, 배치 정규화 계층을, 위에서 말한 조건대로
가중치들을 다시 초기화 시킵니다. 

이 함수는 모델이 만들어지자 마자 바로 적용을 시키게 됩니다.

In [None]:
# ``netG`` 와 ``netD`` 에 적용시킬 커스텀 가중치 초기화 함수
def weights_init(m):
    classname = m.__class__.__name__
    if classname.find('Conv') != -1:
        nn.init.normal_(m.weight.data, 0.0, 0.02)
    elif classname.find('BatchNorm') != -1:
        nn.init.normal_(m.weight.data, 1.0, 0.02)
        nn.init.constant_(m.bias.data, 0)

### 생성자

생성자 $G$ 는 잠재 공간 벡터 $z$ 를, 데이터 공간으로
변환시키도록 설계되었습니다. 우리에게 데이터라 함은 이미지이기 때문에,
$z$ 를 데이터공간으로 변환한다는 뜻은, 학습이미지와 같은 사이즈를 가진
RGB 이미지를 생성하는것과 같습니다 (예. 3x64x64).
실제 모델에서는 스트라이드(stride) 2를 가진 전치 합성곱 계층들을 이어서 구성하는데,
각 전치 합성곱 계층 하나당 2차원 배치 정규화 계층과 relu 활성함수를 한 쌍으로 묶어서 사용합니다.
생성자의 마지막 출력 계층에서는 데이터를 tanh 함수에 통과시키는데,
이는 출력 값을 $[-1,1]$ 사이의 범위로 조정하기 위해서 입니다.
이때 배치 정규화 계층을 주목할 필요가 있는데, DCGAN 논문에 의하면,
이 계층이 경사하강법(gradient-descent)의 흐름에 중요한 영향을 미치는 것으로 알려져 있습니다.
아래의 그림은 DCGAN 논문에서 가져온 생성자의 모델 아키텍쳐입니다.

.. figure:: /_static/img/dcgan_generator.png
   :alt: dcgan_generator

우리가 설정값 섹션에서 정의한 값들이 (``nz``, ``ngf``, 그리고
``nc``) 생성자 모델 아키텍쳐에 어떻게 영향을 끼치는지 주목해주세요. ``nz`` 는 z 입력 벡터의
길이, ``ngf`` 는 생성자를 통과하는 특징 데이터의 크기, 그리고 ``nc`` 는 출력 이미지의
채널 개수입니다 (RGB 이미지이기 때문에 3으로 설정을 했습니다).
아래는 생성자의 코드입니다.




In [None]:
# 생성자 코드

class Generator(nn.Module):
    def __init__(self, ngpu):
        super(Generator, self).__init__()
        self.ngpu = ngpu
        self.main = nn.Sequential(
            # 입력데이터 Z가 가장 처음 통과하는 전치 합성곱 계층입니다.
            nn.ConvTranspose2d( nz, ngf * 8, 4, 1, 0, bias=False),
            nn.BatchNorm2d(ngf * 8),
            nn.ReLU(True),
            # 위의 계층을 통과한 데이터의 크기. ``(ngf*8) x 4 x 4``
            nn.ConvTranspose2d(ngf * 8, ngf * 4, 4, 2, 1, bias=False),
            nn.BatchNorm2d(ngf * 4),
            nn.ReLU(True),
            # 위의 계층을 통과한 데이터의 크기. ``(ngf*4) x 8 x 8``
            nn.ConvTranspose2d( ngf * 4, ngf * 2, 4, 2, 1, bias=False),
            nn.BatchNorm2d(ngf * 2),
            nn.ReLU(True),
            # 위의 계층을 통과한 데이터의 크기. ``(ngf*2) x 16 x 16``
            nn.ConvTranspose2d( ngf * 2, ngf, 4, 2, 1, bias=False),
            nn.BatchNorm2d(ngf),
            nn.ReLU(True),
            # 위의 계층을 통과한 데이터의 크기. ``(ngf) x 32 x 32``
            nn.ConvTranspose2d( ngf, nc, 4, 2, 1, bias=False),
            nn.Tanh()
            # 위의 계층을 통과한 데이터의 크기. ``(nc) x 64 x 64``
        )

    def forward(self, input):
        return self.main(input)

좋습니다. 이제 우리는 생성자의 인스턴스를 만들고 ``weights_init``
함수를 적용시킬 수 있습니다. 모델의 인스턴스를 출력해서 생성자가
어떻게 구성되어있는지 확인해봅시다.




In [None]:
# 생성자를 만듭니다
netG = Generator(ngpu).to(device)

# 필요한 경우 multi-GPU를 설정 해주세요
if (device.type == 'cuda') and (ngpu > 1):
    netG = nn.DataParallel(netG, list(range(ngpu)))

# 모든 가중치의 평균을 0( ``mean=0`` ), 분산을 0.02( ``stdev=0.02`` )로 초기화하기 위해
# ``weight_init`` 함수를 적용시킵니다
netG.apply(weights_init)

# 모델의 구조를 출력합니다
print(netG)

### 구분자

앞서 언급했듯, 구분자 $D$ 는 입력 이미지가 진짜 이미지인지 (혹은 반대로 가짜 이미지인지)
판별하는 전통적인 이진 분류 신경망으로 볼 수 있습니다. 이때 $D$ 는
3x64x64 이미지를 입력받아, Conv2d, BatchNorm2d, 그리고 LeakyReLU 계층을 통과시켜
데이터를 가공시키고, 마지막 출력에서 Sigmoid 함수를 이용하여
0~1 사이의 확률값으로 조정합니다. 이 아키텍쳐는 필요한 경우 더 다양한 레이어를 쌓을 수 있지만,
배치 정규화와 LeakyReLU, 특히 보폭이 있는 (strided) 합성곱 계층을
사용하는 것에는 이유가 있습니다.
DCGAN 논문에서는 보폭이 있는 합성곱 계층을 사용하는 것이 신경망 내에서 스스로의
풀링(Pooling) 함수를 학습하기 때문에, 데이터를 처리하는 과정에서 직접적으로 풀링 계층( MaxPool or AvgPooling)을
사용하는 것보다 더 유리하다고 합니다. 또한 배치 정규화와 leaky relu 함수는 학습과정에서
$G$ 와 $D$ 가 더 효과적인 경사도(gradient)를 얻을 수 있습니다.




In [None]:
# 구분자 코드

class Discriminator(nn.Module):
    def __init__(self, ngpu):
        super(Discriminator, self).__init__()
        self.ngpu = ngpu
        self.main = nn.Sequential(
            # 입력 데이터의 크기는 ``(nc) x 64 x 64`` 입니다
            nn.Conv2d(nc, ndf, 4, 2, 1, bias=False),
            nn.LeakyReLU(0.2, inplace=True),
            # 위의 계층을 통과한 데이터의 크기. ``(ndf) x 32 x 32``
            nn.Conv2d(ndf, ndf * 2, 4, 2, 1, bias=False),
            nn.BatchNorm2d(ndf * 2),
            nn.LeakyReLU(0.2, inplace=True),
            # 위의 계층을 통과한 데이터의 크기. ``(ndf*2) x 16 x 16``
            nn.Conv2d(ndf * 2, ndf * 4, 4, 2, 1, bias=False),
            nn.BatchNorm2d(ndf * 4),
            nn.LeakyReLU(0.2, inplace=True),
            # 위의 계층을 통과한 데이터의 크기. ``(ndf*4) x 8 x 8``
            nn.Conv2d(ndf * 4, ndf * 8, 4, 2, 1, bias=False),
            nn.BatchNorm2d(ndf * 8),
            nn.LeakyReLU(0.2, inplace=True),
            # 위의 계층을 통과한 데이터의 크기. ``(ndf*8) x 4 x 4``
            nn.Conv2d(ndf * 8, 1, 4, 1, 0, bias=False),
            nn.Sigmoid()
        )

    def forward(self, input):
        return self.main(input)

이제 우리는 생성자에 한 것처럼 구분자의 인스턴스를 만들고,
``weights_init`` 함수를 적용시킨 다음, 모델의 구조를 출력해볼 수 있습니다.




In [None]:
# 구분자를 만듭니다
netD = Discriminator(ngpu).to(device)

# 필요한 경우 multi-GPU를 설정 해주세요
if (device.type == 'cuda') and (ngpu > 1):
    netD = nn.DataParallel(netD, list(range(ngpu)))

# 모든 가중치의 평균을 0( ``mean=0`` ), 분산을 0.02( ``stdev=0.02`` )로 초기화하기 위해
# ``weight_init`` 함수를 적용시킵니다
netD.apply(weights_init)

# 모델의 구조를 출력합니다
print(netD)

### 손실함수와 옵티마이저

$D$ 와 $G$ 의 설정을 끝냈으니, 이제 손실함수와 옵티마이저를 정하여
학습을 구체화시킬 시간입니다. 손실함수로는 Binary Cross Entropy loss
([BCELoss](https://pytorch.org/docs/stable/generated/torch.nn.BCELoss.html#torch.nn.BCELoss)_)
를 사용할겁니다. 해당함수는 아래의 식으로 파이토치에 구현되어 있습니다:

\begin{align}\ell(x, y) = L = \{l_1,\dots,l_N\}^\top, \quad l_n = - \left[ y_n \cdot \log x_n + (1 - y_n) \cdot \log (1 - x_n) \right]\end{align}

이때, 위의 함수가 로그함수 요소를 정의한 방식을 주의깊게 봐주세요 (예. $log(D(x))$ 와
$log(1-D(G(z)))$). 우린 $y$ 을 조정을 조정하여, BCE 함수에서
사용할 요소를 고를 수 있습니다.
이 부분은 이후에 서술할 학습 섹션에서 다루겠지만, 어떻게 $y$ 를 이용하여
우리가 원하는 요소들만 골라낼 수 있는지 이해하는 것이 먼저입니다 (예. GT labels).

좋습니다. 다음으로 넘어가겠습니다. 참 라벨 (혹은 정답)은 1로 두고, 거짓 라벨 (혹은 오답)은 0으로
두겠습니다. 각 라벨의 값을 정한건 GAN 논문에서 사용된 값들로, GAN을 구성할때의 관례라 할
수 있습니다. 방금 정한 라벨 값들은 추후에 손실값을 계산하는 과정에서 사용될겁니다.
마지막으로, 서로 구분되는 두 옵티마이저를 구성하겠습니다. 하나는 $D$ 를 위한 것,
다른 하나는 $G$ 를 위한 것입니다. DCGAN에 서술된 대로, 두 옵티마이저는 모두 Adam을 사용하고,
학습률은 0.0002, Beta1 값은 0.5로 둡니다. 추가적으로, 학습이 진행되는 동안 생성자의 상태를 알아보기 위하여,
프로그램이 끝날때까지 고정된 잠재공간 벡터를 생성하겠습니다 (예. fixed_noise).
이 벡터들 역시 가우시안 분포에서 추출합니다. 학습 과정을 반복하면서  $G$ 에 주기적으로 같은 잠재공간 벡터를
입력하면, 그 출력값을 기반으로 생성자의 상태를 확인 할 수 있습니다.




In [None]:
# ``BCELoss`` 함수의 인스턴스를 초기화합니다
criterion = nn.BCELoss()

# 생성자의 학습상태를 확인할 잠재 공간 벡터를 생성합니다
fixed_noise = torch.randn(64, nz, 1, 1, device=device)

# 학습에 사용되는 참/거짓의 라벨을 정합니다
real_label = 1.
fake_label = 0.

# G와 D에서 사용할 Adam옵티마이저를 생성합니다
optimizerD = optim.Adam(netD.parameters(), lr=lr, betas=(beta1, 0.999))
optimizerG = optim.Adam(netG.parameters(), lr=lr, betas=(beta1, 0.999))

### 학습

드디어 최종입니다. GAN 프레임워크에 필요한 부분들은 모두 가졌으니,
실제 모델을 학습시키는 방법을 알아보겠습니다. 주의를 기울일 것은, GAN을 학습시키는 건
관례적인 기술들의 집합이기 때문에, 잘못된 하이퍼파라미터의 설정은
모델의 학습을 망가뜨릴 수 있습니다. 무엇이 잘못되었는지 알아내는 것 조차도 힘들죠.
그러한 이유로, 본 튜토리얼에서는 [Goodfellow’s paper](https://papers.nips.cc/paper/5423-generative-adversarial-nets.pdf)_
에서 서술된 Algorithm 1을 기반으로, [ganhacks](https://github.com/soumith/ganhacks)_ 에서 사용된 몇가지 괜찮은 테크닉들을
더할 것입니다. 앞서 몇번 설명했지만, 우리의 의도는 “진짜 혹은 가짜 이미지를 구성”하고,
$log(D(G(z)))$ 를 최대화하는 G의 목적함수를 최적화 시키는 겁니다. 학습과정은 크게 두가지로 나눕니다.
Part 1은 구분자를, Part 2는 생성자를 업데이트하는 과정입니다.

**Part 1 - 구분자의 학습**

구분자의 목적은 주어진 입력값이 진짜인지 가짜인지 판별하는 것임을 상기합시다.
Goodfellow의 말을 빌리자면, 구분자는 “변화도(gradient)를 상승(ascending)시키며 훈련”하게 됩니다.
실전적으로 얘기하면, $log(D(x)) + log(1-D(G(z)))$ 를 최대화시키는 것과 같습니다.
[ganhacks](https://github.com/soumith/ganhacks)_ 에서 미니 배치(mini-batch)를 분리하여 사용한 개념을 가져와서,
우리 역시 두가지 스텝으로 분리해 계산을 해보겠습니다. 먼저,
진짜 데이터들로만 이루어진 배치를 만들어 $D$ 에 통과시킵니다. 그 출력값으로 ($log(D(x))$) 의 손실값을 계산하고,
역전파 과정에서의 변화도들을 계산합니다. 여기까지가 첫번째 스텝입니다. 두번째 스텝에서는, 오로지 가짜 데이터들로만
이루어진 배치를 만들어 $D$ 에 통과시키고, 그 출력값으로 ($log(1-D(G(z)))$) 의 손실값을 계산해
역전파 변화도를 구하면 됩니다. 이때 두가지 스텝에서 나오는 변화도들은 *축적(accumulate)* 시켜야 합니다.
변화도까지 구했으니, 이제 옵티마이저를 사용해야겠죠. 파이토치의 함수를 호출해주면 알아서 변화도가 적용될겁니다.

**Part 2 - 생성자의 학습**

오리지널 GAN 논문에 명시되어 있듯, 생성자는 $log(1-D(G(z)))$ 을 최소화시키는 방향으로 학습합니다.
하지만 이 방식은 충분한 변화도를 제공하지 못함을 Goodfellow가 보여줬습니다. 특히 학습초기에는 더욱 문제를 일으키죠.
이를 해결하기 위해 $log(D(G(z)))$ 를 최대화 하는 방식으로 바꿔서 학습을 하겠습니다. 코드에서 구현하기
위해서는 : Part 1에서 한대로 구분자를 이용해 생성자의 출력값을 판별해주고, *진짜 라벨값* 을 이용해 G의 손실값을 구해줍니다.
그러면 구해진 손실값으로 변화도를 구하고, 최종적으로는 옵티마이저를 이용해 G의 가중치들을 업데이트시켜주면 됩니다.
언뜻 볼때는, 생성자가 만들어낸 *가짜* 이미지에 *진짜* 라벨을 사용하는것이 직관적으로 위배가 될테지만, 이렇게 라벨을
바꿈으로써 $log(x)$ 라는 ``BCELoss`` 의 일부분을 사용할 수 있게 합니다 (앞서 우리는 BCELoss에서 라벨을 이용해 원하는 로그 계산
요소를 고를 수 있음을 알아봤습니다).

마무리로 G의 훈련 상태를 알아보기 위하여, 몇가지 통계적인 수치들과, fixed_noise를 통과시킨
결과를 화면에 출력하는 코드를 추가하겠습니다. 이때 통계적인 수치들이라 함은:

-  **Loss_D** - 진짜 데이터와 가짜 데이터들 모두에서 구해진 손실값. ($log(D(x)) + log(1 - D(G(z)))$).
-  **Loss_G** - 생성자의 손실값. $log(D(G(z)))$
-  **D(x)** - 구분자가 데이터를 판별한 확률값입니다. 처음에는 1에 가까운 값이다가,
   G가 학습할수록 0.5값에 수렴하게 됩니다.
-  **D(G(z))** - 가짜데이터들에 대한 구분자의 출력값입니다. 처음에는 0에 가까운 값이다가,
   G가 학습할수록 0.5에 수렴하게 됩니다


**Note:** 이후의 과정은 epoch의 수와 데이터의 수에 따라 시간이 좀 걸릴 수 있습니다




In [None]:
# 학습 과정

# 학습상태를 체크하기 위해 손실값들을 저장합니다
img_list = []
G_losses = []
D_losses = []
iters = 0

print("Starting Training Loop...")
# 에폭(epoch) 반복
for epoch in range(num_epochs):
    # 한 에폭 내에서 배치 반복
    for i, data in enumerate(dataloader, 0):

        ############################
        # (1) D 신경망을 업데이트 합니다
        # log(D(x)) + log(1 - D(G(z)))를 최대화 합니다
        ###########################
        ## 진짜 데이터들로 학습을 합니다
        netD.zero_grad()
        # 배치들의 사이즈나 사용할 디바이스에 맞게 조정합니다
        real_cpu = data[0].to(device)
        b_size = real_cpu.size(0)
        label = torch.full((b_size,), real_label,
                        dtype=torch.float, device=device)
        # 진짜 데이터들로 이루어진 배치를 D에 통과시킵니다
        output = netD(real_cpu).view(-1)
        # 손실값을 구합니다
        errD_real = criterion(output, label)
        # 역전파의 과정에서 변화도를 계산합니다
        errD_real.backward()
        D_x = output.mean().item()

        ## 가짜 데이터들로 학습을 합니다
        # 생성자에 사용할 잠재공간 벡터를 생성합니다
        noise = torch.randn(b_size, nz, 1, 1, device=device)
        # G를 이용해 가짜 이미지를 생성합니다
        fake = netG(noise)
        label.fill_(fake_label)
        # D를 이용해 데이터의 진위를 판별합니다
        output = netD(fake.detach()).view(-1)
        # D의 손실값을 계산합니다
        errD_fake = criterion(output, label)
        # 역전파를 통해 변화도를 계산합니다.
        # 이때 앞서 구한 변화도에 더합니다(accumulate)
        errD_fake.backward()
        D_G_z1 = output.mean().item()
        # 가짜 이미지와 진짜 이미지 모두에서 구한 손실값들을 더합니다
        # 이때 errD는 역전파에서 사용되지 않고,
        # 이후 학습 상태를 리포팅(reporting)할 때 사용합니다
        errD = errD_real + errD_fake
        # D를 업데이트 합니다
        optimizerD.step()

        ############################
        # (2) G 신경망을 업데이트 합니다: log(D(G(z)))를 최대화 합니다
        ###########################
        netG.zero_grad()
        label.fill_(real_label)
        # 생성자의 손실값을 구하기 위해 진짜 라벨을 이용

        # 우리는 방금 D를 업데이트했기 때문에,
        # D에 다시 가짜 데이터를 통과시킵니다.

        # 이때 G는 업데이트되지 않았지만,
        # D가 업데이트 되었기 때문에 앞선 손실값가 다른 값이 나오게 됩니다
        output = netD(fake).view(-1)
        # G의 손실값을 구합니다
        errG = criterion(output, label)
        # G의 변화도를 계산합니다
        errG.backward()
        D_G_z2 = output.mean().item()
        # G를 업데이트 합니다
        optimizerG.step()

        # 훈련 상태를 출력합니다
        if i % 50 == 0:
            print('[%d/%d][%d/%d]\tLoss_D: %.4f\tLoss_G: %.4f\tD(x): %.4f\tD(G(z)): %.4f / %.4f'
                % (epoch, num_epochs, i, len(dataloader),
                    errD.item(), errG.item(), D_x, D_G_z1, D_G_z2))

        # 이후 그래프를 그리기 위해 손실값들을 저장해둡니다
        G_losses.append(errG.item())
        D_losses.append(errD.item())

        # fixed_noise를 통과시킨 G의 출력값을 저장해둡니다
        if (iters % 500 == 0) or ((epoch == num_epochs-1) and (i == len(dataloader)-1)):
            with torch.no_grad():
                fake = netG(fixed_noise).detach().cpu()
            img_list.append(vutils.make_grid(fake, padding=2, normalize=True))

        iters += 1

## 결과

결과를 알아봅시다. 이 섹션에서는 총 세가지를 확인할겁니다.

첫번째는 G와 D의 손실값들이 어떻게 변했는가, 두번째는 매 에폭마다
fixed_noise를 이용해 G가 만들어낸 이미지들, 마지막은 학습이 끝난 G가 만들어낸 이미지와
진짜 이미지들의 비교입니다

**학습하는 동안의 손실값들**

아래는 D와 G의 손실값들을 그래프로 그린 모습입니다

In [None]:
plt.figure(figsize=(10,5))
plt.title("Generator and Discriminator Loss During Training")
plt.plot(G_losses,label="G")
plt.plot(D_losses,label="D")
plt.xlabel("iterations")
plt.ylabel("Loss")
plt.legend()
plt.show()

**G의 학습 과정 시각화**

매 에폭마다 fixed_noise를 이용해 생성자가 만들어낸 이미지를 저장한 것을 기억할겁니다.

저장한 이미지들을애니메이션 형식으로 확인해 봅시다. play버튼을 누르면 애니매이션이 실행됩니다

In [None]:
fig = plt.figure(figsize=(8,8))
plt.axis("off")
ims = [[plt.imshow(np.transpose(i,(1,2,0)), animated=True)] for i in img_list]
ani = animation.ArtistAnimation(fig, ims, interval=1000, repeat_delay=1000, blit=True)

HTML(ani.to_jshtml())

**진짜 이미지 vs. 가짜 이미지**

진짜 이미지들과 가짜 이미지들을 옆으로 두고 비교를 해봅시다




In [None]:
# dataloader에서 진짜 데이터들을 가져옵니다
real_batch = next(iter(dataloader))

# 진짜 이미지들을 화면에 출력합니다
plt.figure(figsize=(15,15))
plt.subplot(1,2,1)
plt.axis("off")
plt.title("Real Images")
plt.imshow(np.transpose(vutils.make_grid(real_batch[0].to(device)[:64], padding=5, normalize=True).cpu(),(1,2,0)))

# 가짜 이미지들을 화면에 출력합니다
plt.subplot(1,2,2)
plt.axis("off")
plt.title("Fake Images")
plt.imshow(np.transpose(img_list[-1],(1,2,0)))
plt.show()

## 이제 어디로 여행을 떠나볼까요?

드디어 DCGAN이 끝났습니다! 하지만 더 알아볼 것들이 많이 남아있죠.
무엇을 더 시도해볼 수 있을까요?

-  결과물이 얼마나 더 좋아지는지 확인해보기 위해서 학습시간을 늘려볼 수 있습니다
-  다른 데이터셋을 이용해 훈련시켜보거나, 이미지의 사이즈를 다르게 해보거나, 아키텍쳐의 구성을 바꿔볼 수도 있습니다
-  [여기](https://github.com/nashory/gans-awesome-applications)_ 에서 더욱 멋진 GAN 프로젝트들을 찾을수도 있죠
-  [음악](https://www.deepmind.com/blog/wavenet-a-generative-model-for-raw-audio/)_ 을 작곡하는 GAN도 만들 수 있습니다




### `참고자료` 

- **Large-scale CelebFaces Attributes (CelebA) Dataset** : https://mmlab.ie.cuhk.edu.hk/projects/CelebA.html
- **파이토치 DCGAN 튜토리얼** : https://tutorials.pytorch.kr/beginner/dcgan_faces_tutorial.html
https://pytorch.org/tutorials/beginner/dcgan_faces_tutorial.html
- **Google Colab에서 튜토리얼 실행하기** : https://tutorials.pytorch.kr/beginner/colab