## Generative Model

- (Wikipedia) Randomly generating observable data values
- Random Number generator: uniform, exponential, normal, ...
  - 데이터를 만들려면: 분포를 알아야 함
  - 분포를 따라 랜덤하게 데이터를 생성하면, 생성된 데이터 역시 분포를 잘 따를 것
- Lateneet Dirichlet allocation (LDA)
- 분포를 알고 있다고 해도 샘플링(data generation)은 어려움

![](./img/19_gan.JPG)


#### Generative Model vs. Discriminative Model
- generative model의 활용
  - sampler 로써의 기능
  - 분류기로써의 기능 (더 좋은 성능의 분류기)

## Generative Adversarial Network (GAN)

- Unsupervised Learnig 방법론 중 하나 - 데이터를 만들어 보자(generative model)
- Randomly generating observable data values
- G(random value)
  - 정규분포 등으로 부터
  - 매번 다른 랜덤 넘버를 넣어주면, 매번 다른 데이터가 generating 됨


## GAN 학습 방법

- G (generator) : 데이터를 생성
- D (discriminator) : 진짜/가짜 만을 구별
- 데이터를 잘 생성한다는 것은 모델이 분포를 잘 학습했음을 의미    
- (예) 위조지폐를 잘 만드는 방법
  - G (generator) : 위조 지폐 제작자
  - D (discriminator) : 위조 지폐 감별사
  - 매번 감별사가 판단을 해줌
    - 제작자는 감별사를 이기기 위해서 upgrade해서 점점 더 정교하게 제작할 것
    - 최종적으로는 감별사도 판단하기 어려운 완벽한 형태를 제작할 것

![](./img/19_gan_training.JPG)

## GAN의 목적 함수

- G : generator $\rightarrow$ minimize 되는 것이 목적
- D : discriminator $\rightarrow$ maximize 되는 것이 목적 
- G(z) : 생성된 데이터 = $\hat{x}$
- D(x) : 진짜 데이터일 확률 

> $min_{R}max_{D} V(D,G) = E_{x~P_{data}(x)} [log D(x)] + E_{z~P_{z}(z)}  [log (1-D(G_{(z)}))] $
  - D(x) : 분류 정확도(likelyhood), 진짜를 진짜로 잘 구별할 확률
  - 1-D(G(z)) : 가짜를 가짜로 잘 구별할 확률
<br/>

- D의 관점
  - 분류 성능을 최대화 한다
- G의 관점
  - 분류 성능을 최소화 한다
  - **$(D(G(z)))$ 의 값을 크게 한다 $\rightarrow$ 진짜와 유사한 가짜 데이터를 만든다**


## GAN의 전역 최적 해

- 검정색 점선 실제 데이터
- D(x) : 파란색 점선 - 실제 데이터일 확률
- G(z) : 녹색 실선 - G로 생성한 데이터 

- Optimal Status
  - G(z)(생성데이터)가 검정색 점선(실제데이터)와 완전히 같아질 때,
  - D(x) = 1/2 : 최종적으로 무엇이 진짜 인지 알 수 없게 되는 상태(optimal status)
  
![](./img/19_gan_02.JPG)


- **GAN 결과** : Random 하게 생성한 데이터


## 이미지 벡터 연산

- Word2vec
  - King - MAN + WOMAN = QUEEN
<br/><br/>
- DCGAN
![](./img/19_dcgan.JPG)

#### Autoencoder
![](./img/19_autoencoder.JPG)

#### DCGAN
![](./img/19_dcgan_2.JPG)

#### Z: 이미지의 특성을 담고 있는 저차원 벡터


## InfoGAN

- Information Maximizing GAN
- 필요성
  - GAN, DCGAN: Z-space를 해석할 수 없음
  - InfoGAN : 해석 가능한 Z-space를 학습
- 목적
    - 생성시에 이용 가치가 높은 특징량을 비지도 학습으로 획득
    - 기존의 GAN계 모델에 비하여 ㄱ나단하게 특징량을 획득
- 아이디어
  - 생성용 벡터를 Source (Z) 와 Latent code (C)로 분할
  - C와 생성기 분포 G(Z,C)의 상호정보량 $I(C; G(Z,C))$ (일반화된 correlation)을 극대화

![](./img/19_infogan.JPG)

## InfoGAN의 목적 함수

- 기존 GAN의 목적함수에 상호정보량을 추가
![](./img/19_infogan_02.JPG)

- 상호정보량 (mutual information)
  - H(X) : 엔트로피
  - 일반화한 correlation 으로 두 확률변수 X와 Y의 상호의존 척도를 나타냄
![](./img/19_infogan_03.JPG)


## InfoGAN 실험결과

- MNIST
- **C** :  $c_{1}~Cat(K=10, p=0.1), c_{2}, c_{3}~Unif(-1,1)$
  - 어떤 특정 C에 대해서는 '0'만 생성함
  - 즉, c1값만 조절하면 '0'을 만들지, '1'을 만들지 control 가능
![](./img/19_infogan_04.JPG)

- 3D Faces
![](./img/19_infogan_05.JPG)

- CelebA
![](./img/19_infogan_06.JPG)

## GNN의 응용 (Application 사례)

> Generative Adversarial Text to Image Synthesis <br/>
> http://proceedings.mlr.press/v48/reed16.pdf


![](./img/19_GAN_application.png)


### GAN-CLS

- RNN: Text $\rightarrow$ Visual Detail
- CNN : Visual Detail $\rightarrow$ Image

![](./img/19_GAN_CLS.png)


### GAN-CLS의 목적함수

- $x$ : real image
- $\hat{x} = G(z, h)$ : fake image
- $h$ : right text
- $\widetilde{h}$ : wrong text
- 목적함수 
$$min_{G} max_{D} log(D(x,h)) + [log(1- D(x,\widetilde{h})) + log(1- D(\hat{x}, h))] / 2 $$

|   | Image | Text | 평가 (D) |
|:----------------:|:----------:|:---------:|:--------:|
| $log(D(x,h))$ | Real | Right | Good |
| $log(1- D(x,\widetilde{h})$ | Real | Wrong | Bad |
| $log(1- D(\hat{x}, h))$ | Fake | Right | Bad |
| - | Fake | Wrong |  |

### 실험결과 : 이미지 생성
- CUB dataset
![](./img/19_GAN_Image.png)

### 실험 : Style Trnsfer

- Z: Image의 스타일을 담고 있는 정보로 간주 
- Fake image 와 real image 간의 z 차이를 최소화 할 수 있도록 학습

![](./img/19_GAN_style_transfer.png)


## 다양한 GAN구조

![](./img/19_gan_03.JPG)


## 기타 참고 사이트

- 프사 뉴럴 neural face - http://carpedm20.github.io/faces/
- DCGAN face generator - https://mattya.github.io/chainer-DCGAN/
