Lab03
=======

### Context
#### Dimension Reduction
+ T-SNE

## T-SNE(t-distributed stochastic neighbor embedding)
PCA는 주성분에 사영을 시켜 차원을 축소하는 선형 축소 방식을 사용하기 때문에 군집화 되어 있는 데이터들이 저차원에서 제대로 표현되지 않을 수 있습니다.<br>
이러한 문제를 해결하기 위한 방법으로 비선형 축소 기법인 t-SNE가 있습니다.<br>
t-SNE의 기본적인 개념은 고차원에서 가까운 데이터는 저차원에서도 가까워야 하고, 고차원에서 먼 데이터는 저차원에서도 멀어야한다 입니다.<br>
t-SNE 방법은 이름에서도 알 수 있듯이 t분포를 기반으로 확률을 계산하여 차원 축소를 하므로 매번 값이 바뀌는 특성이 있습니다. 이러한 특성 때문에 시각화에는 이롭지만,<br>
모델의 학습 데이터로 사용하기에는 어려움이 있습니다.

#### 이번 실습에서는 PCA와 t-SNE의 차이를 간단하게 확인해보겠습니다.

In [None]:
from os.path import join
import matplotlib
import numpy as np
import pylab as plt
import matplotlib.cm as cm
import matplotlib.image as mpimg
from sklearn.decomposition import PCA
from sklearn.manifold import TSNE

## 1. 데이터 살펴보기
사용할 데이터는 이번에도 PCA와의 차이점을 확인해보기위해 MNIST 손글씨 데이터를 사용하겠습니다.<br>
실습의 편의를 위해 데이터는 28*28 행렬로 변환되어 저장된 상태입니다.<br>
data 디렉토리에 준비된 데이터와 라벨을 가져옵니다.

In [None]:
X = np.load(join('data','MNIST.npy'))[:2500]
labels = np.load(join('data','Label.npy'))[:2500]

In [None]:
img=plt.imshow(X[1].reshape((28,28)))

## 2. 간단한 전처리
MNIST 데이터는 28*28에 픽셀마다 0~255 범위의 값을 가진 행렬입니다. 
각 픽셀에 대해 0~1 사이의 값을 갖도록 255로 나누어줍니다.
그리고 네트워크에 데이터를 입력하기 편하게 하도록 2차원 이미지를 벡터형태로 펼치겠습니다.
numpy.reshape() 함수를 통해 행렬의 차원을 변경할 수 있습니다. 

In [None]:
X = X/255
X = X.reshape(len(X),784)

값의 범위가 0과 1사이로 잘 되었는지 확인해봅시다.
numpy.max(), numpy.min() 으로 확인해 볼 수 있습니다.

In [None]:
print('최대 : {}, 최소 : {}'.format(np.max(X), np.min(X)))

## 3. Sklearn으로 t-SNE 해보기
Sklearn을 이용해 PCA와 t-SNE의 결과를 비교하며 살펴보도록 하겠습니다.<br>
### 3.1 PCA

In [None]:
# PCA 모델에 축소하고자 하는 차원을 n_compoenets 값에 넣어 생성합니다.
pca = PCA(n_components=2)
# X데이터에 대해 주성분을 찾아 Projection 합니다.
pca_X = pca.fit_transform(X)

In [None]:
def plotting(Y, labels):
    legend_ = []; colors = cm.rainbow(np.linspace(0, 1, 10))
    for i in sorted(list(set(labels))):
        idxs = (labels==i).nonzero()
        l = plt.scatter(np.squeeze(Y[idxs,0]), Y[idxs,1], 20, color=colors[int(i)])
        legend_.append(l)
    plt.legend(legend_, list(range(10)), loc='center left', ncol=1, fontsize=8, bbox_to_anchor=(1, 0.5))
    return

### 3.2 t-SNE

In [None]:
# PCA 모델에 축소하고자 하는 차원을 n_compoenets 값에 넣어 생성합니다.
tsne = TSNE(n_components = 2)
# X 데이터의 차원을 축소합니다.
tsne_X = tsne.fit_transform(X)

## 4. 차원축소 결과를 비교해보기
PCA의 결과에서는 선형 축소 방법의 단점인 군집이 뭉게질 수 있다는 단점을 볼 수 있고,<br>
t-SNE의 결과에서는 흩어진 것 같아 보이지만, 어느정도 잘 뭉쳐있는 것을 볼 수 있습니다.

In [None]:
plotting(pca_X, labels)

In [None]:
plotting(tsne_X, labels)

## 5. t-SNE가 진짜 매번 값이  바뀌는지 알아보기
매 실행마다 군집에 대한 특성은 유지되지만, 형태가 변하는 것을 확인할 수 있었습니다.

In [None]:
tsne = TSNE(n_components = 2)
tsne_X = tsne.fit_transform(X)
plotting(tsne_X, labels)

### Reference
- T-SNE - http://bcho.tistory.com/1210, https://en.wikipedia.org/wiki/T-distributed_stochastic_neighbor_embedding