# 분해 (Decomposition)
* 큰 하나의 행렬을 여러개의 작은 행렬로 분해
* 분해 과정에서 중요한 정보만 남게됨

## 데이터 불러오기 및 시각화

In [None]:
import numpy as np
import matplotlib.pyplot as plt

from sklearn.datasets import load_iris, fetch_olivetti_faces
from sklearn.decomposition import PCA, IncrementalPCA,kernelPCA, SparsePCA
from sklearn.decomposition import TruncatedSVD, DictionaryLearning, FactorAnalysis
from sklearn.decomposition import FastICA, NMF, LatenirichletAllocation
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis

In [None]:
iris, labels = load_iris(return_X_y = True)
faces, _ = fetch_olivetti_faces(return_X_y=True, shuffle= True)

In [None]:
def plot_iris(iris, labels):
    plt.figure()
    colors = ['navy', 'purple', 'red']
    for xy, label in zip(iris,labels):
        plt.scatter(xy[0], xy[1],color =colors[label])

In [None]:
def show_faces(faces):
    plt.figure()
    num_rows, num_cols = 2,3
    for i in range(num_rows * num_cols):
        plt.subplot(num_rows, num_cols, i+1)
        plt.imshow(np.reshape(face[i],(64,64)), cmap = plt.gray)

In [None]:
iris.shape

In [None]:
plot_iris(iris[:,:2],labels)

In [None]:
face.shape

In [None]:
show_faces(faces)

## Principal Component Analysis (PCA)

* PCA를 사용해 iris 데이터 변환
* $150 \times 4$ 크기의 데이터를 $150 \times 2$ 크기의 행렬로 압축

In [None]:
model = PCA(n_components = 2, random_state = 0)
model.fit(iris)
transformed_iris = model.transform(iris)
transformed_iris.shape

In [None]:
plot_iris(transformed_iris, labels)

* PCA를 통해 학습된 각 컴포넌트 (6개)
* 각 컴포넌트는 얼굴의 주요 특징을 나타냄

In [None]:
model = PCA(n_components = 2*3, random_state = 0)
model.fit(faces)
faces_components = model.components_
faces_components.shape

In [None]:
show_faces(faces_components)

## Incremental PCA

* PCA는 SVD 알고리즘 실행을 위해 전체 학습용 데이터 셋을 메모리에 올려야 함
* Incremental PCA는 학습 데이터를 미니 배치 단위로 나누어 사용
* 학습 데이터가 크거나 온라인으로 PCA 적용이 필요할 때 유용

In [None]:
model = IncrementalPCA(n_components = 2)
model.fit(iris)
transformed_iris = model.transform(iris)
transformed_iris.shape

In [None]:
plot_iris(transformed_iris, label)

In [None]:
model = IncrementalPCA(n_components = 2*3)
model.fit(faces)
faces_components = model.components_
faces_components.shape

In [None]:
show_face(faces_components)

## Kernel PCA

* 차원 축소를 위한 복잡한 비선형 투형

In [None]:
# 비선혈적인 특성을 어떤 커널형태로 주어질수 잇잖아

model = KernelPCA(n_components = 2, kernel='rbf', random_state = 0)
model. fit(iris)
transformed_iris = model.transform(iris)
plot_iris(transformed_iris,labels)

In [None]:
model = KernelPCA(n_components = 2*3, kernel = 'rbf', random_state = 0)
model.fit(faces)
faces_components = model.components_
faces_components.shape

## Sparse PCA

* PCA의 주요 단점 중 하나는 주성분들이 보통 모든 입력 변수들의 선형결합으로 나타난다는 점
* 희소 주성분분석(Sparse PCA)는 몇 개 변수들만의 선형결합으로 주성분을 나타냄으로써 이러한 단점을 극복

In [None]:
model = SparsePCA(n_components = 2 ,random_state = 0)
model.fit(iris)
transformed_iris = model.transform(iris)
plot_iris(transformed_iris, labels)

In [None]:
model = SparsePCA(n_components = 2*3 , random_state = 0)
model.fit(faces)
face_components = model.components_
show_face(faces_componenets)
# 어떤건 특성자체가 아예 없어졋네?

## Truncated Singular Value Decomposition (Truncated SVD)

* PCA는 정방행렬에 대해서만 행렬 분해 가능
* SVD는 정방행렬 뿐만 아니라 행과 열이 다른 행렬도 분해 가능
* PCA는 밀집 행렬(Dense Matrix)에 대한 변환만 가능하지만, SVD는 희소 행렬(Sparse Matrix)에 대한 변환도 가능
* 전체 행렬 크기에 대해 Full SVD를 사용하는 경우는 적음
* 특이값이 0인 부분을 모두 제거하고 차원을 줄인 Truncated SVD를 주로 사용

In [None]:
# sklearn에서는 내부적으로 svd를 씀, why 이걸쓰면 pca(정바향만)기능은 따라옴
model = TruncatedSVD(n_components = 2, random_state = 0)
model.fit(iris)
transformed_iris = model.transform(iris)
plot_iris(transformed_iris, labels)

In [None]:
model = TruncatedSVD(n_componenets = 2*3, random_state = 0)
model.fit(faces)
faces_components = model.components_
show_face(faces_components)

#이것도 특성이 아주 조금만 남았네

## Dictionary Learning

* Sparse code를 사용하여 데이터를 가장 잘 나타내는 사전 찾기
* Sparse coding은 overcomplete 기저벡터(basis vector)를 기반으로 데이터를 효율적으로 표현하기 위해 개발
* 기저 벡터는 벡터 공간에 속하는 벡터의 집합이 선형 독립이고, 다른 모든 벡터 공간의 벡터들이 그 벡터 집합의 선형 조합으로 나타남

In [None]:
#기저벡터를 기반으로 하는걸 잘 찾아낸다
model = DictionaryLearning(n_components = 2, random_state = 0)
model.fit(iris)
transform_iris = model.transform(iris)
plot_iris(transformed_iris, labels)


In [None]:
model = DictionaryLearning(n_components = 2*3, random_state = 0)
model.fit(faces)
faces_components = model.components_
show_faces(faces_components)
# 조금 외곡이 되더라도 필요한 데이터로만 나타낼수 잇게 구성해주겠지

## Factor Analysis

* 요인 분석(Factor Analysis)은 변수들 간의 상관관계를 고려하여 저변에 내재된 개념인 요인들을 추출해내는 분석방법
* 요인 분석은 변수들 간의 상관관계를 고려하여 서로 유사한 변수들 끼리 묶어주는 방법
* PCA에서는 오차(error)를 고려하지 않고, 요인 분석에서는 오차(error)를 고려

In [None]:
#요인분석
model = FactorAnalysis(n_components = 2, random_state = 0)
model.fit(iris)
transformed_iris =model.transform(iris)
plot_iris(transformed_iris,labels)

In [None]:
model = FactorAnalysis(n_components = 2*3, random_state = 0)
model.fit(faces)
faces_components = model.components_
show_faces(faces_components)
# 음 이번엔 안경자국이..
# 상황을 고려해서 내제된 factor를 찾는다
# 그걸 이미지로 보니까 이렇게 나오네

## Independent Component Analysis(ICA)

* 독립 성분 분석(Independent Component Analysis, ICA)은 다변량의 신호를 통계적으로 독립적인 하부 성분으로 분리하는 계산 방법
* ICA는 주성분을 이용하는 점은 PCA와 유사하지만, 데이터를 가장 잘 설명하는 축을 찾는 PCA와 달리 가장 독립적인 축, 독립성이 최대가 되는 벡터를 찾음

In [None]:
# 주성분 측을 찾는거졋지 pca는
# ica는 독립적인 축을 찾는거야 -> 독립성이 최대가되는 vactor를 찾는거지
model = FastICA(n_components = 2, random_state = 0)
model.fit(iris)
transformed_iris = model.transform(iris)
plot_iris(transformed_iris, labels)

In [None]:
model = FastICA(n_components = 2*3, random_state = 0)
model.fit(faces)
faces_components = model.components_
show_faces(faces_components)


## Non-negative Matrix Factorization

* 음수 미포함 행렬 분해(Non-negative matrix factorization, NMF)는 음수를 포함하지 않은 행렬 V를 음수를 포함하지 않은 행렬 W와 H의 곱으로 분해하는 알고리즘

In [None]:
#5를 2,3으로 분해하듯이 한 행렬을 2개로 분해하는 알고리즘
model = NMF(n_components = 2, random_state=0)
model.fit(iris)
transformed_iris = model.transform(iris)
plot_iris(transformed_iris, labels)

In [None]:
model = NMF(n_components = 2*3, random_state = 0)
model.fit(faces)
faces_components = model.components_
show_faces(faces_components)

# 원본에 비해서 좀만 달라졋네
# 막 그렇게 앙 뭉그러지지 않았네

## Latent Dirichlet Allocation (LDA)

* 잠재 디리클레 할당은 이산 자료들에 대한 확률적 생성 모형
* 디리클레 분포에 따라 잠재적인 의미 구조를 파악


In [None]:
# 어떤 문서에 대해 toping modeling에서 많이 쓰이느 방법
# 이산자료로 쓰일수 있음
model = LatenDirichleAllocation(n_components = 2, random_state = 0)
model.fit(iris)
transformed_iris = model.transform(iris)
plot_iris(transformed_iris, labels)

# 이것도 왜곡이 된 형태로 나온거같아..

In [None]:
model = LatenDirichletAllocation(n_components = 2*3, random_state = 0)
model.fit(faces)
faces_components = model.coponents_
show_faces(faces_components)

# 약간 노이즈가낀듯한..혹은 결합된듯한..

## Linear Discriminant Analysis (LDA)

* LDA는 PCA와 유사하게 입력 데이터 세트를 저차원 공간에 투영해 차원을 축소
* LDA는 지도학습 분류에서 사용하기 쉽도록 개별 클래스르 분별할 수 있는 기준을 최대한 유지하면서 차원 축소

In [None]:
model = LinearDiscriminantAnalysis(n_components = 2)
model.fit(iris,labels)
transformed_iris = model.transform(iris)
plot_iris(transformed_iris, labels)

# 기준을 최대한 유지하면서

## 압축된 표현을 사용한 학습
* 행렬 분해를 통해 압축된 데이터를 사용해 학습

In [None]:
from sklearn.neighbors import KNeighborsClassifier
from sklearn.svm import SVC
from sklearn.tree import DecisinTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_digits
from sklearn.model_selection import cross_val_score

In [None]:
def min_max_scale(x):
    min_value, max_value = np.min(x,0), np.max(x,0)
    x = (x-min_value) / (max_value - min_value)
    return x

In [None]:
def plot _digits(digits, labels):
    digits = min_max_scale(digits)
    ax = plt.subplot(111,projection= '3d')
    for i in range(digits.shape[0]):
        ax.text(digits[i,0], digits[i,1],digits[i,2],
                str(labels[i]), color= plt.cm.Set1(labels[i] / 10.), # 나눠주어서 스케일링해주고
                fontdict = {'weight': 'bold', 'size' : 9})
    ax.view_init(4,-72)

In [None]:
digits = load_digits()

In [None]:
nmf = NMF(n_components = 3)
nmf.fit(digits.data)
decomposed_digits = nmf.transform(digits.data)

In [None]:
print(digits.data.shape)
print(decomposed_digits.shape)
print(decomposed_digits)

#64차원은 3차원으로 줄임 nmf로, 분해한거지 행렬을

# 2,3 peak 갯수로 라벨링 되어 있으니까 이거 분포도를 3d로 보면 될거같은데?

In [None]:
plt.figure(figsize = (20,20))
plot_digits(decomposed_digits, digits.target)

### KNN

In [None]:
knn = KNeighborsClassifier()

In [None]:
score = cross_val_score(
    estimator= knn,
    X=digits.data, y= digits.target,
    cv= 5
)
score

In [None]:
print('mean cross val score : {} (+/- {})'.format(score.mean(), score.std()))

In [None]:
score = cross_val_score(
    estimator= knn,
    X=decomposed_digits.data, y= decomposed_digits.target,
    cv= 5
)
score

In [None]:
print('mean cross val score : {} (+/- {})'.format(score.mean(), score.std()))

### SVM

### Decision Tree

### Random Forest

## 복원된 표현을 사용한 학습
* 분해 후 복원된 행렬을 사용해 학습

### KNN

### SVM

### Decision Tree

### Random Forest

## 이미지 복원