### 특이값 분해 - SVD(Singular Value Decomposition)

* 대표적인 행렬 분해 방법
    * 고유값 분해(Eigen-Decomposition)
        * $ C = P \sum{}{} P^T $
        * $ C = 
     \begin{pmatrix}
      e_1 & \cdots & e_n \\
     \end{pmatrix}
     \begin{pmatrix}
      \lambda_1 & \cdots & 0 \\
      \vdots  & \ddots & \vdots  \\
      0 & \cdots & \lambda_n
     \end{pmatrix}
     \begin{pmatrix}
      e_1^t \\
      \vdots \\
      e_n^t \\
     \end{pmatrix}
    $
        * 정방행렬(즉, 행과 열의 크기가 같은 행렬)만을 고유벡터로 분해
        * PCA는 분해된 고유 벡터에 원본 데이터를 투영하여 차원 축소<br><br>

    * 특이값 분해(Singular Value Decomposition)
        * $ A = U \sum{}{} V^T $
            1. U : 왼쪽 직교행렬
            2. $\sum{}{}$ : 대각 행렬
                * $\sum{}{}$는 대각행렬이며, 행렬의 대각에 위치한 값만 0이 아니고 나머지 위치의 값은 모두 0입니다.
                * $\sum{}{}$이 위치한 0이 아닌 값이 바로 행렬 A의 특이값입니다.
            3. $V^T$ : 오른쪽 직교행렬
        * 행렬 U와 V에 속한 벡터는 특이벡터(singular vector)이며, 모든 특이벡터는 서로 직교하는 성질을 가집니다.
            * $ U^TU = I $
            * $ V^TV = I $
        * SVD는 정방행렬뿐만 아니라 행과 열의 크기가 다른 m * n 행렬도 분해 가능

### SVD 유형

* Full SVD
    * $A(m * n) = U(m * m) * \sum{}{} (m*n) * V'(n*n) $
* Compact SVD : 비대각 부분과 대각 원소가 0인 부분을 제거
    * $A(m * n) = U(m * p) * \sum{}{} (p*p) * V'(p*n)$
* **Truncated SVD** : 대각 원소 가운데 **상위 r개만** 추출하여 차원 축소
    * $A(m * n) = (m * r) * (r * r) * (r * n)$

### Truncated SVD 행렬 분해 의미

* $A(m * n) -> (m * r) * (r * r) * (r * n) = A'$ 
    * m * r = m과 Latent Factor의 관계 정도
    * r * r = Latent Factor의 크기
    * r * n = n의 Latent Factor 구성
    * A' = 잡음이 제거된 형태로 재구성
* SVD는 차원 축소를 위한 행렬 분해를 통해 Latent Factor(잠재요인)을 찾을 수 있는데, 이렇게 찾아진 Latent Factor는 많은 분야에 활용
    * 추전 엔진, 문재의 잠재 의미 분석 등
* SVD로 차원 축소 행렬 분해된 후, 다시 분해된 행렬을 이용하여 원복된 데이터 셋은 잡음(Noise)이 제거된 형태로 재구성될 수 있음
* 사이킷런에서는 Truncated SVD로 차원을 축소할 때, 원본 데이터에 $U \sum{}{}. $를 적용하여 차원 축소

### SVD 활용
* 이미지 압축/변환
* 추천 엔진
* 문서 잠재 의미 분석
* 의사 역행렬을 통한 모델 예측
    * 의사(pseudo)