# EVD란 (eigenvalue decomposition)

## 정의 :

정방행렬 $A$에 대해 $A|v = \lambda|v$일 때, <br>
$|v$ 를 eigenvector, $\lambda$ 를 eigenvalue라고 부른다. <br>

## 기하학적 의미 : 

행렬 A는 고유벡터의 scale만을 늘리는 선형변환 행렬이고, 이 때 $\lambda$는 그 변화되는 스케일의 정도를 나타낸다. <br>

## 용도 :  대각화 (eigenvalue decomposition) <br>
$ A[|v_1 |v_2 \dots |v_n] = [ \lambda |v_1 \lambda |v_2 \dots \lambda |v_n]$ <br>
$\Rightarrow AP = P \Lambda$ <br>
$\Rightarrow A = P \Lambda P^{-1}$ <br>
이렇게 되면, 거듭제곱, 역행렬, trace이 매우 쉽다. <br>
단, 모든 행렬이 대각화가 되는 것은 아니다. <br>

## 가능 조건 : 

가능조건 정의 : ** A 가 n X n 차원의 정방행렬이라면, A는 linearly independent한 n 개의 eigenvector를 가져야 한다. ** <br>

## 계산 방식 : 
* ### 1. $det(A-\lambda E) = 0$ : characteristic equation(특성방정식) 을 통한 고유값 계산<br>
* ### 2. $A - \lambda E =0$ : 해당 eigenvalue를 통한 eignvector 계산 <br>

## 특징 :
* symmetric matrix의 경우 : 대각화 무조건 가능, orthogonal matrix 대각화 가능. <br>
ps) orthogonal matrix : $ A^{-1} = A^T$ <br>

# SVD란 (Singular Value Decomposition)

## 정의 
^
직사각행렬을 대각화하는 방식. <br>

* $A = U \Sigma V^T$ <br>
* *left singular vector* $ U $ : $AA^T$ 를 EVD하여 얻은 orthogonal matrix - $m X m$ matrix. <br>
* *right singular vector* $ V $ : $A^TA$ 를 EVD하여 얻은 orthogonal matrix - $n X n$ matrix. <br>
* *singular value matrix * $\Sigma $ : $AA^T$ 를 EVD하여 얻은 orthogonal matrix - $m X m$ matrix. <br>

## 특징 :
* **1. 어떻게 singular value를 구하는가? **<br>
singular value는 $AA^T, A^TA$ 의 eigenvalue를 square root한 값이다. <br>
여기서 $AA^T, A^TA$ 의 고유값은 모두 양수이므로 square root 가 가능하다. <br>

* **2. 그렇다면 두 $AA^T, A^TA$ 중, 어떤 eigenvalue를 사용해야 하나요? **<br>
잘 생각해보면, <br>
$\Rightarrow A^TA|v = \lambda|v$ <br>
$\Rightarrow AA^TA|v = A\lambda|v$ <br>
$\Rightarrow AA^T(A|v) = A(\lambda|v)$ <br>
$\Rightarrow AA^T * \lambda |v = \lambda^2|v$ <br>
$\therefore$ if $\lambda$ != 0, $AA^T|v = \lambda |v$ <br>
즉, 한 쪽의 고유값은 다른 한 쪽의 고유값이라, dimention이 작은 쪽의 고유값을 사용하면 된다. <br>

## 기하학적 의미 : 

기하학적 의미를 생각하기 전에, 행렬연산을 좌표 내의 선형변환으로 생각하자. ,<br>
$A = U \Sigma V^T$ 에서 <br>
$U, V^T$ 는 orthogonal matrix. 즉 회전 변환이고 <br>
$ \Sigma$ 는 diagonal matrix. 즉 scale 변환이다. <br>
따라서 A 는 벡터를 $V^T$만큼 회전시키고, $\Sigma$만큼 scale up 하고, 다시 $U$만큼 회전시킨다고 볼 수 있다. <br>

## 용도 :  행렬정보 압축<br>

* ### 1. 데이터 압축 <br>
SVD의 종류로는 **full SVD**, **thin SVD**, **compact SVD**, **truncated SVD**가 있다. <br>
[ref](http://darkpgmr.tistory.com/106)

0인 singular value를 모두 없애버린 **compact SVD** 까지는 어떠한 정보의 누락도 없는데, <br>
singular value가 작은 것들을 없앤 **truncated SVD**의 경우는 정보의 누락이 생긴다. <br>
이러한 정보의 누락을 통하여 중요 정보는 남긴 채, 데이터를 압축시키는 것이다.<br>

* ### 2. pseudo inverse $A^{+}$<br>
행렬 $A$에 대하여 inverse가 없는 겨우, 혹은 inverse가 구하기 어려운 경우, 혹은 정방행렬이 아닌 경우 inverse를 구하는 방법이 pseudo inverse 이다. <br>
이를 위해서는 $A|x=|b$ 일 때, $ A^{+}|b - |x $를 최소(least square)로 만드는 방식 중 가장 안정적인 것이 SVD이다. <br>
![pic](http://cfile7.uf.tistory.com/image/214E9C385260D46E3B450F) <br>
 행렬을 연립방적식으로 바라보기 위하여, dimension m > n 으로 구하는 것이 바람직하다. <br>
방정식 수보다 미지수가 많은 경우의 문제 때문이다. <br>
참고사항 : tolerance라고 해서, 일정 값 이하의 singular value는 0으로 변환 후 $A^{+}$ 를 만드는 것이 일반적이다. 역수를 취하는 과정에서 value가 낮은, 중요하지 않은 정보들이 너무나도 값이 커지기 때문이다. <br>