# Index

## 01 : Vector

### 01 - 벡터의 노름
- Vector norm

#### L1 노름
- 각 축의 변화량의 절대값 합
    - 원점으로 부터 각 축으로 부터 이동한 거리들의 합
<br/>
<br/>

    > ##### $\displaystyle||x||_1 = \sum_{i=1}^{d}{|x_i|}$

In [3]:
import numpy as np

def l1_norm(x) :

    x_norm = np.abs(x)  # 각 인자를 절대값 취한 후 저장
    x_nrom = np.sum(x_norm) # 모든 인자 sum
    return x_nrom

#### L2 노름
- 원점으로 부터 벡터의 꼭지점 실제 거리
    - 피타고라스 정리를 이용한 유클리드 거리
<br/>
<br/>

    > ##### $\displaystyle||x_2|| = \sqrt{\sum_{i=1}^{d}{|x_i|^2}} $

In [7]:
import numpy as np

def l2_norm(x) :
    
    x_norm = x * x  # 각 인가끼리 곱한 후 저장
    x_norm = np.sum(x_norm)
    x_norm = np.sqrt(x_norm)
    return x_norm

### 02 - 두 벡터 사이 거리

L1, L2 노름 가능  

> $|x - y| = |y - x|$

### 03 - 두 벡터 사이 각도

L2 노름
- 수정필요  

> ##### $\displaystyle cos\theta = \frac{||x||^2 + ||y||^2 - ||y - x||^2}{2||x|| + 2||y||}$
> ##### $\displaystyle \;\;\;\;\;\;\;\; = \frac{2 \; x \cdot y}{2 \; |x| \; |y|}$
> ##### $\displaystyle \;\;\;\;\;\;\;\; = \frac{\displaystyle\sum_{i=1}^n{x_i \; y_i}}{|x| \; |y|}$

In [9]:
import numpy as np 

def l2_norm(x) :
    
    x_norm = x * x  # 각 인가끼리 곱한 후 저장
    x_norm = np.sum(x_norm)
    x_norm = np.sqrt(x_norm)
    return x_norm

def vector_angle(x,y) :
    cos_theta = np.dot(x,y) / (l2_norm(x) * l2_norm(y))
                # inner ?
    theta = np.arccos(cos_theta)
    return theta

# 02 : Matrix

## 01 - 행렬의 이해

- 벡터를 원소로 갖는 2차원 배열
    - numpy 에서는 행(row) 가 기본 단위  
<br/>

- 행렬은 행(row) 과 열(column) 두개의 index 를 갖음
    - $x_{ij}$
        - 행(row) : $i$
        - 열(col) : $j$  
<br/>

- 행렬의 전치 (transform)
    - > ${x_{ij}}^\top = x_{ji}$
        - 행과 열의 인덱스가 변경
<br/>

- 행렬과 벡터의 의미
    - 벡터 : 공간에서의 한점
    - 행렬 : 공간에서의 여러점
        - 벡터(데이터)들의 집합
            - column : 변수
            - row : 데이터 
                - $X$ 행렬의 행벡터 $\vec{x_i}$ 는 $i$ 번째 데이터를 의미
                    - > $\vec{x_i} = x_{i1} + x_{i2} + \cdots + x_{in}$
                - $X$ 행렬의 원소 $x_{ij}$ 는 $i$ 번째 데이터의 $j$ 번째 변수의 값을 말한다 
<br/>

- 행렬의 사칙연산
    - 덧셈, 뺄셈 ( O )
        - 조건 : 같은모양
            - 같은 인덱스 위치끼리 계산
        - > $\mathbb{X}_{i \times j} \pm \mathbb{Y}_{i \times j} = \begin{bmatrix} x_{11} & \cdots & x_{1j} \\ \vdots && \vdots \\ x_{i1} & \cdots & x_{ij} \end{bmatrix} + \begin{bmatrix} y_{11} & \cdots & y_{1j} \\ \vdots && \vdots \\ y_{i1} & \cdots & y_{ij} \end{bmatrix}$
        - > $\qquad\qquad\quad\,= \begin{bmatrix} x_{11} + y_{11} & \cdots & x_{ij} + y_{1j} \\ \vdots && \vdots \\ x_{i1} + y_{i1} & \cdots & x_{ij} + y_{ij} \end{bmatrix}$ 

    - 성분 곱, 스칼라 곱 ( O )
        - 조건 : 같은모양
            - 같은 인덱스 위치끼리 계산
        - > $\mathbb{X}_{i \times j} \odot \mathbb{Y}_{i \times j} = \begin{bmatrix} x_{11} & \cdots & x_{1j} \\ \vdots && \vdots \\ x_{i1} & \cdots & x_{ij} \end{bmatrix} \odot \begin{bmatrix} y_{11} & \cdots & y_{1j} \\ \vdots && \vdots \\ y_{i1} & \cdots & y_{ij} \end{bmatrix}$
        - > $\qquad\qquad\quad\,= \begin{bmatrix} x_{11}y_{11} & \cdots & x_{ij}y_{1j} \\ \vdots && \vdots \\ x_{i1}y_{i1} & \cdots & x_{ij}y_{ij} \end{bmatrix}$ 
        
    - 행렬의 곱셈 = 내적 (dot product)
        - 조건 : 행렬 $X$ 의 열 크기와 행렬 $Y$ 의 행의 크기가 같아야 한다
            - 행렬의 내적은 계산의 순서에 따라 결과값이 달라지며 계산이 불가능하기도 하다
            - >> $X \cdot Y \neq Y \cdot X$
        - > $\displaystyle\mathbb{X}_{m \times n} \cdot \mathbb{Y}_{n \times m} = \begin{bmatrix} x_{11} & \cdots&\cdots & x_{1n} \\ \vdots &&& \vdots \\ x_{m1} & \cdots&\cdots & x_{mn} \end{bmatrix}_{m \times n} \cdot \begin{bmatrix} y_{11} & \cdots & y_{1m} \\ \vdots && \vdots \\ \vdots && \vdots \\ y_{n1} & \cdots & y_{nm} \end{bmatrix}_{n \times m}$
        - > $\qquad\qquad\quad\;\;= {\begin{bmatrix} x_{11}y_{11} \; + \; \cdots \; + \; x_{1n}y_{n1} \\ \vdots \qquad \cdots \qquad \vdots \\ x_{m1}y_{1m} \; + \; \cdots \; + \; x_{mn}y_{nm}\end{bmatrix}}_{m \times m}$
        - > $\qquad\qquad\quad\;\;= \displaystyle\sum_{k}^{ } {x_{ik} \times y_{kj}}$

## 02 - 사칙연산 코딩

In [11]:
import numpy as np

x = np.array([[1, -2, 3],
             [7, 5, 0],
             [-2, -1, 2]]) # 3 x 3 행렬

y = np.array([[0, 1],
             [1, -1], 
             [-2, 1]]) # 3 x 2 행렬

EX_01 : 내적

In [12]:
print(np.dot(x,y))
# print(np.inner(x,y))
print(x @ y)

[[-8  6]
 [ 5  2]
 [-5  1]]
[[-8  6]
 [ 5  2]
 [-5  1]]


## 03 - 역행렬, sudo 역행렬
- 행렬은 벡터공간에서 사용되는 연산자 (operato) 로 이해한다
    - 행렬곱을 통해 벡터를 다른 차원의 공간으로 정보 이동
- 역랭렬 이해하기
    - Invers Matrix
    > $\mathbb{A}\mathbb{A}^-1 = \mathbb{A}^-1\mathbb{A} = \mathbb{I} = $ 항등행렬 (Identity Matrix)  
    >> $\mathbb{I} = {\begin{bmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1 \end{bmatrix}}$
    - 조건
        - 행열의 행과 열의 크기가 같아야 한다
        - 행열의 determinate 가 0 이 아니어야 한다
    - 코드
        > np.linalg.inv(x)
- 유사역행렬
    - Sudo Inverse Matrix
    - 무어-펜로즈 역행렬
    - 코드
        > np.linalg.pinv(x)
    - 조건
        - 언제든 사용가능
        - 단, 행렬의 형태에 따라 역행렬을 곱하는 계산순서가 달라져야 한다
            > $\mathbb{A}_{nm} \cdot \vec{x}_{m} = \vec{b}_{n}$
            - $ m \leq n $ 일때 (미지수 $\leq$ 식)
                > $\mathbb{A}^+\mathbb{A} = \mathbb{I}$ 
                >> $\mathbb{A}^+ = (\mathbb{A}^\top\mathbb{A})^{-1}\mathbb{A}^\top$
            - $ n \leq m $ 일때 (식 $\leq$ 미지수)
                > $\mathbb{A}\mathbb{A}^+ = \mathbb{I}$
                >> $\mathbb{A}^+ = \mathbb{A}^\top(\mathbb{A}^\top\mathbb{A})^{-1}$

- Sudo inverse Matrix EX
    1. 연립방정식
        > $ \mathbb{A} \cdot \vec{x} = \vec{b} $  
        > $\rightarrow {\begin{bmatrix} a_{11} & \cdots & a_{1m} \\ \vdots & \ddots & \vdots \\ a_{n1} & \cdots & a_{nm} \end{bmatrix}} {\begin{bmatrix} x_{1} \\ \vdots \\ \vdots \\ x_{m} \end{bmatrix}} = {\begin{bmatrix} b_{1} \\ \vdots \\ b_{n} \end{bmatrix}}$  
        - $\vec{x_m} \; (\mathbb{R}^m) : m$ 차원공간 $\rightarrow$ $\vec{b_{n}} \; (\mathbb{R}n) : n$ 차원공간  
            - 행렬 $\mathbb{A} \rightarrow $ 식의 갯수 : n  
            - 벡터 $\vec{x} \rightarrow$ 미지수의 갯수 : m  
        - $if, n$(식) $\leq m$ (미지수) $\rightarrow$ 해를 구할 수 없다, 역행렬이 존재하지 않는다  
            - sundo inverse matrix 활용
                - 사용조건 확인
                    - 식 $\leq$ 미지수 
                        > $\mathbb{A}\mathbb{A}^+ = \mathbb{I}$
                        >> $\mathbb{A}^+ = \mathbb{A}^\top(\mathbb{A}^\top\mathbb{A})^{-1}$
                    - 대입
                        > $\mathbb{A}\vec{x} = \vec{b}$  
                        >> $\mathbb{A}\vec{x} = \mathbb{I}\vec{b}$  
                        >>> $\rightarrow \mathbb{A}(\mathbb{A}^+)\vec{x} = \mathbb{I}(\mathbb{A}^+)\vec{b}$  
                        >>>> $\rightarrow \vec{x} = \mathbb{A}^\top(\mathbb{A}\mathbb{A}^\top)^{-1}\vec{b}$
    2. 선형회귀 분석
        - 의미
            - 좌표평면상의 데이터 $\mathbb{X}$ 에 대해
            - 계수 벡터 $\vec{\beta}$ 를 곱하여 얻은 선형모델 식을 최대한 타겟 벡터 $\vec{y}$ 에 근하하도록 최적화하는 작업
                - 데이터 : $\mathbb{X}_{nm}$
                - 변수(계수) : $\vec{\beta_{m1}}$
                - target : $\vec{y_{n1}}$
        - 적용 상황
            - $m \leq n$ : (미지수 $\leq$ 식)
            - 해를 구할 수 있을 떄
        - 풀이 방식
            - 연립방정식과 달리 행이 더 크므로 방정식 자체를 푸는건 불가능
                > $\mathbb{X} \; \vec{\beta} \; = \; \hat{y} \; \approx(\neq) \; \vec{y}  $
                >> $\rightarrow(\mathbb{X}^+)\mathbb{X}\vec{\beta} \; = \; (\mathbb{X}^+)\hat{y}$  
                >> $\rightarrow\vec{\beta} \; = \; \mathbb{X}^+\hat{y}$  
                >> $\rightarrow\vec{\beta} \; = \; \mathbb{X}^+\hat{y}$  
                - $ m \leq n $ 일때 (미지수 $\leq$ 식)
                    - $\mathbb{A}^+\mathbb{A} = \mathbb{I}$ 
                    - $\mathbb{A}^+ = (\mathbb{A}^\top\mathbb{A})^{-1}\mathbb{A}^\top$
                >> $\rightarrow\vec{\beta} \approx (\mathbb{X}^\top\mathbb{X})^{-1}\mathbb{X}^\top\hat{y}$
                - $\beta$ 값 을 얻는 방법
                    > $best \; \beta = min ||\vec{y} - \hat{y}||_{2}$  
                    - $L_2$ 노름의 최소화 방법으로 최적의 $\hat{y}$ ($\vec{y}$에 근접한)를 갖는 $\beta$ 를 찾는다
        - 코드
            - sklearn.LinearRegression EX
                > from sklearn.linear_model import LinearRegression         
                >> lg_clf = LinearRegression()                              
                >> model.fit(X_train, y_train)                              
                >> lg_clf_pred = model.predict(X_test)                      

            - Moore-Penrose 역행렬
                - y 절편(intercept) 항 직접 지정 필요
                    > x = np.array(np.append(x,[1])) for x in X])  
                    > beta = np.linalg.pinv(X_) @ y  
                    > moor_pred = np.appred(x, [1]) @ beta