# Matrix


---

- 행렬(matrix)은 행(row) 벡터를 원소로 가지는 2차원 배열입니다.
    - numpy 에선 행(row)이 기본 단위입니다.
    - 보통 열(column)벡터로 해석,
    
- 행렬은 행(row)과 열(column)이라는 인덱스(index)를 가집니다.

- 행렬의 특정 행(열)을 고정하면 행(열)벡터라 부릅니다.

- 전치행렬(transpose matrix)은 행과 열의 인덱스가 바뀐 행렬을 말합니다.


- n 개의 행과 , m개의 열을 가지는 행렬

![image-2.png](attachment:image-2.png)

---

## 행렬 이해

- 벡터가 공간에서 한 점을 의미한다면, 행렬은 여러 점들을 나타냅니다.

- 행렬의 행벡터 xi 는 i 번째 데이터를 의미합니다.

- 행렬의 x(i,j) 는 **i 번째 데이터의 j 번째 변수의 값**을 말합니다. 
    - i = 4, j = 8 > 4행 8열, 4 번째 행 데이터의 8 번째 변수의 값


![image.png](attachment:image.png)

---

## 행렬의 덧셈, 뺄셈, 성분 곱(EWM), 스칼라 곱

- 행렬은 벡터를 원소로 가지는 2차원 배열입니다.

- 행렬끼리 차원이 같으면, 덧셈, 뺄셈을 계산할 수 있습니다.

- 행렬끼리 차원이 같으면, 성분 곱(EWM) 을 계산할 수 있습니다.
    - 성분곱은 각 인덱스 위치끼리 곱합니다.
    
- 행렬의 스칼라를 곱하면, 스칼라 곱으로, 모든 성분에 똑같이 숫자를 곱해줍니다.


In [1]:
# 성분 곱 (EWM) 두 행렬의 차원이 같아야 함

import numpy as np

# 3 x 3
X = np.array([
             [1, -2, 3],
             [7, 5, 0],
             [-2, -1, 2]
             ])

# 3 x 2
Y = np.array([
             [0, 1],
             [1, -1],
             [-2, 1]
             ])

In [2]:
# error (3 x 3) * (3 x 2) 

X * Y

ValueError: operands could not be broadcast together with shapes (3,3) (3,2) 

In [None]:
# Element-wise Multiplication
# X행렬, Y행렬의 차원이 같아야함, 3 x 3

Y = np.array([
             [0, 1, 0],
             [1, -1, 0],
             [-2, 1, 0]
             ])

In [3]:
X * Y

ValueError: operands could not be broadcast together with shapes (3,3) (3,2) 

---

## 행렬 곱셉 (Matrix Multiplication)


- $XY = (\sum_k x_{ik}y_{kj})$

- 행렬 곱셈(matrix multiplication) : **i번째 행 벡터와 j번째 열 벡터 사이의 내적을 성분으로 가지는 행렬을 계산합니다.**

    - X의 열의 개수와 Y의 행의 개수가 같아야 함

- numpy 에서 행렬 곱셉 (matrix multiplication)을 하려면, `@` 연산을 사용

- `np.inner()` : **i번째 행 벡터와 j번째 행 벡터 사이의 내적** 을 성분으로 가지는 행렬 계산 가능
    - np.inner() 연산을 통해 행렬 곱셉 (matrix multiplication) 처리 가능
    
---


In [4]:
# 행렬 곱(MM)
# X의 열의 개수 == Y의 행의 개수 

import numpy as np

# 3 x 3
X = np.array([
             [1, -2, 3],
             [7, 5, 0],
             [-2, -1, 2]
             ])

# 3 x 2
Y = np.array([
             [0, 1],
             [1, -1],
             [-2, 1]
             ])

In [5]:
# 행렬 곱 matrix multiplication, 3 x 2, @ 연산

X @ Y

array([[-8,  6],
       [ 5,  2],
       [-5,  1]])

In [6]:
# (3 x 2) -> (2 x 3)

np.transpose(Y)

array([[ 0,  1, -2],
       [ 1, -1,  1]])

In [7]:
# 행렬 곱 matrix multiplication, 3 x 2, np.inner()을 이용한

# 1-1) 3 x 2 행렬 Y 를 2 x 3 Y^T으로 Transpose 후 

# 1-2) X 행렬의 i번째 행 벡터와 Y^T 행렬의 j번째 행 벡터 (Y 행렬의 j번째 열 벡터 ) 사이의 내적을 성분으로 가지는 행렬 계산 == Matirx Multiplication

# 1-3) np.inner(3 x 3, 2 x 3)  

# 1-4) MM  (3 x 3) @ ( 3 x 2 )

np.inner(X, np.transpose(Y))

array([[-8,  6],
       [ 5,  2],
       [-5,  1]])

In [8]:
# np.inner (3 x 3) (3 x 2) : 뒤의 Y가 Transpose 되면서, 성분 곱 (MM) 
# MM (3 x 3) @ ( 2 x 3 ) : front 열, rear 행 의 개수가 같지 않음

np.inner(X, Y)

ValueError: shapes (3,3) and (2,3) not aligned: 3 (dim 1) != 2 (dim 0)

---

##  행렬 곱셉 (matrix multiplication) 이해  

- 행렬은 벡터공간에서 사용되는 연산자(operator)로 이해한다.
    - 변환 행렬 : 대칭 행렬, 전치 행렬, 이동 행렬, 회전 행렬 등.

- 행렬 곱셉 (matrix multiplication)은, 벡터를 다른 차원의 공간으로 보낼 수 있습니다.
    - 3x2 행렬 * 2x3 행렬 의 행렬곱 MM 을 통해, 3x3 행렬 차원으로 이동.

- 행렬 곱셉 (matrix multiplication)은, 패턴을 추출하거나 데이터를 압축할 수 있습니다.

- 모든 선형 변환(linear transform)은 행렬 곱셉 (matrix multiplication) 으로 계산할 수 있습니다.

---

## 행렬 곱셉 (matrix multiplication) Example

- A(n x m) -n 개의 행, m개의 열 행렬 

- x(m x 1) 벡터 열 벡터

- z(n x 1) 벡터 열 벡터
    - x -> z 
    - m차원 에서 n차원 이동
    
    
![image.png](attachment:image.png)

---

## 행렬 내적

- `np.inner(X,Y)` : **i번째 행 벡터와 j번째 행 벡터 사이의 내적**을 성분으로 가지는 행렬 계산
    - 수학에서 말하는 내적이랑 다름
    - $X @ Y^\intercal$ 
 

- $XY^\intercal = (\sum_k x_{ik}y_{kj})$ 


In [9]:
import numpy as np


# 3 x 3
X = np.array([
             [1, -2, 3],
             [7, 5, 0],
             [-2, -1, 2]
             ])


# 2 x 3
Y = np.array([
             [0, 1, -1],
             [1, -1, 0]
             ])

In [10]:
# X @ Y^T

np.inner(X,Y)

array([[-5,  3],
       [ 5,  2],
       [-3, -1]])

In [11]:
# X @ Y^T

# X 행렬의 열 과 Y 행렬의 행 같도록 Transpose, 행렬곱 (MM) 을 하기 위해서,

X @ np.transpose(Y)

array([[-5,  3],
       [ 5,  2],
       [-3, -1]])

---

## 역행렬(inverse matrix) 

- 어떤 행렬 A 의 연산을 거꾸로 되돌리는 행렬을 역행렬(inverse matrix)이 라 부르고 $A^{-1}$ 라 표기한다. 

- 역행렬은 행과 열 숫자가 같고, 행렬식 (determinant)이 0이 아닌 경우에만 계산할 수 있다.

- 역행렬 연산은 n = m 일 때만 가능하고 행렬 A의 행렬식이 0 이 되면 안된다

- - `np.linalg.inv(X)`


- 항등행렬(Identity Matrix)
    - $AA^{-1} = A^{-1}A = I$ 

In [12]:
# 행 과 열의 숫자가 같아야함 -> 3 x 3

X = np.array([[1, -2, 3], 
			  [7, 5, 0],
              [-2, -1, 2]])


# X와 X의 역행렬을 곱하면 항등행렬(identity matrix)
X @ np.linalg.inv(X)  

array([[ 1.00000000e+00, -1.38777878e-17,  0.00000000e+00],
       [-2.22044605e-16,  1.00000000e+00, -5.55111512e-17],
       [-2.77555756e-17,  0.00000000e+00,  1.00000000e+00]])

---

## 유사역행렬(pseudo-inverse), 무어-펜로즈(Moore-Penrose) 역행렬

- 만일 역행렬을 계산할 수 없다면(행과 열의 숫자가 같지 않더라도), 연산을 되돌리는 행위를 유사역행렬(pseudo-inverse) 또는 무어-펜로즈(Moore-Penrose) 역행렬 $A^{+}$ 을 이용하여 처리

    - `np.linalg.pinv(X)`


- 행의 개수 n, 열의 개수 m일 때, 
    - n ≥ m인 경우, (행의 개수가 더 많은 경우)
        - $ A^{+} = (A^{\intercal}A)^{-1}A^{\intercal} $ 
            - ( M x N * N x M ) 행렬곱 (MM) 의 역행렬, 과 A^T 와 다시 행렬곱 (MM) 계산 처리 - (M x M * M x N)
            - M x N
        - $ A^{+}A = I$ 
    
    - n ≤ m인 경우, (열의 개수가 더 많은 경우)
        - $ A^{+} = A^{\intercal}(A A^{\intercal})^{-1} $
        - $ AA^{+} = I $


---

## 응용 1 - 연립 방정식 풀이 (n ≤ m인 경우)

- 식의 개수 n이 변수의 개수 m보다 작거나 같을 때, 무어-펜로즈 역행렬을 이용하여 연립방정식을 만족하는 해 $X_{j}$  를 하나 구할 수 있습니다.

- `np.linalg.pinv(X)`, 를 이용하면 연립방정식의 해를 구할 수 있다

- 행렬 A, a(n,m)
    - 계수 (a, coefficient )
    - 식의 개수 (n, 행, 데이터)
    - 변수의 개수 (m, 열)

- n <= m 인 경우, 변수의 개수 m 이  더 많은 경우, 

![image.png](attachment:image.png)

---

## 응용 2 -  무어-펜로즈 역행렬을 활용한 선형 회귀 분석 (n ≥ m인 경우)

- 연립 방정식과 달리 행의 개수 n이,  변수 개수 (m) 보다 더 크므로 방정식을 푸는 것은 불가능 (해를 구할 수는 X)

- 데이터를 선형모델(linear model)로 해석하는 선형 회귀식 을 찾을 수 있습니다.
    - 선형 회귀: 선형 회귀는 데이터를 설명하기 위한 선형 모델을 만드는 통계적 기법

- 데이터의 개수(행, n, 식)가 변수 개수(열, m) 보다 많거나 같을 때, 계수 β를 근사하여 구할 수 있습니다.
    - 선형 회귀 모델을 만들 때, 데이터 포인트의 개수를 'n'이라 하고 설명 변수의 개수를 'm'이라 합니다. 일반적으로 선형 회귀에서는 데이터 포인트의 개수 'n'이 설명 변수의 개수 'm'보다 많거나 같아야 합니다. 이는 모델을 훈련시키고 데이터에 맞추기 위한 충분한 정보가 필요하다는 것을 의미합니다.
    
    
- Moore-Penrose 역행렬을 이용하여 y 에 근접하는 ŷ 를 찾을 수 있습니다.
    - 벡터의 크기나 길이를 측정하는 방법으로 L2 norm을 이용하여, 예측값과 실제 값 간의 차이(오차)를 최소화 하는 방식으로 처리
    



---


- $y = X * β + ε$

    - y: 종속 변수(예를 들면, 집 가격)

    - X: 설명 변수(예를 들면, 집 크기, 방의 수, 위치)

    - β: 가중치(계수) 벡터

    - ε: 오차 항 (모든 관찰값에 대한 오차)

- Moore-Penrose 역행렬을 사용한 가중치(계수) 계산
데이터 행렬 X가 주어지고, 데이터 포인트의 개수 n이 설명 변수의 개수 m 이상일 때, 가중치 벡터 β를 계산하기 위해 Moore-Penrose 역행렬을 사용할 수 있습니다.

- $X * β = y$

- $β = X^{+}*y$

- $β = (X^T * X)^{-1} * X^T * y$




---

![image.png](attachment:image.png)

---

In [None]:
# sklearn을 활용한 회긔 분석
# intercept 항 (y 절편) 자동 추가 

from sklearn.linear_model import LinearRegressionRegression

model = LinearRegression()
model.fit(X, y)

y_test = model.predict(x_test)

In [None]:
# Moore=penrose 역행렬 활용
# intercept 항 (y 절편)을 직접 추가해야 함.

X_ = np.array( [np.append(x,[1]) for x in X] )

beta = np.linalg.pinv(X_) @ y

y_test = np.append(x, [1]) @ beta