### 행렬이란?

- 벡터는 숫자(스칼라)를 원소로 가지는 1차원 배열입니다
- 행렬은 벡터를 원소로 가지는 2차원 배열입니다
- 행렬은 행(row)과 열(column)이라는 인덱스(index)를 가집니다.
- 행렬의 특정 행(열)을 고정하면 행(열)벡터라 부릅니다.

<img src="https://imgur.com/vVOETec.jpg">

In [4]:
import numpy as np
x = np.array([[1,-2,3], [7,5,8], [-2,-1,2]]) # 행렬
x # numpy에선 행이 기본단위 입니다.

array([[ 1, -2,  3],
       [ 7,  5,  8],
       [-2, -1,  2]])

#### 전치 행렬

- 전치행렬(transpose matrix)는 행과 열의 인덱스가 바뀐 행렬을 말합니다.

<img src="https://imgur.com/7bTiXeP.jpg">

#### 행렬을 공간상에서 이해하기

- 벡터가 공간에서 한 점을 의미한다면 행렬은 여러개의 점들을 나타냅니다.
- 행렬의 행벡터 $x_i$는 i번째 데이터를 의미합니다.
- 행렬의 $x_{ij}$는 i번째 데이터의 j번째 변수의 값을 말합니다.

행렬끼리의 모양이 같으면 덧셈, 뺄셈을 계산할 수 있습니다.  
성분곱(element-wise-product)도 벡터와 동일합니다.   
성분곱은 같은 위치의 값끼리 곱한 것을 의미합니다.  
스칼라곱도 동일합니다.

#### 행렬 곱셈

- 행렬 곱셈(matrix multiplication)은 **i번째 행벡터와 j번째 열벡터 사이의 내적**을 성분으로 가지는 행렬을 계산합니다.
- 내적(inner product) : 두 벡터들의 연산에 성분곱을 취한다음에 성분곱을 취한 벡터들을 모두 더하는 연산

<img src="https://imgur.com/xtrL8FU.jpg">

In [8]:
x = np.array([[1,-2,3], 
              [7,5,8], 
              [-2,-1,2]]) 


y = np.array([[0,-1], 
              [1,-1], 
              [-2,1]]) 

x @ y # 두 행렬의 행렬곱

array([[ -8,   4],
       [-11,  -4],
       [ -5,   5]])

#### 행렬 내적

- 넘파이의 np.inner는 **i번째 행벡터와 j번째 행벡터 사이의 내적**을 성분으로 가지는 행렬을 계산합니다
- 수학에서 말하는 내적과는 다르므로 주의해야 합니다.

<img src="https://imgur.com/fo9JJdA.jpg">

In [9]:
x = np.array([[1,-2,3], 
              [7,5,8], 
              [-2,-1,2]]) 

y = np.array([[1,-2,3], 
              [7,5,8]])

np.inner(x,y)

array([[ 14,  21],
       [ 21, 138],
       [  6,  -3]])

#### 행렬의 이해 두번쨰

- 행렬은 벡터공간에서 사용되는 연산자(operator)로 이해한다
- 행렬곱을 통해 벡터를 다른 차원의 공간으로 보낼 수 있습니다
- 행렬을 통해서 두 벡터를 연결할 수 있습니다
- 행렬곱을 통해 패턴을 추출할 수 있고 데이터를 압축할 수도 있습니다.
- 모든 선형변환(linear transform)은 행렬곱으로 계산할 수 있습니다.

<img src="https://imgur.com/QUwUbqJ.jpg">

#### 역행렬

- 어떤 행렬 A의 연산을 거꾸로 되돌리는 행렬을 역행렬(inverse matrix) $A^{-1}$라고 부른다.
- 역행렬은 행과 열 숫자가 같고 행렬식이 0이 아닌 경우에만 계산할 수 있습니다.

<img src="https://imgur.com/oWNG9Kd.jpg">

In [12]:
np.linalg.inv(x) # 역행렬 구하는 방법

array([[ 0.20689655,  0.01149425, -0.35632184],
       [-0.34482759,  0.09195402,  0.14942529],
       [ 0.03448276,  0.05747126,  0.2183908 ]])

In [14]:
x @ np.linalg.inv(x) # 기존 행렬과 역행렬을 행렬곱하면 항등행렬이 나옴

array([[ 1.00000000e+00,  1.38777878e-17,  5.55111512e-17],
       [-5.55111512e-17,  1.00000000e+00,  0.00000000e+00],
       [-6.93889390e-17,  0.00000000e+00,  1.00000000e+00]])

- 만일 역행렬을 계산할 수 없다면 유사역행렬(pseudo-inverse)또는 무어 펜로즈 역행렬 $A^+$을 이용합니다
- n은 행, m이 열인 경우

<img src="https://imgur.com/IaXYRKt.jpg">

In [17]:
np.linalg.pinv(x) # 유사역행렬

array([[ 0.20689655,  0.01149425, -0.35632184],
       [-0.34482759,  0.09195402,  0.14942529],
       [ 0.03448276,  0.05747126,  0.2183908 ]])

In [20]:
x @ np.linalg.pinv(x) # 항등행렬을 구할 수 있음

array([[ 1.00000000e+00, -1.38777878e-16, -2.77555756e-17],
       [-9.43689571e-16,  1.00000000e+00,  1.11022302e-15],
       [ 1.80411242e-16, -2.77555756e-17,  1.00000000e+00]])

#### 연립방정식 풀기

- ```np.linalg.pinv()```를 활용하여 연립방정식의 해를 구할 수 있습니다

<img src="https://imgur.com/EZxjEMJ.jpg">

#### 선형회귀분석

- ```np.linalg.pinv()```를 이용하면 데이털르 선형모델로 해석하는 선형회귀식을 찾을 수 있습니다
- 선형회귀분석은 연립방정식과 달리 행이 더 크므로 방정식을 푸는건 불가능합니다
- 데이터를 최대한 잘 표현 가능한 회귀선을 찾아야 합니다
- 현실에서는 완전히 동일한 y를 구할 수 없으므로 $\hat{y}$를 구해야 합니다

$X\beta = \hat{y} ~ y,$  $L_2$ 노름을 최소화하는 $\hat{y}$를 찾아야 합니다  
$\beta = X^{+}y = (X^{T}X)^{-1}X^Ty$ Moore-Penrose 역행렬을 이용하여 y에 근접한 $\hat{y}$을 찾을 수 있습니다

<img src="https://imgur.com/Sh84K25.jpg">

sklearn y절편 자동으로 추가  
Moore- Penrose는 y절편을 따로 추가해줘야함