# 왜 선형대수를 알아야 하는가?

딥러닝을 이해하기위해서는 선형대수+행렬미분+확률의 탄탄한 기초가 필요하다.

![image.png](attachment:image.png)

이렇게 학심아이디어가 행렬에 관한 식으로 표현되는 경우가 많다.

목표 : 선형대수와 행렬미분의 기초를 배우고 간단한 머신러닝 알고리즘(PCA)를 유도해보자

# 기본 표기법

![image.png](attachment:image.png)
 ![image-2.png](attachment:image-2.png)
 ![image-3.png](attachment:image-3.png)

## python에서 벡터, 행렬 방법

In [1]:
import numpy as np
x = np.array([10,4,3])

In [2]:
x.shape

(3,)

In [4]:
i = 2
x[i]

3

In [5]:
np.expand_dims(x, axis=1) #차원하나 추가하기 1차원_>2차원어레이

array([[10],
       [ 4],
       [ 3]])

In [7]:
A = np.array([
    [10,20,30],
    [40,50,60]
])
A

array([[10, 20, 30],
       [40, 50, 60]])

In [9]:
A.shape # 형태확인

(2, 3)

In [12]:
i = 0 # 행렬의 특정 원소확인
j = 2
A[i,j]

30

In [11]:
# 컬럼 벡터 확인
j = i
A[:,j]

array([10, 40])

In [13]:
# 행 백터 확인
i = 1
A[i,:]

array([40, 50, 60])

# 행렬의 곱셉(Matrix Multiplication)

![image.png](attachment:image.png)

행렬의 곱셈을 이해하는 몇 가지 방식들
- 벡터 x 벡터
- 행렬 x 벡터
- 행렬 x 행렬

## 벡터 X 벡터 (vec vec products)
![image.png](attachment:image.png)


In [17]:
import numpy as np
x = np.array([1,2,3])
y = np.array([4,5,6])
x.dot(y)

##궁금한점!! : y는 왜 하필 세로행렬로 나타내는걸까?

32

In [18]:
y.dot(x)

32

![image.png](attachment:image.png)

## 외적일 경우 두 개의 차원이 달라도 상관이 없다!

In [22]:
x = np.array([1,2,3])
y = np.array([4,5,6])

In [23]:
x = np.expand_dims(x, axis=1) # 컬럼벡터가 되는 것
y = np.expand_dims(y, axis=0) # 행벡터로..근데 yt가 왜 행벡터가 되는 것인지??
x.shape, y.shape

((3, 1), (1, 3))

In [24]:
np.matmul(x,y)
# 3x1 1x3 이니 3x3 행렬!

array([[ 4,  5,  6],
       [ 8, 10, 12],
       [12, 15, 18]])

![image.png](attachment:image.png)

In [28]:
# column vector
x = np.expand_dims(np.array([1,2,3]), axis=1)
x

array([[1],
       [2],
       [3]])

In [29]:
ones = np.ones([1,4])
ones

array([[1., 1., 1., 1.]])

In [30]:
A = np.matmul(x, ones) # ones함수는 우너소들이 모두 1인 행렬
A # 모든 행들이 같은 행렬

array([[1., 1., 1., 1.],
       [2., 2., 2., 2.],
       [3., 3., 3., 3.]])

![image.png](attachment:image.png)

In [31]:
A = np.array([
    [1,2,3],
    [4,5,6]
])
A

array([[1, 2, 3],
       [4, 5, 6]])

In [32]:
ones = np.ones([3,1])
ones

array([[1.],
       [1.],
       [1.]])

In [33]:
np.matmul(A,ones)

array([[ 6.],
       [15.]])

![image.png](attachment:image.png)

In [35]:
A = np.array([
    [1,0,1],
    [0,1,1]
])

X = np.array([
    [1],
    [2],
    [3],
])
np.matmul(A,x)

array([[4],
       [5]])

In [36]:
for i in range(A.shape[1]):
    print('a_' + str(i)+":", A[:,i], '\tx_'+str(i)+':', x[i], '\ta_'+str(i))

a_0: [1 0] 	x_0: [1] 	a_0
a_1: [0 1] 	x_1: [2] 	a_1
a_2: [1 1] 	x_2: [3] 	a_2


![image.png](attachment:image.png)