# 1. 파이썬의 컴퓨팅 라이브러리, numpy
**numpy를 이용해서 데이터를 다뤄봅시다!**

### Our Goal
1. Numpy 시작하기
    - prerequisite : Python의 List
    - numpy import하기
    - numpy.array

2. Numpy로 연산하기
    - Vector - Scalar : elementwise! (+, -, *, /)
    - Vector - Vector : elementwise / broadcasting (+, -, *, /)
    - Indexing & Slicing
3. Example : Linear Algebra with Numpy
    1. basics
    - 영벡터 : `.zeros()`
    - 일벡터 : `.ones()`
    - 대각행렬 : `.diag()`
    - 항등행렬 : `.eye()`
    - 행렬곱 : `@` / `.dot()`
  
    2. furthermore
    - 트레이스 : `.trace()`
    - 행렬식 : `.linalg.det()`
    - 역행렬 : `.linalg.inv()`
    - 고유값 : `.linalg.eig()`


## I. Numpy 시작하기

### Remind : 리스트

In [1]:
arr = [1, "two", 3.0]
print(arr)

[1, 'two', 3.0]


### Numpy 모듈 불러오기

In [2]:
import numpy as np

### 왜 numpy를 사용해야 할까요?
A) List보다 numpyt가 훨씬 빠르다

#### List


In [4]:
L = range(1000)

%timeit [i ** 2 for i in L]

330 µs ± 19.5 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


#### numpy.array

In [5]:
N = np.arange(1000)

%timeit N ** 2

1.66 µs ± 84.8 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


### numpy.array
numpy의 container, array

In [6]:
arr = np.array([1,2,3])
arr

array([1, 2, 3])

In [7]:
arr_2d = np.array([[1,2,3], [4,5,6], [7,8,9]])

arr_2d

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [8]:
arr.shape

(3,)

In [9]:
arr_2d.shape

(3, 3)

# 인공지능 수학 - 선형대수 ( Numpy 실습)

### 행렬과 벡터의 코딩 및 연산

In [10]:
import numpy as np
# 행렬 코딩
A = np.array([[3, 1, 1], [1, -2, -1], [1, 1, 1]])

print(A)
print(np.shape(A))

[[ 3  1  1]
 [ 1 -2 -1]
 [ 1  1  1]]
(3, 3)


In [11]:
# 벡터 코딩
# 수학적으로 기본적으론 열벡터로 생각
b = np.array([4, 1, 2])

print(b)
print(np.shape(b))

[4 1 2]
(3,)


In [12]:
# 역행렬 구하기
A_inv = np.linalg.inv(A)

print(A_inv)
# [0.5, 0, -0.5]
# [1, -1, -2]
# [-1.5, 1, 3.5]
print(np.shape(A_inv))

[[ 5.00000000e-01 -7.40148683e-17 -5.00000000e-01]
 [ 1.00000000e+00 -1.00000000e+00 -2.00000000e+00]
 [-1.50000000e+00  1.00000000e+00  3.50000000e+00]]
(3, 3)


In [13]:
# 역행렬을 이용한 선형시스템 Ax = b의 해 구하기
# x = np.matmul(A_inv, b)

x = A_inv @ b

print(x)
print(np.shape(x))

[ 1. -1.  2.]
(3,)


In [14]:
# 결과 검증
# bb = np.matmul(A, x)

bb = A @ x

print(np.shape(bb))
print(bb)

if np.linalg.norm(b - bb) < 1e-3:   # 벡터가 비슷한지 검사  10^-3
    print("OK")
else:
    print("something wrong")
       

(3,)
[4. 1. 2.]
OK


## II. Numpy로 연산하기

### Vector와 Scalar 사이의 연산

벡터의 각 원소에 대해서 연산을 진행

![image.png](attachment:image.png)

In [15]:
import numpy as np

In [18]:
x = np.array([1, 2, 3])
c = 5

print("더하기 : {}".format(x + c))
print("빼기 : {}".format(x - c))
print("곱하기 : {}".format(x * c))
print("나누기 : {}".format(x / c))

더하기 : [6 7 8]
빼기 : [-4 -3 -2]
곱하기 : [ 5 10 15]
나누기 : [0.2 0.4 0.6]


## Vector와 Vector 사이의 연산

벡터와 **같은 인덱스**끼리 연산이 진행

![image-2.png](attachment:image-2.png)



In [19]:
y = np.array([1, 3, 5])
z = np.array([2, 9, 20])

print("더하기 : {}".format(y + z))
print("빼기 : {}".format(y - z))
print("곱하기 : {}".format(y * z))
print("나누기 : {}".format(y / z))

더하기 : [ 3 12 25]
빼기 : [ -1  -6 -15]
곱하기 : [  2  27 100]
나누기 : [0.5        0.33333333 0.25      ]


## Array의 Indexing
python의 List와 유사하게 진행 

차이점)  
python : a[row][col]  
Array : a[row, col]  

![image.png](attachment:image.png)

In [21]:
W = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])

W[0, 0]

1

In [22]:
W[2, 3]

12

In [23]:
# 7을 가져오기
W[1, 2]

7

## Array의 Slicing

python의 리스트와 유사하게 진행

In [26]:
W = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])

W[0:2, 1:3]

array([[2, 3],
       [6, 7]])

In [27]:
print(W[0:2, 0:4])
print(W[0:2])
print(W[0:2, :])

[[1 2 3 4]
 [5 6 7 8]]
[[1 2 3 4]
 [5 6 7 8]]
[[1 2 3 4]
 [5 6 7 8]]


In [28]:
print(W[0:3, 2:4])
print(W[:, 2:4])

[[ 3  4]
 [ 7  8]
 [11 12]]
[[ 3  4]
 [ 7  8]
 [11 12]]


## Array의 Broadcasting

기본적으로 같은 Type의 data에 대해서만 연산이 적용 가능  
하지만 만약에 피연산자가 연산 가능하도록 변환이 가능하다면 연산이 가능헙나더  
이를 **Broadcasting**이라고 합니다

### 1. M by N, M by 1

In [31]:
a = np.array([[1,2,3], [4,5,6], [7,8,9]])
x = np.array([0, 1, 0])

x = x[:, None]  # x를 전치

print(a + x)

[[1 2 3]
 [5 6 7]
 [7 8 9]]


### 2. M by N, 1 by N

In [32]:
y = np.array([0, 1, -1])

print(a * y)

[[ 0  2 -3]
 [ 0  5 -6]
 [ 0  8 -9]]


### 3. M by 1, 1 by N

In [33]:
t = np.array([1,2,3])
t = t[:, None]  # Transpose

u = np.array([2, 0, -2])

print(t + u)

'''
1 1 1     2 0 -2
2 2 2  +  2 0 -2
3 3 3     2 0 -2
'''

[[ 3  1 -1]
 [ 4  2  0]
 [ 5  3  1]]


## III. Numpy로 선형대수 지식 끼얹기

## A. basics

### 영벡터(행렬)

- 원소가 모두 0인 벡터(행렬)
- `np.zeros(dim)` 을 통해 생성, dim은 값, 혹은 튜플(,)

In [34]:
np.zeros(3)

array([0., 0., 0.])

In [38]:
np.zeros((3,3,3))

array([[[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]],

       [[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]],

       [[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]]])

### 일벡터(행렬)

- 원소가 모두 1인 벡터(행렬)
- `np.ones(dim)` 을 통해 생성, dim은 값, 튜플(,)

In [39]:
np.ones(2)

array([1., 1.])

In [40]:
np.ones((3, 3))

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

### 대각행렬(diagonal matrix)

- Main diagonal을 제외한 성분이 0인 행렬
- `np.diag((main_diagonal))` 을 통해 생성할 수 있음.

In [41]:
np.diag((2, 4))

array([[2, 0],
       [0, 4]])

In [43]:
np.diag((1,3,5))

array([[1, 0, 0],
       [0, 3, 0],
       [0, 0, 5]])

### 항등행렬 (identitiy matrix)

- Main diagonal이 1인 대각행렬
- `np.eye(n, (dtype= int, uint, float, ...))` 을 통해 생성할 수 있음

In [47]:
a = np.eye(2)

print(a)
print(a.dtype)

[[1. 0.]
 [0. 1.]]
float64


In [48]:
b = np.eye(2, dtype=int)

print(b)
print(b.dtype)

[[1 0]
 [0 1]]
int32


In [49]:
np.eye(3)

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

### 행렬곱 (dot product)

- 행렬간의 곱연산
- `np.dot()` or `@` 사용

In [54]:
mat_1 = np.array([[1, 4], [2, 3]])
mat_2 = np.array([[7, 9], [0, 6]])

print(mat_1.dot(mat_2))
print()
print(mat_1 @ mat_2)

[[ 7 33]
 [14 36]]

[[ 7 33]
 [14 36]]


## B. Furthermore

### 트레이스 (trace)

- Main diagonal의 Sum
- `np.trace()`을 사용

In [55]:
arr = np.array([[1,2,3], [4,5,6], [7,8,9]])
arr

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [56]:
arr.trace()

15

In [58]:
np.eye(2, dtype=int).trace()

2

### 행렬식 (determinant)

- 행렬을 대표하는 값들 중 하나
- 선형변환 과정에서 vector의 Scaling 척도
- `np.linalg.det()` 으로 계산

In [59]:
arr_2 = np.array([[2,3],[1,6]])

np.linalg.det(arr_2)

9.000000000000002

In [60]:
arr_3 = np.array([[1,4,7], [2, 5, 8],[3,6,9]])

np.linalg.det(arr_3)

0.0

### 역행렬 (inverse matrix)

- 행렬 A에 대해 AB = BA = I를 만족하는 행렬 B = A^-1
- `np.lnalg.inv()` 을 사용

In [64]:
mat = np.array([[1,4],[2,3]])

mat

array([[1, 4],
       [2, 3]])

In [65]:
mat_inv = np.linalg.inv(mat)

mat_inv

array([[-0.6,  0.8],
       [ 0.4, -0.2]])

In [66]:
mat @ mat_inv

array([[1., 0.],
       [0., 1.]])

### 고유값과 고유벡터 (eigenvalue and eigenvector)

- 정방행렬(nxn) A에 대해 $ Ax = \lambda x$를 만족하는 상수 $ \lambda\ $와 이에 대응하는 벡터
- `np.linalg.eig()` 로 계산

In [67]:
mat = np.array([[2, 0, -2], [1, 1, -2], [0, 0, 1]])

mat

array([[ 2,  0, -2],
       [ 1,  1, -2],
       [ 0,  0,  1]])

In [68]:
np.linalg.eig(mat)

(array([1., 2., 1.]),
 array([[0.        , 0.70710678, 0.89442719],
        [1.        , 0.70710678, 0.        ],
        [0.        , 0.        , 0.4472136 ]]))

#### Validation

In [69]:
eig_val, eig_vec = np.linalg.eig(mat)

eig_val

array([1., 2., 1.])

In [70]:
eig_vec

array([[0.        , 0.70710678, 0.89442719],
       [1.        , 0.70710678, 0.        ],
       [0.        , 0.        , 0.4472136 ]])

In [71]:
mat @ eig_vec[:, 0]  # Ax

array([0., 1., 0.])

In [72]:
eig_val[0] * eig_vec[:, 0]  # (lambda) x

array([0., 1., 0.])

## IV. Exercises

### 1. 어떤 벡터가 주어졌을 때 L2 norm을 구하는 함수 `get_L2_norm()`을 작성하세요

- **매개변수** : 1차원 벡터 (`np.array`)
- **반환값** : 인자로 주어진 벡터의 L2 Norm값 (`number`)

In [74]:
import numpy as np
import math

mat = np.array([1, 2, 3, 4])

def get_L2_norm(mat):
    # np.linalg.norm(mat, 2)
    return math.sqrt(sum([i**2 for i in mat]))

print(get_L2_norm(mat))

5.477225575051661


### 2. 어떤 행렬이 singular matrix인지 확인하는 함수 `is_singular()` 를 작성하세요

- 매개변수 : 2차원 벡터(`np.array`)
- 반환값 : 인자로 주어진 벡터가 singular하면 True, non-singular하면 False를 반환 

In [76]:
mat_1 = np.array([[1,2],[3,4]])
mat_2 = np.array([[1,2],[2,4]])

def is_singular(mat):
    if np.linalg.det(mat) == 0:
        return False
    return True

print(is_singular(mat_1))

print(is_singular(mat_2))

True
False
