# 1. 파이썬의 컴퓨팅 라이브러리, numpy
**numpy를 이용해서 데이터를 다뤄봅시다!**

### Our Goal
1. Numpy 시작하기
    - prerequisite : Python의 List
    - numpy import하기
    - numpy.array

2. Numpy로 연산하기
    - Vector - Scalar : elementwise! (+, -, *, /)
    - Vector - Vector : elementwise / broadcasting (+, -, *, /)
    - Indexing & Slicing
3. Example : Linear Algebra with Numpy
    1. basics
    - 영벡터 : `.zeros()`
    - 일벡터 : `.ones()`
    - 대각행렬 : `.diag()`
    - 항등행렬 : `.eye()`
    - 행렬곱 : `@` / `.dot()`
  
    2. furthermore
    - 트레이스 : `.trace()`
    - 행렬식 : `.linalg.det()`
    - 역행렬 : `.linalg.inv()`
    - 고유값 : `.linalg.eig()`


## I. Numpy 시작하기

### Remind: 리스트

In [1]:
arr = [1, 'two', 3.0]

print(arr)

[1, 'two', 3.0]


#### 그러나, 리스트는 너무... 느리다.!
#### => 숫자 계산을 효율적으로 만들어 놓은 Numpy를 사용

### Numpy 모듈 불러오기

In [2]:
import numpy as np

### Numpy가 얼마나 빠른가 !?

### List

In [3]:
L = range(1000)

%timeit [i**2 for i in L] # 실행속도가 얼마나 걸리는지 알 수 있게 해주는 노트북 환경의 특수한 모듈

297 µs ± 53.7 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


### numpy.array

In [4]:
N = np.arange(1000)
%timeit N**2

1.61 µs ± 11.7 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


1.61 µs vs 11.7 ns -> 엄청나게 차이가 난다

### numpy.array

numpy의 Container, array (Container: 여러 자료를 담을 수 있는 자료형)

In [5]:
arr = np.array([1, 2, 3])

arr

array([1, 2, 3])

In [6]:
arr_2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

arr_2d

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [7]:
li = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]

li

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

출력할 때도 numpy.array가 list보다 보기 편하다

### numpy.array.shape

arry의 자료형의 차원을 반환

In [8]:
arr.shape

(3,)

In [9]:
arr_2d.shape

(3, 3)

## II. Numpy로 연산하기

### Vector와 Scalar 사이의 연산

벡터의 각 원소에 대해서 연산을 진행

$x = \left(\begin{matrix}1\\2\\3\end{matrix}\right) \ \ \ c = 5$

In [13]:
x = np.array([1, 2, 3])
c = 5

print("더하기: {}".format(x + c))
print("빼기: {}".format(x - c))
print("곱하기: {}".format(x * c))
print("나누기: {}".format(x / c))

더하기: [6 7 8]
빼기: [-4 -3 -2]
곱하기: [ 5 10 15]
나누기: [0.2 0.4 0.6]


### Vector와 Vector 사이의 연산

벡터와 같은 인덱스 끼리 연산이 진행

$y = \left(\begin{matrix}1\\3\\5\end{matrix}\right) \ \ \ z = \left(\begin{matrix}2\\9\\20\end{matrix}\right)$

In [15]:
y = np.array([1, 3, 5])
z = np.array([2, 9, 20])

print("더하기: {}".format(y + z))
print("빼기: {}".format(y - z))
print("곱하기: {}".format(y * z))
print("나누기: {}".format(y / z))

더하기: [ 3 12 25]
빼기: [ -1  -6 -15]
곱하기: [  2  27 100]
나누기: [0.5        0.33333333 0.25      ]


### Array indexing

python의 List와 유사하게 진행
[0][1] -> [0, 1]

$W = \left(\begin{matrix}1\ 2\ 3\ 4\\5\ 6\ 7\ 8\\9\ 10\ 11\ 12\end{matrix}\right)$

In [21]:
W = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])

print(W[0, 0])

print(W[2, 3])

# 7을 가져오려면?
print(W[1, 2])

1
12
7


### Array slicing
python의 list와 유사하게 진행
python: [:]

In [23]:
W[0:2, 1:3] # 행 idx, 열, idx

array([[2, 3],
       [6, 7]])

In [24]:
W[0:2,  0:4]

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

In [25]:
W[0:2]

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

In [26]:
W[0:2,  :]

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

In [27]:
W[0:3,  2:4]

array([[ 3,  4],
       [ 7,  8],
       [11, 12]])

In [30]:
W[:, 2:4]

array([[ 3,  4],
       [ 7,  8],
       [11, 12]])

In [31]:
W[1:,  :3]

array([[ 5,  6,  7],
       [ 9, 10, 11]])

### Array Broadcasting

- numpy가 연산을 진행하는 특수한 방법

- 기본적으로는 같은 Type의 data에 대해서만 연산이 적용가능하다

- 하지만 만약에 피연산자가 연산 가능하도록 변환이 가능하다면 연산이 가능하다.

- 이를 Broadcating이라고 한다.

#### 1. $M \times N, M \times 1$ 

In [38]:
A = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
x = np.array([0, 1, 0])

x = x[:, None] # N전치: 행벡터 -> 열벡터
print(A + x)

[[1 2 3]
 [5 6 7]
 [7 8 9]]


#### 2. $M \times N, 1 \times N$ 

In [40]:
y = np.array([0, 1, 0])

print(A * y)

[[0 2 0]
 [0 5 0]
 [0 8 0]]


#### 2. $M \times 1, 1 \times N$ 

In [42]:
t = np.array([1, 2, 3])
t = t[:, None]

u = np.array([2, 0, -2])

print(t + u)

[[ 3  1 -1]
 [ 4  2  0]
 [ 5  3  1]]




## III. Numpy로 선형대수 지식 끼얹기

### 영벡터(영행렬)

- 원소가 모두 0인 벡터(행렬)
- `np.zeros(dim)`을 통해 생성, dim은 값 혹은 튜플(,)

In [43]:
np.zeros(3)

array([0., 0., 0.])

In [44]:
np.zeros((3, 3))

array([[0., 0., 0.],
       [0., 0., 0.],
       [0., 0., 0.]])

### 일벡터(일행렬)

- 원소가 모두 1인 벡터(행렬)
- `np.ones(dim)`을 통해 생성, dim은 값, 튜플

In [45]:
np.ones(2)

array([1., 1.])

In [46]:
np.ones((2, 2))

array([[1., 1.],
       [1., 1.]])

### 대각행렬

- main diagonal을 제외한 성분이 0인 행렬
- `np.diag((main)diagonals))`를 통해 생성할 수 있음

In [48]:
np.diag((2, 4))

array([[2, 0],
       [0, 4]])

In [49]:
np.diag((2, 4, 6, 7))

array([[2, 0, 0, 0],
       [0, 4, 0, 0],
       [0, 0, 6, 0],
       [0, 0, 0, 7]])

### 항등행렬

- main diagonal이 1인 대각 행렬
- `np.eye(n, (dtype= int, uint, float, complex, ...))`를 사용

In [50]:
np.eye(2)

array([[1., 0.],
       [0., 1.]])

In [51]:
np.eye(2, dtype=int)

array([[1, 0],
       [0, 1]])

### 행렬 곱

- 행렬 간의 곱 연산
- `np.dot()` or `@` 사용

In [52]:
mat_1 = np.array([[1, 4], [2, 3]])
mat_2 = np.array([[7, 9], [0, 6]])

mat_1.dot(mat_2)

array([[ 7, 33],
       [14, 36]])

In [53]:
mat_1 @ mat_2

array([[ 7, 33],
       [14, 36]])

In [55]:
mat_3 = np.array([[1, 2, 3], [2, 4, 5], [1, 2, 4]])
mat_i = np.eye(3, dtype=int)

mat_3 @ mat_i

array([[1, 2, 3],
       [2, 4, 5],
       [1, 2, 4]])

### trace 트레이스

- main diagonal의 합
- `np.trace()`를 사용

In [57]:
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

arr

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [58]:
arr.trace()

15

In [59]:
arr1 = np.eye(3, dtype=int)
arr1.trace()

3

### 행렬식 (determinant)

- 행렬을 대표하는 값 들 중 하나 
- 선형변환 과정에서 Vector의 Scaling의 척도
- `np.linalg.det()`로 계산

In [60]:
arr_2 = np.array([[2, 3], [1, 6]])

arr_2

array([[2, 3],
       [1, 6]])

In [61]:
np.linalg.det(arr_2)

9.000000000000002

In [68]:
arr_3 = np.array([[1, 4, 7], [2, 5, 8], [3, 6, 9]])

arr_3

array([[1, 4, 7],
       [2, 5, 8],
       [3, 6, 9]])

In [69]:
np.linalg.det(arr_3)

0.0

### 역행렬

- 행렬 $A$에 대해 $AB = BA = I$를 만족하는 행렬 $B=A^{-1}$
- `np.linalg.inv()`로 계산

In [70]:
mat = np.array([[1, 4], [2, 3]])

mat

array([[1, 4],
       [2, 3]])

In [72]:
mat_inv = np.linalg.inv(mat)

mat_inv

array([[-0.6,  0.8],
       [ 0.4, -0.2]])

In [73]:
mat @ mat_inv

array([[1., 0.],
       [0., 1.]])

In [84]:
arr_4 = np.array([[1, 4, 2], [2, 5, 8], [3, 6, 9]])

arr_4

array([[1, 4, 2],
       [2, 5, 8],
       [3, 6, 9]])

In [86]:
arr_4_inv = np.linalg.inv(arr_4)

arr_4_inv

array([[-0.2       , -1.6       ,  1.46666667],
       [ 0.4       ,  0.2       , -0.26666667],
       [-0.2       ,  0.4       , -0.2       ]])

고유값과 고유벡터 (eigenvalue and eigenvector)

- 정방행렬 A에 대해 $Ax = \lambda x$를 만족하는 ($\lambda$)와 이에 대응하는 벡터를 각각 고유값과 고유벡터라고 한다.
- `np.linalg.eig()`로 계산

In [74]:
mat = np.array([[2, 0, -2], [1, 1, -2], [0, 0, 1]])

mat

array([[ 2,  0, -2],
       [ 1,  1, -2],
       [ 0,  0,  1]])

In [76]:
eig_val, eig_vec = np.linalg.eig(mat)

print(eig_val, eig_vec)

[1. 2. 1.] [[0.         0.70710678 0.89442719]
 [1.         0.70710678 0.        ]
 [0.         0.         0.4472136 ]]


#### validation

In [79]:
Ax = mat @ eig_vec[:, 1] # Ax
lambdax = eig_val[1] * eig_vec[:, 1] # lambda x

print(Ax, lambdax)

[1.41421356 1.41421356 0.        ] [1.41421356 1.41421356 0.        ]


In [78]:
eig_val[1] * eig_vec[:, 1] # lambda x

array([1.41421356, 1.41421356, 0.        ])

In [80]:
Ax = mat @ eig_vec[:, 0] # Ax
lambdax = eig_val[0] * eig_vec[:, 0] # lambda x

print(Ax, lambdax)

[0. 1. 0.] [0. 1. 0.]


In [81]:
Ax = mat @ eig_vec[:, 2] # Ax
lambdax = eig_val[2] * eig_vec[:, 2] # lambda x

print(Ax, lambdax)

[0.89442719 0.         0.4472136 ] [0.89442719 0.         0.4472136 ]


## IV. Exercises

### 1. 어떤 벡터가 주어졌을 때 L2 norm을 구하는 함수 `get_L2_norm()`을 작성하세요

- **매개변수** : 1차원 벡터 (`np.array`)
- **반환값** : 인자로 주어진 벡터의 L2 Norm값 (`number`)

In [88]:
def get_L2_norm(arr):
    return np.linalg.norm(arr)


get_L2_norm(arr)

16.881943016134134

### 2. 어떤 행렬이 singular matrix인지 확인하는 함수 `is_singular()` 를 작성하세요

- 매개변수 : 2차원 벡터(`np.array`)
- 반환값 : 인자로 주어진 벡터가 singular하면 True, non-singular하면 False를 반환 

In [93]:
def is_singular(arr):
    return True if np.linalg.det(arr) == 0 else False


print(is_singular(arr_3))
(is_singular(arr_4))

True


False

### SVD

In [100]:
A = np.array([[1, 1], [-2, 2], [-1, -1]])

U = np.array([[1/1.414, 0, 1/1.414], [0, 1, 0], [-1/1.414, 0, 1/1.414]])
D = np.array([[4, 0], [0, 1/1.414], [0, 0]])
Vt = np.array([[1/1.414, 1/1.414], [-1/1.414, 1/1.414]])

print('A:', A)
print('U:', U)
print('D:', D)
print('Vt:', Vt)

A: [[ 1  1]
 [-2  2]
 [-1 -1]]
U: [[ 0.70721358  0.          0.70721358]
 [ 0.          1.          0.        ]
 [-0.70721358  0.          0.70721358]]
D: [[4.         0.        ]
 [0.         0.70721358]
 [0.         0.        ]]
Vt: [[ 0.70721358  0.70721358]
 [-0.70721358  0.70721358]]


In [101]:
np.linalg.svd(A)

(array([[ 1.11022302e-16, -7.07106781e-01,  7.07106781e-01],
        [ 1.00000000e+00,  2.22044605e-16, -5.37546367e-17],
        [-1.11022302e-16,  7.07106781e-01,  7.07106781e-01]]),
 array([2.82842712, 2.        ]),
 array([[-0.70710678,  0.70710678],
        [-0.70710678, -0.70710678]]))