## 1. Numpy 시작하기

### numpy 모듈 불러오기

In [2]:
import numpy as np

### 왜 numpy?

**LIST**

In [5]:
L = range(1000)

%timeit [i**2 for i in L]

408 µs ± 6.24 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


**NUMPY.array**

In [7]:
N = np.arange(1000)

In [8]:
%timeit N ** 2

2.55 µs ± 29.3 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


numpy의 container, array

In [10]:
arr = np.array([1, 2, 3])

arr

array([1, 2, 3])

In [11]:
arr_2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

arr_2d

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [12]:
arr.shape

(3,)

In [13]:
arr_2d.shape

(3, 3)

## 선형대수 Numpy 활용하기

#### 원소가 모두 0인 0벡터(행렬)

- 'np.zeros(dim)'
   dim은 값 혹은 튜플 ( , ) 형태
   
   ex. np.zeros(3, 3) < 오류 발생
       np.zeros((3, 3)) < 컨테이너로 출력해야 함

In [14]:
np.zeros(2)

array([0., 0.])

In [15]:
np.zeros((1, 2, 3))

array([[[0., 0., 0.],
        [0., 0., 0.]]])

#### 원소가 모두 1인 1벡터(행렬)

- np.ones(dim)

In [16]:
np.ones(2)

array([1., 1.])

In [17]:
np.ones((3, 3))

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

In [18]:
np.ones((4, 2, 3))

array([[[1., 1., 1.],
        [1., 1., 1.]],

       [[1., 1., 1.],
        [1., 1., 1.]],

       [[1., 1., 1.],
        [1., 1., 1.]],

       [[1., 1., 1.],
        [1., 1., 1.]]])

#### 대각행렬

- main diagonal을 제외한 성분이 0인 행렬
- np.diag(main_diagonal)을 통해 생성

In [21]:
np.diag((2, 3))

array([[2, 0],
       [0, 3]])

In [20]:
np.diag((3, 5, 7))

array([[3, 0, 0],
       [0, 5, 0],
       [0, 0, 7]])

#### 항등행렬

- main diagonal이 1인 대각행렬
- `np.eye()`

In [23]:
np.eye(3, dtype = int)

array([[1, 0, 0],
       [0, 1, 0],
       [0, 0, 1]])

In [24]:
np.eye(5, dtype = complex)

array([[1.+0.j, 0.+0.j, 0.+0.j, 0.+0.j, 0.+0.j],
       [0.+0.j, 1.+0.j, 0.+0.j, 0.+0.j, 0.+0.j],
       [0.+0.j, 0.+0.j, 1.+0.j, 0.+0.j, 0.+0.j],
       [0.+0.j, 0.+0.j, 0.+0.j, 1.+0.j, 0.+0.j],
       [0.+0.j, 0.+0.j, 0.+0.j, 0.+0.j, 1.+0.j]])

#### 행렬곱

- 행렬간의 곱연산
- `np.dot()` or @ 사용

In [25]:
mat_1 = np.array([[1, 2], [3, 4]])
mat_2 = np.array([[9, 2], [5, 0]])

mat_1.dot(mat_2)

array([[19,  2],
       [47,  6]])

In [26]:
mat_1 = np.array([[1, 2], [3, 4]])
mat_2 = np.array([[9, 2], [5, 0]])

mat_1 @ mat_2

array([[19,  2],
       [47,  6]])

#### 트레이스

- main diagonal의 합
- `np.trace()` 사용

In [27]:
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

arr

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [28]:
arr.trace()

15

In [29]:
np.eye(2, dtype = int).trace()

2

#### 행렬식

- 행렬을 대표하는 값들 중 하나
- 선형변환 과정에서 vector의 scaling 척도
- `np.linalg.det()`

In [38]:
arr_2 = np.array([[1, 2], [3, 6]])
                   
arr_2

array([[1, 2],
       [3, 6]])

In [39]:
np.linalg.det(arr_2)

0.0

0이라는 것은 full rank가 아니다! 차원의 손실이 일어난다 = 원소간에 종속관계 존재한다

In [37]:
arr_3 = np.array([[1, 5, 7], [2, 4, 6], [9, 5, 4]])

arr_3

array([[1, 5, 7],
       [2, 4, 6],
       [9, 5, 4]])

In [40]:
np.linalg.det(arr_3)

34.000000000000036

#### 역행렬

- 행렬 A에 대하여 AB=BA=I 를 만족하는 행렬 B=A^-1 행렬 B
- `np.linalg.inv()`

In [130]:
mat = np.array([[1, 2], [4, 5]])

mat

array([[1, 2],
       [4, 5]])

In [131]:
mat_inv = np.linalg.inv(mat)

In [132]:
mat_inv

array([[-1.66666667,  0.66666667],
       [ 1.33333333, -0.33333333]])

In [44]:
mat@mat_inv

array([[1.00000000e+00, 0.00000000e+00],
       [2.22044605e-16, 1.00000000e+00]])

#### 고유값과 고유벡터

- 정방행렬 A에 대하여 Ax = (/lamda)x를 만족하는 상수 (/lamda)와 x를 각각 고유값과 고유벡터라고 한다.
- `np.linalg.eig()`

In [45]:
mat = np.array([[2, 0, -2], [1, 1, -2], [0, 0, 1]])

mat

array([[ 2,  0, -2],
       [ 1,  1, -2],
       [ 0,  0,  1]])

In [46]:
np.linalg.eig(mat)

(array([1., 2., 1.]),
 array([[0.        , 0.70710678, 0.89442719],
        [1.        , 0.70710678, 0.        ],
        [0.        , 0.        , 0.4472136 ]]))

검증하기

In [47]:
eig_val, eig_vec = np.linalg.eig(mat)

eig_val

array([1., 2., 1.])

In [48]:
eig_vec

array([[0.        , 0.70710678, 0.89442719],
       [1.        , 0.70710678, 0.        ],
       [0.        , 0.        , 0.4472136 ]])

In [49]:
mat @ eig_vec[:, 0]  #Ax에 대한 값

array([0., 1., 0.])

In [51]:
eig_val[0] * eig_vec[:, 0]  #람다x 값

array([0., 1., 0.])

Ax는 [lamda]x를 만족하는 x와 lamda를 구한 것을 확인

## 연습

1. 어떤 벡터가 주어졌을 때 L2 norm을 구하는 함수 `get_L2_norm()`을 작성하세요.

- 매개변수: 1차원 벡터 (`np.array`)
- 반항값: 인자로 주어진 벡터의 L2 Norm값 (`number`)

2. 어떤 행렬이 singular matrix인지 확인하는 함수 `is_singular()`를 작성하세요

- 매개변수: 2차원 벡터(`np.array`)
- 반항값: 인자로 주어진 벡터가 singular 하면 True, non이면 False로 변환

### numpy로 연산

#### vector와 scalar 사이의 연산

x = 1 2 3  
c = 5

In [54]:
x = np.array([1, 2, 3])
c = 5

print("더하기 : {}".format(x + c))
print("빼기 : {}".format(x - c))
print("곱하기 : {}".format(x * c))
print("나누기 : {}".format(x / c))

더하기 : [6 7 8]
빼기 : [-4 -3 -2]
곱하기 : [ 5 10 15]
나누기 : [0.2 0.4 0.6]


### vector과 vector 사이의 연산

벡터의 **같은 인덱스**끼리 연산 진행

y = 1 3 5
z = 2 9 20

In [55]:
y = np.array([1, 3, 5])

z = np.array([2, 9, 20])

print("더하기 : {}".format(y + z))
print("빼기 : {}".format(y - z))
print("곱하기 : {}".format(y * z))
print("나누기 : {}".format(y / z))

더하기 : [ 3 12 25]
빼기 : [ -1  -6 -15]
곱하기 : [  2  27 100]
나누기 : [0.5        0.33333333 0.25      ]


array의 indexing

- array에서 특정 위치의 원하는 원소를 가지고 오고 싶다면?

In [72]:
W = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])

W[0, 0]

1

In [73]:
W[2, 3]

12

In [77]:
W[1, 2]

7

array의 slicing

array에서 특정 범위의 원하는 원소들을 가지고 오고 싶다면?

In [79]:
W = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])

#2, 3 -> 행 : 인덱스 0~1 -> [0:2]  
#6, 7 -> 열: 인덱스 1~2 -> [1:3]
    
W[0:2, 1:3]

array([[2, 3],
       [6, 7]])

[a:b]

[:b] ~ 맨 처음부터 B까지 (~B~1)
[A:] ~ A부터 끝까지
[:] ~ 처음부터 끝까지

In [80]:
W[0:2, 0:4]

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

In [81]:
W[0:2]

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

In [82]:
W[0:2, :]

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

In [83]:
W[0:2,2:4]

array([[3, 4],
       [7, 8]])

In [84]:
W[:, 2:4]

array([[ 3,  4],
       [ 7,  8],
       [11, 12]])

### Array의 broadcasting

numpy가 연산을 진행하는 특수한 방법

: 기본적으로 같은 타입의 데이터에 대해서만 연산 적용 가능  
하지만 만약에 피연산자가 연산 가능하도록 변환이 가능하다면 연산이 가능하다.  
이를 브로드캐스팅이라고 한다.

1. M X N, M X 1
2. M X N, 1 X N
3. M X 1, 1 X N

## 1. M by N, M by 1

In [89]:
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
x = np.array([0, 1, 0])

x = x[:, None] #x를 전치

print(a+x)

[[1 2 3]
 [5 6 7]
 [7 8 9]]


## 2. M by N, 1 by N

In [93]:
y = np.array([0, 1, -1])

print(a * y)

[[ 0  2 -3]
 [ 0  5 -6]
 [ 0  8 -9]]


## 3. M by 1, 1 by N

In [94]:
t = np.array([1, 2, 3]) #열벡터로 바꿔주기
t = t[:, None]

u = np.array([2, 0, -2])

print(t + u)

[[ 3  1 -1]
 [ 4  2  0]
 [ 5  3  1]]


# 연습

- 강의 순서를 반대로 들어서 노트북 끝에 연습 문제 다시 적었습니다!

### 1. 어떤 벡터가 주어졌을 때 L2 norm을 구하는 함수 get_L2_norm()을 작성하세요.
매개변수: 1차원 벡터 (np.array)  
반항값: 인자로 주어진 벡터의 L2 Norm값 (number)

### 2. 어떤 행렬이 singular matrix인지 확인하는 함수 is_singular()를 작성하세요
매개변수: 2차원 벡터(np.array)  
반항값: 인자로 주어진 벡터가 singular 하면 True, non이면 False로 변환

1번!

#### L2 norm이란?

- norm: 벡터의 길이 또는 크기를 측정하는 방법
- L2: norm의 차수가 2이고, n차원 좌표평면(유클리드 공간)에서의 벡터의 크기를 계산

In [10]:
import numpy as np

In [16]:
a = np.array([1, 2])

a

array([1, 2])

In [17]:
np.ndim(a)   #1차원 벡터인지 확인

1

In [18]:
l2 = np.linalg.norm(a)

l2

2.23606797749979

2번!

In [175]:
arr = np.array([[1,2], [2,4]])    #배열 생성  
a = np.linalg.det(arr)         #행렬식 계산(0이면 특이행렬)
a = int(a)                   #a 정수 취급

if a == 0 :             
    print("True")
else :
    print("False")

True
