# Numpy

## Numpy 

- Numerical Python
- 파이썬의 **고성능 과학 계산용 패키지**
- **Matrix와 Vector와 같은 Array 연산의 사실상의 표준**
- 한글로 넘파이로 주로 통칭, 넘피/늄파이라고 부르기도 함

**특징**

- 일반 List에 비해 빠르고, 메모리 효율적
- 반복문 없이 데이터 배열에 대한 처리를 지원함
- 선형대수와 관련된 다양한 기능을 제공함
- C, C++, 포트란 등의 언어와 통합 가능

## ndarray 

In [1]:
import numpy as np

In [3]:
test_array = np.array([1,4,5,8],float) # 다이나믹 타이핑 지원 안함
print(test_array)
type(test_array[3])

[1. 4. 5. 8.]


numpy.float64

- numpy는 np.array 함수를 이용해서 배열을 생성함 ->ndarray
- numpy는 하나의 데이터 type만 배열에 넣을 수 있음
- List와 가장 큰 차이점, Dynamic typing not support 
- C의 Array를 사용하여 배열을 생성함

## array shape()

- shape : numpy array의 object의 dimenstion을 구성
- Array(vector, matrix, tensor)의 크기, 형태 등에 대한 정보

In [5]:
test_array.shape # Array(배열)의 shape을 tuple 타입으로 반환함

(4,)

In [7]:
matrix = [[1,2,5,8],[1,2,5,8],[1,2,5,8]]
np.array(matrix, int).shape # 3행 4열

(3, 4)

![image.png](attachment:image.png)
- 이미지 처리에서 많이 사용됨

![image.png](attachment:image.png)

## reshape
- Array의 shape의 크기를 변경함 

In [9]:
test_matrix = [[1,2,3,4],[1,2,5,8]] 
np.array(test_matrix).shape

(2, 4)

In [10]:
np.array(test_matrix).reshape(2,2,2)

array([[[1, 2],
        [3, 4]],

       [[1, 2],
        [5, 8]]])

In [11]:
np.array(test_matrix).reshape(-1,2).shape # -1 : size를 기반으로 row 개수 산정

(4, 2)

## flatten 
- 다차원 array를 1차원 array로 변환 
![image.png](attachment:image.png)

In [15]:
test_matrix = [[[1,2,3,4],[1,2,3,5],[1,2,3,6]]]

np.array(test_matrix).flatten() # 플랫하게 쫙 펴줌

array([1, 2, 3, 4, 1, 2, 3, 5, 1, 2, 3, 6])

## indexing 
- List와 달리 이차원 배열에서 [0,0]과 같은 표기법을 제공함
- Matrix일경우 앞은 row 뒤는 column을 의미함

In [19]:
a = np.array([[1,2,3],[4,5,6]],int)

print(a[0,0])# two dimensional array representation #1
print(a[0][0])# two dimensional array representation #2

1
1


In [21]:
a[0,0] = 12 # matrix 0,0에 12 할당
print(a)

[[12  2  3]
 [ 4  5  6]]


## slicing 
- List와 달리 행과 열 부분을 나눠서 slicing이 가능함
- Matrix의 부분 집합을 추출할 때 유용함

In [24]:
a = np.array([[1,2,3,4,5],[6,7,8,9,10]],int)
a

array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10]])

In [26]:
a[:,2:] # 전체 Row의 2열 이상

array([[ 3,  4,  5],
       [ 8,  9, 10]])

In [27]:
a[1,1:3] # 1 Row의 1열 ~ 2열

array([7, 8])

In [28]:
a[1:3] # 1 Row ~ 2 Row의 전체

array([[ 6,  7,  8,  9, 10]])

## arange 
- array의 범위를 지정하여, 값의 list를 생성하는 명령어 

In [29]:
np.arange(30) # range : List의 range와 같은 효과, integer로 0 부터 29까지 배열 추출

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29])

In [31]:
np.arange(0, 5, 0.5) # floating point도 표시 가능함

array([0. , 0.5, 1. , 1.5, 2. , 2.5, 3. , 3.5, 4. , 4.5])

In [32]:
np.arange(30).reshape(5,6)

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23],
       [24, 25, 26, 27, 28, 29]])

## ones, zeros and empty 
- zeros, 0으로 가득 찬 ndarray 생성 
- empty : shape만 주어지고 비어있는 ndarray 생성 (memory initialization이 되지 않음)

In [33]:
np.zeros(shape = (10,), dtype = np.int8) # zero vector 생성

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0], dtype=int8)

In [34]:
np.zeros((2,5)) # 2 by 5 -zero matrix 생성 

array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

In [35]:
np.empty(shape = (10,), dtype = np.int8)

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0], dtype=int8)

In [38]:
np.empty((3,5)) # 근데 실제로 잘 안 사용한다 함...ㅎ

array([[4.67296746e-307, 1.69121096e-306, 9.45698831e-308,
        8.34441742e-308, 1.78022342e-306],
       [6.23058028e-307, 9.79107872e-307, 6.89807188e-307,
        7.56594375e-307, 6.23060065e-307],
       [1.78021527e-306, 8.34454050e-308, 1.11261027e-306,
        2.04712907e-306, 3.49698923e-317]])

## identity 
- 단위 행렬을 생성함 

In [39]:
np.identity(n = 3, dtype = np.int8)

array([[1, 0, 0],
       [0, 1, 0],
       [0, 0, 1]], dtype=int8)

In [40]:
np.identity(5)

array([[1., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0.],
       [0., 0., 1., 0., 0.],
       [0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 1.]])

## eye 
- 대각선이 1인 행렬, K값의 시작 index의 변경이 가능 

In [41]:
np.eye(N = 3, M = 5, dtype= np.int8)

array([[1, 0, 0, 0, 0],
       [0, 1, 0, 0, 0],
       [0, 0, 1, 0, 0]], dtype=int8)

In [42]:
np.eye(3)

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

In [44]:
np.eye(3,5,k=2) # k : start

array([[0., 0., 1., 0., 0.],
       [0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 1.]])

## random sampling 
- 데이터 분포에 따른 sampling으로 array를 생성 

In [45]:
np.random.uniform(0,1,10).reshape(2,5) # 균등분포

array([[0.47553071, 0.23800448, 0.21793896, 0.23943755, 0.47800115],
       [0.4864563 , 0.65895455, 0.70434908, 0.79998245, 0.30447999]])

In [46]:
np.random.normal(0,1,10).reshape(2,5) # 정규분포

array([[-0.13057845,  0.10625501, -1.13057224, -0.21538323,  0.59210138],
       [ 1.65722063,  1.53279873, -1.33408522,  1.82115058,  0.53956748]])

## axis

![image.png](attachment:image.png)

## concatenate 
- Numpy array를 합치는 함수
![image.png](attachment:image.png)

- 축 값을 기준으로 붙이기 
![image.png](attachment:image.png)

## Operations b/t arrays
- Numpy는 array간의 기본적인 사칙 연산을 지원함

In [49]:
test_a = np.array([[1,2,3],[4,5,6]],float)

array([[ 2.,  4.,  6.],
       [ 8., 10., 12.]])

In [52]:
test_a + test_a # matrix + matrix 연산 

array([[ 2.,  4.,  6.],
       [ 8., 10., 12.]])

In [50]:
test_a - test_a # matrix - matrix 

array([[0., 0., 0.],
       [0., 0., 0.]])

In [51]:
test_a * test_a # matrix내 element들 간 같은 위치에 있는 값들끼리 연산

array([[ 1.,  4.,  9.],
       [16., 25., 36.]])

![image.png](attachment:image.png)
![image-2.png](attachment:image-2.png)

## broadcasting 
- shape이 다른 배열 간 연산을 지원하는 기능
![image.png](attachment:image.png)

## All & Any 
- Array의 데이터 전부 또는 일부가 조건에 만족 여부 반환

In [3]:
import numpy as np 

a = np.arange(10)
a

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [5]:
a>5 # Numpy에서 값을 비교할 때 사용, 브로드 캐스팅 

array([False, False, False, False, False, False,  True,  True,  True,
        True])

In [6]:
np.any(a>5), np.any(a<0) # 하나라도 조건에 충족한다면 True

(True, False)

In [7]:
np.all(a>5), np.all(a<10) # 모두가 조건에 충족한다면 True

(False, True)

## logical_and & not & or
- 그렇게 많이 사용하지는 않는다

In [8]:
a = np.array([1,3,0],float)

np.logical_and(a > 0, a < 3) # and 조건의 condition

array([ True, False, False])

In [10]:
b = np.array([True, False, True], bool)
np.logical_not(b) # Not 조건의 condition

array([False,  True, False])

In [11]:
c = np.array([False, True, False], bool)
np.logical_or(b,c) # Or 조건의 condition

array([ True,  True,  True])

## np.where 
- 자주 사용함
- 조건에 만족하는 index 값을 반환

In [12]:
a

array([1., 3., 0.])

In [13]:
np.where(a > 0, 3, 2) # True일 경우 3을, False일 경우 2를 반환

array([3, 3, 2])

In [15]:
np.where(a>0) # index값 반환 

(array([0, 1], dtype=int64),)

## argmax & argmin 
- array내 최대값 또는 최소값의 index를 반환함 

In [16]:
a = np.array([1,2,4,5,67,23,3])
np.argmax(a), np.argmin(a) # 최대값과 최소값 반환 

(4, 0)

- axis 기반의 반환 

In [21]:
a = np.array([[1,2,4,7],[9,88,6,45],[9,76,3,4]])
a

array([[ 1,  2,  4,  7],
       [ 9, 88,  6, 45],
       [ 9, 76,  3,  4]])

In [23]:
np.argmax(a, axis = 1), np.argmin(a, axis = 0)

(array([3, 1, 1], dtype=int64), array([0, 0, 2, 2], dtype=int64))

## boolen index 
- numpy는 배열의 특정 조건에 따른 값을 배열 형태로 추출 할 수 있음
- Comparison operation 함수들도 모두 사용 가능

In [24]:
test_array = np.array([1,4,0,3,4,8,9,7], float)
test_array > 3 

array([False,  True, False, False,  True,  True,  True,  True])

In [25]:
test_array[test_array>3] # 조건이 True인 index의 element만 추출

array([4., 4., 8., 9., 7.])

In [26]:
condition = test_array < 3 
test_array[condition]

array([1., 0.])

## fancy index 
- numpy는 array를 index value로 사용해서 값을 추출하는 방법
- Matrix 형태의 데이터도 가능하다

In [27]:
a = np.array([2,4,6,8], float)
b = np.array([0,0,1,3,2,1], int) # 반드시 int로 선언
a[b] # bracket index, b 배열의 값을 index로 하여 a의 값들을 추출함

array([2., 2., 4., 8., 6., 4.])

In [28]:
a.take(b) # take 함수 : bracket index와 같은 효과

array([2., 2., 4., 8., 6., 4.])

In [30]:
a = np.array([[1,4],[9,16]],float)
b = np.array([0,0,1,1,0],int)
c = np.array([0,1,1,1,1], int)
a[b,c] # b를 row_index, c를 column index로 변환하여 표시함

array([ 1.,  4., 16., 16.,  4.])

# 벡터가 뭔가요?

## 벡터가 뭔가요?
- 벡터는 숫자를 원소로 가지는 리스트 또는 배열입니다. 
![image.png](attachment:image.png)
- 벡터끼리 같은 모양을 가지면, 덧셈 뺄셈을 계산할 수 있습니다.
![image-2.png](attachment:image-2.png)
- 벡터끼리 같은 모양을 가지면 성분곱(Hadamard product)을 계산할 수 있습니다
![image-3.png](attachment:image-3.png)

- 벡터는 공간에서 한 점을 나타냅니다
![image-2.png](attachment:image-2.png)
- 벡터는 원점으로부터 상대적 위치를 표현합니다
![image-3.png](attachment:image-3.png)
- 벡터에 숫자를 곱해주면 길이만 변합니다.
![image-4.png](attachment:image-4.png)


- 두 벡터의 덧셈은 다른 벡터로부터 상대적 위치 이동을 표현합니다
![image.png](attachment:image.png)

- 두 벡터의 뺄셈은 덧셈의 반대 방향으로 움직인다고 이해하면 편하다
![image.png](attachment:image.png)

### 벡터의 노름 구해보기

![image.png](attachment:image.png)
![image-2.png](attachment:image-2.png)

![image.png](attachment:image.png)
![image-2.png](attachment:image-2.png)