# Numpy

## 개요
- C언어로 구현된 파이썬 라이브러리
- Numerical Python의 줄임 말로 벡터 및 행렬 연산에 특화된 기능 제공

## 배열 생성하기
- 배열(Array)이란 순서가 있는 같은 종류의 데이터가 저장된 집합을 의미
- numpy를 통해 배열을 생성할 수 있음

In [34]:
import numpy as np

### 1. 시퀀스 데이터로부터 배열 생성
- array(seq_data)
- 시퀀스 데이터를 인자로 받아 배열 객체를 생성
- 리스트와 튜플 타입의 데이터를 사용할 수 있음(주로 리스트 데이터를 많이 사용)

In [47]:
seq_data = [1, 2, 4, 5, 6]
arr_object = np.array(seq_data)
arr_object

array([1, 2, 4, 5, 6])

In [48]:
type(arr_object)

numpy.ndarray

### 2. 범위를 지정해 배열 생성
- arange(start, stop, step)
- linspace(start, stop, num)

In [49]:
arr_object1 = np.arange(1, 29, 2)
arr_object1

array([ 1,  3,  5,  7,  9, 11, 13, 15, 17, 19, 21, 23, 25, 27])

In [51]:
type(arr_object1)

numpy.ndarray

In [54]:
arr_object2 = np.linspace(1, 29, 6)
arr_object2

array([ 1. ,  6.6, 12.2, 17.8, 23.4, 29. ])

In [55]:
type(arr_object2)

numpy.ndarray

### 3. 특별한 형태의 배열 생성
- 다차원 배열(0): zeros()
- 다차원 배열(1): ones()
- 단위 행렬: eye()

In [56]:
arr_zero_1 = np.zeros(5)
arr_zero_1

array([0., 0., 0., 0., 0.])

In [57]:
arr_zero_2 = np.zeros((4,3))
arr_zero_2

array([[0., 0., 0.],
       [0., 0., 0.],
       [0., 0., 0.],
       [0., 0., 0.]])

In [58]:
arr_one_1 = np.ones(4)
arr_one_1

array([1., 1., 1., 1.])

In [115]:
arr_one_2 = np.ones((5,2))
arr_one_2

array([[1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.]])

In [66]:
arr_eye = np.eye(4)
arr_eye

array([[1., 0., 0., 0.],
       [0., 1., 0., 0.],
       [0., 0., 1., 0.],
       [0., 0., 0., 1.]])

### 4. 배열의 데이터 타입 변환

In [106]:
str_list = ["1", "2", "3"]
str_arr = np.array(str_list)
num_arr = str_arr.astype('i')
num_arr

array([1, 2, 3], dtype=int32)

### 5. 난수 배열의 생성
- random 모듈을 이용해 난수 생성
- randint(start, n): start와 n-1 사이의 랜덤 숫자
- rand(n, m): 0~1 균일분포 표준정규분포에서 난수 생성
- randn(n, m): 평균 0, 표준편차 1인 가우시안분포 표준정규분포에서 난수 생성

In [120]:
randint_num_1 = np.random.randint(4)
randint_num_1

2

In [121]:
randint_num_2 = np.random.randint(4, 23)
randint_num_2

21

In [109]:
rand_num_1 = np.random.rand(6)
rand_num_1

array([0.90496528, 0.45039959, 0.61587986, 0.11062912, 0.05531384,
       0.28519133])

In [113]:
rand_num_2 = np.random.rand(2, 4)
rand_num_2

array([[0.5391715 , 0.42965532, 0.97812414, 0.27951136],
       [0.10936237, 0.25163845, 0.24765675, 0.63662786]])

In [123]:
randn_num_1 = np.random.randn(4)
randn_num_1

array([ 0.08191006, -0.41997729,  1.00801298, -0.55025274])

In [124]:
randn_num_2 = np.random.randn(4,5)
randn_num_2

array([[-0.02936106, -0.32079719,  0.87915066, -2.18445511,  0.18476838],
       [ 0.81603994, -0.69108443,  0.20201081, -1.27613795, -0.09110036],
       [-1.40698778,  0.30895519,  0.97866733, -0.54436566, -0.54249686],
       [ 0.96269111, -0.40407336,  0.80352376, -0.9908727 ,  0.46655891]])

## 배열 연산

### 1. 기본 연산
- 배열의 형태가 같은 경우 연산이 가능

In [140]:
randn_num_2 * 4 >= 3

array([[False, False,  True, False, False],
       [ True, False, False, False, False],
       [False, False,  True, False, False],
       [ True, False,  True, False, False]])

### 2. 통계를 위한 연산
- 배열의 합, 평균, 표준편차, 분산, 최소값, 최대값, 누적합, 누적곱 등

In [148]:
np.sum(randn_num_2)

-2.8793663476648845

In [149]:
np.mean(randn_num_2)

-0.14396831738324423

In [153]:
np.std(randn_num_2)

0.8558031203297823

In [154]:
np.var(randn_num_2)

0.7323989807661919

In [155]:
np.min(randn_num_2)

-2.1844551136756607

In [156]:
np.max(randn_num_2)

0.9786673258481213

In [157]:
np.cumsum(randn_num_2)

array([-0.02936106, -0.35015825,  0.52899241, -1.65546271, -1.47069432,
       -0.65465438, -1.34573881, -1.143728  , -2.41986595, -2.51096631,
       -3.91795409, -3.60899889, -2.63033157, -3.17469722, -3.71719408,
       -2.75450297, -3.15857633, -2.35505257, -3.34592526, -2.87936635])

In [159]:
np.cumprod(randn_num_2)

array([-2.93610636e-02,  9.41894663e-03,  8.28067315e-03, -1.80887588e-02,
       -3.34223069e-03, -2.72739374e-03,  1.88485935e-03,  3.80761956e-04,
       -4.85904781e-04,  4.42660985e-05, -6.22818597e-05, -1.92423041e-05,
       -1.88318143e-05,  1.02513929e-05, -5.56134844e-06, -5.35386069e-06,
        2.16335246e-06,  1.73830511e-06, -1.72243907e-06, -8.03619304e-07])

### 3. 행렬 연산
- 단순 연산 뿐만 아니라 선형대수를 위한 행렬 연산도 지원함

In [162]:
arr_1 = np.array([[1, 3], [3, 5], [2, 3]])
arr_2 = np.array([[4, 3, 3], [2, 5, 5]])

In [166]:
# 행렬곱
np.dot(arr_1, arr_2)

array([[10, 18, 18],
       [22, 34, 34],
       [14, 21, 21]])

In [167]:
# 전치행렬
np.transpose(arr_1)

array([[1, 3, 2],
       [3, 5, 3]])

In [170]:
# 역행렬
arr_3 = np.array([[2, 3], [3, 2]])
np.linalg.inv(arr_3)

array([[-0.4,  0.6],
       [ 0.6, -0.4]])

In [171]:
# 행렬식
np.linalg.det(arr_3)

-5.000000000000001

## 배열의 인덱싱과 슬라이싱

### 1. 배열의 인덱싱
- 배열의 위치나 조건을 지정해 배열의 원소를 선택하는 것

In [183]:
arr_3[0, 1]

3

In [176]:
arr_3[[0, 1], [0, 1]]

array([2, 2])

In [204]:
arr_3[[False, True]]

array([[3, 2]])

### 2. 배열의 슬라이싱
- 범위를 지정해 배열의 일부분을 선택하는 방법

In [207]:
arr_3[0:1]

array([[2, 3]])

In [216]:
arr_3[0:1, 0:2]

array([[2, 3]])

In [217]:
arr_3[0, 0:2]

array([2, 3])