# 06장 Numpy
---
- Dates : Aug 27, 2024  
- Author : JaeEun Yoo
---

## Numpy란?
- Numerical Python의 줄임말로, NumPy는 파이썬의 고성능 수치계산을 위한 라이브러리
- 여러 형태의 벡터 및 행렬연산과 나아가 여러 수학적인 기능들을 빠르고 간편하게 사용할 수 있는 기능들을 제공

**NumPy 공식 사이트에 소개된 NumPy의 장점!**

* POWERFUL N-DIMENSIONAL ARRAY
   * NumPy에서 배열 및 벡터를 표현하는 핵심 구조인 ndarray를 사용하여 빠르고 메모리를 효율적으로 사용할 수 있음
* NUMERICAL COMPUTING TOOLS
   * 반복문을 작성할 필요 없이 **전체 데이터 배열에 대해 빠른 연산을 제공**하는 다양한 표준 수학 함수를 제공
* PERFORMANT
   * 최적화하여 컴파일된 C/C++ 코드를 사용하여 빠른 연산 가능

## Numpy Array
행렬 및 벡터 연산을 위해선 **다차원 array**를 사용

* **array(배열)**
   * 번호와 번호에 대응하는 데이터들로 이루어진 자료 구조.
   * 일반적으로 배열에는 같은 종류의 데이터들이 순차적으로 저장
   * 값의 번호가 곧 배열의 시작점으로부터 값이 저장되어 있는 상대적인 위치
 
     
NumPy에선 이러한 다차원 array형태인 핵심적인 객체를 ndarray라고 부르며,  
아래와 같은 속성들을 가짐.  

- ndarray.ndim
- ndarray.shape
- ndarray.size
- ndarray.dtype
- ndarray.itemsize
- ndarray.data


In [None]:
import numpy as np

---
## Numpy 다루기
### 기본 배열 만들기

In [None]:
a = np.array([1, 2, 3])

![numpy array 01](./figures/numpy_01.png)

In [None]:
a.shape

In [None]:
len(a)

In [None]:
a = [[1,2,3], [4,5,6]]
b = np.array(a) 

In [None]:
b

### built-in method를 활용한 다양한 배열 만들기

In [None]:
# 원소가 0으로 구성된 배열
np.zeros(2)

In [None]:
# 원소가 1로 구성된 배열
np.ones(3)

In [None]:
# 원소가 0부터 입력된 길이까지 1씩 증가하는 정수로 구성된 배열
np.arange(4)

In [None]:
# x번째 인자 ~ y번째 인자까지 범위 내에서 z번째 인자 갯수만큼 선형 간격(일정한 간격)을 가진 숫자들을 배열로 반환
np.linspace(0, 10, num=5)

In [None]:
c = np.random.randn(2, 3)

In [None]:
c

![numpy array 02](./figures/numpy_02.png)

---
## Numpy의 기본 연산
- 배열의 기본 산술연산은 element-wise하게 적용

In [None]:
a = np.array([1, 2, 3])
b = np.array([10, 20, 30])
a+b

In [None]:
2*(a+b)

In [None]:
b-a

In [None]:
A = np.array([[1, 1],
              [0, 1]])
B = np.array([[2, 0],
              [3, 4]])
A*B

In [None]:
A/B

In [None]:
A-b

In [None]:
a*B

## 브로드캐스팅 (BroadCasting)
- 넘파이에서 서로 다른 모양(shape)의 배열도 일정 조건을 만족하면 연산할 수 있음


### 브로드캐스팅이 가능한 조건
1. **원소가 하나인 배열**은 어떤 배열이나 브로드캐스팅이 가능

2. 하나의 배열이 1차원 배열인 경우, 브로드캐스팅이 가능  
2-1. 두 배열이 모두 2차원 배열이면, 브로드캐스팅이 불가  



In [None]:
arr1.shape = (3, )  
arr2.shape = (3, 3)  
np.add(arr1, arr2) # 가능

3. 차원의 짝이 맞을때 브로드캐스팅이 가능

In [None]:
arr1.shape = (4, 1)
arr2.shape = (1, 4)
np.add(arr1, arr2) # 가능

In [None]:
arr1 = np.array([[0, 0, 0], 
                 [1, 1, 1],
                 [2, 2, 2]])
                 
arr2 = np.array([5, 6, 7])

arr1 + arr2

![numpy array 02](./figures/numpy_03.png)

In [None]:
arr3 = np.array([1, 1, 1])

arr4 = np.array([[0],
                 [1],
                 [2]])

arr3 + arr4

![numpy array 02](./figures/numpy_04.png)

---
## Numpy의 인덱싱 / 슬라이싱 (Indexing / Slicing)
### 1차원 배열에서의 접근
- **1차원 배열**의 경우 기존 Python의 리스트와 동일한 방식으로 인덱싱, 슬라이싱이 가능함

![numpy array 02](./figures/numpy_05.png)

### 인덱싱 (Indexing)

In [None]:
arr = np.arange(10)
arr

In [None]:
arr[5]

In [None]:
arr[5:8]

In [None]:
arr[5:8] = 10
arr

### 고차원 배열에서의 접근
- 2차원 배열 생성 시, 각 인덱스에 해당하는 원소는 스칼라가 아니고 **1차원 벡터**가 됨

In [None]:
arr2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
arr2d[0]

In [None]:
arr2d[0][1]

In [None]:
arr2d[0, 1]

- 2차원 배열 인덱스에서 첫번째 성분은 행, 두번째 성분은 열을 의미

In [None]:
arr3d = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])
arr3d

In [None]:
arr3d[0]

In [None]:
arr3d[0, 1]

### 슬라이싱 (Slicing)

In [None]:
lst = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]
arr = np.array(lst)

In [None]:
arr

In [None]:
a = arr[0:2, 0:2]

In [None]:
a

In [None]:
arr[1:, 1:]

![numpy array 02](./figures/numpy_06.png)

### 논리 인덱싱
- 비교 연산자를 활용한 논리 인덱싱

In [None]:
names = np.array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'])

In [None]:
names == 'Bob'

In [None]:
names != 'Bob'

In [None]:
mask = (names == 'Bob') | (names == 'Will')
mask

In [None]:
mask = (names == 'Bob') & (names == 'Joe')
mask

### 배열에서 특정 조건을 충족하는 값 선택하기

In [None]:
a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])

In [None]:
a

In [None]:
a[a>5]

## 예제 풀어보기 (Exercise)

## <Question 01>

> **0으로 채워진 길이가 10인 1차원 배열을 만들되, 7번째 인덱스는 1로 구성하세요.** 

a = array([0, 0, 0, 0, 0, 0, 0, 1, 0, 0])


## <Question 02>

> **20부터 40까지 구성된 1차원 배열을 생성하세요.** 

b = array([20, 21, 22, ..., 39, 40])
  
  
  


## <Question 03>

> **무작위 원소를 가진 3x3x3의 array를 생성하세요.**

c = array(

    [[[0.92842722, 0.92574424, 0.07725618],  
        [0.75726719, 0.75362092, 0.22836732],  
        [0.12551308, 0.9106576 , 0.17518133]],  
   
       [[0.06029213, 0.99286814, 0.80926844],  
        [0.42243376, 0.95335137, 0.18474632],  
        [0.04488715, 0.89688706, 0.37775391]],  
   
       [[0.94077574, 0.91818125, 0.35818829],  
        [0.76793943, 0.12810186, 0.99508023],  
        [0.4833759 , 0.59272653, 0.01835418]]])  

  
  
  


---
## Numpy의 속성 알아보기
### Numpy 속성 요약

![numpy array 02](./figures/numpy_07.png)

In [None]:
arr = np.array([[1,2,3,4],
                [5,6,7,8],
                [9,10,11,12]])

In [None]:
arr

### 배열의 차원의 개수 : ndarray.ndim

In [None]:
arr.ndim

### 배열의 모양 (각 차원별 배열의 크기) : ndarray.shape (매우 중요)

In [None]:
arr.shape

### 배열의 모든 원소의 개수 : ndarray.size

In [None]:
arr.size

### 배열에 저장된 원소의 데이터 타입 : ndarray.dtype

In [None]:
arr.dtype

### 각 원소의 크기 (byte) : ndarray.itemsize

In [None]:
arr.itemsize

---
## Numpy의 내장 함수 (Built-in method)
### 자주 사용되는 내장함수

In [None]:
arr1 = np.array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

In [None]:
arr1

In [None]:
arr1.max()

In [None]:
arr1.min()

In [None]:
arr1.sum()

In [None]:
arr2 = np.array([[ 0.1,  2,  0.3,  4],
       [ 5,  0.6,  7,  8],
       [ 9, 10, 0.11, 0.12]])

In [None]:
np.add(arr1,arr2)

In [None]:
np.subtract(arr1,arr2)

In [None]:
np.multiply(arr1,arr2)

In [None]:
np.sqrt(arr1)

In [None]:
np.sqrt(4)

In [None]:
arr1.shape

In [None]:
a = np.array([1, 2, 3, 4, 5, 6])


In [None]:
a.shape

In [None]:
b = np.expand_dims(a, axis=1)

In [None]:
b.shape

In [None]:
c = np.expand_dims(a, axis=0)

In [None]:
c.shape

### Numpy 수학 함수

- sum(), mean() : 배열 전체 합, 평균
- cumsum(), cumprod() : 배열 누적 합, 누적 곱
- std(), var() : 표준편차, 분산
- min(), max() : 최소값, 최대값
- argmin(), argmax(): 최소 원소의 색인 값, 최대 원소의 색인 값

### Numpy 랜덤 함수
- seed() : 난수 발생기의 seed를 지정
- permutation() : 임의의 순열을 반환
- shuffle() : 리스트나 배열의 순서를 뒤섞음
- rand() : 균등분포에서 표본을 추출
- randint() : 주어진 최소/최대 범위 안에서 임의의 난수를 추출
- randn() : 표준편차가 1이고 평균값이 0인 정규분포에서 표본을 추출
- binomial() : 이항분포에서 표본을 추출
- normal() : 정규분포(가우시안)에서 표본을 추출
- beta() : 베타분포에서 표본을 추출
- chisquare() : 카이제곱분포에서 표본을 추출
- gamma() : 감마분포에서 표본을 추출
- uniform() : 균등(0,1)에서 표본을 추출