# Numpy
- Numpy는 C언어로 구현된 파이썬 라이브러리, 고성능의 수치계산을 위해 제작됨
- Numpy는 벡터 및 행렬 연산에 있어서 매우 편리한 기능을 제공
- 데이터분석을 할 때 사용되는 라이브러리인 pandas와 matplotlib의 기반으로 사용
- 기본적으로 array(행렬) 단위로 데이터를 관리하며 이에 대해 연산을 수행함

In [None]:
#!pip install numpy
import numpy as np

---

## 1. Arrary 정의 및 사용

In [None]:
list1 = [1, 2, 3, 4, 5]
list1

[1, 2, 3, 4, 5]

In [None]:
list2 = [1, 2, 3.5, 4, 5]
list2

[1, 2, 3.5, 4, 5]

In [None]:
# 파이썬의 리스트를 np.array()를 이용하여 사용할 수 있음
array1 = np.array(list1)
array1

array([1, 2, 3, 4, 5])

In [None]:
# 직접 리스트를 넣어서도 배열 생성 가능
array2 = np.array([1, 2, 3.5, 4, 5])
array2

array([1. , 2. , 3.5, 4. , 5. ])

In [None]:
array3 = np.array([[1, 2, 3],[4, 5, 6],[7, 8, 9],[10, 11, 12]])
array3

array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])

#### shape

In [None]:
# .shape를 통해 배열의 차원(shape)를 알 수 있음
array1.shape

(5,)

In [None]:
array2.shape

(3, 5)

In [None]:
array3.shape

(4, 3)

#### dtype

In [None]:
# .dtype를 통해 자료형을 알 수 있음
print(array1.dtype)
print(array2.dtype)
print(array3.dtype)

int32
float64
int32


### 질문! array1과 array3의 차원 수는?
- array1.shape : (5,)
- array3.shape : (4, 3)

In [None]:
print(array1.ndim)
print(array3.ndim)

1
2


#### zeros

In [None]:
# zeros는 입력받는 형태만큼 인자가 0으로 채워진 행렬을 만든다
np.zeros(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [None]:
np.zeros((3,5))

array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

#### ones

In [None]:
# ones는 입력받는 형태만큼 인자가 1으로 채워진 행렬을 만든다
np.ones(10)

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

In [None]:
np.ones((3,5))

array([[1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.]])

#### arange

In [None]:
# arange는 파이썬 range와 비슷한 개념
# 한자리수(n)만 입력하면 0부터 n-1까지 1씩 늘어남
np.arange(10)

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [None]:
# 두개의 숫자(first, end)를 입력하면 first부터 end-1까지 1씩 늘어남
np.arange(1,27)

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
       18, 19, 20, 21, 22, 23, 24, 25, 26])

In [None]:
# 3번째 자리에 늘어나는 간격을 설정하여 사용 가능
np.arange(1,27, 0.3)

array([ 1. ,  1.3,  1.6,  1.9,  2.2,  2.5,  2.8,  3.1,  3.4,  3.7,  4. ,
        4.3,  4.6,  4.9,  5.2,  5.5,  5.8,  6.1,  6.4,  6.7,  7. ,  7.3,
        7.6,  7.9,  8.2,  8.5,  8.8,  9.1,  9.4,  9.7, 10. , 10.3, 10.6,
       10.9, 11.2, 11.5, 11.8, 12.1, 12.4, 12.7, 13. , 13.3, 13.6, 13.9,
       14.2, 14.5, 14.8, 15.1, 15.4, 15.7, 16. , 16.3, 16.6, 16.9, 17.2,
       17.5, 17.8, 18.1, 18.4, 18.7, 19. , 19.3, 19.6, 19.9, 20.2, 20.5,
       20.8, 21.1, 21.4, 21.7, 22. , 22.3, 22.6, 22.9, 23.2, 23.5, 23.8,
       24.1, 24.4, 24.7, 25. , 25.3, 25.6, 25.9, 26.2, 26.5, 26.8])

---

## 2. Array 연산

#### !  원칙적으로 shape가 같아야 연산 가능 !

각 array의 같은 자리에 있는 값들끼리 연산하기 때문이다.

In [None]:
array1_ = np.array([[1,2,3],[4,5,6]])
array1_

array([[1, 2, 3],
       [4, 5, 6]])

In [None]:
array1_.shape

(2, 3)

In [None]:
array2_ = np.array([[10,11,12],[13,14,15]])
array2_

array([[10, 11, 12],
       [13, 14, 15]])

In [None]:
array2_.shape

(2, 3)

#### 덧셈

In [None]:
array1_ + array2_

array([[11, 13, 15],
       [17, 19, 21]])

#### 뺄셈

In [None]:
array1_ - array2_

array([[-9, -9, -9],
       [-9, -9, -9]])

#### 곱셈
##### (주의 : 그냥 같은 자리끼리 곱해짐 )

In [None]:
array1_ * array2_

array([[10, 22, 36],
       [52, 70, 90]])

##### 참고 : 생각하고 계신 행렬의 곱(내적곱)을 하려면 .dot 이용
- (2, 3) * (3, 4) : 가능 
- (2, 3) * (2, 3) : 불가능 

In [None]:
a = np.arange(1, 11)
b = np.arange(11, 21)
print(a * b)
print(a.dot(b))

[ 11  24  39  56  75  96 119 144 171 200]
935


#### 나눗셈

In [None]:
array1_ / array2_

array([[0.1       , 0.18181818, 0.25      ],
       [0.30769231, 0.35714286, 0.4       ]])

#### ! 원칙적으로 shape가 같아야 연산 가능하지만 브로드캐스팅이 가능하다!
- 넘파이에서 브로드캐스팅이란 서로 크기가 다른 array가 연산이 가능하게 하는 것


In [None]:
array1_

array([[1, 2, 3],
       [4, 5, 6]])

In [None]:
array1_.shape

(2, 3)

In [None]:
array3_ = np.array([10, 11, 12])
array3_

array([10, 11, 12])

In [None]:
array3_.shape

(3,)

#### 연산

In [None]:
array1_ + array3_

array([[11, 13, 15],
       [14, 16, 18]])

In [None]:
array1_ * array3_

array([[10, 22, 36],
       [40, 55, 72]])

In [None]:
# 스칼라와도 가능
array1_ * 10

array([[10, 20, 30],
       [40, 50, 60]])

---

## 3. Array 인덱싱

#### 1차원 데이터 인덱싱

In [None]:
arr1 = np.arange(10)
arr1

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [None]:
# 0번째 요소
arr1[0]

0

In [None]:
# 3번째 요소
arr1[3]

3

In [None]:
# 3번째 요소부터 8번째 요소
arr1[3:9]

array([3, 4, 5, 6, 7, 8])

In [None]:
# 전체
arr1[:]

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

#### 2차원 데이터 인덱싱

In [None]:
arr2 = np.array([[1,2,3,4],
                 [5,6,7,8],
                 [9,10,11,12]])
arr2

array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

In [None]:
# 2차원의 array를 인덱싱을 하기 위해선 2개의 인자 입력
arr2[0,0]

1

In [None]:
# 2번째 array의 전체 불러오기
arr2[2,:]

array([ 9, 10, 11, 12])

In [None]:
# 2번째 array의 3번째 값 불러오기
arr2[2,3]

12

In [None]:
# 모든 array의 3번째 값들만 불러오기
arr2[:,3]

array([ 4,  8, 12])

#### 필터링을 통한 인덱싱

In [None]:
arr1

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [None]:
# boolean으로 확인하기

arr1 > 5

array([False, False, False, False, False, False,  True,  True,  True,
        True])

In [None]:
# 조건에 맞는 (= 필터링된) 값 불러오기

arr1[arr1 > 5]

array([6, 7, 8, 9])

In [None]:
# 조건에 맞는 값들의 인덱스값만 반환
np.where(arr1 > 5)

(array([6, 7, 8, 9], dtype=int64),)

In [None]:
np.where(arr1 > 5, 'O', 'X')

array(['X', 'X', 'X', 'X', 'X', 'X', 'O', 'O', 'O', 'O'], dtype='<U1')

---

## 4. 자주 쓰이는 Numpy 함수

#### concatenate - 결합
(주의: 가로, 세로 결합에 따라 row, column 갯수가 맞아야 결합이 가능)

In [None]:
array1_

array([[1, 2, 3],
       [4, 5, 6]])

In [None]:
array2_

array([[10, 11, 12],
       [13, 14, 15]])

In [None]:
# default axis = 0, 수평축
array_con0 = np.concatenate((array1_, array2_))
print(array_con0)

[[ 1  2  3]
 [ 4  5  6]
 [10 11 12]
 [13 14 15]]


In [None]:
array3_ = np.array([[1, 2, 3],[4, 5, 6]])
array3_

array([[1, 2, 3],
       [4, 5, 6]])

In [None]:
# axis=1로 하면 수직축
array_con1 = np.concatenate((array2_, array3_), axis=1)
print(array_con1)

[[10 11 12  1  2  3]
 [13 14 15  4  5  6]]


#### reshape - 재배열

reshape(행 수, 열 수)

In [None]:
arr = np.array(range(10))
arr

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [None]:
# shape : array가 몇 행, 몇 열인지 반환
# ndim : array의 차원수 반환
arr.shape, arr.ndim

((10,), 1)

In [None]:
arr_reshaped1 = arr.reshape(2, 5)
arr_reshaped1

array([[0, 1, 2, 3, 4],
       [5, 6, 7, 8, 9]])

In [None]:
arr_reshaped2 = arr.reshape(5, 2)
arr_reshaped2

array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7],
       [8, 9]])

#### resahpe(-1) : 원래 배열의 길이와 남은 차원으로부터 추정

In [None]:
arr_reshaped3 = arr.reshape(5, -1)
arr_reshaped3

array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7],
       [8, 9]])

#### argmax, argmin

In [None]:
arr1

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [None]:
np.argmax(arr1)

9

In [None]:
np.argmin(arr1)

0

*참고한 문헌: https://www.flearning.net/courses/6
(주소 이전으로 접속이 안되네요)