# numpy
> numerical python

C언어로 구현된 수치 연산을 위한 파이썬 라이브러리.  

- import numpy as np

In [3]:
# numpy 를 np라는 이름으로 가져오기
import numpy as np

## 생성, 조회, 수정, 삭제

### 생성

In [4]:
# 1차원 생성
np.array([1, 2, 3, 4])

array([1, 2, 3, 4])

In [5]:
# 2차원 생성
np.array([[1,2,3],
          [4,5,6],
          [7,8,9]])

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

### 생성 연습

np.arange() : range와 비슷한 기능. 실수도 적용 가능하다. (0, 1, 0.2)

In [9]:
# arange 함수를 통해 0~9 값을 갖는 배열 생성
np.arange(10)
np.arange(0.1,1,0.1)

array([0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9])

np.linspace(start, end, n) : start~end(포함)의 n 개의 구간으로 나눔 

In [14]:
# linspace 함수를 통해 1, 100까지 5개의 구간으로 나누기
np.linspace(0,100,5)

array([  0.,  25.,  50.,  75., 100.])

기타 배열 생성 함수
![image.png](attachment:image.png)

In [20]:
np.ones((2,2))
np.zeros((2,2))
np.full((2,2),-1)
np.eye(2)

array([[1., 0.],
       [0., 1.]])

### 조회

In [21]:
# 실행
array = np.array([1,2,3,4])
array

array([1, 2, 3, 4])

In [22]:
# 차원 조회
array.ndim

1

In [23]:
# 차원별 크기
array.shape

(4,)

In [24]:
# 요소 개수
array.size

4

In [26]:
# 데이터 타입 조회
array.dtype

dtype('int32')

In [28]:
array2 = np.array([[1,2,3,4]])
print(f"{array.shape}와 {array2.shape}의 차이는 무엇일까요?")
# array는 1 차원 행열이라... array2는 2차원 행열이라 1*4 행렬

(4,)와 (1, 4)의 차이는 무엇일까요?


### 수정

In [31]:
# 배열 변경 (실행)
array = np.arange(16)
array, array.shape

(array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15]),
 (16,))

In [32]:
# 4행으로 변경하세요

array.reshape(4,4), array.reshape(4,4).shape

(array([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11],
        [12, 13, 14, 15]]),
 (4, 4))

In [33]:
# 답


array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15]])

In [36]:
# array의 데이터타입을 float64로 바꿔보세요
array2 = np.array(array, dtype = np.float64)
array2

array([ 0.,  1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10., 11., 12.,
       13., 14., 15.])

## 연산

In [37]:
x = np.array([[1,2], [3,4]])
y = np.array([[5,6], [7,8]])
x, y

(array([[1, 2],
        [3, 4]]),
 array([[5, 6],
        [7, 8]]))

In [40]:
# 두 배열의 덧셈
x+y
np.add(x,y)

array([[ 6,  8],
       [10, 12]])

In [43]:
# 두 배열의 뺄셈
x-y
np.subtract(x,y)

array([[-4, -4],
       [-4, -4]])

In [45]:
# 두 배열의 곱셈
x*y
np.multiply(x,y)

array([[ 5, 12],
       [21, 32]])

In [48]:
# 두 배열의 나눗셈
x/y
np.divide(x,y)

array([[0.2       , 0.33333333],
       [0.42857143, 0.5       ]])

In [49]:
# scalar 연산도 가능
x/3

array([[0.33333333, 0.66666667],
       [1.        , 1.33333333]])

In [50]:
# scalar 연산도 가능
y*2

array([[10, 12],
       [14, 16]])

내적 (두 벡터의 곱) : np.inner()  
외적 (두 벡터에 수직인 벡터) : np.outer()  
등의 다양한 연산도 가능  

## Indexing

정수 인덱싱 : array[0], array[3, 3]  

조건 인덱싱 : array[조건] # 조건은 True or False 값을 가짐  

팬시 인덱싱 : array[row, col] - array[[0,1], [2,1]] 처럼 다른 array이용

### 정수 인덱싱

In [52]:
# 0 ~ 8의 값을 갖는 2차원 배열 생성 - arange, reshape 사용

array = np.arange(9).reshape(3,3)
array

array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

In [54]:
# arr의 첫 번째 행 indexing하여 출력
array[0]

array([0, 1, 2])

In [55]:
# arr의 마지막 행(음수 index 사용) indexing하여 출력

array[-1]

array([6, 7, 8])

In [57]:
# arr의 첫 번째 행, 첫 번째 열 indexing 하여 출력
array[0][0]

0

### 조건 인덱싱

In [59]:
# 1 ~ 5의 값을 갖는 1차원 배열 생성 - arange 사용

array = np.arange(1,6)
array

array([1, 2, 3, 4, 5])

In [66]:
# arr 배열에서 홀수의 값만 선택
for x in array:
    if(x%2==1):
        print(x)
bidx = array % 2 ==1
bidx

1
3
5


array([ True, False,  True, False,  True])

In [67]:
array[bidx]

array([1, 3, 5])

In [68]:
# arr 배열에서 값이 3이상인 것만 선택
array[array>=3]


array([3, 4, 5])

### 팬시 인덱싱

다른 array를 이용하는 인덱싱.  
조건 인덱싱도 True, False값을 갖는 array를 이용하므로 팬시 인덱싱의 일종이라고 할 수 있음.

In [82]:
# 0 ~ 8의 값을 갖는 2차원 배열 생성

array = np.arange(0,9).reshape((3,3))
array

array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

In [83]:
# 0행 2열, 1행 1열의 값을 추출 - row = [], col = []

row = [0,1]
col = [2,1]
array[row,col]

array([2, 4])

## Slicing

`:` 을 사용하여 특정 범위 값에 접근

슬라이싱하여 새로운 배열을 만들 경우, 새로운 배열을 수정하면 원본 배열이 수정됨

방지)  
copy() 함수 혹은 팬시인덱싱 사용

In [94]:
# 0~8을 갖는 (3,3) shape의 array 생성
array = np.arange(0,9).reshape((3,3))
array

array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

In [95]:
# a 변수에 1 행, 전체 열 추출
a = array[1]
a

array([3, 4, 5])

In [96]:
# a[1]을 1000으로 수정
a[1] = 1000

In [97]:
# array값 확인
array

array([[   0,    1,    2],
       [   3, 1000,    5],
       [   6,    7,    8]])

### copy 함수 사용

In [98]:
# b 변수에 0 행, 전체 열 추출
b = array[0].copy()
b

array([0, 1, 2])

In [99]:
# b[1]을 2000으로 수정
b[1] = 2000

In [100]:
# array값 확인
array

array([[   0,    1,    2],
       [   3, 1000,    5],
       [   6,    7,    8]])

## 다양한 numpy 함수

### np.where

In [113]:
# 0~8을 갖는 (3,3) shape의 array 생성
array = np.arange(0,9).reshape((3,3))
array


array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

In [114]:
# array에서 짝수인 요소의 위치를 반환

np.where(array%2==0)

(array([0, 0, 1, 2, 2], dtype=int64), array([0, 2, 1, 0, 2], dtype=int64))

In [115]:
# array에서 짝수이면 True, 홀수면 False로 하는 array 생성

np.where(array%2==0, True,False)

array([[ True, False,  True],
       [False,  True, False],
       [ True, False,  True]])

### 통계 함수

`axis=0` 행과 행의 연산  
`axis=1` 열과 열의 연산  

min, max, mean, median, quantile, std, var, corrcoef, argmin, argmax, 
cumsum, cumprod

In [116]:
# 0~8을 갖는 (3,3) shape의 array 생성
array = np.arange(9).reshape((3,3))
array

array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

In [117]:
# array 행과 행의 합
array.sum()
array.sum(axis=0)

array([ 9, 12, 15])

In [118]:
# array 열과 열의 합
array.sum(axis=1)

array([ 3, 12, 21])

In [119]:
# array 행과 행의 평균
array.mean(axis=0)

array([3., 4., 5.])

In [120]:
# array 열과 열의 평균
array.mean(axis=1)

array([1., 4., 7.])