# NumPy 한번에 제대로 배우기



---



## NumPy 특징

* Numerical Python의 약자
* 고성능 과학 계산용 패키지로 강력한 N차원 배열 객체
* 범용적 데이터 처리에 사용 가능한 다차원 컨테이너
* 정교한 브로드캐스팅(broadcasting) 기능
* 파이썬의 자료형 list와 비슷하지만, 더 빠르고 메모리를 효율적으로 관리
* 반복문 없이 데이터 배열에 대한 처리를 지원하여 빠르고 편리
* 데이터 과학 도구에 대한 생태계의 핵심을 이루고 있음

In [1]:
import numpy as np



---



## 배열 생성

### 리스트로 배열 만들기


In [7]:
a1 = np.array([1,2,3,4,5])
print(a1)
print(type(a1))
print(a1.shape)
a1[0] = 10

[1 2 3 4 5]
<class 'numpy.ndarray'>
(5,)
5


In [11]:
a2 = np.array([[1,2,3],[4,5,6],[7,8,9]])
print(a2.shape)

(3, 3)


### 배열 생성 및 초기화

* `zeros()`: 모든 요소를 0으로 초기화

In [13]:
np.zeros(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

* `ones()`: 모든 요소를 1로 초기화

In [14]:
np.ones(10)

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

* `full()`: 모든 요소를 지정한 값으로 초기화

In [15]:
np.full((3,3), 1.23)

array([[1.23, 1.23, 1.23],
       [1.23, 1.23, 1.23],
       [1.23, 1.23, 1.23]])

* `eye()`: 단위행렬(identity matrix) 생성
  + 주대각선의 원소가 모두 1이고 나머지 원소는 모두 0인 정사각 행렬

In [16]:
np.eye(3)

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

* `tri()`: 삼각행렬 생성

In [17]:
np.tri(3)

array([[1., 0., 0.],
       [1., 1., 0.],
       [1., 1., 1.]])

* `empty()`: 초기화되지 않은 배열 생성
  + 초기화가 없어서 배열 생성비용 저렴하고 빠름
  + 초기화되지 않아서 기존 메모리 위치에 존재하는 값이 있음

In [18]:
np.empty(10) # 빠르긴 하지만 어떤 값이 올 지 모름

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

* `_like()`: 지정된 배열과 shape가 같은 행렬 생성
  + `np.zeros_like()`
  + `np.ones_like()`
  + `np.full_like()`
  + `np.empty_like()`

In [19]:
print(a1)
np.zeros_like(a1)

[10  2  3  4  5]


array([0, 0, 0, 0, 0])

In [20]:
np.ones_like(a2)

array([[1, 1, 1],
       [1, 1, 1],
       [1, 1, 1]])

In [21]:
np.full_like(a2, 12)

array([[12, 12, 12],
       [12, 12, 12],
       [12, 12, 12]])

### 생성한 값으로 배열 생성

* `arange()`: 정수 범위로 배열 생성

In [23]:
np.arange(0, 30, 2)

array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28])

* `linspace()`: 범위 내에서 균등 간격의 배열 생성

In [24]:
np.linspace(0, 1, 5)

array([0.  , 0.25, 0.5 , 0.75, 1.  ])

* `logspace()`: 범위 내에서 균등간격으로 로그 스케일로 배열 생성

In [25]:
np.logspace(0.1, 1, 20)

array([ 1.25892541,  1.40400425,  1.565802  ,  1.74624535,  1.94748304,
        2.1719114 ,  2.42220294,  2.70133812,  3.0126409 ,  3.35981829,
        3.74700446,  4.17881006,  4.66037703,  5.19743987,  5.79639395,
        6.46437163,  7.2093272 ,  8.04013161,  8.9666781 , 10.        ])

### 랜덤값으로 배열 생성


|함수|설명|
|:-----------:|:-----------------------------------------|
|`seed`       |난수 발생을 위한 시드(seed) 지정           |
|`permutation`|순서를 임의로 바꾸거나 임의의 순열 반환    |
|`shuffle`    |리스트나 배열의 순서를 뒤섞음              |
|`random`     |랜덤한 수의 배열 생성                      |
|`rand`       |균등분포에서 표본 추출                     |
|`randint`    |주어진 최소/최대 범위의 난수 추출          |
|`randn`      |표준편차 1, 평균값 0인 정규분포 표본 추출  |
|`binomial`   |이항분포에서 표본 추출                     |
|`normal`     |정규분포(가우시안)에서 표본 추출           |
|`beta`       |베타분포에서 표본 추출                     |
|`chisquare`  |카이제곱분포에서 표본 추출                 |
|`gamma`      |감마분포에서 표본 추출                     |
|`uniform`    |균등(0,1)분포에서 표본 추출                |

* `random.random()`: 랜덤한 수의 배열 생성

In [26]:
np.random.random((3,3))

array([[0.19564384, 0.79211555, 0.80880958],
       [0.27177753, 0.52696141, 0.080262  ],
       [0.27762918, 0.33848354, 0.92260078]])

* `random.randint()`: 일정 구간의 랜덤 정수의 배열 생성

In [28]:
np.random.randint(0, 10, (3,3))

array([[3, 9, 1],
       [9, 4, 4],
       [2, 7, 6]])

* `random.normal()`: 정규분포(normal distribution)를 고려한 랜덤한 수의 배열 생성
* 평균=0, 표준편차=1, 3 x 3 배열

In [29]:
np.random.normal(0, 1, (3,3))

array([[-0.10545937,  0.04089393,  1.3871239 ],
       [ 0.97056439, -1.19295546, -0.73107829],
       [ 1.20653567, -1.83664676,  0.19748577]])

* `random.rand()`: 균등분포(uniform distribution)를 고려한 랜덤한 수의 배열 생성

In [30]:
np.random.rand(3,3)

array([[0.45913292, 0.38607489, 0.98328219],
       [0.19145683, 0.31660228, 0.3587135 ],
       [0.89233692, 0.06269696, 0.41495425]])

* `random.randn()`: 표준 정규 분포(standard normal distribution)를 고려한 랜덤한 수의 배열 생성

In [32]:
np.random.randn(3, 3)

array([[ 0.45693296, -0.0486653 , -1.84897486],
       [ 0.21053519, -1.1978889 , -0.66901617],
       [-0.67855357, -1.54317551, -0.56292821]])

### 표준 데이터 타입

|데이터 타입|설명|
|-----------|----|
|`bool_`|바이트로 저장된 Boolean으로 True,False 가짐|
|`int_`|기본 Integer 타입|
|`intc`|C 언어에서 사용되는 `int`와 동일(일반적으로 `int32` or `int64`)|
|`intp`|인덱싱에 사용되는 정수(C언어에서 `ssize_t`와 동일)|
|`int8`|Byte(-128 ~ 127)|
|`int16`|정수(-32768 ~ 32767)|
|`int32`|정수(-2147483648 ~ 2147483647)|
|`int64`|정수(-9223372036854775808 ~ 9223372036854775807)|
|`uint8`|부호 없는 정수(0 ~ 255)|
|`uint16`|부호 없는 정수(0 ~ 65535)|
|`uint32`|부호 없는 정수(0 ~ 4294967295)|
|`uint64`|부호 없는 정수(0 ~ 18446744073709551615)|
|`float16`|반정밀 부동 소수점(Half precision float) : 부호 비트, 5비트 지수, 10비트 가수|
|`float32`|단정밀 부동 소수점(Single precision float) : 부호 비트, 8비트 지수, 23비트 가수|
|`float64`|배정밀 부동 소수점(Double precision float) : 부호 비트, 11비트 지수, 52비트 가수|
|`float_`|`float64`를 줄여서 표현|
|`complex64`|복소수(Complex number). 두 개의 32비트 부동 소수점으로 포현|
|`complex128`|복소수, 두 개의 64비트 부동 소수점으로 표현|
|`complex_`|`complex128`를 줄여서 표현|

In [33]:
np.zeros(20, dtype = int)

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

In [34]:
np.ones((3,3), dtype = bool)

array([[ True,  True,  True],
       [ True,  True,  True],
       [ True,  True,  True]])

In [35]:
np.full((3,3), 1.0, dtype = float)

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

### 날짜/시간 배열 생성


|코드|의미|상대적 시간 범위|절대적 시간 범위|
|---|-------|-------------|-----------------------|
|`Y`|연|±9.2e18 년|[9.2e18 BC, 9.2e18 AD]|
|`M`|월|±7.6e17 년|[7.6e17 BC, 7.6e17 AD]|
|`W`|주|±1.7e17 년|[1.7e17 BC, 1.7e17 AD]|
|`D`|일|±2.5e16 년|[2.5e16 BC, 2.5e16 AD]|
|`h`|시|±1.0e15 년|[1.0e15 BC, 1.0e15 AD]|
|`m`|분|±1.7e13 년|[1.7e13 BC, 1.7e13 AD]|
|`s`|초|±2.9e12 년|[2.9e9 BC, 2.9e9 AD]|
|`ms`|밀리초|±2.9e9 년|[2.9e6 BC 2.9e6 AD]|
|`us`|마이크로초|±2.9e6 년|[290301 BC, 294241 AD]|
|`ns`|나노초|±292 년|[1678 AD, 2262 AD]|
|`ps`|피코초|±106 일|[1969 AD, 1970 AD]|
|`fs`|펨토초|±2.6 시간|[1969 AD, 1970 AD]|
|`as`|아토초|±9.2 ch|[1969 AD, 1970 AD]|

In [39]:
date = np.array('2021-09-03', dtype=np.datetime64)
date

array('2021-09-03', dtype='datetime64[D]')

In [40]:
date + np.arange(12)

array(['2021-09-03', '2021-09-04', '2021-09-05', '2021-09-06',
       '2021-09-07', '2021-09-08', '2021-09-09', '2021-09-10',
       '2021-09-11', '2021-09-12', '2021-09-13', '2021-09-14'],
      dtype='datetime64[D]')

In [41]:
datetime = np.datetime64('2021-09-03 15:00')
datetime

numpy.datetime64('2021-09-03T15:00')

In [42]:
datetime = np.datetime64('2021-09-03 15:00:12.34','ns')
datetime

numpy.datetime64('2021-09-03T15:00:12.340000000')



---



## 배열 조회

### 배열 속성 정보

In [43]:
def array_info(array) :
    print(array)
    print('ndim : ', array.ndim)
    print('shape : ', array.shape)
    print('dtype : ', array.dtype)
    print('size : ', array.size)
    print('itemsize : ', array.itemsize)
    print('nbytes : ', array.nbytes)
    print('strides : ', array.strides)

In [44]:
array_info(a1)

[10  2  3  4  5]
ndim :  1
shape :  (5,)
dtype :  int32
size :  5
itemsize :  4
nbytes :  20
strides :  (4,)


In [45]:
array_info(a2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
ndim :  2
shape :  (3, 3)
dtype :  int32
size :  9
itemsize :  4
nbytes :  36
strides :  (12, 4)


### 인덱싱(Indexing)

In [49]:
print(a1)
print(a1[0])
print(a1[-2])

[10  2  3  4  5]
10
4


In [52]:
print(a2)
print(a2[0,0])
print(a2[2,-1])

[[1 2 3]
 [4 5 6]
 [7 8 9]]
1
9


### 슬라이싱(Slicing)

* 슬라이싱 구문: `a[start:stop:step]`
* 기본값: start=0, stop=ndim, step=1

In [53]:
print(a1)
print(a1[0:2])
print(a1[:2])
print(a1[::2])

[10  2  3  4  5]
[10  2]
[10  2]
[10  3  5]


In [54]:
print(a2)
print(a2[:2,:2])
print(a2[::-1,::-1])

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 2]
 [4 5]]
[[9 8 7]
 [6 5 4]
 [3 2 1]]


### 불리언 인덱싱(Boolean Indexing)

* 배열 각 요소의 선택 여부를 불리언(True or False)로 지정
* True 값인 인덱스의 값만 조회

In [55]:
print(a1)
bi = [False, True, True, False, True]
print(a1[bi])

[10  2  3  4  5]
[2 3 5]


In [56]:
bi = np.random.randint(0, 2, (3, 3), dtype = bool)
print(a2)
print(bi)
print(a2[bi])

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[False False  True]
 [False False  True]
 [False False False]]
[3 6]


### 팬시 인덱싱(Fancy Indedxing)

In [60]:
print(a1)
print([a1[0], a1[2]])
ind = [0,2]
print(a1[ind])
ind = np.array([[0,1],[2,0]])
print(a1[ind])

[10  2  3  4  5]
[10, 3]
[10  3]
[[10  2]
 [ 3 10]]


In [61]:
print(a2)
row,col = np.array([0,2]), np.array([1,2])
print(a2[row, col])

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[2 9]




---



## 배열 값 삽입/수정/삭제/복사

### 배열 값 삽입

* `insert()`: 배열의 특정 위치에 값 삽입
* axis를 지정하지 않으면 1차원 배열로 변환
* 추가할 방향을 axis로 지정
* 원본 배열 변경없이 새로운 배열 반환

In [65]:
print(a1)
b1 = np.insert(a1, 0, 10)
print(b1)
c1 = np.insert(a1, 2, 1234)
print(c1)

[10  2  3  4  5]
[10 10  2  3  4  5]
[  10    2 1234    3    4    5]


In [67]:
print(a2)
b2 = np.insert(a2, 1, 10, axis = 0)
print(b2)
c2 = np.insert(a2, 1, 10, axis = 1)
print(c2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[ 1  2  3]
 [10 10 10]
 [ 4  5  6]
 [ 7  8  9]]
[[ 1 10  2  3]
 [ 4 10  5  6]
 [ 7 10  8  9]]


### 배열 값 수정

* 배열의 인덱싱으로 접근하여 값 수정

In [70]:
a1[:2] = 9
print(a1)
i = np.array([1,3,4])
a1[i] = 99
print(a1)

[9 9 3 4 5]
[ 9 99  3 99 99]


In [71]:
a2[:2, 2] = 99
print(a2)

[[ 1  2 99]
 [ 4  5 99]
 [ 7  8  9]]


### 배열 값 삭제

* `delete()`: 배열의 특정 위치에 값 삭제
* axis를 지정하지 않으면 1차원 배열로 변환
* 삭제할 방향을 axis로 지정
* 원본 배열 변경없이 새로운 배열 반환

In [73]:
print(a1)
b1 = np.delete(a1,1)
print(b1)

[ 9 99  3 99 99]
[ 9  3 99 99]


In [74]:
print(a2)
b2 = np.delete(a2, 1, axis=0)
print(b2)

[[ 1  2 99]
 [ 4  5 99]
 [ 7  8  9]]
[[ 1  2 99]
 [ 7  8  9]]


### 배열 복사

* 리스트 자료형과 달리 배열의 슬라이스는 복사본이 아님

In [78]:
print(a2)
print(a2[:2,:2])
a2_sub = a2[:2, :2]
print(a2_sub)
a2_sub[:,1] = 0
print(a2_sub)
print(a2)  # 원본 배열도 똑같이 바뀐다는 것 주목

[[ 1  0 99]
 [ 4  0 99]
 [ 7  8  9]]
[[1 0]
 [4 0]]
[[1 0]
 [4 0]]
[[1 0]
 [4 0]]
[[ 1  0 99]
 [ 4  0 99]
 [ 7  8  9]]



* `copy()`: 배열이나 하위 배열 내의 값을 명시적으로 복사

In [80]:
print(a2)
a2_sub_copy = a2[:2,:2].copy()

[[ 1  0 99]
 [ 4  0 99]
 [ 7  8  9]]




---



## 배열 변환

### 배열 전치 및 축 변경

In [81]:
print(a2)
print(a2.T)

[[ 1  0 99]
 [ 4  0 99]
 [ 7  8  9]]
[[ 1  4  7]
 [ 0  0  8]
 [99 99  9]]


In [83]:
print(a2)
print(a2.swapaxes(1,0))

[[ 1  0 99]
 [ 4  0 99]
 [ 7  8  9]]
[[ 1  4  7]
 [ 0  0  8]
 [99 99  9]]


### 배열 재구조화


* `reshape()`: 배열의 형상을 변경

In [86]:
n1 = np.arange(1, 10)
print(n1)
print(n1.reshape(3, 3))

[1 2 3 4 5 6 7 8 9]
[[1 2 3]
 [4 5 6]
 [7 8 9]]


* `newaxis()`: 새로운 축 추가

In [87]:
print(n1[np.newaxis, :5])
print(n1[:5, np.newaxis])

[[1 2 3 4 5]]
[[1]
 [2]
 [3]
 [4]
 [5]]


### 배열 크기 변경

* 배열 모양만 변경

In [90]:
n2 = np.random.randint(0, 10, (2, 5))
print(n2)
n2.resize((5,2))
print(n2)

[[7 5 9 1 2]
 [6 9 9 8 0]]
[[7 5]
 [9 1]
 [2 6]
 [9 9]
 [8 0]]


* 배열 크기 증가
* 남은 공간은 0으로 채워짐

In [94]:
n2.resize((5, 5))
n2

array([[7, 5, 9, 1, 2],
       [6, 9, 9, 8, 0],
       [0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0]])

* 배열 크기 감소
* 포함되지 않은 값은 삭제됨

In [104]:
n2.resize((3, 3), refcheck = False)
n2

array([[7, 5, 9],
       [1, 2, 6],
       [9, 9, 8]])

### 배열 추가

* `append()`: 배열의 끝에 값 추가

In [105]:
a2 = np.arange(1, 10).reshape(3, 3)
print(a2)
b2 = np.arange(10, 19).reshape(3, 3)
print(b2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[10 11 12]
 [13 14 15]
 [16 17 18]]


* axis 지정이 없으면 1차원 배열 형태로 변형되어 결합

In [106]:
c2 = np.append(a2, b2)
print(c2)

[ 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18]


* axis를 0으로 지정
* shape[0]을 제외한 나머지 shape은 같아야 함

In [107]:
c2 = np.append(a2, b2, axis = 0)
print(c2)

[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]
 [13 14 15]
 [16 17 18]]


* axis를 1로 지정
* shape[1]을 제외한 나머지 shape은 같아야 함

In [108]:
c2 = np.append(a2, b2, axis = 1)
print(c2)

[[ 1  2  3 10 11 12]
 [ 4  5  6 13 14 15]
 [ 7  8  9 16 17 18]]


### 배열 연결

* `concatenate()`: 튜플이나 배열의 리스트를 인수로 사용해 배열 연결

In [109]:
a1 = np.array([1, 3, 5])
b1 = np.array([2, 4, 6])
np.concatenate([a1, b1])

array([1, 3, 5, 2, 4, 6])

In [110]:
c1 = np.array([7, 8, 9])
np.concatenate([a1, b1, c1])

array([1, 3, 5, 2, 4, 6, 7, 8, 9])

In [111]:
a2 = np.array([[1,2,3],[4,5,6]])
np.concatenate([a2, a2])

array([[1, 2, 3],
       [4, 5, 6],
       [1, 2, 3],
       [4, 5, 6]])

In [112]:
a2 = np.array([[1,2,3],[4,5,6]])
np.concatenate([a2, a2], axis = 1)

array([[1, 2, 3, 1, 2, 3],
       [4, 5, 6, 4, 5, 6]])

* `vstack()`: 수직 스택(vertical stack), 1차원으로 연결

In [113]:
np.vstack([a2, a2])

array([[1, 2, 3],
       [4, 5, 6],
       [1, 2, 3],
       [4, 5, 6]])

* `hstack()`: 수평 스택(horizontal stack), 2차원으로 연결

In [114]:
np.hstack([a2, a2])

array([[1, 2, 3, 1, 2, 3],
       [4, 5, 6, 4, 5, 6]])

* `dstack()`: 깊이 스택(depth stack), 3차원으로 연결

In [115]:
np.dstack([a2, a2])

array([[[1, 1],
        [2, 2],
        [3, 3]],

       [[4, 4],
        [5, 5],
        [6, 6]]])

* `stack()`: 새로운 차원으로 연결

In [116]:
np.stack([a2, a2])

array([[[1, 2, 3],
        [4, 5, 6]],

       [[1, 2, 3],
        [4, 5, 6]]])

### 배열 분할

* `split()`: 배열 분할

In [121]:
a1 = np.arange(0, 10)
print(a1)
b1, c1 = np.split(a1, [5])
print(b1, c1)
b1, c1, d1, e1, f1 = np.split(a1, [2,4,6,8])
print(b1, c1, d1, e1, f1)

[0 1 2 3 4 5 6 7 8 9]
[0 1 2 3 4] [5 6 7 8 9]
[0 1] [2 3] [4 5] [6 7] [8 9]


* `vsplit()`: 수직 분할, 1차원으로 분할

In [124]:
a2 = np.arange(1, 10).reshape(3, 3)
print(a2)
b2, c2 = np.vsplit(a2, [2])
print(b2,'\n\n', c2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 2 3]
 [4 5 6]] 

 [[7 8 9]]


* `hsplit()`: 수평 분할, 2차원으로 분할

In [125]:
a2 = np.arange(1, 10).reshape(3, 3)
print(a2)
b2, c2 = np.hsplit(a2, [2])
print(b2,'\n\n', c2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 2]
 [4 5]
 [7 8]] 

 [[3]
 [6]
 [9]]


* `dsplit()`: 깊이 분할, 3차원으로 분할

In [126]:
a3 = np.arange(1, 28).reshape(3, 3, 3)
print(a3)
b3, c3 = np.dsplit(a3, [2])
print(b3,'\n\n', c3)

[[[ 1  2  3]
  [ 4  5  6]
  [ 7  8  9]]

 [[10 11 12]
  [13 14 15]
  [16 17 18]]

 [[19 20 21]
  [22 23 24]
  [25 26 27]]]
[[[ 1  2]
  [ 4  5]
  [ 7  8]]

 [[10 11]
  [13 14]
  [16 17]]

 [[19 20]
  [22 23]
  [25 26]]] 

 [[[ 3]
  [ 6]
  [ 9]]

 [[12]
  [15]
  [18]]

 [[21]
  [24]
  [27]]]




---



## 배열 연산

* NumPy의 배열 연산은 벡터화(vectorized) 연산을 사용
* 일반적으로 NumPy의 범용 함수(universal functions)를 통해 구현
* 배열 요소에 대한 반복적인 계산을 효율적으로 수행

### 브로드캐스팅(Broadcasting)

In [135]:
a1 = np.array([1,2,3])
print(a1 + 5)
a2 = np.arange(1,10).reshape(3, 3)
print('\n',a2)
print('\n',a1 + a2)
b2 = np.array([1,2,3]).reshape(3, 1)
print('\n',a1+ b2)

[6 7 8]

 [[1 2 3]
 [4 5 6]
 [7 8 9]]

 [[ 2  4  6]
 [ 5  7  9]
 [ 8 10 12]]

 [[2 3 4]
 [3 4 5]
 [4 5 6]]


### 산술 연산(Arithmetic Operators)

|연산자|범용 함수|설명|
|----|-----------|--------|
|`+`|`np.add`|덧셈|
|`-`|`np.subtract`|뺄셈|
|`-`|`np.negative`|단항 음수|
|`*`|`np.multiply`|곱셈|
|`/`|`np.divide`|나눗셈|
|`//`|`np.floor_divide`|나눗셈 내림|
|`**`|`np.power`|지수 연산|
|`%`|`np.mod`|나머지 연산|

In [139]:
a1 = np.arange(1, 10)
print(np.add(a1, 10))
print(np.power(a1, 2))

[11 12 13 14 15 16 17 18 19]
[ 1  4  9 16 25 36 49 64 81]


#### 절대값 함수(Absolute Function)

* `absolute()`, `abs()`: 내장된 절대값 함수

In [141]:
a1 = np.random.randint(-10, 10, size = 5)
print(a1)
print(np.abs(a1))

[-9  4  6 -3  7]
[9 4 6 3 7]


#### 제곱/제곱근 함수

* `square`, `sqrt`: 제곱, 제곱근 함수

In [143]:
print(a1)
print(np.square(a1))
print(np.sqrt(abs(a1)))

[-9  4  6 -3  7]
[81 16 36  9 49]
[3.         2.         2.44948974 1.73205081 2.64575131]


#### 지수와 로그 함수 (Exponential and Log Function)

In [144]:
a1 = np.random.randint(1, 10, size = 5)
print(a1)
print(np.exp(a1))
print(np.exp2(a1))

[9 4 9 7 5]
[8103.08392758   54.59815003 8103.08392758 1096.63315843  148.4131591 ]
[512.  16. 512. 128.  32.]


In [145]:
print(np.log(a1))
print(np.log2(a1))

[2.19722458 1.38629436 2.19722458 1.94591015 1.60943791]
[3.169925   2.         3.169925   2.80735492 2.32192809]


#### 삼각 함수(Trigonometrical Function)


|함수|설명|
|--------|----------------------|
|np.sin(array)|사인|
|np.cos()|코사인|
|np.tan()|탄젠트|
|np.arcsin()|아크 사인|
|np.arccos()|아크 코사인|
|np.arctan()|아크 탄젠트
|np.arctan2(1,2)|아크 탄젠드 1 / 2|
|np.sinh()|하이퍼볼릭 사인|
|np.cosh()|하이퍼볼릭 코사인|
|np.tanh()|하이퍼볼릭 탄젠트|
|np.arcsinh()|하이퍼볼릭 아크 사인|
|np.arccosh()|하이퍼볼릭 아크 코사인|
|np.arctanh()|하이퍼볼릭 아크 탄젠트|
|np.deg2rad()|각도에서 라디안 변환|
|np.rad2deg()|라디안에서 각도 변환|
|np.hypot(1,2)|유클리드 거리 계산|

In [147]:
t = np.linspace(0, np.pi, 3)
print(t)
print(np.tan(t))

[0.         1.57079633 3.14159265]
[ 0.00000000e+00  1.63312394e+16 -1.22464680e-16]


In [149]:
x = [-1, 0, 1]
print(x)
print(np.arccos(x))

[-1, 0, 1]
[3.14159265 1.57079633 0.        ]


### 집계 함수(Aggregate Functions)

|함수|NaN 안전 모드|설명
|---|-----|-------------------|
|`np.sum`|`np.nansum`|합 계산|
|`np.cumsum`|`np.nancumsum`|누적 합|
|`np.diff`|N/A|차분|
|`np.prod`|`np.nanprod`|곱 계산|
|`np.cumprod`|`np.nancumprod`|누적 곱|
|`np.dot`|N/A|점 곱(dot product)|
|`np.matmul`|N/A|행렬 곱|
|`np.tensordot`|N/A|텐서 곱(tensor product)|
|`np.cross`|N/A|벡터 곱(cross product)|
|`np.inner`|N/A|내적(inner product)|
|`np.outer`|N/A|외적(outer product)|
|`np.mean`|`np.nanmean`|평균|
|`np.std`|`np.nanstd`|표준 편차|
|`np.var`|`np.nanvar`|분산|
|`np.min`|`np.nanmin`|최소값|
|`np.max`|`np.nanmax`|최대값|
|`np.argmin`|`np.nanargmin`|최소값 인덱스|
|`np.argmax`|`np.nanargmax`|최대값 인덱스|
|`np.median`|`np.nanmedian`|중앙값|
|`np.percentile`|`np.nanpercentile`|순위 기반 백분위 수 계산|
|`np.any`|N/A|참이 있는지 평가|
|`np.all`|N/A|모든 요소가 참인지 평가|

#### sum(): 합 계산

In [152]:
a2 = np.random.randint(1, 10, size=(3, 3))
print(a2)
print(a2.sum(), np.sum(a2))
print(np.sum(a2, axis = 0))
print(a2.sum(axis = 1))

[[3 9 3]
 [6 1 3]
 [7 9 5]]
46 46
[16 19 11]
[15 10 21]


#### cumsum(): 누적합 계산

In [154]:
print(a2.cumsum(), np.cumsum(a2))
print(np.cumsum(a2, axis = 0))
print(a2.cumsum(axis = 1))

[ 2  6 12 21 26 34 37 44 50] [ 2  6 12 21 26 34 37 44 50]
[[ 2  4  6]
 [11  9 14]
 [14 16 20]]
[[ 2  6 12]
 [ 9 14 22]
 [ 3 10 16]]


#### diff(): 차분 계산

In [156]:
print(np.diff(a2))
print(np.diff(a2, axis = 0))
print(np.diff(a2, axis = 1))

[[ 2  2]
 [-4  3]
 [ 4 -1]]
[[ 7  1  2]
 [-6  2 -2]]
[[ 2  2]
 [-4  3]
 [ 4 -1]]


#### prod(): 곱 계산

In [157]:
print(np.prod(a2))
print(np.prod(a2, axis = 0))
print(np.prod(a2, axis = 1))

2177280
[ 54 140 288]
[ 48 360 126]


#### cumprod(): 누적곱 계산

In [160]:
print(np.cumprod(a2))
print(np.cumprod(a2, axis = 0))
print(np.cumprod(a2, axis = 1))

[      2       8      48     432    2160   17280   51840  362880 2177280]
[[  2   4   6]
 [ 18  20  48]
 [ 54 140 288]]
[[  2   8  48]
 [  9  45 360]
 [  3  21 126]]


#### dot()/matmul(): 점곱/행렬곱 계산

In [161]:
b2 = np.ones_like(a2)
print(b2)
print(np.dot(a2,b2))
print(np.matmul(a2,b2))

[[1 1 1]
 [1 1 1]
 [1 1 1]]
[[12 12 12]
 [22 22 22]
 [16 16 16]]
[[12 12 12]
 [22 22 22]
 [16 16 16]]


#### tensordot(): 텐서곱 계산

In [165]:
print(a2,'\n\n', b2)
print(np.tensordot(a2, b2))
print(np.tensordot(a2, b2, axes = 0))

[[2 4 6]
 [9 5 8]
 [3 7 6]] 

 [[1 1 1]
 [1 1 1]
 [1 1 1]]
50
[[[[2 2 2]
   [2 2 2]
   [2 2 2]]

  [[4 4 4]
   [4 4 4]
   [4 4 4]]

  [[6 6 6]
   [6 6 6]
   [6 6 6]]]


 [[[9 9 9]
   [9 9 9]
   [9 9 9]]

  [[5 5 5]
   [5 5 5]
   [5 5 5]]

  [[8 8 8]
   [8 8 8]
   [8 8 8]]]


 [[[3 3 3]
   [3 3 3]
   [3 3 3]]

  [[7 7 7]
   [7 7 7]
   [7 7 7]]

  [[6 6 6]
   [6 6 6]
   [6 6 6]]]]


#### cross(): 벡터곱

In [166]:
x, y = [1, 2, 3], [4, 5, 6]
print(np.cross(x, y))

[-3  6 -3]


#### inner()/outer(): 내적/외적

In [167]:
print(np.inner(a2, b2))
print(np.outer(a2, b2))

[[12 12 12]
 [22 22 22]
 [16 16 16]]
[[2 2 2 2 2 2 2 2 2]
 [4 4 4 4 4 4 4 4 4]
 [6 6 6 6 6 6 6 6 6]
 [9 9 9 9 9 9 9 9 9]
 [5 5 5 5 5 5 5 5 5]
 [8 8 8 8 8 8 8 8 8]
 [3 3 3 3 3 3 3 3 3]
 [7 7 7 7 7 7 7 7 7]
 [6 6 6 6 6 6 6 6 6]]


#### mean(): 평균 계산

In [169]:
print(np.mean(a2))

5.555555555555555


#### std(): 표준 편차 계산

In [170]:
np.std(a2)

2.1659542988464366

#### var(): 분산 계산

In [171]:
np.var(a2)

4.691358024691358

#### min(): 최소값

In [172]:
np.min(a2)

2

#### max(): 최대값

In [173]:
np.max(a2)

9

#### argmin(): 최소값 인덱스

In [174]:
np.argmin(a2)

0

#### argmax(): 최대값 인덱스

In [175]:
np.argmax(a2)

3

#### median(): 중앙값

In [176]:
np.median(a2)

6.0

#### percentile(): 백분위 수



![%EC%BA%A1%EC%B2%98.PNG](attachment:%EC%BA%A1%EC%B2%98.PNG)

In [183]:
a1 = np.array([0, 1, 2, 3])
print(a1)
print(np.percentile(a1, [0, 20, 40, 60, 80, 100], interpolation = 'linear'))
print(np.percentile(a1, [0, 20, 40, 60, 80, 100], interpolation = 'higher'))
print(np.percentile(a1, [0, 20, 40, 60, 80, 100], interpolation = 'lower'))
print(np.percentile(a1, [0, 20, 40, 60, 80, 100], interpolation = 'nearest'))
print(np.percentile(a1, [0, 20, 40, 60, 80, 100], interpolation = 'midpoint'))

[0 1 2 3]
[0.  0.6 1.2 1.8 2.4 3. ]
[0 1 2 2 3 3]
[0 0 1 1 2 3]
[0 1 1 2 2 3]
[0.  0.5 1.5 1.5 2.5 3. ]


#### any()

In [190]:
a2 = np.array([[False,False,True],
              [False, True, True],
              [False, True, True]])
print(a2)
print(np.any(a2))
print(np.any(a2, axis = 1))

[[False False  True]
 [False  True  True]
 [False  True  True]]
True
[ True  True  True]


#### all()

In [192]:
print(a2)
print(np.all(a2))
print(np.all(a2, axis = 0))

[[False False  True]
 [False  True  True]
 [False  True  True]]
False
[False False  True]


### 비교 연산(Comparison Operators)


|연산자|비교 범용 함수|
|------|---------------|
|`==`|`np.equal`|
|`!=`|`np.not_equal`|
|`<`|`np.less`|
|`<=`|`np.less_equal`|
|`>`|`np.greater`|
|`>=`|`np.greater_equal`|

In [196]:
a1 = np.arange(1, 10)
print(a1 >= 5)

[False False False False  True  True  True  True  True]


In [199]:
a2 = np.arange(1, 10).reshape(3, 3)
print(np.sum(a2))
print(np.count_nonzero(a2 > 5))
print(np.sum(a2 > 5))

45
4
4


|비교 범용 함수|설명|
|--------------|-------------------------------|
|`np.isclose`|배열 두 개가  (z*1e+02)% 내외로 가까우면 True|
|`np.isinf`|배열이 inf 이면 True|
|`np.isfinite`|배열이 inf,nan 이면 False|
|`np.isnan`|배열이 nan이면 True|

In [200]:
a1 = np.array([1,2,3,4,5])
b1 = np.array([1,2,3,3,4])
print(np.isclose(a1,b1))

[ True  True  True False False]


In [208]:
a1 = np.array([np.nan, 2, np.inf, 4, np.NINF])
print(a1)
print(np.isnan(a1))
print(np.isinf(a1))

[ nan   2.  inf   4. -inf]
[ True False False False False]
[False False  True False  True]


#### 불리언 연산자(Boolean Operators)


|연산자|비교 범용 함수|
|---|----------------|
|`&`|`np.bitwise_and`|
|`ㅣ`|`np.bitwise_or`|
|`^`|`np.bitwise_xor`|
|`~`|`np.bitwise_not`|

In [209]:
a2 = np.arange(1, 10).reshape(3, 3)
print((a2>5) & (a2 < 8))

[[False False False]
 [False False  True]
 [ True False False]]


### 배열 정렬

In [216]:
a1 = np.random.randint(1, 10, size= 10)
print(a1)
print(np.sort(a1))
print(np.argsort(a1))
a1.sort()
print(a1)

[6 5 7 7 8 1 1 7 1 4]
[1 1 1 4 5 6 7 7 7 8]
[5 6 8 9 1 0 2 3 7 4]
[1 1 1 4 5 6 7 7 7 8]


In [218]:
a2 = np.random.randint(1, 10, size=(3, 3))
print(a2, '\n\n')
print(np.sort(a2, axis= 1))

[[8 4 9]
 [6 2 6]
 [1 3 6]] 


[[4 8 9]
 [2 6 6]
 [1 3 6]]


#### 부분 정렬

* `partition()`: 배열에서 k개의 작은 값을 반환

In [219]:
a1 = np.random.randint(1, 10, size= 10)
print(a1)
print(np.partition(a1, 3))

[7 2 7 8 1 2 5 3 5 1]
[1 1 2 2 3 5 5 7 8 7]


## 배열 입출력


|함수|설명|파일 종류|
|----|---|---------|
|`np.save()`|NumPy 배열 객체 1개를 파일에 저장|바이너리
|`np.savez()`|NumPy 배열 객체 여러 개를 파일에 저장|바이너리
|`np.load()`|NumPy 배열 저장 파일로부터 객체 로딩|바이너리
|`np.loadtxt()`|텍스트 파일로부터 배열 로딩|텍스트
|`np.savetxt()`|텍스트 파일에 NumPy 배열 객체 저장|텍스트

In [221]:
np.save('a',a2)

array([[8, 4, 9],
       [6, 2, 6],
       [1, 3, 6]])

In [None]:
np.savetxt('아무거나.csv',a2,delimiter=',', fmt='%.2e',header='c1,c2,c3')

In [None]:
csv = np.loadtxt('아무거나.csv', delimiter=',')



---

