# NumPy

* Numerical Python의 약자

* 다양한 수학 연산과 다차원 데이터를 쉽게 다루기 위한 파이썬 라이브러리

* Numpy는 ndarray라고 하는 특별한 객체를 사용
    + 리스트와 달리 고정된 크기를 갖음
    + 같은 타입의 데이터만 저장 가능

* ndarray는 python 리스트에서 지원하지 않는 다양한 기능들을 지원
    + 효율적으로 코드 작성 가능
    + 더 빠른 속도

In [1]:
!pip install numpy



In [2]:
import numpy as np
np.__version__

'1.20.1'



---



# 배열 생성

## 리스트로 배열 만들기
![1.2 Array.png](https://drive.google.com/uc?id=1EKPVGuDQinETf6XkcKFYaQfqp5P2oklE)

In [3]:
a1 = np.array([1,2,3,4,5])
print(a1)
print(type(a1))
print(a1.shape)
print(a1[0],a1[1],a1[2])

[1 2 3 4 5]
<class 'numpy.ndarray'>
(5,)
1 2 3


In [4]:
a2 = np.array([[1,2,3],[4,5,6]])
print(a2)
print(a2.shape)
print(a2[0,0],a2[1,1])

[[1 2 3]
 [4 5 6]]
(2, 3)
1 5


In [5]:
a3 = np.array([[[1,2,3,4],[5,6,7,8],[9,0,1,2]],
              [[3,4,5,6],[7,8,9,0],[1,2,3,4]]])

print(a3)
print(a3.shape)

[[[1 2 3 4]
  [5 6 7 8]
  [9 0 1 2]]

 [[3 4 5 6]
  [7 8 9 0]
  [1 2 3 4]]]
(2, 3, 4)


## 배열 생성 및 초기화

* `zeros()`: 모든 요소를 0으로 초기화

In [6]:
np.zeros(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

* `ones()`: 모든 요소를 1로 초기화

In [7]:
np.ones((2,3))

array([[1., 1., 1.],
       [1., 1., 1.]])

* `full()`: 모든 요소를 지정한 값으로 초기화

In [8]:
np.full((2,3),1.23)

array([[1.23, 1.23, 1.23],
       [1.23, 1.23, 1.23]])

* `eye()`: 단위행렬(identity matrix) 생성
  + 주대각선의 원소가 모두 1이고 나머지 원소는 모두 0인 정사각 행렬

In [9]:
np.eye(3)

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

* `tri()`: 삼각행렬 생성

In [10]:
np.tri(3)

array([[1., 0., 0.],
       [1., 1., 0.],
       [1., 1., 1.]])

* `empty()`: 초기화되지 않은 배열 생성
  + 초기화가 없어서 배열 생성비용 저렴하고 빠름
  + 초기화되지 않아서 기존 메모리 위치에 존재하는 값이 있음

In [11]:
np.empty(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

* `_like()`: 지정된 배열과 shape가 같은 행렬 생성
  + `np.zeros_like()`
  + `np.ones_like()`
  + `np.full_like()`
  + `np.empty_like()`

In [14]:
print(a1)
np.zeros_like(a1)

[1 2 3 4 5]


array([0, 0, 0, 0, 0])

In [15]:
print(a2)
np.ones_like(a2)

[[1 2 3]
 [4 5 6]]


array([[1, 1, 1],
       [1, 1, 1]])

In [16]:
print(a3)
np.full_like(a3, 10)

[[[1 2 3 4]
  [5 6 7 8]
  [9 0 1 2]]

 [[3 4 5 6]
  [7 8 9 0]
  [1 2 3 4]]]


array([[[10, 10, 10, 10],
        [10, 10, 10, 10],
        [10, 10, 10, 10]],

       [[10, 10, 10, 10],
        [10, 10, 10, 10],
        [10, 10, 10, 10]]])

## 생성한 값으로 배열 생성

* `arange()`: 정수 범위로 배열 생성

In [17]:
np.arange(0,30,2)

array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28])

* `linspace()`: 범위 내에서 균등 간격의 배열 생성

In [18]:
np.linspace(0,1,5)

array([0.  , 0.25, 0.5 , 0.75, 1.  ])

## 랜덤값으로 배열 생성

| 함수 | 설명 |
|------|------|
| `seed` | 난수 발생을 위한 시드(seed) 지정 |
| `permutation` | 순서를 임의로 바꾸거나 임의의 순열 반환 |
| `shuffle` | 리스트나 배열의 순서를 뒤섞음 |
| `random` | 랜덤한 수의 배열 생성 |
| `rand` | 균등분포에서 표본 추출 |
| `randint` | 주어진 최소/최대 범위의 난수 추출 |
| `randn` | 표준편차가 1, 평균값 0인 정규분포의 표본 추출 |
| `binomial` | 이항분포에서 표본 추출 |
| `normal` | 정규분포(가우시안)에서 표본 추출 |
| `beta` | 베타분포에서 표본 추출 |
| `chisquare` | 카이제곱분포에서 표본 추출 |
| `gamma` | 감마분포에서 표본 추출 |
| `uniform` | 균등(0, 1)분포에서 표본 추출 |

* `random.random()`: 랜덤한 수의 배열 생성

In [19]:
np.random.random((3,3))

array([[0.66077684, 0.9402087 , 0.91376898],
       [0.16215925, 0.02583757, 0.13667537],
       [0.5878717 , 0.62085483, 0.5401763 ]])

* `random.randint()`: 일정 구간의 랜덤 정수의 배열 생성

In [20]:
np.random.randint(0,10,(3,3))

array([[1, 4, 2],
       [1, 1, 3],
       [6, 1, 6]])

* `random.normal()`: 정규분포(normal distribution)를 고려한 랜덤한 수의 배열 생성
* 평균=0, 표준편차=1, 3 x 3 배열

In [21]:
np.random.normal(0,1,(3,3))

array([[ 0.53443662,  0.89250756,  0.8405175 ],
       [-0.31771421, -0.7197605 , -1.50482776],
       [-1.96187236, -0.27734801,  0.86152968]])

* `random.rand()`: 균등분포(uniform distribution)를 고려한 랜덤한 수의 배열 생성

In [22]:
np.random.rand(3,3)

array([[0.03827218, 0.14352262, 0.45380763],
       [0.83602609, 0.36562501, 0.26765127],
       [0.21549122, 0.67671197, 0.94886069]])

* `random.randn()`: 표준 정규 분포(standard normal distribution)를 고려한 랜덤한 수의 배열 생성

In [23]:
np.random.randn(3,3)

array([[ 0.10859821,  1.56245889, -1.46435554],
       [ 0.37260265, -0.76542489,  1.39452056],
       [-0.88130547, -0.34293233,  1.92590562]])

## 표준 데이터 타입

| 데이터 타입	    | 설명 |
|---------------|-------------|
| ``bool_``     | 바이트로 저장된 불리언(Boolean)으로 True 또는 False 값을 가짐 |
| ``int_``      | 기본 정수(Integer) 타입 | 
| ``intc``      | C 언어에서 사용되는 ``int``와 동일 (일반적으로 ``int32`` 또는 ``int64``) | 
| ``intp``      | 인덱싱에 사용되는 정수 (C 언어에서 ``ssize_t``와 동일; 일반적으로 ``int32`` 또는 ``int64``) | 
| ``int8``      | 바이트(Byte) (-128 ~ 127) | 
| ``int16``     | 정수 (-32768 ~ 32767) |
| ``int32``     | 정수 (-2147483648 ~ 2147483647) |
| ``int64``     | 정수(-9223372036854775808 ~ 9223372036854775807) | 
| ``uint8``     | 부호 없는 정수 (0 ~ 255) | 
| ``uint16``    | 부호 없는 정수 (0 ~ 65535) | 
| ``uint32``    | 부호 없는 정수 (0 ~ 4294967295) | 
| ``uint64``    | 부호 없는 정수 (0 ~ 18446744073709551615) |  
| ``float16``   | 반정밀 부동 소수점(Half precision float): 부호 비트, 5비트 지수, 10비트 가수 | 
| ``float32``   | 단정밀 부동 소수점(Single precision float): 부호 비트, 8비트 지수, 23비트 가수| 
| ``float64``   | 배정밀 부동 소수점(Double precision float): 부호 비트, 11비트 지수, 52비트 가수 |
| ``float_``    | ``float64``를 줄여서 표현 |
| ``complex64`` | 복소수(Complex number), 두 개의 32비트 부동 소수점으로 표현 | 
| ``complex128``| 복소수, 두 개의 64비트 부동 소수점으로 표현| 
| ``complex_``  | ``complex128``를 줄여서 표현 | 

In [24]:
np.zeros(20,dtype=int)

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

In [26]:
np.ones((3,3),dtype=bool)

array([[ True,  True,  True],
       [ True,  True,  True],
       [ True,  True,  True]])

In [28]:
np.full((3,3),1,dtype=float)

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])



---



# 배열 조회

## 배열 속성 정보

In [29]:
def array_info(array):
    print(array)
    print("ndim:",array.ndim)
    print("shape:",array.shape)
    print("dtype:",array.dtype)
    print("size:",array.size) # 배열 요소의 갯수
    print("itemsize:", array.itemsize) # 배열 요소 1개의 메모리크기(바이트)
    print("nbytes:",array.nbytes) # 배열 객체의 전체 크기(바이트)
    print("strides:", array.strides) # 걸음. 등간격. 차원간격, 요소간격(바이트)

In [30]:
array_info(a1)

[1 2 3 4 5]
ndim: 1
shape: (5,)
dtype: int32
size 5
itemsize: 4
nbytes: 20
strides: (4,)


In [32]:
array_info(a2)

[[1 2 3]
 [4 5 6]]
ndim: 2
shape: (2, 3)
dtype: int32
size 6
itemsize: 4
nbytes: 24
strides: (12, 4)


In [33]:
array_info(a3)

[[[1 2 3 4]
  [5 6 7 8]
  [9 0 1 2]]

 [[3 4 5 6]
  [7 8 9 0]
  [1 2 3 4]]]
ndim: 3
shape: (2, 3, 4)
dtype: int32
size 24
itemsize: 4
nbytes: 96
strides: (48, 16, 4)


## 인덱싱(Indexing)

In [34]:
print(a1)
print(a1[0])
print(a1[2])
print(a1[-1])
print(a1[-2])

[1 2 3 4 5]
1
3
5
4


In [35]:
print(a2)
print(a2[0,0])
print(a2[0,2])
print(a2[1,-1])

[[1 2 3]
 [4 5 6]]
1
3
6


In [36]:
print(a3)
print(a3[0,0,0])
print(a3[1,1,1])
print(a3[0,-1,-1])

[[[1 2 3 4]
  [5 6 7 8]
  [9 0 1 2]]

 [[3 4 5 6]
  [7 8 9 0]
  [1 2 3 4]]]
1
8
2


## 슬라이싱(Slicing)

* 슬라이싱 구문: `a[start:stop:step]`
* 기본값: start=0, stop=ndim, step=1

In [37]:
print(a1)
print(a1[0:2])
print(a1[1:])
print(a1[:3])
print(a1[::2])
print(a1[::-1])

[1 2 3 4 5]
[1 2]
[2 3 4 5]
[1 2 3]
[1 3 5]
[5 4 3 2 1]


In [39]:
print(a2)
print(a2[1])
print(a2[1, :])
print(a2[:1,:2])
print(a2[1:, ::-1])
print(a2[::-1,::1])
print(a2[::-1, ::-1])

[[1 2 3]
 [4 5 6]]
[4 5 6]
[4 5 6]
[[1 2]]
[[6 5 4]]
[[4 5 6]
 [1 2 3]]
[[6 5 4]
 [3 2 1]]


## 불리언 인덱싱(Boolean Indexing)

* 배열 각 요소의 선택 여부를 불리언(True or False)로 지정
* True 값인 인덱스의 값만 조회

In [40]:
print(a1)
bi = [False, True, True, False, True]
print(a1[bi])
bi = [True, False, True, True, False]
print(a1[bi])

[1 2 3 4 5]
[2 3 5]
[1 3 4]


In [41]:
print(a2)
bi = np.random.randint(0,2,(2,3), dtype=bool)
print(bi)
print(a2[bi])

[[1 2 3]
 [4 5 6]]
[[False False  True]
 [ True  True  True]]
[3 4 5 6]


# 배열 값 삽입/수정/삭제/복사

## 배열 값 삽입

* `insert()`: 배열의 특정 위치에 값 삽입
* axis를 지정하지 않으면 1차원 배열로 변환
* 추가할 방향을 axis로 지정
* 원본 배열 변경없이 새로운 배열 반환

In [43]:
print(a1)
b1 = np.insert(a1, 0, 10)
print(b1)
c1 = np.insert(a1, 2 , 10)
print(c1)

[1 2 3 4 5]
[10  1  2  3  4  5]
[ 1  2 10  3  4  5]


In [45]:
print(a2)
b2 = np.insert(a2, 1, 10, axis=0)
c2 = np.insert(a2, 1, 10, axis = 1)
print(b2)
print(c2)

[[1 2 3]
 [4 5 6]]
[[ 1  2  3]
 [10 10 10]
 [ 4  5  6]]
[[ 1 10  2  3]
 [ 4 10  5  6]]


## 배열 값 수정

* 배열의 인덱싱으로 접근하여 값 수정

In [46]:
a1[0] = 11
a1[1] = 22
a1[2] = 33
print(a1)

a1[:2] = 9
print(a1)

i = np.array([1,3,4])
a1[i] = 0
print(a1)

a1[i] += 4
print(a1)

[11 22 33  4  5]
[ 9  9 33  4  5]
[ 9  0 33  0  0]
[ 9  4 33  4  4]


In [47]:
a2 = np.array([[1,2,3],[4,5,6],[7,8,9]])
print(a2)

a2[0,0]
a2[1,1]
a2[0] = 1
print(a2)

a2[1:, 2] = 9
print(a2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 1 1]
 [4 5 6]
 [7 8 9]]
[[1 1 1]
 [4 5 9]
 [7 8 9]]


## 배열 값 삭제

* `delete()`: 배열의 특정 위치에 값 삭제
* axis를 지정하지 않으면 1차원 배열로 변환
* 삭제할 방향을 axis로 지정
* 원본 배열 변경없이 새로운 배열 반환

In [48]:
a1 = np.array([1,2,3,4,5])
print(a1)

b1 = np.delete(a1, 1)
print(b1)
print(a1)

[1 2 3 4 5]
[1 3 4 5]
[1 2 3 4 5]


In [49]:
a2 = np.array([[1,2,3],[4,5,6],[7,8,9]])
print(a2)

b2 = np.delete(a2, 1, axis=0)
print(b2)
c2 = np.delete(a2, 1, axis=1)
print(c2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 2 3]
 [7 8 9]]
[[1 3]
 [4 6]
 [7 9]]


## 배열 복사

* 리스트 자료형과 달리 배열의 슬라이스는 복사본이 아님

In [50]:
print(a2)

a2_sub = a2[:2, :2]
print(a2_sub)

a2_sub[:, 1] = 0
print(a2_sub)
print(a2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 2]
 [4 5]]
[[1 0]
 [4 0]]
[[1 0 3]
 [4 0 6]
 [7 8 9]]



* `copy()`: 배열이나 하위 배열 내의 값을 명시적으로 복사

In [52]:
print(a2)

a2_sub_copy = a2[:2, :2].copy()
print(a2_sub_copy)

a2_sub_copy[:, 1] = 1
print(a2_sub_copy)
print(a2)

[[1 0 3]
 [4 0 6]
 [7 8 9]]
[[1 0]
 [4 0]]
[[1 1]
 [4 1]]
[[1 0 3]
 [4 0 6]
 [7 8 9]]




---



# 배열 변환

## 배열 전치 및 축 변경

In [53]:
a2 = np.array([[1,2,3],[4,5,6],[7,8,9]])
print(a2)
print(a2.T)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 4 7]
 [2 5 8]
 [3 6 9]]


In [55]:
print(a2)
print(a2.swapaxes(1,0))

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 4 7]
 [2 5 8]
 [3 6 9]]


## 배열 재구조화


* `reshape()`: 배열의 형상을 변경

In [86]:
n1 = np.arange(1,10)
print(n1)
print(n1.reshape(3,3))

[1 2 3 4 5 6 7 8 9]
[[1 2 3]
 [4 5 6]
 [7 8 9]]


* `newaxis()`: 새로운 축 추가. 한 차원 증가

In [None]:
print(n1)
print(n1[np.newaxis, 2:5])
print(n1[2:5, np.newaxis])

## 배열 크기 변경

* `resize()`: 배열 크기 변경
* element의 수가 같으면, 배열 모양만 변경
* element의 sequence는 유지됨

In [63]:
n2 = np.random.randint(0,10,(2,5))
print(n2)

n2.resize((5,2))
print(n2)

[[8 1 7 4 0]
 [4 9 7 2 7]]
[[8 1]
 [7 4]
 [0 4]
 [9 7]
 [2 7]]


* resize 크기가 원본 배열보다 크면, 남은 공간은 0으로 채워짐

In [66]:
n2.resize((5,5))
print(n2)

[[8 1 7 4 0]
 [4 9 7 2 7]
 [0 0 0 0 0]
 [0 0 0 0 0]
 [0 0 0 0 0]]


* resize 크기가 원본 배열보다 작으면, 기본 값은 삭제됨

In [68]:
n2.resize((3,3))
print(n2)

[[8 0 0]
 [0 0 0]
 [0 0 0]]


## 배열 추가

* `append()`: 배열의 끝에 값 추가

In [69]:
a2 = np.arange(1,10).reshape(3,3)
b2 = np.arange(10,19).reshape(3,3)
print(a2)
print(b2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[10 11 12]
 [13 14 15]
 [16 17 18]]


* axis 지정이 없으면 1차원 배열 형태로 변형되어 결합

In [70]:
c2 = np.append(a2, b2)
print(c2)

[ 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18]


* axis를 0으로 지정 : 행 방향 결합

In [71]:
c2 = np.append(a2, b2, axis=0)
print(c2)

[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]
 [13 14 15]
 [16 17 18]]


* axis를 1로 지정 : 열 방향 결합

In [72]:
c2 = np.append(a2, b2, axis=1)
print(c2)

[[ 1  2  3 10 11 12]
 [ 4  5  6 13 14 15]
 [ 7  8  9 16 17 18]]


## 배열 연결

* `concatenate()`: 튜플이나 배열의 리스트를 인수로 사용해 배열 연결
    + 기본값은 행방향 연결

In [73]:
a1 = np.array([1,3,5])
b1 = np.array([2,4,6])
np.concatenate([a1,b1])

array([1, 3, 5, 2, 4, 6])

In [74]:
c1 = np.array([7,8,9])
np.concatenate([a1,b1,c1])

array([1, 3, 5, 2, 4, 6, 7, 8, 9])

In [77]:
a2 = np.array([[1,2,3],
              [4,5,6]])
np.concatenate([a2,a2], axis = 1) # 열방향 연결

array([[1, 2, 3, 1, 2, 3],
       [4, 5, 6, 4, 5, 6]])

* `vstack()`: 수직 스택(vertical stack), y축 방향으로 연결

In [79]:
np.vstack([a2,a2])

array([[1, 2, 3, 1, 2, 3],
       [4, 5, 6, 4, 5, 6]])

* `hstack()`: 수평 스택(horizontal stack), x축 방향으로 연결

In [80]:
np.hstack([a2,a2])

array([[[1, 1],
        [2, 2],
        [3, 3]],

       [[4, 4],
        [5, 5],
        [6, 6]]])

* `dstack()`: 깊이 스택(depth stack), 3차원으로 연결

In [None]:
np.dstack([a2,a2])

* `stack()`: 새로운 차원으로 연결

In [81]:
np.stack([a2,a2])

array([[[1, 2, 3],
        [4, 5, 6]],

       [[1, 2, 3],
        [4, 5, 6]]])

## 배열 분할

* `split()`: 배열 분할

In [82]:
a1 = np.arange(11,21)
print(a1)

b1, c1 = np.split(a1, [5]) #index 5부터 새로운 배열
print(b1, c1)

b1,c1,d1,e1,f1 = np.split(a1, [2,4,6,8])
print(b1,c1,d1,e1,f1)

[11 12 13 14 15 16 17 18 19 20]
[11 12 13 14 15] [16 17 18 19 20]
[11 12] [13 14] [15 16] [17 18] [19 20]


* `vsplit()`: 수직(y축) 분할. 행 분할

In [83]:
a2 = np.arange(1,10).reshape(3,3)
print(a2)

b2, c2 = np.vsplit(a2,[2])
print(b2)
print(c2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 2 3]
 [4 5 6]]
[[7 8 9]]


* `hsplit()`: 수평(x축) 분할. 열 분할

In [84]:
a2 = np.arange(1,10).reshape(3,3)
print(a2)

b2, c2 = np.hsplit(a2,[2])
print(b2)
print(c2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 2]
 [4 5]
 [7 8]]
[[3]
 [6]
 [9]]




---



# 배열 연산

* NumPy의 배열 연산은 벡터화(vectorized) 연산을 사용
* 일반적으로 NumPy의 범용 함수(universal functions)를 통해 구현
* 배열 요소에 대한 반복적인 계산을 효율적으로 수행

## 브로드캐스팅(Broadcasting)

![1.3 Broadcasting.png](https://drive.google.com/uc?id=1iDTSzbR5GILf1-A7aTfNssG_IF6UZAD2)

In [89]:
a1 = np.array([1,2,3])
print(a1)
print(a1 + 5)
print('-------------------------')
a2 = np.arange(1,10).reshape(3,3)
print(a2)
print(a1 + a2)
print('-------------------------')
b2 = np.array([1,2,3]).reshape(3,1)
print(b2)
print(a1 + b2)

[1 2 3]
[6 7 8]
-------------------------
[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[ 2  4  6]
 [ 5  7  9]
 [ 8 10 12]]
-------------------------
[[1]
 [2]
 [3]]
[[2 3 4]
 [3 4 5]
 [4 5 6]]


## 산술 연산(Arithmetic Operators)

| 연산자	      | 범용 함수           | 설명        |
|---------------|---------------------|-------------|
|``+``          |``np.add``           | 덧셈        |
|``-``          |``np.subtract``      | 뺄셈        |
|``-``          |``np.negative``      | 단항 음수  |
|``*``          |``np.multiply``      | 곱셈        |
|``/``          |``np.divide``        | 나눗셈      |
|``//``         |``np.floor_divide``  | 나눗셈 내림 |
|``**``         |``np.power``         | 지수 연산   |
|``%``          |``np.mod``           | 나머지 연산 |


In [91]:
a1 = np.arange(1,10)
print(a1)
print(a1 + 1)
print(np.add(a1, 1))
print(a1 - 2)
print(np.subtract(a1, 2))
print(-a1)
print(np.negative(a1))
print(a1 * 2)
print(np.multiply(a1, 2))
print(a1 / 2)
print(np.divide(a1, 2))
print(a1 // 2)
print(np.floor_divide(a1, 2))
print(a1 ** 2)
print(np.power(a1, 2))
print(a1 % 2)
print(np.mod(a1, 2))

[1 2 3 4 5 6 7 8 9]
[ 2  3  4  5  6  7  8  9 10]
[ 2  3  4  5  6  7  8  9 10]
[-1  0  1  2  3  4  5  6  7]
[-1  0  1  2  3  4  5  6  7]
[-1 -2 -3 -4 -5 -6 -7 -8 -9]
[-1 -2 -3 -4 -5 -6 -7 -8 -9]
[ 2  4  6  8 10 12 14 16 18]
[ 2  4  6  8 10 12 14 16 18]
[0.5 1.  1.5 2.  2.5 3.  3.5 4.  4.5]
[0.5 1.  1.5 2.  2.5 3.  3.5 4.  4.5]
[0 1 1 2 2 3 3 4 4]
[0 1 1 2 2 3 3 4 4]
[ 1  4  9 16 25 36 49 64 81]
[ 1  4  9 16 25 36 49 64 81]
[1 0 1 0 1 0 1 0 1]
[1 0 1 0 1 0 1 0 1]


In [94]:
a1 = np.arange(1, 10)
b1 = np.random.randint(1, 10, size = 9)
print(a1, b1)
print(a1 + b1)
print(a1 - b1)
print(a1 * b1)
print(a1 / b1)
print(a1 // b1)
print(a1 ** b1)
print(a1 % b1)

[1 2 3 4 5 6 7 8 9] [3 1 3 1 9 8 1 5 2]
[ 4  3  6  5 14 14  8 13 11]
[-2  1  0  3 -4 -2  6  3  7]
[ 3  2  9  4 45 48  7 40 18]
[0.33333333 2.         1.         4.         0.55555556 0.75
 7.         1.6        4.5       ]
[0 2 1 4 0 0 7 1 4]
[      1       2      27       4 1953125 1679616       7   32768      81]
[1 0 0 0 5 6 0 3 1]


In [97]:
a2 = np.arange(1,10).reshape(3,3)
b2 = np.random.randint(1,10,size=(3,3))
print(a2)
print(b2)
print(a2 + b2)
print(a2 - b2)
print(a2 * b2)
print(a2 / b2)
print(a2 // b2)
print(a2 ** b2)
print(a2 % b2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[6 2 7]
 [6 4 5]
 [3 1 2]]
[[ 7  4 10]
 [10  9 11]
 [10  9 11]]
[[-5  0 -4]
 [-2  1  1]
 [ 4  7  7]]
[[ 6  4 21]
 [24 20 30]
 [21  8 18]]
[[0.16666667 1.         0.42857143]
 [0.66666667 1.25       1.2       ]
 [2.33333333 8.         4.5       ]]
[[0 1 0]
 [0 1 1]
 [2 8 4]]
[[   1    4 2187]
 [4096  625 7776]
 [ 343    8   81]]
[[1 0 3]
 [4 1 1]
 [1 0 1]]


### 절대값 함수(Absolute Function)

* `absolute()`, `abs()`: 내장된 절대값 함수

In [98]:
a1 = np.random.randint(-10,10, size = 5)
print(a1)
print(np.absolute(a1))
print(np.abs(a1))

[ 6  2 -6  0  0]
[6 2 6 0 0]
[6 2 6 0 0]


### 제곱/제곱근 함수

* `square`, `sqrt`: 제곱, 제곱근 함수

In [99]:
print(a1)
print(np.square(a1))
print(np.sqrt(a1)) # 음수가 있으면 runtimewarning이 발생 결과는 nan(Not A Number)

[ 6  2 -6  0  0]
[36  4 36  0  0]
[2.44948974 1.41421356        nan 0.         0.        ]


  print(np.sqrt(a1))


### 지수와 로그 함수 (Exponential and Log Function)

In [100]:
a1 = np.random.randint(1,10,size = 5)
print(a1)
print(np.exp(a1)) # e^n (e = 2.718...)
print(np.exp2(a1)) # 2^n

[1 4 8 1 1]
[2.71828183e+00 5.45981500e+01 2.98095799e+03 2.71828183e+00
 2.71828183e+00]
[  2.  16. 256.   2.   2.]


In [101]:
print(a1)
print(np.log(a1))
print(np.log2(a2))
print(np.log10(a1))

[1 4 8 1 1]
[0.         1.38629436 2.07944154 0.         0.        ]
[[0.         1.         1.5849625 ]
 [2.         2.32192809 2.5849625 ]
 [2.80735492 3.         3.169925  ]]
[0.         0.60205999 0.90308999 0.         0.        ]


## 집계 함수(Aggregate Functions)


|  함수  |  NaN 안전 모드  |            설명            |
|--------|-----------------|----------------------------|
| ``np.sum``        | ``np.nansum``       | 요소의 합 계산                       |
|``np.cumsum``      | ``np.nancumsum``    | 요소의 누적 합 |
|``np.diff``        | N/A      | 요소의 차분 |
| ``np.prod``       | ``np.nanprod``      | 요소의 곱 계산 |
|``np.cumprod``     |	``np.nancumprod``   | 요소의 누적 곱 |
|``np.dot``         |	N/A                 | 점 곱(dot product) |
|``np.matmul``      | N/A                 | 행렬 곱 |
|``np.tensordot``   |	N/A                 | 텐서곱(tensor product) |
|``np.cross``       |	N/A                 | 벡터곱(cross product) |
|``np.inner``       |	N/A                 | 내적(inner product) |
|``np.outer``       |	N/A                 | 외적(outer product) |
| ``np.mean``       | ``np.nanmean``      | 요소의 평균 계산                      |
| ``np.std``        | ``np.nanstd``       | 표준 편차 계산                    |
| ``np.var``        | ``np.nanvar``       | 분산 계산                              |
| ``np.min``        | ``np.nanmin``       | 최소값                            |
| ``np.max``        | ``np.nanmax``       | 최대값                            |
| ``np.argmin``     | ``np.nanargmin``    | 최소값 인덱스                   |
| ``np.argmax``     | ``np.nanargmax``    | 최대값 인덱스                   |
| ``np.median``     | ``np.nanmedian``    | 중앙값                    |
| ``np.percentile`` | ``np.nanpercentile``| 요소의 순위 기반 백분위 수 계산     |
| ``np.any``        | N/A                 | 요소 중 참이 있는지 평가        |
| ``np.all``        | N/A                 | 모든 요소가 참인지 평가        |



### sum(): 합 계산

In [102]:
a2 = np.random.randint(1,10, size=(3,3))
print(a2)
print(a2.sum(), np.sum(a2))
print(a2.sum(axis=0), np.sum(a2, axis=0))
print(a2.sum(axis=0), np.sum(a2, axis=1))

[[6 8 9]
 [4 8 5]
 [6 5 5]]
56 56
[16 21 19] [16 21 19]
[16 21 19] [23 17 16]


### cumsum(): 누적합 계산

In [103]:
print(a2)
print(np.cumsum(a2))
print(np.cumsum(a2, axis=0))
print(np.cumsum(a2, axis=1))

[[6 8 9]
 [4 8 5]
 [6 5 5]]
[ 6 14 23 27 35 40 46 51 56]
[[ 6  8  9]
 [10 16 14]
 [16 21 19]]
[[ 6 14 23]
 [ 4 12 17]
 [ 6 11 16]]


### prod(): 곱 계산

In [104]:
print(a2)
print(np.prod(a2))
print(np.prod(a2, axis=0))
print(np.prod(a2, axis=1))

[[6 8 9]
 [4 8 5]
 [6 5 5]]
10368000
[144 320 225]
[432 160 150]


### cumprod(): 누적곱 계산

In [105]:
print(a2)
print(np.cumprod(a2))
print(np.cumprod(a2, axis=0))
print(np.cumprod(a2, axis=1))

[[6 8 9]
 [4 8 5]
 [6 5 5]]
[       6       48      432     1728    13824    69120   414720  2073600
 10368000]
[[  6   8   9]
 [ 24  64  45]
 [144 320 225]]
[[  6  48 432]
 [  4  32 160]
 [  6  30 150]]


### dot()/matmul(): 점곱/행렬곱 계산

In [106]:
print(a2)
b2 = np.ones_like(a2)
print(b2)
print(np.dot(a2,b2))
print(np.matmul(a2,b2))

[[6 8 9]
 [4 8 5]
 [6 5 5]]
[[1 1 1]
 [1 1 1]
 [1 1 1]]
[[23 23 23]
 [17 17 17]
 [16 16 16]]
[[23 23 23]
 [17 17 17]
 [16 16 16]]


### mean(): 평균 계산

In [107]:
print(a2)
print(np.mean(a2))
print(np.mean(a2, axis=0))
print(np.mean(a2, axis=1))

[[6 8 9]
 [4 8 5]
 [6 5 5]]
6.222222222222222
[5.33333333 7.         6.33333333]
[7.66666667 5.66666667 5.33333333]


### std(): 표준 편차 계산

In [108]:
print(a2)
print(np.std(a2))
print(np.std(a2, axis=0))
print(np.std(a2, axis=1))

[[6 8 9]
 [4 8 5]
 [6 5 5]]
1.617802197617893
[0.94280904 1.41421356 1.88561808]
[1.24721913 1.69967317 0.47140452]


### var(): 분산 계산

In [109]:
print(a2)
print(np.var(a2))
print(np.var(a2, axis=0))
print(np.var(a2, axis=1))

[[6 8 9]
 [4 8 5]
 [6 5 5]]
2.6172839506172836
[0.88888889 2.         3.55555556]
[1.55555556 2.88888889 0.22222222]


### min(): 최소값

In [110]:
print(a2)
print(np.min(a2))
print(np.min(a2, axis=0))
print(np.min(a2, axis=1))

[[6 8 9]
 [4 8 5]
 [6 5 5]]
4
[4 5 5]
[6 4 5]


### max(): 최대값

In [112]:
print(a2)
print(np.max(a2))
print(np.max(a2, axis=0))
print(np.max(a2, axis=1))

[[6 8 9]
 [4 8 5]
 [6 5 5]]
9
[6 8 9]
[9 8 6]


### argmin(): 최소값 인덱스

In [113]:
print(a2)
print(np.argmin(a2))
print(np.argmin(a2, axis=0))
print(np.argmin(a2, axis=1))

[[6 8 9]
 [4 8 5]
 [6 5 5]]
3
[1 2 1]
[0 0 1]


### argmax(): 최대값 인덱스

In [114]:
print(a2)
print(np.argmax(a2))
print(np.argmax(a2, axis=0))
print(np.argmax(a2, axis=1))

[[6 8 9]
 [4 8 5]
 [6 5 5]]
2
[0 0 0]
[2 1 0]


### median(): 중앙값

In [115]:
print(a2)
print(np.median(a2))
print(np.median(a2, axis=0))
print(np.median(a2, axis=1))

[[6 8 9]
 [4 8 5]
 [6 5 5]]
6.0
[6. 8. 5.]
[8. 5. 5.]


### percentile(): 백분위 수

* percentile(a, q, interpolation='linear')
    + a 배열 요소의 q번째 백분위 수 계산
    + q는 0~100 사이의 값
    + interpolation : 백분위 수가 두 데이터 i, j (i < j) 사이에 있을 때 사용할 보간 방법
        - 'linear' : i + (j - i) * fraction, where fraction is the fractional part of the index surrounded by i and j.
        - 'lower' : i
        - 'higher' : j
        - 'nearest' : i or j, whichever is nearest
        - 'midpoint' : (i + j) / 2

In [117]:
a1 = np.arange(1, 11)
print(a1)
print(np.percentile(a1, [30,50,80],interpolation='linear'))
print(np.percentile(a1, [30,50,80],interpolation='lower'))
print(np.percentile(a1, [30,50,80],interpolation='higher'))
print(np.percentile(a1, [30,50,80],interpolation='nearest'))
print(np.percentile(a1, [30,50,80],interpolation='midpoint'))

[ 1  2  3  4  5  6  7  8  9 10]
[3.7 5.5 8.2]
[3 5 8]
[4 6 9]
[4 5 8]
[3.5 5.5 8.5]


### any()

In [118]:
a2 = np.array([[False,False,False],
             [True, True, True],
             [False, True, True]])
print(a2)
print(np.any(a2))
print(np.any(a2, axis=0))
print(np.any(a2, axis=1))

[[False False False]
 [ True  True  True]
 [False  True  True]]
True
[ True  True  True]
[False  True  True]


### all()

In [119]:
a2 = np.array([[False,False,False],
             [True, True, True],
             [False, True, True]])
print(a2)
print(np.all(a2))
print(np.all(a2, axis=0))
print(np.all(a2, axis=1))

[[False False False]
 [ True  True  True]
 [False  True  True]]
False
[False False False]
[False  True False]


## 비교 연산(Comparison Operators)

| 연산자	      | 비교 범용 함수      |
|---------------|---------------------|
|``==``         |``np.equal``         |
|``!=``         |``np.not_equal``     |
|``<``          |``np.less``          |
|``<=``         |``np.less_equal``    |
|``>``          |``np.greater``       |
|``>=``         |``np.greater_equal`` |

In [120]:
a1 = np.arange(1,10)
print(a1)
print(a1 == 5)
print(a1 != 5)
print(a1 < 5)
print(a1 <= 5)
print(a1 > 5)
print(a1 >= 5)

[1 2 3 4 5 6 7 8 9]
[False False False False  True False False False False]
[ True  True  True  True False  True  True  True  True]
[ True  True  True  True False False False False False]
[ True  True  True  True  True False False False False]
[False False False False False  True  True  True  True]
[False False False False  True  True  True  True  True]


## 배열 정렬

* np.sort(array) : 정렬된 배열의 복사본 생성. 원본 배열의 변경 없음
* array.sort() : 원본 배열의 값이 변경됨

In [121]:
a1 = np.random.randint(1,10,size = 10)
print(a1)
print(np.sort(a1))
print(a1)
print(a1.sort())
print(a1)

[6 6 5 2 2 7 4 8 2 8]
[2 2 2 4 5 6 6 7 8 8]
[6 6 5 2 2 7 4 8 2 8]
None
[2 2 2 4 5 6 6 7 8 8]


### 부분 정렬

* `partition(array, k)`: 배열에서 k개의 작은 값을 선택하여 왼쪽에 배치
    + -k : k개의 큰 값을 오른쪽에 배치

In [122]:
a1 = np.random.randint(1,10,size = 10)
print(a1)
print(np.partition(a1,3))
print(np.partition(a1,-3))

[6 9 1 1 5 6 9 3 6 4]
[1 1 3 4 5 6 9 9 6 6]
[3 4 1 1 5 6 6 6 9 9]


# 배열 입출력

| 함수 | 설명 | 파일 종류 |
|------|------|-----------|
| `np.save()` | NumPy 배열 객체 1개를 파일에 저장 | 바이너리 |
| `np.savez()` | NumPy 배열 객체 여러개를 파일에 저장 | 바이너리 |
| `np.load()` | NumPy 배열 저장 파일로부터 객체 로딩 | 바이너리 |
| `np.loadtxt()` | 텍스트 파일로부터 배열 로딩 | 텍스트 |
| `np.savetxt()` | 텍스트 파일에 NumPy 배열 객체 저장 | 텍스트 |

In [123]:
a2 = np.random.randint(1,10,size = (5,5))
print(a2)
np.save("a", a2)

[[9 6 4 6 4]
 [9 3 6 3 3]
 [6 2 8 5 3]
 [1 7 9 7 9]
 [1 2 2 7 3]]


In [124]:
ls

 E 드라이브의 볼륨: 새 볼륨
 볼륨 일련 번호: C475-428A

 E:\python 디렉터리

2021-11-19  오후 05:22    <DIR>          .
2021-11-19  오후 05:22    <DIR>          ..
2021-11-19  오후 02:40    <DIR>          .ipynb_checkpoints
2021-11-12  오후 04:06    <DIR>          10주차
2021-09-10  오후 05:26    <DIR>          1주차
2021-10-21  오후 01:50    <DIR>          2주차
2021-10-21  오후 02:04    <DIR>          3주차
2021-10-21  오후 03:26    <DIR>          4주차
2021-10-22  오후 02:04    <DIR>          5주차
2021-10-13  오후 08:30    <DIR>          6주차
2021-11-11  오전 12:29    <DIR>          7주차
2021-11-11  오후 08:30    <DIR>          8주차
2021-11-12  오후 03:15    <DIR>          9주차
2021-11-19  오후 05:22               228 a.npy
2021-11-12  오후 05:31    <DIR>          chapter 10
2021-11-12  오후 04:06    <DIR>          chapter10
2021-11-19  오후 05:22           122,717 NumPy.ipynb
2021-10-21  오후 03:42             6,630 practice.ipynb
2021-10-27  오후 04:44                72 Untitled.ipynb
2021-09-29  오후 08:49             5,016 과제1 2017134041_황보규.ipynb
2021

In [125]:
b2 = np.random.randint(1,10,size = (5,5))
print(b2)
np.savez("ab",a2,b2)

[[7 1 8 8 4]
 [4 9 6 1 8]
 [6 2 5 3 5]
 [2 1 2 8 5]
 [9 9 1 3 2]]


In [126]:
npy = np.load("a.npy")
print(npy)

[[9 6 4 6 4]
 [9 3 6 3 3]
 [6 2 8 5 3]
 [1 7 9 7 9]
 [1 2 2 7 3]]


In [128]:
npz = np.load("ab.npz")
print(npz.files)

['arr_0', 'arr_1']


In [129]:
print(npz['arr_0'])
print(npz['arr_1'])

[[9 6 4 6 4]
 [9 3 6 3 3]
 [6 2 8 5 3]
 [1 7 9 7 9]
 [1 2 2 7 3]]
[[7 1 8 8 4]
 [4 9 6 1 8]
 [6 2 5 3 5]
 [2 1 2 8 5]
 [9 9 1 3 2]]


In [130]:
print(a2)
np.savetxt("a.csv", a2, delimiter=',')

[[9 6 4 6 4]
 [9 3 6 3 3]
 [6 2 8 5 3]
 [1 7 9 7 9]
 [1 2 2 7 3]]


In [131]:
ls

 E 드라이브의 볼륨: 새 볼륨
 볼륨 일련 번호: C475-428A

 E:\python 디렉터리

2021-11-19  오후 05:26    <DIR>          .
2021-11-19  오후 05:26    <DIR>          ..
2021-11-19  오후 02:40    <DIR>          .ipynb_checkpoints
2021-11-12  오후 04:06    <DIR>          10주차
2021-09-10  오후 05:26    <DIR>          1주차
2021-10-21  오후 01:50    <DIR>          2주차
2021-10-21  오후 02:04    <DIR>          3주차
2021-10-21  오후 03:26    <DIR>          4주차
2021-10-22  오후 02:04    <DIR>          5주차
2021-10-13  오후 08:30    <DIR>          6주차
2021-11-11  오전 12:29    <DIR>          7주차
2021-11-11  오후 08:30    <DIR>          8주차
2021-11-12  오후 03:15    <DIR>          9주차
2021-11-19  오후 05:26               630 a.csv
2021-11-19  오후 05:22               228 a.npy
2021-11-19  오후 05:24               706 ab.npz
2021-11-12  오후 05:31    <DIR>          chapter 10
2021-11-12  오후 04:06    <DIR>          chapter10
2021-11-19  오후 05:26           125,954 NumPy.ipynb
2021-10-21  오후 03:42             6,630 practice.ipynb
2021-10-27  오후 04:44           

In [133]:
csv = np.loadtxt("a.csv", delimiter=',')
print(csv)

[[9. 6. 4. 6. 4.]
 [9. 3. 6. 3. 3.]
 [6. 2. 8. 5. 3.]
 [1. 7. 9. 7. 9.]
 [1. 2. 2. 7. 3.]]




---



# 참고문헌

* NumPy, https://numpy.org/
* Jake VanderPlas, "Python Data Science Handbook", O'Reilly
* Wes Mckinney, "Python for Data Analysis", O'Reilly