# Numpy
Numpy는 Numerical Python의 줄임말로, 파이썬에서 산술 계산을 위한 가장 중요한 패키지다.</br>
과학 계산을 위한 대부분의 패키지는 Numpy의 배열 객체를 데이터 교환을 위한 공통 언어처럼 사용한다.

## Numpy 라이브러리 import

In [1]:
import numpy as np

### Numpy ndarray
Numpy의 핵심 기능 중 하나는 ndarray라고 하는 N차원의 배열 객체다.</br>
파이썬에서 할 수 있는 대규모 데이터 집합을 담을 수 있는 빠르고 유연한 자료구조이다.

In [5]:
a = np.array([1, 2, 3])
print(a, type(a))

[1 2 3] <class 'numpy.ndarray'>


### List와 비교

In [21]:
L = [1, 2, 3]
A = np.array([1, 2, 3])
print(L)
print(A)

[1, 2, 3]
[1 2 3]


In [22]:
for i in L:
    print(i)

1
2
3


In [23]:
for i in A:
    print(i)

1
2
3


In [24]:
L.append(4)
print(L)

[1, 2, 3, 4]


In [25]:
A = np.append(A, 4)
print(A)

[1 2 3 4]


In [26]:
L = L + [5]
print(L)

[1, 2, 3, 4, 5]


In [27]:
A = A + np.array([5])
print(A) # 브로드캐스팅 현상

[6 7 8 9]


In [29]:
# list의 모든 원소를 2배로 만들기
L = [1, 2, 3]
L2 = []
for i in L:
    L2.append(i * 2)
print(L2)

[2, 4, 6]


In [32]:
A = np.array([1, 2, 3])
A2 = np.array([])

for i in A:
    A2 = np.append(i * 2)
print(A2)

TypeError: append() missing 1 required positional argument: 'values'

In [33]:
A = np.array(L)
A2 = A * 2
print(A2)

[2 4 6]


In [34]:
L * 2

[1, 2, 3, 1, 2, 3]

### 배열
Numpy 배열은 모두 같은 유형의 값이며, 음수가 아닌 정수 튜플로 인덱싱된다. 차원의 수는 배열의 랭크이다.</br>
배열의 shape은 각 차원별 배열 크기의 튜플이다. 중첩된 파이썬 리스트로부터 numpy배열을 초기화 할 수 있고 대괄호를 사용하여 요소에 접근할 수 있다.

In [35]:
a = np.array([1, 2, 3])
print(a)
print(type(a), a.ndim, a.shape, a.dtype)

[1 2 3]
<class 'numpy.ndarray'> 1 (3,) int64


In [8]:
# asarray를 사용하면 원본 데이터를 그대로 복사(연결되어 있다), 값을 수정하면 원본도 바뀐다.
b = np.asarray(a)

print(b)

[9 2 3]


In [7]:
b[0] = 9
print(a)
print(b)

[9 2 3]
[9 2 3]


In [9]:
c = np.array(a)
print(c)

[9 2 3]


In [10]:
c[0] = 1
print(a)
print(b)
print(c)

[9 2 3]
[9 2 3]
[1 2 3]


In [19]:
a = np.zeros((3, 4)) #3행 4열
print(a)
print(type(a))
print(a.dtype)

[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]
<class 'numpy.ndarray'>
float64


In [14]:
b = np.ones((5,2))
print(b)

[[1. 1.]
 [1. 1.]
 [1. 1.]
 [1. 1.]
 [1. 1.]]


In [15]:
c = np.full((2,3), 4)
print(c)

[[4 4 4]
 [4 4 4]]


In [23]:
d = np.empty((3,3))
print(d)

[[ 2.60605835e-31 -5.21211670e-31  1.30302917e-31]
 [-5.21211670e-31  1.13363538e-30 -3.51817877e-31]
 [ 1.30302917e-31 -3.51817877e-31  2.01969522e-31]]


In [25]:
e = np.zeros_like(a)
f = np.ones_like(a)
g = np.full_like(a, 2)
h = np.empty_like(a)
print(e)
print(f)
print(g)
print(h)

[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]
[[1. 1. 1. 1.]
 [1. 1. 1. 1.]
 [1. 1. 1. 1.]]
[[2. 2. 2. 2.]
 [2. 2. 2. 2.]
 [2. 2. 2. 2.]]
[[2. 2. 2. 2.]
 [2. 2. 2. 2.]
 [2. 2. 2. 2.]]


In [28]:
# 항등행렬, 대각선 방향으로 1을 채우고 나머지는 0
i = np.eye(3)
j = np.identity(10)
print(i)
print(j)

[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]
[[1. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 1. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 1. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 1. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 1. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 1. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 1. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 1. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 1.]]


In [36]:
k = np.arange(10)
print(k)

[0 1 2 3 4 5 6 7 8 9]


In [43]:
k = np.arange(10, 0, -1)
print(k)

[10  9  8  7  6  5  4  3  2  1]


In [35]:
for i in range(1, 10):
    print(i)

1
2
3
4
5
6
7
8
9


In [41]:
# uniform distribution
I = np.random.rand(2,2)
print(I)

[[0.76777479 0.950071  ]
 [0.99460117 0.85262658]]


In [42]:
# normal distribution
m = np.random.randn(2,2)
print(m)

[[-1.80815784  0.38622606]
 [-0.96925605  0.28784517]]


### 배열의 dtype

In [46]:
a = np.array([1, 2, 3])
b = np.array([1, 2, 3], dtype = np.float64)
c = np.array([1, 2, 3], dtype = np.int32)

print(a, b, c)
print(a.dtype, b.dtype, c.dtype)

[1 2 3] [1. 2. 3.] [1 2 3]
int64 float64 int32


In [48]:
d = np.array([1, 2, 3], dtype = 'i1')
e = np.array([1, 2, 3], dtype = 'i2')
f = np.array([1, 2, 3], dtype = 'i4')
g = np.array([1, 2, 3], dtype = 'i8')

print(d.dtype, e.dtype, f.dtype, g.dtype)

int8 int16 int32 int64


In [49]:
d = np.array([1, 2, 3], dtype = 'u1')
e = np.array([1, 2, 3], dtype = 'u2')
f = np.array([1, 2, 3], dtype = 'u4')
g = np.array([1, 2, 3], dtype = 'u8')

print(d.dtype, e.dtype, f.dtype, g.dtype)

uint8 uint16 uint32 uint64


In [50]:
d = np.array([1, 2, 3], dtype = 'f2')
e = np.array([1, 2, 3], dtype = 'f4')
f = np.array([1, 2, 3], dtype = 'f8')
g = np.array([1, 2, 3], dtype = 'f16')

print(d.dtype, e.dtype, f.dtype, g.dtype)

float16 float32 float64 float128


In [55]:
d = np.array([1, 2, 3], dtype = 'i')
e = np.array([1, 2, 3], dtype = 'd')
f = np.array([1, 2, 3], dtype = 'g')

print(d.dtype, e.dtype, f.dtype)

int32 float64 float128


In [58]:
d = d.astype(np.float64)
print(d.dtype)

float64


In [61]:
j = f.astype(f.dtype)

### 배열 Indexing(색인)과 slicing

In [74]:
a = np.arange(10)
print(a)

[0 1 2 3 4 5 6 7 8 9]


In [75]:
print(a[5])
print(a[0])

5
0


In [76]:
print(a[5:8])

[5 6 7]


In [77]:
print(a[-1])

9


In [79]:
print(a[7:-1])

[7 8]


In [80]:
a[5:8] = 10
print(a)

[ 0  1  2  3  4 10 10 10  8  9]


#### indexing을 사용하면 항상 랭크가 감소합니다. 반면에 slicing을 사용하면 차원이 유지됩니다.

In [81]:
b = np.arange(1, 13)
print(b)
print(b.shape)
print(b.ndim)

[ 1  2  3  4  5  6  7  8  9 10 11 12]
(12,)
1


In [83]:
indexing = b[1]
slicing = b[1:2]
print(indexing, indexing.shape, indexing.ndim)
print(slicing, slicing.shape, slicing.ndim)

2 () 0
[2] (1,) 1


이것은 Indexing과 slicing을 함께 사용할 때도 마찬가지이다. Indexing의 개수만큼 랭크는 감소한다.

In [84]:
b = b.reshape(3, 4)
print(b)
print(b.shape)
print(b.ndim)

[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]
(3, 4)
2


In [86]:
row_r1 = b[1, : ]
row_r2 = b[1:2, :]
print(row_r1, row_r1.shape, row_r1.ndim)
print(row_r2, row_r2.shape, row_r2.ndim)

[5 6 7 8] (4,) 1
[[5 6 7 8]] (1, 4) 2


#### slicing examples

In [87]:
c = np.arange(24).reshape(2,3,4)
print(c)
print(c.shape)

[[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]]
(2, 3, 4)


In [88]:
c = np.arange(24).reshape(3,2,4)
print(c)

[[[ 0  1  2  3]
  [ 4  5  6  7]]

 [[ 8  9 10 11]
  [12 13 14 15]]

 [[16 17 18 19]
  [20 21 22 23]]]


In [105]:
print(c[:,:,3:])

[[[ 3]
  [ 7]]

 [[11]
  [15]]

 [[19]
  [23]]]


In [107]:
print(c[:,:,:1])

[[[ 0]
  [ 4]]

 [[ 8]
  [12]]

 [[16]
  [20]]]


In [106]:
print(c[:1,...])

[[[0 1 2 3]
  [4 5 6 7]]]


In [118]:
print(c[0:1])
print(c[0::3])

[[[0 1 2 3]
  [4 5 6 7]]]
[[[0 1 2 3]
  [4 5 6 7]]]


### boolean indexing

In [120]:
c = np.arange(24).reshape(2,3,4)
print(c)

[[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]]


In [121]:
bool_idx = (c > 10)
print(bool_idx)

[[[False False False False]
  [False False False False]
  [False False False  True]]

 [[ True  True  True  True]
  [ True  True  True  True]
  [ True  True  True  True]]]


In [122]:
print(c[bool_idx])

[11 12 13 14 15 16 17 18 19 20 21 22 23]


In [123]:
c[c>10] = -1
print(c)

[[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 -1]]

 [[-1 -1 -1 -1]
  [-1 -1 -1 -1]
  [-1 -1 -1 -1]]]


### fancy indexing

In [None]:
d = np.arange(8).reshape(8,-1)
print(d, d.shape)

In [None]:
d = np.hstack((d, d, d, d))
print(d, d.shape)