# Numpy
---------

## > 넘파이 배열

![image.png](attachment:c38478ca-4269-4fab-a34b-a0f27bec4417.png)

#### -> python list vs numpy ndarray 비교

![image.png](attachment:83e8c62e-045c-4086-8bcf-2e32f1f9c458.png)

## > 넘파이 패키지 임포트하기

![image.png](attachment:3c7772e4-eb2a-42bf-aa93-f0dc6c4bcb2a.png)

#### -> 기본적으로 anaconda에 포함되어 설치된 라이브러리

In [2]:
import numpy as np

## > 1차원 배열 만들기

![image.png](attachment:2398540d-f4ff-4eab-b540-fdca9a4df945.png)

#### -> ndarray class로부터 객체를 생성한다.

In [151]:
ar = np.array([_ for _ in range(10)])
ar

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [152]:
np.arange(10)

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [14]:
type(ar)

numpy.ndarray

In [16]:
ar.shape

(10,)

## > 1차원 배열 만들기

![image.png](attachment:510f2b79-94a7-443a-b8f4-212f717030c3.png)

In [26]:
ar2 = np.array([0.1, 5, 4, 10, 2, 3.14])

In [25]:
ar2

array([ 0.  ,  5.  ,  4.  , 10.  ,  2.  ,  3.14])

## > 넘파이의 자료형

![image.png](attachment:fc048fa2-8511-4d5f-a23a-d1065c2f777e.png)

![image.png](attachment:53663a7e-bc9f-4813-b690-3b9dddeb8348.png)

In [27]:
ar2.dtype

dtype('float64')

In [29]:
x = np.array([1, 2, 3], dtype = 'f')

In [30]:
x.dtype

dtype('float32')

#### -> ndarray도 인덱싱을 할 수 있다.

In [31]:
x[0] + x[1]

3.0

In [153]:
x = np.array([1, 2, 3], dtype = 'U')
x

array(['1', '2', '3'], dtype='<U1')

In [36]:
x.dtype

dtype('<U1')

In [37]:
x[0] + x[1]

'12'

In [38]:
x = [0, 1, -1, 0]
y = [1, 0, 0, 0]
x / y

TypeError: unsupported operand type(s) for /: 'list' and 'list'

#### -> 리스트와 리스트는 나누기 연산이 안됨

![image.png](attachment:a5addfbf-5b30-4932-aae9-9daa3eee06c7.png)

In [39]:
xn = np.array(x)
yn = np.array(y)

In [42]:
xn

array([ 0,  1, -1,  0])

In [43]:
yn

array([1, 0, 0, 0])

In [44]:
xn / yn

  xn / yn
  xn / yn


array([  0.,  inf, -inf,  nan])

## > 벡터화 연산(Vectorized Operation)

![image.png](attachment:6bb84090-6719-4f1b-a843-28c4d9a24a6b.png)

In [49]:
data = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [50]:
x = np.array(data)
x

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [52]:
2 * x

array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18])

In [53]:
a = np.array([1, 2, 3])
b = np.array([10, 20, 30])

In [54]:
2 * a + b

array([12, 24, 36])

In [55]:
a == 2

array([False,  True, False])

In [59]:
a == np.array([2, 2, 2])

array([False,  True, False])

In [57]:
b > 10

array([False,  True,  True])

In [58]:
(a == 2) & (b > 10) 

array([False,  True, False])

#### -> '&'는 비트 비교연산자 / 벡터연산을 하기 때문에 'and'값을 쓸 수 없음.
#### -> '&'연산자는 우선순위가 있기 때문에 ()로 표기.

## > 2차원 배열 만들기

![image.png](attachment:94455503-9876-4b56-98bf-1752f0e70e40.png)

In [62]:
c = np.array([[0, 1, 2], [3, 4, 5]])
c

array([[0, 1, 2],
       [3, 4, 5]])

In [63]:
c.shape

(2, 3)

In [64]:
len(c) #행의 갯수

2

In [65]:
len(c[0]) #열의 갯수

3

#### -> 리스트형을 중첩하는 구조를 통해 2차원 배열처럼 생성 가능

In [155]:
# 연습문제
np.array([[10, 20, 30, 40], [50, 60, 70, 80]])

array([[10, 20, 30, 40],
       [50, 60, 70, 80]])

In [154]:
# 연습문제
np.array([[_ for _ in range(10, 41, 10)],
          [_ for _ in range(50, 81, 10)]])

array([[10, 20, 30, 40],
       [50, 60, 70, 80]])

## > 3차원 배열 만들기

![image.png](attachment:29f64c2c-8622-4c00-afc7-a737fdab4330.png)

In [158]:
d = np.array([[[1, 2, 3, 4],
               [5, 6, 7, 8],
               [9, 10, 11, 12]],
              [[11, 12, 13, 14],
               [15, 16, 17, 18],
               [19, 20, 21, 22]]])

In [159]:
d

array([[[ 1,  2,  3,  4],
        [ 5,  6,  7,  8],
        [ 9, 10, 11, 12]],

       [[11, 12, 13, 14],
        [15, 16, 17, 18],
        [19, 20, 21, 22]]])

In [160]:
d.dtype

dtype('int32')

#### -> 3차원 배열의 깊이, 행, 열 구하기

In [161]:
d.shape

(2, 3, 4)

In [162]:
len(d), len(d[0]), len(d[0][0])

(2, 3, 4)

## > 배열의 차원과 크기 알아내기 

![image.png](attachment:80fa1a11-9b2c-447b-9bae-a71e29dd91c9.png)

In [74]:
a = np.array([1, 2 ,3])
print(a.ndim)
print(a.shape)

1
(3,)


In [75]:
print(c.ndim)
print(c.shape)

2
(2, 3)


In [76]:
print(d.ndim)
print(d.shape)

3
(2, 3, 4)


#### -> 'ndim'은 배열의 차원 'shape'은 배열의 속성(행/렬)을 표현

## > 배열의 인덱싱

In [None]:
# 1차원 배열의 인덱싱
a = np.array([0, 1, 2, 3, 4])
a[2]

In [77]:
# list
test = [[1, 2, 3, 4], [5, 6, 7, 8]]
test[1][1]

6

In [81]:
# 다차원 배열의 인덱싱

b = np.array([[0, 1, 2], [3, 4, 5]])
b

array([[0, 1, 2],
       [3, 4, 5]])

In [83]:
b[0,0]

0

In [84]:
b[1,0]

3

## > 배열의 슬라이싱

In [85]:
a = [[1, 2, 3, 4], [5, 6, 7, 8]]
a[0][0:3]

[1, 2, 3]

In [86]:
a = np.array([[0, 1, 2, 3], [4, 5, 6, 7]])
a

array([[0, 1, 2, 3],
       [4, 5, 6, 7]])

In [87]:
a[0, :]

array([0, 1, 2, 3])

In [89]:
a[1, 0:]

array([4, 5, 6, 7])

In [90]:
a[1, 1:2]

array([5])

In [92]:
a[:1, 1:]

array([[1, 2, 3]])

In [93]:
# 연습문제
m = np.array([[0, 1, 2, 3, 4], 
              [5, 6, 7, 8, 9], 
              [10, 11, 12, 13, 14]])          
# 1. 이 행렬에서 값 7 을 인덱싱한다.
# 2. 이 행렬에서 값 14 을 인덱싱한다.
# 3. 이 행렬에서 배열 [6, 7] 을 슬라이싱한다.
# 4. 이 행렬에서 배열 [7, 12] 을 슬라이싱한다.
# 5. 이 행렬에서 배열 [[3, 4], [8, 9]] 을 슬라이싱한다. 

In [125]:
print(m[1][2])
print(m[2][-1])
print(m[1, 1:3])
print(m[1:, 2])
print(m[:2, 3:])

7
14
[6 7]
[ 7 12]
[[3 4]
 [8 9]]


## > 배열 생성

![image.png](attachment:f7c45118-88ce-4ea7-b3ec-8e4b312097a4.png)

#### -> 모든 값이 0인 배열을 생성하려면 zeros 메서드 활용

In [126]:
zeros = np.zeros(5)
zeros

array([0., 0., 0., 0., 0.])

In [128]:
c = np.zeros((5, 2), dtype="i")
c

array([[0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0]], dtype=int32)

In [163]:
d = np.zeros(5, dtype="U4")
d

array(['', '', '', '', ''], dtype='<U4')

In [164]:
d[0] = "abc"
d[1] = "abcd"
d[2] = "ABCDE"
d[3] = "ABCDEF"
d

array(['abc', 'abcd', 'ABCD', 'ABCD', ''], dtype='<U4')

#### * zeros 메서드로 문자열 배열 생성가능하지만 모든 요소의 문자열 크기가 같아야함.

#### -> 0이 아닌 1로 초기화된 배열을 생성하려면 ones 명령 사용 

In [132]:
e = np.ones((2, 3, 4), dtype="i8")
e

array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],

       [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]], dtype=int64)

In [135]:
np.ones((2, 3, 4), dtype='<U4')

array([[['1', '1', '1', '1'],
        ['1', '1', '1', '1'],
        ['1', '1', '1', '1']],

       [['1', '1', '1', '1'],
        ['1', '1', '1', '1'],
        ['1', '1', '1', '1']]], dtype='<U4')

In [136]:
test = np.array([10, 20, 22])

In [137]:
np.ones_like(test, dtype='f')

array([1., 1., 1.], dtype=float32)

In [141]:
#np.zeros(test, dtype='f')

![image.png](attachment:a3045e15-09e8-4e02-bdbf-9049c4917bc4.png)

In [170]:
g = np.empty((4, 3))
g

array([[  2.,   2.,   2.],
       [150., 400., 650.],
       [  2.,   2.,   2.],
       [150., 400., 650.]])

In [171]:
np.arange(10)

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [169]:
np.arange(3, 21, 2) # 시작, 끝(포함하지 않음), 단계

array([ 3,  5,  7,  9, 11, 13, 15, 17, 19])

#### -> linspace 명령이나 logspace 명령은 선형 구간 혹은 로그 구간을 지정한 구간의 수만큼 분할 

In [148]:
ex = np.linspace(0, 100, 5)
ex

array([  0.,  25.,  50.,  75., 100.])

In [150]:
ex2 = np.logspace(0, 100, 5)
ex2

array([1.e+000, 1.e+025, 1.e+050, 1.e+075, 1.e+100])

## > 전치 연산

![image.png](attachment:2d78529c-c0ee-47ad-ab4b-687244f4c9bc.png)

In [200]:
A = np.array([[1, 2, 3], [4, 5, 6]])
A

array([[1, 2, 3],
       [4, 5, 6]])

In [201]:
A.T

array([[1, 4],
       [2, 5],
       [3, 6]])

## > 배열의 크기 변형

![image.png](attachment:0a628f16-628b-4a2e-88a9-3c77488a1bf5.png)

In [188]:
a = np.arange(12)
a

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

In [189]:
b = a.reshape(3, 4)
b

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

In [190]:
a.reshape(3, -1)

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

In [197]:
a.reshape(2, -1, 2)

array([[[ 0,  1],
        [ 2,  3],
        [ 4,  5]],

       [[ 6,  7],
        [ 8,  9],
        [10, 11]]])

In [198]:
a.reshape(2, 2, -1)

array([[[ 0,  1,  2],
        [ 3,  4,  5]],

       [[ 6,  7,  8],
        [ 9, 10, 11]]])

In [196]:
a.reshape(7, -1)

ValueError: cannot reshape array of size 12 into shape (7,newaxis)

#### -> reshape 명령의 형태 튜플의 원소 중 하나는 -1이라는 숫자로 대체할 수 있다.
#### -> -1을 넣으면 해당 숫자는 다를 값에서 게산되어 사용된다.

In [199]:
a.flatten()

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

In [200]:
a.ravel()

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

#### -> 다차원 배열을 1차원으로 만들기 위해서는 faltten 혹은 ravel 메서드 사용

In [164]:
x = np.arange(5)
x

array([0, 1, 2, 3, 4])

In [171]:
x.reshape(1, 5)

array([[0, 1, 2, 3, 4]])

In [172]:
x.reshape(5, 1)

array([[0],
       [1],
       [2],
       [3],
       [4]])

In [169]:
x = np.arange(5)

In [170]:
# 차원을 증가시킬 수 있음
x[:, np.newaxis]

array([[0],
       [1],
       [2],
       [3],
       [4]])

## > 배열 연결

![image.png](attachment:09076190-0505-42ec-bac7-39caa15d8be0.png)

In [173]:
a1 = np.ones((2,3))
a1

array([[1., 1., 1.],
       [1., 1., 1.]])

In [175]:
a2 = np.zeros((2, 2))
a2

array([[0., 0.],
       [0., 0.]])

In [176]:
# hstack 명령
np.hstack([a1, a2])

array([[1., 1., 1., 0., 0.],
       [1., 1., 1., 0., 0.]])

In [177]:
b1 = np.ones((2, 3))
b1

array([[1., 1., 1.],
       [1., 1., 1.]])

In [208]:
b2 = np.zeros((3, 3))
b2

array([[0., 0., 0.],
       [0., 0., 0.],
       [0., 0., 0.]])

In [209]:
# vstack
np.vstack([b1, b2])

array([[1., 1., 1.],
       [1., 1., 1.],
       [0., 0., 0.],
       [0., 0., 0.],
       [0., 0., 0.]])

In [211]:
c1 = np.ones((3, 4))
c1

array([[1., 1., 1., 1.],
       [1., 1., 1., 1.],
       [1., 1., 1., 1.]])

In [212]:
c2 = np.zeros((3, 4))
c2

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

In [213]:
c3 = np.empty((3,4))
c3

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

In [214]:
# dstack - 깊이의 방향으로 배열 합침
np.dstack([c1, c2])

array([[[1., 0.],
        [1., 0.],
        [1., 0.],
        [1., 0.]],

       [[1., 0.],
        [1., 0.],
        [1., 0.],
        [1., 0.]],

       [[1., 0.],
        [1., 0.],
        [1., 0.],
        [1., 0.]]])

In [225]:
# stack 명령은 dstack의 기능을 확장한 것으로 axis인수를 사용하여 회전 방향 결정
c = np.stack([c1, c2], axis=0)
c

array([[[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]],

       [[0., 0., 0., 0.],
        [0., 0., 0., 0.],
        [0., 0., 0., 0.]]])

In [226]:
c.shape

(2, 3, 4)

In [228]:
d1 = np.ones((4, 5))
d2 = np.zeros((4, 5))
d3 = np.arange(20).reshape(4,5)

In [229]:
d1

array([[1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.]])

In [230]:
d2

array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

In [231]:
d3

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])

In [232]:
np.stack([d1, d2, d3])

array([[[ 1.,  1.,  1.,  1.,  1.],
        [ 1.,  1.,  1.,  1.,  1.],
        [ 1.,  1.,  1.,  1.,  1.],
        [ 1.,  1.,  1.,  1.,  1.]],

       [[ 0.,  0.,  0.,  0.,  0.],
        [ 0.,  0.,  0.,  0.,  0.],
        [ 0.,  0.,  0.,  0.,  0.],
        [ 0.,  0.,  0.,  0.,  0.]],

       [[ 0.,  1.,  2.,  3.,  4.],
        [ 5.,  6.,  7.,  8.,  9.],
        [10., 11., 12., 13., 14.],
        [15., 16., 17., 18., 19.]]])

In [236]:
np.stack([d1, d2, d3], axis=2)

array([[[ 1.,  0.,  0.],
        [ 1.,  0.,  1.],
        [ 1.,  0.,  2.],
        [ 1.,  0.,  3.],
        [ 1.,  0.,  4.]],

       [[ 1.,  0.,  5.],
        [ 1.,  0.,  6.],
        [ 1.,  0.,  7.],
        [ 1.,  0.,  8.],
        [ 1.,  0.,  9.]],

       [[ 1.,  0., 10.],
        [ 1.,  0., 11.],
        [ 1.,  0., 12.],
        [ 1.,  0., 13.],
        [ 1.,  0., 14.]],

       [[ 1.,  0., 15.],
        [ 1.,  0., 16.],
        [ 1.,  0., 17.],
        [ 1.,  0., 18.],
        [ 1.,  0., 19.]]])

![image.png](attachment:444cf6f3-a184-4ad3-8c63-e9654bc7dfc1.png)

In [224]:
np.c_[np.array([1, 2, 3]), np.array([4, 5, 6])]

array([[1, 4],
       [2, 5],
       [3, 6]])

In [231]:
a = np.array([[0, 1, 2], [3, 4, 5]])
np.tile(a, 2)

array([[0, 1, 2, 0, 1, 2],
       [3, 4, 5, 3, 4, 5]])

In [228]:
np.tile(a, (3, 2))

array([[0, 1, 2, 0, 1, 2],
       [3, 4, 5, 3, 4, 5],
       [0, 1, 2, 0, 1, 2],
       [3, 4, 5, 3, 4, 5],
       [0, 1, 2, 0, 1, 2],
       [3, 4, 5, 3, 4, 5]])

In [248]:
# 연습문제
a = np.zeros((3, 3))
b = np.ones((3, 2))
c = np.array([[10, 20, 30, 40, 50],
             [60, 70, 80, 90, 100],
             [110, 120, 130, 140, 150]])
h = np.hstack([a, b])
v = np.vstack([h, c] * 2) 
v

array([[  0.,   0.,   0.,   1.,   1.],
       [  0.,   0.,   0.,   1.,   1.],
       [  0.,   0.,   0.,   1.,   1.],
       [ 10.,  20.,  30.,  40.,  50.],
       [ 60.,  70.,  80.,  90., 100.],
       [110., 120., 130., 140., 150.],
       [  0.,   0.,   0.,   1.,   1.],
       [  0.,   0.,   0.,   1.,   1.],
       [  0.,   0.,   0.,   1.,   1.],
       [ 10.,  20.,  30.,  40.,  50.],
       [ 60.,  70.,  80.,  90., 100.],
       [110., 120., 130., 140., 150.]])

In [252]:
# 연습문제
zeros = np.zeros([3, 3])
ones = np.ones([3, 2])
numbers = np.reshape(np.arange(10, 160, 10), (3, -1))
res = np.tile(np.vstack([np.hstack([zeros, ones]), numbers]), (2, 1))
res

array([[  0.,   0.,   0.,   1.,   1.],
       [  0.,   0.,   0.,   1.,   1.],
       [  0.,   0.,   0.,   1.,   1.],
       [ 10.,  20.,  30.,  40.,  50.],
       [ 60.,  70.,  80.,  90., 100.],
       [110., 120., 130., 140., 150.],
       [  0.,   0.,   0.,   1.,   1.],
       [  0.,   0.,   0.,   1.,   1.],
       [  0.,   0.,   0.,   1.,   1.],
       [ 10.,  20.,  30.,  40.,  50.],
       [ 60.,  70.,  80.,  90., 100.],
       [110., 120., 130., 140., 150.]])

## > 벡터화 연산

![image.png](attachment:a5afca8f-ca62-4293-945f-06b1f8207c2d.png)

In [271]:
x = np.arange(1, 10001)
y = np.arange(10001, 20001)

In [273]:
%%time
z = np.zeros_like(x)
for i in range(10000):
    z[i] = x[i] + y[i]

Wall time: 3.24 ms


In [274]:
z[:10]

array([10002, 10004, 10006, 10008, 10010, 10012, 10014, 10016, 10018,
       10020])

#### -> 사칙 연산뿐 아니라 비교 연산과 같은 논리 연산도 벡터화 연산이 가능

In [275]:
a = np.array([1, 2, 3, 4])
b = np.array([4, 2, 2, 4])

In [276]:
a == b

array([False,  True, False,  True])

In [277]:
a >= b

array([False,  True,  True,  True])

#### -> 배열의 각 원소들을 일일이 비교하는 것이 아니라, 다 같은지 비교하려면 'all'명령 사용 

In [278]:
a = np.array([1, 2, 3, 4])
b = np.array([4, 2, 2, 4])
c = np.array([1, 2, 3, 4])

In [279]:
np.all(a == b)

False

In [280]:
np.all(a == c)

True

## > 스칼라와 벡터/행렬의 곱셈

#### -> 넘파이 배열에서 스칼라와 벡터/행렬의 곱도 선형대수에서 사용하는 식과 같이 표현 가능

In [5]:
x = np.arange(10)
x

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [6]:
100 * x

array([  0, 100, 200, 300, 400, 500, 600, 700, 800, 900])

In [7]:
x = np.arange(12).reshape(3,4)
x

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

In [8]:
100 * x

array([[   0,  100,  200,  300],
       [ 400,  500,  600,  700],
       [ 800,  900, 1000, 1100]])

## > 브로드 캐스팅

![image.png](attachment:af06dae4-2d96-4088-8be3-34c9ae74715e.png)

#### -> 브로드캐스팅 가능한 경우

![image.png](attachment:62d27169-1336-415c-a0b4-baa1942a70f0.png)

#### -> 브로드캐스팅 불가능한 경우

![image.png](attachment:f35fd810-32ff-46c9-b173-017640f1d822.png)

## > 차원 축소 연산

![image.png](attachment:bfcbaf57-5042-4acb-b70d-1ddbef6593b5.png)

![image.png](attachment:5a980451-618c-4b98-9399-95ddebe550e5.png)

#### -> np.sum()과 ndarray.sum()은 동등한 메서드다

In [11]:
x = np.array([1, 2, 3, 4])
x

array([1, 2, 3, 4])

In [12]:
np.sum(x)

10

In [13]:
x.sum()

10

In [16]:
x = np.arange(12).reshape(3,-1)
x

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

In [21]:
x.sum(axis=0)

array([12, 15, 18, 21])

In [22]:
x.sum(axis=1)

array([ 6, 22, 38])

![image.png](attachment:25c07b6f-7c26-4154-b6c1-0382a4e5839a.png)

In [56]:
x = np.arange(20).reshape(2, 5, -1)
x

array([[[ 0,  1],
        [ 2,  3],
        [ 4,  5],
        [ 6,  7],
        [ 8,  9]],

       [[10, 11],
        [12, 13],
        [14, 15],
        [16, 17],
        [18, 19]]])

In [29]:
x.min()

0

In [30]:
np.min(x)

0

In [31]:
x.min(axis=0)

array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7],
       [8, 9]])

In [32]:
np.min(x, axis=1)

array([[ 0,  1],
       [10, 11]])

In [33]:
x.min(axis=2)

array([[ 0,  2,  4,  6,  8],
       [10, 12, 14, 16, 18]])

![image.png](attachment:71f53613-ec34-4ec3-ab67-099f373100d0.png)

In [34]:
x = np.arange(20).reshape(2, 5, -1)
x

array([[[ 0,  1],
        [ 2,  3],
        [ 4,  5],
        [ 6,  7],
        [ 8,  9]],

       [[10, 11],
        [12, 13],
        [14, 15],
        [16, 17],
        [18, 19]]])

In [35]:
x.argmin()

0

In [36]:
np.argmin(x)

0

In [37]:
x.argmin(axis=0)

array([[0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0]], dtype=int64)

In [38]:
np.argmin(x, axis=1)

array([[0, 0],
       [0, 0]], dtype=int64)

In [39]:
x.argmin(axis=2)

array([[0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0]], dtype=int64)

![image.png](attachment:27594dff-38a5-4c9e-9642-bca6da336b59.png)

In [40]:
x = np.arange(20).reshape(2, 5, -1)
x

array([[[ 0,  1],
        [ 2,  3],
        [ 4,  5],
        [ 6,  7],
        [ 8,  9]],

       [[10, 11],
        [12, 13],
        [14, 15],
        [16, 17],
        [18, 19]]])

In [42]:
x.max()

19

In [43]:
np.max(x)

19

In [44]:
x.argmax(axis=0)

array([[1, 1],
       [1, 1],
       [1, 1],
       [1, 1],
       [1, 1]], dtype=int64)

In [45]:
np.argmax(x, axis=1)

array([[4, 4],
       [4, 4]], dtype=int64)

In [46]:
x.argmax(axis=2)

array([[1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1]], dtype=int64)

#### ->예제

In [48]:
import random
test = np.array([random.randint(1, 99) for _ in range(20)]).reshape(2, 5, -1)
test

array([[[21, 45],
        [76,  7],
        [90, 53],
        [76, 99],
        [52, 55]],

       [[36, 61],
        [40, 44],
        [63, 58],
        [38, 17],
        [95, 26]]])

In [49]:
np.min(test, axis=1)

array([[21,  7],
       [36, 17]])

In [50]:
np.min(test, axis=2)

array([[21,  7, 53, 76, 52],
       [36, 40, 58, 17, 26]])

In [57]:
x = np.array([1, 2, 3, 1])
x.mean()

1.75

In [58]:
np.median(x)

1.5

#### -> np.all()은 배열요소가 모두 True일 때 True를 반환합니다.

In [59]:
np.all([True, True, False])

False

In [60]:
np.any([True, True, False])

True

In [61]:
a = np.array([1, 2, 3, 2])
b = np.array([2, 2, 3, 2])
c = np.array([6, 4, 4, 5])

In [62]:
((a <= b) & (b <= c)).all()

True

In [63]:
a = np.zeros((100, 100), dtype=np.int64)
a

array([[0, 0, 0, ..., 0, 0, 0],
       [0, 0, 0, ..., 0, 0, 0],
       [0, 0, 0, ..., 0, 0, 0],
       ...,
       [0, 0, 0, ..., 0, 0, 0],
       [0, 0, 0, ..., 0, 0, 0],
       [0, 0, 0, ..., 0, 0, 0]], dtype=int64)

In [64]:
np.any(a != 0)

False

In [65]:
np.all(a == a)

True

In [66]:
practice = np.array([[1.1, 7.1, 8.0, 2.1, 6.5, 7.2],
                     [2.7, 5.2, 3.3, 9.0, 7.7, 2.8],
                     [0.7, 8.8, 4.2, 8.9, 4.3, 7.4],
                     [8.2, 1.1, 5.4, 2.9, 6.9, 0.2],
                     [7.4, 4.8, 2.7, 3.1, 2.8, 8.9]])

In [78]:
print(np.max(practice))
print(practice.sum(axis=0))
print(practice.max(axis=0))
print(practice.mean(axis=1))
print(practice.min(axis=1))

9.0
[20.1 27.  23.6 26.  28.2 26.5]
[8.2 8.8 8.  9.  7.7 8.9]
[5.33333333 5.11666667 5.71666667 4.11666667 4.95      ]
[1.1 2.7 0.7 0.2 2.7]


## > 정렬

![image.png](attachment:b3079218-b670-4554-adee-af94078b0741.png)

In [80]:
a = np.array([[4, 3, 5, 7],
              [1, 12, 11, 9], 
              [2, 15, 1, 15]])
a

array([[ 4,  3,  5,  7],
       [ 1, 12, 11,  9],
       [ 2, 15,  1, 15]])

In [81]:
a.sort(axis=1)
a

array([[ 3,  4,  5,  7],
       [ 1,  9, 11, 12],
       [ 1,  2, 15, 15]])

In [82]:
a = np.array([42, 38, 12, 25])
j = np.argsort(a)
j

array([2, 3, 1, 0], dtype=int64)

In [83]:
a[j]

array([12, 25, 38, 42])

In [84]:
np.sort(a)

array([12, 25, 38, 42])

## > 고급인덱싱 - 인덱스 배열을 사용한 인덱싱

![image.png](attachment:5f14aa01-51e1-40fc-a501-a5ed8f4ac1ff.png)

In [86]:
a = np.array([[1,2],[3,4],[5,6]])
a

array([[1, 2],
       [3, 4],
       [5, 6]])

In [88]:
print(a[[0,1,2], [0,1,0]])

[1 4 5]


![image.png](attachment:4108f46c-ecd7-4221-b6e4-e8eec1e56ba6.png)

In [89]:
a = np.array([[1,2],[3,4],[5,6]])
a

array([[1, 2],
       [3, 4],
       [5, 6]])

In [90]:
print(a[:, [0, 1, 0]])

[[1 2 1]
 [3 4 3]
 [5 6 5]]


In [3]:
# 연습문제
scores = np.array([[ 1,   2,   3,   4],
                   [ 46, 99, 100,  71],
                   [ 81, 59,  90, 100]])

In [4]:
a = np.argsort(scores[1,:])

In [5]:
a

array([0, 3, 1, 2], dtype=int64)

In [100]:
print(scores[:, a])

[[  1   4   2   3]
 [ 46  71  99 100]
 [ 81 100  59  90]]


In [116]:
np.random.seed(0)

In [117]:
np.random.rand(5)

array([0.5488135 , 0.71518937, 0.60276338, 0.54488318, 0.4236548 ])

In [118]:
np.random.rand(10)

array([0.64589411, 0.43758721, 0.891773  , 0.96366276, 0.38344152,
       0.79172504, 0.52889492, 0.56804456, 0.92559664, 0.07103606])

In [119]:
np.random.rand(10)

array([0.0871293 , 0.0202184 , 0.83261985, 0.77815675, 0.87001215,
       0.97861834, 0.79915856, 0.46147936, 0.78052918, 0.11827443])

## > 데이터의 순서 바꾸기

In [121]:
x = np.arange(10)
x

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [122]:
np.random.shuffle(x)
x

array([3, 6, 4, 5, 2, 9, 7, 8, 1, 0])

## > 데이터 샘플링

In [123]:
np.random.choice(5, 5, replace=False)

array([1, 4, 0, 3, 2])

In [124]:
np.random.choice(5, 3, replace=False)

array([2, 1, 3])

In [125]:
np.random.choice(5, 10)

array([0, 4, 1, 4, 1, 2, 2, 0, 1, 1])

In [126]:
np.random.choice(5, 10, p=[0.1, 0, 0.3, 0.6, 0])

array([0, 3, 3, 2, 2, 3, 3, 2, 0, 3])

## > 난수 생성

![image.png](attachment:9b64cb48-bc84-4c68-915d-eacad5df8a15.png)

![image.png](attachment:a44f3674-f6bd-4c57-bc4b-67c754570111.png)

In [135]:
np.random.randn(10)

array([ 1.76405235,  0.40015721,  0.97873798,  2.2408932 ,  1.86755799,
       -0.97727788,  0.95008842, -0.15135721, -0.10321885,  0.4105985 ])

In [136]:
np.random.randn(3, 5)

array([[ 0.14404357,  1.45427351,  0.76103773,  0.12167502,  0.44386323],
       [ 0.33367433,  1.49407907, -0.20515826,  0.3130677 , -0.85409574],
       [-2.55298982,  0.6536186 ,  0.8644362 , -0.74216502,  2.26975462]])

In [131]:
np.random.randint(10, size=10)

array([5, 1, 2, 2, 8, 1, 5, 8, 4, 0])

In [132]:
np.random.randint(10, 20, size=10)

array([12, 15, 15, 10, 18, 11, 11, 10, 13, 18])

In [133]:
np.random.randint(10, 20, size=(3,5))

array([[18, 14, 14, 10, 19],
       [13, 17, 13, 12, 11],
       [11, 12, 11, 14, 12]])

In [149]:
# 연습문제
np.random.seed(0)
a = np.random.randint(0, 2, 100)
a.sum() / 100

0.56

## > 정수 데이터 카운팅

![image.png](attachment:866fa815-7e88-4c25-83ff-93778bbb9c51.png)

In [6]:
np.unique([11, 11, 2, 2, 34, 34])

array([ 2, 11, 34])

In [7]:
a = np.array(['a', 'b', 'b', 'c', 'a'])
index, count = np.unique(a, return_counts=True)

In [8]:
index

array(['a', 'b', 'c'], dtype='<U1')

In [9]:
count

array([2, 2, 1], dtype=int64)

![image.png](attachment:f7e27e27-f121-4a7c-a47a-de91cb53140a.png)

In [10]:
np.bincount([1, 1, 2, 2, 2, 3], minlength=6)

array([0, 2, 3, 1, 0, 0], dtype=int64)