In [3]:
# !pip install numpy
# !conda install numpy

# 넘파이 (Numpy) 

- http://www.numpy.org
- Numerical Python
- 고성능 과학연산을 위한 패키지로 데이터분석, 머신러닝등에  필수로 사용된다.
- 강력한 다차원 배열(array)  지원
- 벡터 연산 지원
- 다양한 수학관련 함수
- 선형대수, 난수 생성, 푸리에 변환 기능 지원


## 넘파이에서 데이터 구조
- **스칼라 (Scalar)**
    - 하나의 숫자로 이루어진 데이터
- **벡터 (Vector)**
    - 여러개의 숫자들을 특정한 순서대로 모아놓은 데이터 모음(데이터 레코드)
    - 1D Array (1차원 배열)
- **행렬 (Matrix)**
    - 벡터들을 모아놓은 데이터 집합
    - 2D Array (2차원 배열)
- **텐서 (Tensor)**
    - 같은 크기의 행렬들(텐서들)을 모아놓은 데이터 집합
    - ND Array (다차원 배열)

### 용어
- 축 (axis) 
    - 값들의 나열 방향
    - 하나의 축(axis)는 하나의 범주(Category)이다.
- 랭크(rank) 
    - 데이터 집합에서 축의 개수. 
- 형태/형상(shape)
    - 각 축(axis) 별 데이터의 개수
- 크기(size) 
    - 배열내 원소의 총 개수

![image.png](attachment:image.png)
[출처: https://www.oreilly.com/library/view/elegant-scipy/9781491922927/ch01.html ]

# 넘파이 배열(ndarray)
- n-dimension array => ndarray

- Numpy에서 제공하는 N 차원 배열 객체
- 같은 타입의 값들만 가질 수 있다.
- 빠르고 메모리를 효율적으로 사용하며 벡터 연산과 브로드캐스팅 기능을 제공한다. 

## 차원 (dimension)
- Vector에서 차원 : 원소의 개수
- 넘파이 배열에서 차원 : 축의 개수

## 배열 생성 함수
### array(배열형태 객체 [, dtype])
- 배열형태 객체가 가진 원소들로 구성된 numpy 배열 생성
> - 배열형태 객체  (array-like)  
>     - 리스트, 튜플, 넘파이배열(ndarray), Series

### 데이터 타입
- 원소들의 데이터 타입
- ndarray 는 같은 타입의 데이터만 모아서 관리한다.
- 배열 생성시 dtype 속성을 이용해 데이터 타입 설정 가능
- ndarray.dtype 속성을 이용해 조회
- ndarray.astype(데이터타입)
    - 데이터타입 변환하는 메소드
    - 변환한 새로운 ndarray객체를 반환
- 타입 지정
    - 문자열로 지정
        - 'int', 'int64', 'float'
    - numpy에 각 타입이 변수로 제공됨
        - numpy.int, numpy.int64, numpy.float    

![image.png](attachment:image.png)

In [4]:
# numpy  모듈을 import => 별칭은 관례적으로 np
import numpy as np

In [7]:
a1 = np.array([1,2,3]) # 기존 자료구조(array 행태)를 이용해 ndarray 생성
print(a1)
a1

[1 2 3]


array([1, 2, 3])

In [11]:
print(a1)
print(type(a1))
print(a1.dtype) #배열의 타입
print(a1.shape) #배열의 shape(형태 - 각축의 원소 수)

[1 2 3]
<class 'numpy.ndarray'>
int32
(3,)


In [12]:
a2 = np.array([1.1, 2.2, 3.3])
print(a2)

[1.1 2.2 3.3]


In [14]:
print(a2.dtype) #실수의 기본형: float64, 정수의 기본형: int32

float64


In [19]:
a3 = np.array([1.1, 2.2, 3.3], dtype=np.float32) #, dtype='float32')
print(a3.dtype)

float32


In [23]:
a4 = a2.astype(np.int32) #배열의 dtype을 변경하는 메소드(타입을 변환한 새로운 배열을 생성해서 반환.)

In [24]:
a4.dtype

dtype('int32')

In [25]:
a4.shape

(3,)

In [28]:
l = [1, 10.5, True, "abc"] #리스트: 원소의 타입이 다를 수있다.
print(l)

[1, 10.5, True, 'abc']


In [31]:
a5 = np.array(l)
print(a5.dtype) #<U32 : 문자열
a5

<U32


array(['1', '10.5', 'True', 'abc'], dtype='<U32')

- 서로 다른 타입의 값들이용해서 ndarray를 생성하면 가장 큰 타입으로 통일해서 변환한다.
- 타입의 크기
    - bool < int < float < str

In [32]:
# 1 -> '1', 10.5->'10.5', True->'True'

In [34]:
a6 = np.array([10,20,30,20.7])
a6

array([10. , 20. , 30. , 20.7])

In [35]:
a6.dtype

dtype('float64')

In [37]:
a7 = np.array([1, True, False]) #bool => 숫자 : True->1, False->0
a7

array([1, 1, 0])

In [42]:
a7.shape

(3,)

In [40]:
l2 = [
    [1,2,3],
    [10,20,30],
    [100,200,300],
    [1000,2000,3000]
]
# len(l2)

In [41]:
a8 = np.array(l2)

In [44]:
print(a8.shape)
print(a8.ndim) #rank수
# (4,3) rank-2

(4, 3)
2


In [45]:
import copy
l3 = copy.deepcopy(l2)

In [47]:
a9 = np.array([l2, l3])

In [49]:
print(a9.shape)
2*4*3

(2, 4, 3)


24

In [50]:
print(a9.size) #총 원소의 개수

24


### zeros(shape, dtype)
영벡터(행렬) 생성 : 원소들을 0으로 채운 배열
- shape : 형태(크기, 개수) 지정
- dtype : 요소의 개수 지정

In [51]:
a1 = np.zeros((3,5))
a1

array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

In [53]:
print(a1.dtype)

float64


In [55]:
a2 = np.zeros([5,2], dtype=np.int8)
print(a2.shape)
print(a2.dtype)
a2

(5, 2)
int8


array([[0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0]], dtype=int8)

In [56]:
a3 = np.zeros([10])
a3

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [62]:
a4 = np.zeros(10) #정수: 1차원 배열(vector)

In [63]:
a4

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

### ones(shape, dtype)
일벡터 생성 : 원소들을 1로 채운 배열
- shape : 형태(크기, 개수) 지정
- dtype : 요소의 개수 지정

In [64]:
a1 = np.ones((5,2))
a1

array([[1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.]])

In [65]:
print(a1.dtype)

float64


In [66]:
a2 = np.ones((5,2), dtype=np.int8)
print(a2.dtype)

int8


In [67]:
a3 = np.ones(5)
print(a3.shape)
a3

(5,)


array([1., 1., 1., 1., 1.])

### full(shape, fill_value, dtype))
원소들을 원하는 값으로 채운 배열 생성
- shape : 형태(크기, 개수) 지정
- fill_vlaue : 채울 값
- dtype : 요소의 개수 지정

In [68]:
a1 = np.full(10, fill_value=5)
a1

array([5, 5, 5, 5, 5, 5, 5, 5, 5, 5])

In [73]:
a2 = np.full((5,2), fill_value=7, dtype=np.float)
print(a2.shape)
print(a2.dtype)
a2

(5, 2)
float64


array([[7., 7.],
       [7., 7.],
       [7., 7.],
       [7., 7.],
       [7., 7.]])

### xxx_like(배열)
- zeros_like(), ones_like()
- 매개변수로 받은 배열과 같은 shape의 0 또는 1로 값을 채운 배열을 생성.

In [75]:
a8.shape

(4, 3)

In [79]:
a8_2 = np.zeros_like(a8)
a8_2.shape

(4, 3)

In [80]:
a8_2

array([[0, 0, 0],
       [0, 0, 0],
       [0, 0, 0],
       [0, 0, 0]])

In [81]:
a8_3 = np.ones_like(a8)
a8_3.shape

(4, 3)

In [82]:
a8_3

array([[1, 1, 1],
       [1, 1, 1],
       [1, 1, 1],
       [1, 1, 1]])

### arange(start, stop, step, dtype)
start에서 stop 범위에서 step의 일정한 간격의 값들로 구성된 배열 리턴 
- [API](https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.arange.html)
- start : 범위의 시작값으로 포함된다.(생략가능 - 기본값:0)
- stop : 범위의 끝값으로 **포함되지 않는다.** (필수)
- step : 간격 (기본값 1)
- dtype : 요소의 타입
- 1차원 배열만 생성가능

In [84]:
a1 = np.arange(1, 100, 10) #1<= num <100  증감: +10
print(a1.shape)
a1

(10,)


array([ 1, 11, 21, 31, 41, 51, 61, 71, 81, 91])

In [85]:
a2 = np.arange(0,100,10)
a2

array([ 0, 10, 20, 30, 40, 50, 60, 70, 80, 90])

In [86]:
a3 = np.arange(5)
a3

array([0, 1, 2, 3, 4])

In [87]:
a4 = np.arange(100,0,-10) # num <= 100, num > 0 증감: -10
a4

array([100,  90,  80,  70,  60,  50,  40,  30,  20,  10])

In [88]:
a5 = np.arange(0, 1, 0.1)
a5

array([0. , 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9])

In [91]:
# a3 = np.arange(, 5, 2)
np.arange(5) #start, step 생략
np.arange(1, 10) # step 생략
np.arange(1,10,2)

array([1, 3, 5, 7, 9])

### linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)

시작과 끝을 균등하게 나눈 값들을 가지는 배열을 생성 
- [API](https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.linspace.html#numpy.linspace)

- start : 시작값
- stop : 종료값
- num : 나눌 개수. 기본-50, 양수 여야한다.
- endpoint : stop을 포함시킬 것인지 여부. 기본 True
- retstep : 생성된 배열 샘플과 함께 간격(step)도 리턴할지 여부. True일경우 간격도 리턴(sample, step) => 튜플로 받는다.
- dtype : 데이터 타입

In [93]:
a1 = np.linspace(1,100) # 1<= num <=100  50개 균등하게 나눈 값
a1

array([  1.        ,   3.02040816,   5.04081633,   7.06122449,
         9.08163265,  11.10204082,  13.12244898,  15.14285714,
        17.16326531,  19.18367347,  21.20408163,  23.2244898 ,
        25.24489796,  27.26530612,  29.28571429,  31.30612245,
        33.32653061,  35.34693878,  37.36734694,  39.3877551 ,
        41.40816327,  43.42857143,  45.44897959,  47.46938776,
        49.48979592,  51.51020408,  53.53061224,  55.55102041,
        57.57142857,  59.59183673,  61.6122449 ,  63.63265306,
        65.65306122,  67.67346939,  69.69387755,  71.71428571,
        73.73469388,  75.75510204,  77.7755102 ,  79.79591837,
        81.81632653,  83.83673469,  85.85714286,  87.87755102,
        89.89795918,  91.91836735,  93.93877551,  95.95918367,
        97.97959184, 100.        ])

In [96]:
a2 = np.linspace(1,100, endpoint=False)
a2

array([ 1.  ,  2.98,  4.96,  6.94,  8.92, 10.9 , 12.88, 14.86, 16.84,
       18.82, 20.8 , 22.78, 24.76, 26.74, 28.72, 30.7 , 32.68, 34.66,
       36.64, 38.62, 40.6 , 42.58, 44.56, 46.54, 48.52, 50.5 , 52.48,
       54.46, 56.44, 58.42, 60.4 , 62.38, 64.36, 66.34, 68.32, 70.3 ,
       72.28, 74.26, 76.24, 78.22, 80.2 , 82.18, 84.16, 86.14, 88.12,
       90.1 , 92.08, 94.06, 96.04, 98.02])

In [98]:
print(a1.shape, a2.shape)

(50,) (50,)


In [100]:
a3 = np.linspace(1,100, num=100)
print(a3.shape)
a3

(100,)


array([  1.,   2.,   3.,   4.,   5.,   6.,   7.,   8.,   9.,  10.,  11.,
        12.,  13.,  14.,  15.,  16.,  17.,  18.,  19.,  20.,  21.,  22.,
        23.,  24.,  25.,  26.,  27.,  28.,  29.,  30.,  31.,  32.,  33.,
        34.,  35.,  36.,  37.,  38.,  39.,  40.,  41.,  42.,  43.,  44.,
        45.,  46.,  47.,  48.,  49.,  50.,  51.,  52.,  53.,  54.,  55.,
        56.,  57.,  58.,  59.,  60.,  61.,  62.,  63.,  64.,  65.,  66.,
        67.,  68.,  69.,  70.,  71.,  72.,  73.,  74.,  75.,  76.,  77.,
        78.,  79.,  80.,  81.,  82.,  83.,  84.,  85.,  86.,  87.,  88.,
        89.,  90.,  91.,  92.,  93.,  94.,  95.,  96.,  97.,  98.,  99.,
       100.])

In [101]:
np.linspace(1,100, num=100, retstep=True)

(array([  1.,   2.,   3.,   4.,   5.,   6.,   7.,   8.,   9.,  10.,  11.,
         12.,  13.,  14.,  15.,  16.,  17.,  18.,  19.,  20.,  21.,  22.,
         23.,  24.,  25.,  26.,  27.,  28.,  29.,  30.,  31.,  32.,  33.,
         34.,  35.,  36.,  37.,  38.,  39.,  40.,  41.,  42.,  43.,  44.,
         45.,  46.,  47.,  48.,  49.,  50.,  51.,  52.,  53.,  54.,  55.,
         56.,  57.,  58.,  59.,  60.,  61.,  62.,  63.,  64.,  65.,  66.,
         67.,  68.,  69.,  70.,  71.,  72.,  73.,  74.,  75.,  76.,  77.,
         78.,  79.,  80.,  81.,  82.,  83.,  84.,  85.,  86.,  87.,  88.,
         89.,  90.,  91.,  92.,  93.,  94.,  95.,  96.,  97.,  98.,  99.,
        100.]),
 1.0)

### eye(N, M=None, k=0, dtype=<class 'float'>)  /  identity(N)
- 항등행렬 생성
단위 행렬 생성 
- N : 행수
- M : 컬럼수
- k : 대각선이 시작할 index (첫행의 index를 지정한다. ) 기본값 : 0
- [API](https://docs.scipy.org/doc/numpy-1.15.1/reference/generated/numpy.eye.html) 
> ### 대각행렬
>    - 행과 열이 같은 위치를 대각(diagnonal) 이라고 하며 그 대각에만 값이 있고 비대각은 0으로 채워진 행렬.    
>
> ### 항등행렬/단위행렬
>    - 대각의 값이 1인 정방행렬로 $E$나 $I$ 로 표현한다.
>    - 단위행렬은 행렬에서 곱셈의 항등원이다
>    - 행렬곱셈(내적)에대해서 교환법칙이 성립한다.
>         - $A\cdot E = A$

In [103]:
a1 = np.eye(5)  # (5,5) shape의 항등행렬
print(a1.shape)
a1

(5, 5)


array([[1., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0.],
       [0., 0., 1., 0., 0.],
       [0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 1.]])

In [111]:
np.eye(5, 9, k=5) #k=대각의 시작 index

array([[0., 0., 0., 0., 0., 1., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 1., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 1.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0.]])

In [112]:
np.identity(3) #(3,3) 단위행렬

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

In [113]:
np.eye(3)

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

In [115]:
a1.shape

(5, 5)

## 난수를 원소로 하는 ndarray 생성

- numpy의 서브패키지인 random 패키지에서 제공하는 함수들
- np.random.seed(정수) : 시드값 설정

### np.random.seed(시드값)
- 난수 발생 알고리즘이 사용할 시작값(시드값)을 설정
- 시드값을 설정하면 항상 일정한 순서의 난수(random value)가 발생한다.
> 랜덤함수는 특정숫자부터 시작하는 일렬의 수열을 만들어 값을 제공하는 함수이다.    
> 시작 숫자는 실행할때 마다 바뀌므로 다른 값들이 나오는데 시드값은 시작값을 고정시키면 항상 시작 값이 같으므로 같은 값들이 순서대로 제공된다.    
> 매번 실행할때 마다 같은 순서의 임의의 값이(난수) 나오도록 할때 시드값을 설정한다.

In [140]:
np.random.seed(0) # seed 값을 0으로 설정

In [143]:
np.random.randint(10)

1

### np.random.rand(axis0[, axis1, axis2, ...])    
- [API](https://numpy.org/doc/stable/reference/random/generated/numpy.random.rand.html?highlight=rand#numpy.random.rand)
- 0~1사이의 실수를 리턴
- 축의 크기는 순서대로 나열한다.

In [174]:
np.random.seed(0)

In [177]:
a = np.random.rand()  #0<= 실수 <1 
a

0.6027633760716439

In [None]:
0.5488135039273248
0.7151893663724195
0.6027633760716439
0.5448831829968969
0.4236547993389047

In [180]:
np.random.seed(0)

In [181]:
b = np.random.rand(5)  # 0축 size->5
print(b.shape)
b

(5,)


array([0.5488135 , 0.71518937, 0.60276338, 0.54488318, 0.4236548 ])

In [182]:
c = np.random.rand(5,2,3)  # shape: (5,3,2)
print(c.shape)
c

(5, 2, 3)


array([[[0.64589411, 0.43758721, 0.891773  ],
        [0.96366276, 0.38344152, 0.79172504]],

       [[0.52889492, 0.56804456, 0.92559664],
        [0.07103606, 0.0871293 , 0.0202184 ]],

       [[0.83261985, 0.77815675, 0.87001215],
        [0.97861834, 0.79915856, 0.46147936]],

       [[0.78052918, 0.11827443, 0.63992102],
        [0.14335329, 0.94466892, 0.52184832]],

       [[0.41466194, 0.26455561, 0.77423369],
        [0.45615033, 0.56843395, 0.0187898 ]]])

### np.random.normal(loc=0.0, scale=1.0, size=None) 
정규분포를 따르는 난수.  
- 평균에서 2 표준편차 범위의 값이 나올 확률이 95%

- [API](https://numpy.org/doc/stable/reference/random/generated/numpy.random.normal.html?highlight=normal#numpy.random.normal)
- loc: 평균
- scale: 표준편차
- loc, scale 생략시 표준정규 분포를 따르는 난수를 제공 
> #### 표준정규분포
> 평균 : 0, 표준편차 : 1 인 분포

In [210]:
a = np.random.normal()  #평균: 0, 표준편차: 1 => -2 ~ 2 범위의 실수가 나올 확률이 95%
a

-0.7760204669235409

In [212]:
a2 = np.random.normal(size=(5,4,4,4)) #size: shape을 튜플/리스트로 설정
a2

array([[[[-2.06420942e-01,  4.88426467e-01, -8.38330966e-01,
           3.81163744e-01],
         [-9.90903282e-01,  1.01788005e+00,  3.41587396e-01,
          -1.25088622e+00],
         [ 9.25250752e-01, -9.04786158e-01,  1.84369153e+00,
           1.52550724e+00],
         [-1.44553558e+00,  3.77160611e-01, -7.05572292e-02,
           6.04159707e-01]],

        [[ 4.72148998e-01,  8.19917293e-01,  9.07519617e-01,
          -5.85822875e-01],
         [ 9.37558842e-01, -2.54608092e-01,  9.73598712e-01,
           2.07282772e-01],
         [ 1.09964197e+00,  9.39896981e-01,  6.06389001e-01,
           1.76084071e-03],
         [-9.90160143e-01,  1.87239408e+00, -2.41073590e-01,
           5.33449070e-02]],

        [[ 1.03081595e+00, -1.27698899e+00,  8.37719765e-01,
          -1.49011141e+00],
         [-1.07021500e+00, -2.09128617e-01,  6.04572277e-01,
          -1.74305823e+00],
         [ 1.52422681e+00,  1.86357532e+00,  1.29137792e+00,
           1.30069627e+00],
         [ 9.1820

In [213]:
# 80 ~ 120 사이의 실수: 평균-100, 표준편차-10
a = np.random.normal(loc=100, scale=10, size=(5,5))
a

array([[ 90.58777897,  98.71770303, 112.72386135,  91.97005258,
        110.22303203],
       [115.07875916,  90.76658304, 106.58777556, 112.85972561,
         88.44932969],
       [101.18876454, 110.32144978, 105.39952432,  77.48738813,
         96.56382744],
       [ 99.32056468, 111.7658723 ,  84.8498485 ,  91.06328188,
         93.19756373],
       [101.94206644,  90.32502602, 110.6825969 , 112.13087606,
        111.44718802]])

### np.random.randint(low, high=None, size=None, dtype='l')
임의의 정수를 가지는 배열
- [API](https://numpy.org/doc/stable/reference/random/generated/numpy.random.randint.html?highlight=randint#numpy.random.randint)
- low ~ high 사이의 정수 리턴. high는 포함안됨
- high 생략시 0 ~ low 사이 정수 리턴. low는 포함안됨
- size : 배열의 크기. 다차원은 튜플로 지정 기본 1개
- dtype : 원소의 타입

In [227]:
# 1 ~ 10 사이의 정수 난수
np.random.randint(1,11, size=(3,4))

array([[ 8,  4,  4,  1],
       [ 1, 10,  5,  5],
       [ 6,  9,  9,  1]])

In [232]:
# 0 ~ 100
np.random.randint(101, size=(3,4)) # 시작이 0일 경우는 생략

array([[30, 19,  4, 20],
       [74, 67, 86, 60],
       [93, 41, 40, 60]])

### np.random.choice(a, size=None, replace=True, p=None)
- [API](https://numpy.org/doc/stable/reference/random/generated/numpy.random.choice.html?highlight=choice#numpy.random.choice)
- 샘플링 메소드
- a : 샘플링대상. 1차원 배열 또는 정수 (정수일 경우 0 ~ 정수, 정수 불포함)
- size : 샘플 개수
- replace : True-복원추출(기본), False-비복원추출
- p: 샘플링할 대상 값들이 추출될 확률 지정한 배열

In [234]:
a = np.arange(1,1000)
print(a.shape)
a

(999,)


array([  1,   2,   3,   4,   5,   6,   7,   8,   9,  10,  11,  12,  13,
        14,  15,  16,  17,  18,  19,  20,  21,  22,  23,  24,  25,  26,
        27,  28,  29,  30,  31,  32,  33,  34,  35,  36,  37,  38,  39,
        40,  41,  42,  43,  44,  45,  46,  47,  48,  49,  50,  51,  52,
        53,  54,  55,  56,  57,  58,  59,  60,  61,  62,  63,  64,  65,
        66,  67,  68,  69,  70,  71,  72,  73,  74,  75,  76,  77,  78,
        79,  80,  81,  82,  83,  84,  85,  86,  87,  88,  89,  90,  91,
        92,  93,  94,  95,  96,  97,  98,  99, 100, 101, 102, 103, 104,
       105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117,
       118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130,
       131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143,
       144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156,
       157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169,
       170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 18

In [242]:
b= np.random.choice(a, size=10) # 배열 a의 원소(값)들 중 임의의 10개를 추출
print(b.shape)
b

(10,)


array([630, 572, 677, 902, 262,  39, 676,  89, 946, 720])

In [246]:
c = np.random.choice(100, size=5) # 0 ~ 100-1 정수중에 임의의 5개 추출
c

array([47, 98, 21, 20, 42])

In [249]:
d = np.random.choice([True, False], size=10)#, replace=False)
d

array([False,  True, False,  True, False,  True, False,  True, False,
       False])

In [251]:
np.random.choice([True, False], size=10, p=[0.1, 0.9])  #True:10%확률, False:90%

array([False, False, False, False, False,  True, False,  True, False,
       False])

## 배열의 값 섞기
- np.random.shuffle(배열)
    - 원본을 섞는다.
- np.random.permutation(배열)
    - 원본을 섞은 카피배열을 반환
- 다차원 배열의 경우는 0번 축을 기준으로 섞는다.    

In [252]:
a = np.arange(10)
a

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [254]:
np.random.permutation(a)

array([0, 6, 2, 7, 1, 3, 5, 4, 9, 8])

In [256]:
np.random.shuffle(a)

In [257]:
a

array([4, 9, 0, 6, 1, 8, 7, 5, 3, 2])

In [259]:
b = np.array([[1,2,3],[10,20,30],[100,200,300]])
b

array([[  1,   2,   3],
       [ 10,  20,  30],
       [100, 200, 300]])

In [260]:
b.shape

(3, 3)

In [261]:
np.random.permutation(b)

array([[100, 200, 300],
       [  1,   2,   3],
       [ 10,  20,  30]])