# Numpy 간단 이해

설치: `pip install numpy` OR `conda install numpy`

1. numpy 특징
    - vector, matrix 계사넹 특화된 python library
    - 빠른 속도, 적은 메모리, ndarray라는 배열 이용
    - 다른 library(matplot 등)의 기반이 되는 library


2. numpy array(ndarray)
    - np.array(list, dtype=np.float62)


3. Numpy array 특징
    - arr.ndim, arr.shape, arr.size, axis


4. numpy array 다양한 생성 함수
    - zeros(), ones(), full(), empty()
    - zeros_like(), arange, linspace()
    - random기반 생성 함수 (05_numpy_mat 참고)

## numpy 자료구조

In [1]:
#numpy에 대한 alisasing은 무조건 np (따른걸로 해도 상관은 없되...)
import numpy as np

a = [1,2,3,4]
print("a[0] : {}, a[0]의 타입: {}".format(a[0],type(a[0])))

arr = np.array([1,2,3,4])
print(type(arr))
print("arr[0]:{}, arr[0]의 타입:{}".format(arr[0],type(arr[0])))
print(arr.dtype)

a[0] : 1, a[0]의 타입: <class 'int'>
<class 'numpy.ndarray'>
arr[0]:1, arr[0]의 타입:<class 'numpy.int32'>
int32


In [2]:
my_list = [100,3.14,"Hong",True]
arr = np.array(my_list)
# unicode로 출력이 된다.
arr

array(['100', '3.14', 'Hong', 'True'],
      dtype='<U32')

## 다차원 배열

In [8]:
# 2차원 리스트 (파이썬 리스트)
my_list = [[1,2,3],[4,5,6],[7,8,9]]
print(my_list[0])
# numpy array를 사용하여 수학적 매트릭스 형태로 파이선 2차원 리스트를 볼수있다.
arr = np.array(my_list)
print(arr)

[1, 2, 3]
[[1 2 3]
 [4 5 6]
 [7 8 9]]


## 인덱싱

In [10]:
# 파이쏜 인덱싱 방법
my_list = [[1,2,3],[4,5,6],[7,8,9]]
print(my_list[1][2])

# numpy 인덱싱 방법
arr = np.array(my_list)
print(arr[1,2])

# 정수형태의 2차원 리스트의 데이터타입을 지정해줄수 있다.
arr = np.array(my_list, dtype=np.float64)
print(arr)
print(arr.ndim, " 차원 numpy 배열") # 배열의 차원을 출력
print(arr.shape, " 행과 열")# 배열의 형태(행과열의 개수)를 tuple로 출력
print(len(arr)) # numpy배열을 len()함수로 보면 약간 적절하지 못 하다! 1차원만 가능한 len()
print(arr.size) # len()대신에 .size를 쓰는게 낳다.

6
6
[[1. 2. 3.]
 [4. 5. 6.]
 [7. 8. 9.]]
2  차원 numpy 배열
(3, 3)  행과 열
3
9


## AXIS

    numpy배열의 axis?
    axis는 차원에 영향을 받는다.
    1차원 = axis = 0
    2차원 = axis = 0,1
    3차원 = axis = 0,1,2

In [14]:
print(arr)
print(arr.sum(axis=0)) # 열의 값들을 더한다
print(arr.sum(axis=1)) # 행의 값들을 더한다

[[1. 2. 3.]
 [4. 5. 6.]
 [7. 8. 9.]]
[12. 15. 18.]
[ 6. 15. 24.]


In [41]:
import numpy as np

my_list1 = [1,2,3,4,5,6,7,8,9]
arr1 = np.array(my_list1)
print(arr1)
arr1.shape = (3,3) # array 형태를 바꿀수 있다. (행3 열3)
print(arr1)

for x in range(0,arr1.shape[0]):
    for y in range(0,arr1.shape[1]):
        print("arr1[{},{}] = {}".format(x,y,arr1[x,y]))

[1 2 3 4 5 6 7 8 9]
[[1 2 3]
 [4 5 6]
 [7 8 9]]
arr1[0,0] = 1
arr1[0,1] = 2
arr1[0,2] = 3
arr1[1,0] = 4
arr1[1,1] = 5
arr1[1,2] = 6
arr1[2,0] = 7
arr1[2,1] = 8
arr1[2,2] = 9


In [19]:
arr1.shape[0]

3

## 자료구조 변환

In [27]:
arr = np.array([1,2,3,4,5])
arr1 = arr.astype(np.float64)
print(arr1)
print(arr1.dtype)
arr1 = arr.astype(np.str)
print(arr1)
print(arr1.dtype)

[1. 2. 3. 4. 5.]
float64
['1' '2' '3' '4' '5']
<U11


## 지정 shape으로 0으로 채워진 배열 만들기

In [33]:
arr_zs = np.zeros((4,4,4),dtype=np.int32)
#shape를 튜플로 지정해준다.
#dtype도 지정해줄수 있따.
print(arr_zs)

[[[0 0 0 0]
  [0 0 0 0]
  [0 0 0 0]
  [0 0 0 0]]

 [[0 0 0 0]
  [0 0 0 0]
  [0 0 0 0]
  [0 0 0 0]]

 [[0 0 0 0]
  [0 0 0 0]
  [0 0 0 0]
  [0 0 0 0]]

 [[0 0 0 0]
  [0 0 0 0]
  [0 0 0 0]
  [0 0 0 0]]]


## 지정 shape으로 1로 채워진 배열 만들기

In [43]:
import numpy as np

arr_os = np.ones((4,4,4),dtype=np.int32)
print(arr_os)

[[[1 1 1 1]
  [1 1 1 1]
  [1 1 1 1]
  [1 1 1 1]]

 [[1 1 1 1]
  [1 1 1 1]
  [1 1 1 1]
  [1 1 1 1]]

 [[1 1 1 1]
  [1 1 1 1]
  [1 1 1 1]
  [1 1 1 1]]

 [[1 1 1 1]
  [1 1 1 1]
  [1 1 1 1]
  [1 1 1 1]]]


## 지정 shape으로 비워진 배열 만들기

In [45]:
arr_empt = np.empty((3,3,3))
# 초기값을 안주고 공간만 생성
# 쓰레기값들이 있을수 있다.
arr_empt

array([[[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]],

       [[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]],

       [[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]]])

## 지정 shape으로 지정 값으로 채워진 배열 만들기

In [46]:
arr_ful = np.full((4,4,4),42) # 내가 원하는 값으로 초기화
arr_ful

array([[[42, 42, 42, 42],
        [42, 42, 42, 42],
        [42, 42, 42, 42],
        [42, 42, 42, 42]],

       [[42, 42, 42, 42],
        [42, 42, 42, 42],
        [42, 42, 42, 42],
        [42, 42, 42, 42]],

       [[42, 42, 42, 42],
        [42, 42, 42, 42],
        [42, 42, 42, 42],
        [42, 42, 42, 42]],

       [[42, 42, 42, 42],
        [42, 42, 42, 42],
        [42, 42, 42, 42],
        [42, 42, 42, 42]]])

## 다른 배열과 같은 shape으로 지정 값으로 채워진 배열 만들기

In [47]:
arr_like = np.full_like(arr_ful,7)
# 특정 array의 shape과 같은 array를 지정값으로 생성
arr_like

array([[[7, 7, 7, 7],
        [7, 7, 7, 7],
        [7, 7, 7, 7],
        [7, 7, 7, 7]],

       [[7, 7, 7, 7],
        [7, 7, 7, 7],
        [7, 7, 7, 7],
        [7, 7, 7, 7]],

       [[7, 7, 7, 7],
        [7, 7, 7, 7],
        [7, 7, 7, 7],
        [7, 7, 7, 7]],

       [[7, 7, 7, 7],
        [7, 7, 7, 7],
        [7, 7, 7, 7],
        [7, 7, 7, 7]]])

## range를 지정해서 배열 채우기

In [73]:
arr_rang = np.arange(0,100,2) # 0~100 range, 2증가수
arr_rang

array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32,
       34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66,
       68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98])

## 지정 개수로 자동으로 증가수 채우기?

In [79]:
arr_spc = np.linspace(0,10,6) # 0~10사이 6개 수
# 여기서 중요한건 6개의 수가 만들어지고,
# 증가수가 자동으로 지정된다
arr_spc

array([ 0.,  2.,  4.,  6.,  8., 10.])

## random seed

In [None]:
import numpy as np

"""
random 알고리즘은 특정 초기갑을 이용해서 계산된다
이걸 seed 라고 부른다.
seed값을 고정시키고 난수를 발생시키면
고정적인 (똑같이 발생시킬수 있는) 난수가 발생된다.
"""
np.random.seed(5)

## 균등분포 만들기

In [4]:
arr = np.random.randint(0,100,(3,4))
# 0~100사이 균등분포 정수형 난수
# 3행 4열
print(arr)

[[99 78 61 16]
 [73  8 62 27]
 [30 80  7 76]]


## ndarray shape 바꾸기


NDARRAY의 속성들
1. .arange()
2. .reshape()
3. .copy()

** VIEW라는 개념을 잘 이해해야 된다!


In [15]:
# .arange는 1차 배열바께 못 만든다!~
arr = np.arange(0,12,1)
# one thing to note is that printing ndarray and
# just returning ndarray output is DIFFERENT.
print("type:list = {} : {}".format(type(arr),arr))
# display() does the same, but I guess it's more useful?
display(arr)
# returns a tuple of SHAPE, which is number of ROWS AND COLUMNS
print(arr.shape)


print("="*30)

# Reshape 할때 조심해야 할 사항은 새로 생성된
# numpy배열이 view로 생성된다?
arr1 = arr.reshape(4,3)
print(arr1)
# arr과 arr1은 데이터를 공유한다. rr1은 걍 view 방식이 다른 뿐이다!

print("="*30)
arr[0] = 100
# arr만 바꿨는데 보니 arr1도 바껴서 보인다!
print(arr)
print(arr1)
if arr1.base is arr:
    print("데이터가 같아요!")
else:
    print("데이터가 달라요!")

print("="*30)
# reshape을 하고 데이터를 공유하고 싶지 않을때
# .copy()를 사용해서 아예 복사를 한다.
arr2 = arr.reshape(2,6).copy()

if arr2.base is arr:
    print(arr)
    print(arr2)
    print("데이터가 같아요!")
else:
    print(arr)
    print("데이터가 달라요!")
    arr2[0,0]=42
    print(arr2)

type:list = <class 'numpy.ndarray'> : [ 0  1  2  3  4  5  6  7  8  9 10 11]


array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

(12,)
[[ 0  1  2]
 [ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]]
[100   1   2   3   4   5   6   7   8   9  10  11]
[[100   1   2]
 [  3   4   5]
 [  6   7   8]
 [  9  10  11]]
데이터가 같아요!
[100   1   2   3   4   5   6   7   8   9  10  11]
데이터가 달라요!
[[42  1  2  3  4  5]
 [ 6  7  8  9 10 11]]


### 자동으로 shape 바꾸기
    
    자동 행/열 정렬로 reshape
    .reshape(-1,n)
    .reshape(n,-1)

In [26]:
arr = np.arange(0,12,1) # 요소가 12개인 numpy array
arr1 = arr.reshape(-1,4) # 4열짜리인, 자동으로 행 생성. -1을 사용하면 된다.
print(arr1)
arr1 = arr.reshape(4,-1) # 4행, 자동 열 생성
print(arr1)

'''
다차원 배열을 1차원 배열로 바꾼다.
.ravel()
이것도 결국 view만 바꾸는거다.
'''
print("="*30)
arr2 = np.random.randint(0,12,(3,4))
print(arr2)
arr3 = arr2.ravel()
print(arr3)
arr3 = arr2.ravel().copy()
print(arr3 is arr2)

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
[[ 0  1  2]
 [ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]]
[[ 5 10  8  4]
 [ 6  0 10  3]
 [ 4 11 10  8]]
[ 5 10  8  4  6  0 10  3  4 11 10  8]
False


## .resize 함수에 대한 이해

    .resize() 함수 이해
    arr.resize(shape)와 np.resize(array,shape)의 차이
    원본을 바꾸냐 : 원본의 resize된 모습을 copy한다. (shape하고 copy쓴 느낌?)

In [42]:
arr = np.arange(0,12,1)
print("원본 arr: \n", arr)
print("="*30)

arr1 = arr.reshape(3,4)
print("view만 바뀐 arr1: \n", arr1)
arr2 = arr.resize(2,6)
print(".resize()는 원본을 바꾸니, return이 없다: \n",arr2)
print("원본: \n",arr)
print("="*30)

arr2 = np.resize(arr,(2,6))
print("np.resize(arr,shape) 사용: \n",arr2)
print(arr2 is arr)
print("="*30)

"""
.resize() 함수의 특성
reshape을 사용하면 사용가능한 shape만 가능한데,
resize를 사용하면 요소개수와 상관없이 shape을 갖춘다.
요소가 모자르면 0으로 채우고, 남으면 버린다.
"""
arr = np.arange(0,12,1)
arr.resize(3,4)
print(arr)
print("="*30)
# 요소가 부족할떄 0 더하기
arr.resize(3,5)
print(arr)
print("="*30)
# 요소가 남으면 버리기
arr.resize(2,2)
print(arr)

원본 arr: 
 [ 0  1  2  3  4  5  6  7  8  9 10 11]
view만 바뀐 arr1: 
 [[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
.resize()는 원본을 바꾸니, return이 없다: 
 None
원본: 
 [[ 0  1  2  3  4  5]
 [ 6  7  8  9 10 11]]
np.resize(arr,shape) 사용: 
 [[ 0  1  2  3  4  5]
 [ 6  7  8  9 10 11]]
False
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11  0  0  0]]
[[0 1]
 [2 3]]


## 다른 shape의 배열들을 합치기!

    행의 개수가 다른데 열의 개수가 같은
    두개의 배열을 연결
    .vstack() 함수 (vertical 방향으로 stack, 더하기)
    ** 이런 더하는 행위를 concatenation이라 부른다. (연결이란 뜻을 가짐. Interconnect*)
    return값은 view임으로 원본 배열들이 수정되면 return값도 다르게 보인다.

In [53]:
arr = np.arange(1,7,1)
arr.resize(2,3)
print(arr)

arr1 = np.arange(1,26,2)
arr1.resize(4,3)
print(arr1)

result = np.vstack((arr,arr1))
print(result)

[[1 2 3]
 [4 5 6]]
[[ 1  3  5]
 [ 7  9 11]
 [13 15 17]
 [19 21 23]]
[[ 1  2  3]
 [ 4  5  6]
 [ 1  3  5]
 [ 7  9 11]
 [13 15 17]
 [19 21 23]]


In [55]:
import numpy as np

'''
horizontal stacking
'''

arr1 = np.arange(1,7,1)
arr1.resize(2,3)
arr2 = np.arange(2,11,1)
arr2.resize(2,4)

print(arr1)
print(arr2)

result = np.hstack((arr1,arr2))
print(result)

[[1 2 3]
 [4 5 6]]
[[2 3 4 5]
 [6 7 8 9]]
[[1 2 3 2 3 4 5]
 [4 5 6 6 7 8 9]]


## Indexing & Slicing

In [63]:
import numpy as np
'''
indexing
1. enumerate()

slicing
1. [index:index]
'''

arr = np.arange(10,20,1)

# 보통 파이썬 for문은 한개씩 표출되나
# enumerate()을 사용하면 index와 value가 같이 나온다 => tuple
for index,item in enumerate(arr):
    print(index, item)
    
print("="*30)

# numpy에 슬라이싱하면 view가 생성된다.
tmp = arr[0:3]
print(tmp)
# 원본 데이터를 공유하나 reference는 다르다??
print(arr is tmp)
tmp[0] = 1000
print(tmp)
print(arr)

print("="*30)

'''
슬라이싱 하는데 2칸씩 뛴다.
'''
print(arr[0:-1:2])
# 역순으로 슬라이싱
print(arr[::-1])

0 10
1 11
2 12
3 13
4 14
5 15
6 16
7 17
8 18
9 19
[10 11 12]
False
[1000   11   12]
[1000   11   12   13   14   15   16   17   18   19]
[1000   12   14   16   18]
[  19   18   17   16   15   14   13   12   11 1000]


In [70]:
import numpy as np

arr = np.arange(1,10,1)
arr.resize(3,3)
print(arr)
print("="*30)

print(arr[:,0:2]) # 각 행의 요소 2개씩 뽑기
print("="*30)

print(arr[:,1:3]) # 각 행의 지정된 요소 뽑기
print("="*30)

print(arr[1:,1:3]) # 지정된 행의 지정된 요소 뽑기

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 2]
 [4 5]
 [7 8]]
[[2 3]
 [5 6]
 [8 9]]
[[5 6]
 [8 9]]


## 논리연산

    NUMPY ARRAY에 대한 논리연산
    numpy는 기본적으로 boolean indexing을 지원
    1. boolean mask
    2. boolean indexing

    불린 마스크를 사용해서 불린 인덱싱 사용!

In [3]:
np.random.seed(1)
arr = np.random.randint(0,10,(10))
print(arr)

tmp = (arr%2==0) # boolean mask
# 여기선 even 숫자만
print(tmp)

# boolean indexing
# even 숫자 mask를 사용하여 even 숫자만 슬라이싱
# TRUE되는 숫자들만 출력이 된다.
print(arr[tmp])
print(arr[arr%2==0])

[5 8 9 5 0 0 1 7 6 9]
[False  True False False  True  True False False  True False]
[8 0 0 6]
[8 0 0 6]


In [89]:
import numpy as np

name_arr = np.array(["KIM","MOON","LEE","KIM","LEE","KIM"])

np.random.seed(0)
data_arr = np.random.randn(6,3) # 6행3열짜리 0,1 분포 난수 생성

# 배열 2개 > 맵핑
# name_arr[0] => data_arr[0,:]로 간주

# 이름이 "Lee"인 사람의 data를 추출
print(name_arr)
print(data_arr)

print("="*30)

# 불린 마스크 생성
print(name_arr)
tmp = (name_arr=="LEE")
print(tmp)

# 불린 마스크를 사용하여 불린 인덱싱
# 즉, LEE라는 사람의 데이터를 갖고오는 인덱싱
print("ALL THE LEE'S: \n", data_arr[tmp,:])

['KIM' 'MOON' 'LEE' 'KIM' 'LEE' 'KIM']
[[ 1.76405235  0.40015721  0.97873798]
 [ 2.2408932   1.86755799 -0.97727788]
 [ 0.95008842 -0.15135721 -0.10321885]
 [ 0.4105985   0.14404357  1.45427351]
 [ 0.76103773  0.12167502  0.44386323]
 [ 0.33367433  1.49407907 -0.20515826]]
['KIM' 'MOON' 'LEE' 'KIM' 'LEE' 'KIM']
[False False  True False  True False]
ALL THE LEE'S: 
 [[ 0.95008842 -0.15135721 -0.10321885]
 [ 0.76103773  0.12167502  0.44386323]]


## Fancy 인덱싱

배열에 index배열을 전달해서 배열요소를 참조하는 방식

In [99]:
np.random.seed(0)
arr = np.random.randint(0,10,(4,5))
print(arr)
print(arr[0,0]) # 인덱싱
print(arr[0,:]) # 슬라이싱

# FANCY 인덱싱
print(arr[0,[1,3]]) # 1과 3열의 0행 정보 제공

print(arr[[1,3],0]) # 1,3행의 0열 정보 제공

[[5 0 3 3 7]
 [9 3 5 2 4]
 [7 6 8 8 1]
 [6 7 7 8 1]]
5
[5 0 3 3 7]
[0 3]
[9 6]


## 이행연산

shape이 똑같은 배열끼리만 가능

In [106]:
np.random.seed(0)
arr1 = np.random.randint(0,10,(2,3))
arr2 = np.random.randint(0,10,(2,3))
arr3 = np.random.randint(0,10,(3,2))
print(arr1)
print(arr2)
print(arr3)
print("="*30)

print(arr1+arr2) #같은 인덱스에 있는것 끼리 연산

print("="*30)
"""
행렬곱
dot product
내적
"""
print(np.dot(arr1,arr3))

print("="*30)
"""
2차원 배열 + 1차원 배열
BROADCASTING이라고 하는 기능이 있다.
"""
arr4 = np.random.randint(0,10,(3))
print(arr4) # 1행 3열
print(arr1+arr4) # 2행3열 + 1행3열(x2)

'''
배열 값 비교는
원래는 값을 하나하나 loop돌려서 확인하지만
이게 리소스와 시간을 많이 잡기 떄문에
numpy 자체함수 np.array_equal(배열, 배열)로
쉽게 비교분석이 가능하다.
'''
print(np.array_equal(arr1,arr2))

[[5 0 3]
 [3 7 9]]
[[3 5 2]
 [4 7 6]]
[[8 8]
 [1 6]
 [7 7]]
[[ 8  5  5]
 [ 7 14 15]]
[[ 61  61]
 [ 94 129]]
[8 1 5]
[[13  1  8]
 [11  8 14]]
False


## 간단한 연산

    3차원 배열
    axis=0 > depth
    axis=1 > 행방향
    axis=2 > 열방향

In [113]:
arr = np.random.randint(0,10,(3,3))
print(arr)
print("="*30)
# 전체 sum
print(arr.sum())
print("="*30)
# 열방향 sum
print(arr.sum(axis=0))
print("="*30)
# 행방향 sum
print(arr.sum(axis=1))

[[2 7 2]
 [9 2 3]
 [3 2 3]]
33
[14 11  8]
[11 14  8]


## 집계함수

    집계함수가 필요한 이유는;

    수학식을 이용하면
    모든 집계함수를 프로그램적으로 구현이 가능.
    우리가 다루는 데이터는 상당히 크기가 큰 데이터이다.

In [11]:
arr = np.arange(100000000)
# 밑에 CELL에서 주피터 기능 %%time을 사용해서
# 밑 cell에서 구현한 함수 계산 시간을 확인할수 있다.

In [12]:
%%time

result = 0.0
for tmp in arr:
    result += tmp

print(result)

4.99999995e+15
Wall time: 22.6 s


In [13]:
%%time

print(arr.sum())

887459712
Wall time: 45.6 ms


## mask indexing + 집계연산

In [123]:
arr = np.array([True,False,True,False,False])
print(arr)
# True=1, False=0이기에
# .sum()을 하면 1+1 한 값들만 나온다.
print(arr.sum())
# True개수를 찾는데 유용하다.
print("="*30)

# 배열의 True (<3.0) 개수 찾기
arr = np.random.normal(3,1,(4,5))
print(arr)
print(arr > 3.0) # boolean mask,index 활용
print((arr>3.0).sum()) # sum 활용

[ True False  True False False]
2
[[3.3972174  3.5768477  3.06000009 3.51379384 2.34282297]
 [2.31902092 3.35476966 1.56584561 3.47174338 2.95195559]
 [2.41936168 3.25278526 2.98106258 2.30931694 3.79976165]
 [5.2141412  3.43887142 3.6382597  5.01584138 2.75634725]]
[[ True  True  True  True False]
 [False  True False  True False]
 [False  True False False  True]
 [ True  True  True  True False]]
12


## Sorting (정렬)

    정렬, 2가지 형태

    1. np.sort(배열, axis=)
    정렬된 결과를 return, 원본엔 변화가 없다.

    2. 배열.sort(axis=)
    원본이 정렬된다. Return none.

    NOTE:
    axis를 명시하지 않으면 axis=-1로 지정된다 : 마지막 축

In [126]:
np.random.seed(0)
arr = np.random.randint(0,10,(3,3))
print(arr)

arr.sort() # axis=-1 : axis=1 (2차원), 열방향
print(arr)

arr.sort(axis=0) # 행방향
print(arr)

[[5 0 3]
 [3 7 9]
 [3 5 2]]
[[0 3 5]
 [3 7 9]
 [2 3 5]]
[[0 3 5]
 [2 3 5]
 [3 7 9]]


## Unique값들만 추출!

    np.unique(배열)
    중복값을 없애고 사용되는 원소들 리턴.

In [132]:
np.random.seed(0)
arr = np.random.randint(0,9,(7))
print(arr)
tmp = np.unique(arr)
print(tmp)
tmp[0] = 8
print(tmp)

[5 0 3 3 7 3 5]
[0 3 5 7]
[8 3 5 7]
