<a href="https://colab.research.google.com/github/ryopxd/data-analysis/blob/main/numpy.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# numpy 기초 사용법

In [None]:
import numpy as np

list_data = [1, 2, 3]
array = np.array(list_data)

In [None]:
print(array.size)
print(array.dtype)
print(array[2])

3
int64
3


In [None]:
# 0부터 3까지의 배열 만들기
array1 = np.arange(4)
print(array1)

[0 1 2 3]


In [None]:
array2 = np.zeros((4, 4), dtype = float)
print(array2)

[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]


In [None]:
array3 = np.ones((3, 3), dtype = str)
print(array3)

[['1' '1' '1']
 ['1' '1' '1']
 ['1' '1' '1']]


In [None]:
# 0부터 9까지 랜덤하게 초기화된 배열 만들기
array4 = np.random.randint(1, 10, (3, 3))
print(array4)

[[8 5 8]
 [9 7 5]
 [6 1 1]]


In [None]:
# 평균이 0이고, 표준편차가 1인 표준 정규를 띄는 배열
array5 = np.random.normal(0, 1, (3, 3))
print(array5)

[[-0.14637582 -0.13734389  0.12192027]
 [-2.70795188 -1.64781    -0.7495966 ]
 [ 0.38009493 -0.15251082 -1.5730093 ]]


In [None]:
array1 = np.array([1, 2, 3])
array2 = np.array([4, 5, 6])
array3 = np.concatenate([array1, array2])

print(array3.shape)
print(array3)

(6,)
[1 2 3 4 5 6]


In [None]:
array1 = np.array([1, 2, 3, 4])
array2 = array1.reshape((2, 2))

print(array2)

[[1 2]
 [3 4]]


In [None]:
array1 = np.arange(4).reshape(1, 4)
array2 = np.arange(8).reshape(2, 4)

print(array1)
print(array2)

array3 = np.concatenate([array1, array2], axis = 0)
print(array3)

[[0 1 2 3]]
[[0 1 2 3]
 [4 5 6 7]]
[[0 1 2 3]
 [0 1 2 3]
 [4 5 6 7]]


In [None]:
array = np.arange(8).reshape(2, 4)
left, right = np.split(array, [2], axis = 1)

print(left.shape)
print(right.shape)
print(array)
print(left)
print(right[1][1])

(2, 2)
(2, 2)
[[0 1 2 3]
 [4 5 6 7]]
[[0 1]
 [4 5]]
7


# numpy의 기본 연산

In [None]:
import numpy as np

array = np.random.randint(1, 10, size = 4).reshape(2, 2)
print(array)

[[6 9]
 [5 8]]


In [None]:
result_array = array * 10
print(result_array)

[[60 90]
 [50 80]]


In [None]:
array1 = np.arange(4).reshape(2,2)
array2 = np.arange(2)

array3 = array1 + array2
print(array3)

[[0 2]
 [2 4]]


In [None]:
array1 = np.arange(8).reshape(2,4)
array2 = np.arange(8).reshape(2,4)
array3 = np.concatenate([array1, array2], axis = 0)
array4 = np.arange(0, 4).reshape(4, 1)

print(array3 + array4)

[[ 0  1  2  3]
 [ 5  6  7  8]
 [ 2  3  4  5]
 [ 7  8  9 10]]


In [None]:
array1 = np.arange(16).reshape(4,4)
print(array1)

array2 = array1 < 10
print(array2)

array1[array2] = 100
print(array1)

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [12 13 14 15]]
[[ True  True  True  True]
 [ True  True  True  True]
 [ True  True False False]
 [False False False False]]
[[100 100 100 100]
 [100 100 100 100]
 [100 100  10  11]
 [ 12  13  14  15]]


In [None]:
array = np.arange(16).reshape(4,4)

print("최대값 : ", np.max(array))
print("최소값 : ", np.min(array))
print("합계 : ", np.sum(array))
print("평균값 : ", np.mean(array))

최대값 :  15
최소값 :  0
합계 :  120
평균값 :  7.5


In [None]:
array = np.arange(16).reshape(4,4)

print("합계 : ", np.sum(array, axis = 0))

합계 :  [24 28 32 36]


In [None]:
# 단일 객체 저장 및 불러오기
array = np.arange(0,10)
np.save('saved.npy', array)


In [None]:
result = np.load('saved.npy')
print(result)

[0 1 2 3 4 5 6 7 8 9]


In [None]:
# 복수 객체 저장 및 불러오기
array1 = np.arange(0,10)
array2 = np.arange(10,20)
np.savez('saved.npz', array1 = array1, array2 = array2)

data = np.load('saved.npz')
result1 = data['array1']
result2 = data['array2']

print(result1)
print(result2)

[0 1 2 3 4 5 6 7 8 9]
[10 11 12 13 14 15 16 17 18 19]


In [None]:
# Numpy 원소 오름차순 정렬
array = np.array([5, 9, 10, 3, 1])
array.sort()

# 내림차순
print(array[::-1])

[10  9  5  3  1]


In [None]:
# 각 열을 기준으로 정렬
array = np.array([[5, 9, 10, 3, 1],
                  [8, 3, 4, 2, 5]])

print(array)
array.sort(axis = 0)
print(array)

[[ 5  9 10  3  1]
 [ 8  3  4  2  5]]
[[ 5  3  4  2  1]
 [ 8  9 10  3  5]]


In [None]:
# 균일한 간격으로 데이터 생성
array = np.linspace(0, 10, 5)
print(array)

[ 0.   2.5  5.   7.5 10. ]


In [None]:
# 난수의 재연(실행마다 결과 동일)
np.random.seed(7)
print(np.random.randint(0, 10, (2, 3)))

[[4 9 6]
 [3 3 7]]


In [None]:
# Numpy 배열 객체 복사
array1 = np.arange(0,10)
array2 = array1
array2[0] = 99
print(array1)

array1 = np.arange(0, 10)
array2 = array1.copy()
array2[0] = 99
print(array1)

[99  1  2  3  4  5  6  7  8  9]
[0 1 2 3 4 5 6 7 8 9]


In [None]:
# 중복된 원소 제거)
array = np.array([1, 1, 2, 2, 2, 3, 3, 4])
print(np.unique(array))

[1 2 3 4]
