## 1.3 Numpy

#### ndarray 생성 
>- Numpy 모듈의 array() 함수로 생성
>- 인자로 주로 파이썬 List 또는 ndarray 입력
>- ndarray의 shape는 ndarray.shape 속성으로, 차원은 ndarray.ndim으로, 데이터타입은 ndarray.dtype으로 확인
>- astype() 함수는 원하는 데이터 타입으로 변경 

In [None]:
import numpy as np

list1 = [1, 2, 3]
print(list1)
array1 = np.array(list1)
print('array1 type :', type(array1))
print('array1 shape:', array1.shape)

In [None]:
array2 = np.array([[1, 2, 3],
                   [2, 3, 4]])
print('array2 type :', type(array2))
print('array2 shape:', array2.shape)

In [None]:
array3 = np.array([[1, 3, 3]])         # 중첩 List
print('array3 type :', type(array3))
print('array3 shape:', array3.shape)

In [None]:
print('array1: {:0} 차원, array2: {:1} 차원, array3: {:2} 차원'.format(array1.ndim, array2.ndim, array3.ndim))

#### ndarray 데이터 타입

In [None]:
list1 = [1, 2, 3]
print(list1)
array1 = np.array(list1)
print('list type         :', type(list1))
print('array1 array type :', type(array1))
print('array1 data type  :', array1.dtype)

In [None]:
list2 = [1, 2, 'test']
array2 = np.array(list2)
print(array2, array2.dtype)

In [None]:
list3 = [1, 2, 3.0]
array3 = np.array(list3)
print(array3, array3.dtype)

In [None]:
array_int = np.array([1, 2, 3])
array_float = array_int.astype('float64')
print(array_float, array_float.dtype)

In [None]:
array_int1 = array_float.astype('int32')
print(array_int1, array_int1.dtype)

In [None]:
array_float1 = np.array([1.1, 2.2, 3.3])
array_int2 = array_float1.astype(np.int32)
print(array_int2, array_int2.dtype)

#### ndarray 초기화 - arange(), zeros(), ones()

In [None]:
sequence_array = np.arange(10)
print(sequence_array)
print(sequence_array.dtype, sequence_array.shape)

In [None]:
# (3,2) shape을 가지는 모든 원소가 0, dytpe은 int32인 ndarray 생성
zero_array = np.zeros((3,2), dtype='int32')
print(zero_array)
print(zero_array.dtype, zero_array.shape)

In [None]:
# (3, 2) shape을 가지는 모든 원소가 1인 ndarray 생성
one_array = np.ones((3,2))
print(one_array)
print(one_array.dtype, one_array.shape)

#### ndarray 차원과 크기 변경 - reshape()
>- 인자에 -1를 부여하면, -1에 해당하는 axis의 키그는 가변 크기로 shape을 변환
>- reshape(-1, 1) vs. reshape(-1,) 

In [None]:
array1 = np.arange(10)
print("array1: \n", array1)
      
# (2, 5) Shape으로 변환
array2 = array1.reshape(2, 5)
print("array2: \n", array2)

# (5, 2) Shape으로 변환
array3 = array2.reshape(5, 2)
print("array3: \n", array3)

In [None]:
# array1.reshape(4, 3)      # ValueError: cannot reshape array of size 10 into shape (4,3)

In [None]:
array1 = np.arange(10)
print(array1)

array2 = array1.reshape(-1, 5)
print(array2)

array3 = array1.reshape(5, -1)
print(array3)

In [None]:
# array4 = array1.reshape(-1, 4)    # ValueError: cannot reshape array of size 10 into shape (4)

In [None]:
array1 = np.arange(8)
array3d = array1.reshape((2, 2, 2))
print("array3d: \n", array3d.tolist())

# 3차원 ndarray를 2차원 ndarray로 변환 & 컬럼수는 1
array5 = array3d.reshape(-1, 1)
print("array5: \n", array5.tolist())
print("array5 shape: ", array5.shape)

# 1차원 ndarray를 2차원 ndarray로 변환 & 컬럼수는 2
array6 = array1.reshape(-1, 1)
print("array6: \n", array6.tolist())
print("array6 shape: ", array6.shape)

In [None]:
# 3차원 ndarray를 1차원 ndarray로 변환
array7 = array3d.reshape(-1,)
print(array7)

#### ndarray  데이터 세트 선택 - indexing
>- Slicing : 연속된 index의 ndarray를 추축하는 방식. "시작 Index : 종료 Index"로 표시하며, 시작 Index에서 종료 Index-1 위치에 있는 ndarray를 반환
>- Fancy Indexing : Indexing 집합을 List or ndarray 형태로 지정하여 해당 위치에 있는 ndarray를 반환
>- Boolean Indexing : True/False 값 Indexing 집합을 기반으로 True에 해당하는 Index 위치에 있는 ndarray를 반환

In [None]:
# 단일 Indexing
# 1에서 9가지의 1차원 ndarray
array1 = np.arange(start=1, stop=10)
print("array1: ", array1)

# index는 0부터 시작. array1[2]는 3번째 index 위치의 데이터 값을 의미
value = array1[2]
print("value: ", value)
print(type(value))

In [None]:
print("맨 뒤의 값: ", array1[-1], ", 맨 뒤에서 두 번째 값: ", array1[-2])

In [None]:
array1[0] = 9
array1[8] = 0
print("array1: ", array1)

In [None]:
array1d = np.arange(start=1, stop=10)
array2d = array1d.reshape(3, 3)
print(array2d)

print("(row=0, col=0) Index value: ", array2d[0, 0])
print("(row=0, col=1) Index value: ", array2d[0, 1])
print("(row=1, col=0) Index value: ", array2d[1, 0])
print("(row=2, col=2) Index value: ", array2d[2, 2])

In [None]:
# Slicing Indexing
array1 = np.arange(start=1, stop=10)
print("array1: ", array1)

array3 = array1[0:3]
print(array3)
print(type(array3))
print(array3.shape)

In [None]:
array1 = np.arange(1, 10)
# 위치 Index 0-2(2포함)까지 추출
array4 = array1[0:3]
print(array4)

# 위치 Index 3부터 마지막까지 추출
array5 = array1[3:]
print(array5)

# 위치 Index로 전체 데이터 추출
array6 = array1[:]
print(array6)

In [None]:
array1d = np.arange(1, 10)
array2d = array1d.reshape(3, 3)
print("array2d: \n", array2d)

print("array2d[0:2, 0:2]: \n", array2d[0:2, 0:2])
print("array2d[1:3, 0:3]: \n", array2d[1:3, 0:3])
print("array2d[1:3, :]  : \n", array2d[1:3, :])
print("array2d[:, :]    : \n", array2d[:, :])
print("array2d[:2, 1:]  : \n", array2d[:2, 1:])
print("array2d[:2, 0]   : \n", array2d[:2, 0])     # 단일 Index -> 차원 축소

In [None]:
print(array2d[0])
print(array2d[1])
print("array2d[0] shape: ", array2d[0].shape, "array2d[1] shape: ", array2d[1].shape)

In [None]:
# Fancy Indexing
array1d = np.arange(1, 10)
array2d = array1d.reshape(3, 3)
print(array2d)

array3 = array2d[[0, 1], 2]
print("array2d[[0, 1], 2]   => ", array3.tolist())

array4 = array2d[[0, 1], 0:2]
print("array2d[[0, 1], 0:2] => ", array4.tolist())

array5 = array2d[[0, 1]]
print("array2d[[0, 1]]      => ", array5.tolist())

array6 = array2d[[1]]
print("array2d[[1]]         => ", array6.tolist())

In [None]:
# Boolean Indexing
array1d = np.arange(1, 10)
# [] 안에 "array1d > 5" Boolean 조건식을 적용
array7 = array1d[array1d > 5]
print("'array1d > 5' Boolean Indexing 결과 값: ", array7)

In [None]:
array1d > 5

In [None]:
val = array1d > 5
print(val, type(val), val.shape)

In [None]:
boolean_indexes = np.array([False, False, False, False, False,  True,  True,  True,  True])
array8 = array1d[boolean_indexes]
print("Boolean Index로 Filtering 결과: ", array8)

In [None]:
# Boolean Indexing을 적용하지 않은 경우
array1d = np.arange(1, 10)
target = []

for i in range(0, 9):
    if array1d[i] > 5 :
        target.append(array1d[i])
        
array_selected = np.array(target)
print(array_selected)

In [None]:
indexs = np.array([5, 6, 7, 8])
array9 = array1d[indexs]
print("일반 Index Filtering 결과: ", array9) 

#### 배열의 정렬 - sort() & argsort()
>- sort()
>- np.sort(ndarray) : 인자로 들어온 원 행렬은 그대로 유지하고, 원 행렬의 정렬된 행렬 반환
>- ndarray.sort()   : 원 행렬 자체를 정렬한 형태로 변환하며 반환 값은 None
>- np.sort() or ndarray.sort() 모두 오름차순이 Default. 내림차순 정렬을 하기 위해 np.sort()[::-1]과 같이 사용  

>- argsort()
>- 원본 행렬 정렬 시, 정렬된 행렬의 원래 Index를 필요로 할 때 np.argsort()를 사용
>- np.argsort()는 정렬 행렬의 원본 행렬 Index를 ndarray형으로 반환

In [None]:
org_array = np.array([3, 1, 9, 5])
print("Original Array: ", org_array)

# np.sort()로 정렬
sort_array1 = np.sort(org_array)
print("np.sort() 호출 후 반환 배열 : ", sort_array1)
print("np.sort() 호출 후 원본 배열 : ", org_array)

# ndarray.sort()로 정렬
sort_array2 = org_array.sort()
print("np.sort() 호출 후 반환 배열 : ", sort_array2)
print("np.sort() 호출 후 원본 배열 : ", org_array)

In [None]:
sort_array1_desc = np.sort(org_array)[::-1]
print("내림차순 정렬: ", sort_array1_desc)

In [None]:
array2d = np.array([[8, 12],
                    [7, 1]])

sort_array2d_axis0 = np.sort(array2d, axis=0)
print("Row 방향으로 정렬: \n", sort_array2d_axis0)

sort_array2d_axis1 = np.sort(array2d, axis=1)
print("Column 방향으로 정렬: \n", sort_array2d_axis1)

In [None]:
# 정렬 행렬의 Index 반환 - argsort()
org_array = np.array([3, 1, 9, 5])
sort_indices = np.argsort(org_array)
print(type(sort_indices))
print("행렬 정렬 시 원본 배열의 Index: ", sort_indices)

In [None]:
org_array = np.array([3, 1, 9, 5])
sort_indices_desc = np.argsort(org_array)[::-1]
print("행렬 내림차순 정렬 시 원본 배열의 Index: ", sort_indices_desc)

In [None]:
name_array = np.array(['John', 'Mike', 'Sarah', 'Kate', 'Sanuel'])
score_array = np.array([78, 95, 84, 98, 88])

sort_indices_asc = np.argsort(score_array)
print("성적 오름차순 정렬 시 socre_array의 Index: ", sort_indices_asc)
print("성적 오름차순으로 name_array의 name 출력 : ", name_array[sort_indices_asc]) 

#### 선형대수 연산
>- 행렬 내적: np.dot(A, B)
>- 전치 행렬: np.transpose(A) 

In [None]:
# 행렬 내적
A = np.arange(1, 7).reshape(2, -1)
B = np.arange(7, 13).reshape(3, -1)

dot_product = np.dot(A, B)
print("행렬 내적 결과: \n", dot_product)

In [None]:
# 전치 행렬
C = np.arange(1, 5).reshape(2, -1)
transpose_mat = np.transpose(C)
print("C의 전치행렬: \n", transpose_mat)