# Numpy
numpy는 선형대수 기반의 프로그램을 쉽게 만들 수 있도록 지원하는 대표적인 패키지 입니다.
루프를 사용하지 않고, 배열 연산을 가능하게 하므로, 빠른 배열 연산 속도를 보장합니다.


In [1]:
import numpy as np

---
## ndarray 
- <span style = "color:red">**numpy.array()**</span>를 통해서 리스트와 같은 다양한 인자들을 ndarray로 변환 할 수 있습니다.<br>
    - <span style = "color:red">*ndarray.shape*</span>를 이용하여 ndarray의 형태를 확인 할 수 있습니다  
    -  <span style = "color:red">*ndarray.ndim*</span>을 이용하여 차원을 확인 할 수 있습니다.

![image.png](attachment:image.png)

In [2]:
ndarray = np.array([[1,2,3],[4,5,6]])
print(ndarray) #ndarray 로 변환
print(type(ndarray)) # 데이터 타입 = numpy.ndarray
print(ndarray.shape)

ndarray = np.array([1,2,3])
print(ndarray.shape)
print(ndarray.ndim)

ndarray = np.array([[1,2,3]])
print(ndarray.shape) # 위와 결과가 다른이유는 이차원 리스트가 제공되어 2Darray로 인식하였기 때문이다
print(ndarray.ndim)

[[1 2 3]
 [4 5 6]]
<class 'numpy.ndarray'>
(2, 3)
(3,)
1
(1, 3)
2


---
## ndarray의 DataType
-  <span style = "color:red">ndarray.dtype</span>을 이용하여 데이터의 타입을 확인할 수 있고,  <span style = "color:red">ndarray.astype()</span>으로 형태를 바꿀 수 있습니다.

In [3]:
list1 = [1,2,3]
print(type(list1))
array1 = np.array(list1)

print(type(array1))
print(array1, array1.dtype)

<class 'list'>
<class 'numpy.ndarray'>
[1 2 3] int32


---
## ndarray의 axis 기반의 연산
 - () 안에 아무것도 없으면, 전체 행에 대해서 시행
 - axis = n 이면 n축 <span style = "color:red">방향</span> 으로 계산을 시행

In [4]:
array2 = np.array([[1,2,3],
                  [2,3,4]])

print(array2.sum())
print(array2.sum(axis=0))
print(array2.sum(axis=1))

15
[3 5 7]
[6 9]


---
## ndarray의 편의기능
 - <span style = "color:red">ndarray.arange(n)</span>: 0 ~ n 이전까지의 정수를 1차원 array로 생성 
 - <span style = "color:red">ndarray.zeros((m,n))</span>: m행, n열의 2차원 array에 0을 삽입 
 - <span style = "color:red">ndarray.ones((m,n))</span>: ... 1을 삽입

In [6]:
sequence_array = np.arange(10)
print(sequence_array)
print(sequence_array.dtype, sequence_array.shape)

zero_array = np.zeros((3,2),dtype='int32')
print(zero_array)
print(zero_array.dtype, zero_array.shape)

one_array = np.ones((3,2))
print(one_array)
print(one_array.dtype, one_array.shape)

[0 1 2 3 4 5 6 7 8 9]
int32 (10,)
[[0 0]
 [0 0]
 [0 0]]
int32 (3, 2)
[[1. 1.]
 [1. 1.]
 [1. 1.]]
float64 (3, 2)


---
## ndarray의 재배열
 - <span style = "color:red">ndarray.reshape(m,n)</span>을 이용하여 m행 n열의 모양으로 재배열이 가능하다
 - 받드시 기존의 배열이 제공한 행과 열에 부족함 없이 채워 질 수 있어야 한다.
 - -1을 이용하여 특정 차원으로 고정된 가변길이의 ndarray의 형태로 변환시킬 수 있으나, 위의 기준은 만족해야한다

In [13]:
array = np.arange(9)
print(array)
print(array.reshape(3,3)) # 기존의 ndarray는 변하지 않고, 새로운 ndarray를 리턴한다. 

array = np.arange(10)
print(array.reshape(-1, 5)) # 가변길이로 알아서 정렬하지만, 불가능한 경우 에러가 발생한다. 

[0 1 2 3 4 5 6 7 8]
[[0 1 2]
 [3 4 5]
 [6 7 8]]
[[0 1 2 3 4]
 [5 6 7 8 9]]


---
## ndarray의 인덱싱
- 인덱스를 통해서 원하는 곳에 접근 가능하다. 
- 이차원 ndarray의 경우, 행과 열 값을 이용하여 접근 가능하다. 
- slicing 또한 가능하다. (파이썬의 슬라이싱과 동일)
- fancy indexing : 원하는 2차원 ndarray에서 원하는 행과 열의 정보만을 리스트로 전달하여 특정 행과 열만을 출력 가능하다
- <span style = "color:red"> Boolean indexing</span>: ndarrya[] 형태에서 괄호 안에 조건식을 제공하여 원하는 인덱스 만을 출력할 수 있다. 이때 [] 안에 제공되는 것은 True, False로 구성된  1차원 ndarray가 제공된다 

In [41]:
#fancy indexing
array = np.arange(start= 1, stop = 10)
array2 = array.reshape(3,3)
print(array2)

print(array2[[0,2],:]) #팬시 인덱싱으로, 1,3행을 선택하고 슬라이싱으로 모든 열을 선택.

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 2 3]
 [7 8 9]]


In [42]:
#boolean indexing
array = np.arange(9)
print(array)

filt = array > 5
print(filt) # 다음과 같이 True, False로 구성된 ndarray로 반환된다. 

print(array[filt])
print(array[array > 5]) # 위와 아래가 동일한 역할을 수행한다.

#일반 인덱스로 필터링
filt = np.array([0,3,1]) # 원하는 인덱스를 ndarray로 만들어서 제공하여 필터링 하는 방법도 존재한다. 
print(array[filt])



[0 1 2 3 4 5 6 7 8]
[False False False False False False  True  True  True]
[6 7 8]
[6 7 8]
[0 3 1]


---
## 행렬의 정렬
- <span style = "color:red">np.sort(ndarray)</span>: ()안에 정렬 하고자 하는 ndarray를 넣으면, 원본은 변하지 않고, 정렬될 새로운 ndarray가 리턴. 원본을 수정하고 싶은 경우, ndarray.sort()를 이용하여 가능하다.
- <span style = "color:red">np.argsort(ndarray)</span> : 정렬된 행렬에 대해 정렬 이전의 인덱스를 리턴한다. ndarray는 단일 자료형만을 다루기 때문에 key-value의 구성이 어렵다. 이를 해결하는데 쓰기도 한다.

In [49]:
array = np.array([3,1,7,4,5,2])
print(array)
print()

print("정렬후")
print(np.sort(array))
print()

print(array)
array.sort()
print(array)

[3 1 7 4 5 2]

정렬후
[1 2 3 4 5 7]

[3 1 7 4 5 2]
[1 2 3 4 5 7]


In [50]:
name_array=np.array(['John', 'Mike', 'Sarah', 'Kate', 'Samuel'])
score_array=np.array([78, 95, 84, 98, 88])

# score_array의 정렬된 값에 해당하는 원본 행렬 위치 인덱스 반환하고 이를 이용하여 name_array에서 name값 추출.  
sort_indices = np.argsort(score_array)
print("sort indices:", sort_indices)

name_array_sort = name_array[sort_indices]

score_array_sort = score_array[sort_indices]
print(name_array_sort)
print(score_array_sort)

sort indices: [0 2 4 1 3]
['John' 'Sarah' 'Samuel' 'Mike' 'Kate']
[78 84 88 95 98]


---
## 선형대수 연산(행렬의 내적과 전치 행렬)
- 행렬 내적

In [51]:
A = np.array([[1, 2, 3],
              [4, 5, 6]])
B = np.array([[7, 8],
              [9, 10],
              [11, 12]])

dot_product = np.dot(A, B)
print('행렬 내적 결과:\n', dot_product)

행렬 내적 결과:
 [[ 58  64]
 [139 154]]


- 전치 행렬

In [53]:
A = np.array([[1, 2],
              [3, 4]])
transpose_mat = np.transpose(A)
print('A의 전치 행렬:\n', transpose_mat)

A의 전치 행렬:
 [[1 3]
 [2 4]]
