### Numpy
- Numerical Python을 의미하는 NumPy는 파이썬에서 선형대수 기반의 프로그램을 쉽게 만들수 있도록 지원하는 대표적인 패키지
- 많은 머신러닝 알고리즘이 넘파이 기반으로 작성돼 있으며 알고리즘의 입 출력 데이터를 넘파이 배열 타입으로 사용함
- 넘파이의 기본 데이터 타입은 ndarray.ndarray를 이용해 넘파이에서 다차원 배열을 쉽게 생성 하고 다양한 연산 수행

In [7]:
# 1차원 배열로 3개의 데이터

import numpy as np

array1 = np.array([1,2,3])
print("array1 type : ",type(array1))


#1 차원 배열의 shape는 (,열)이 아닌 (열,)형태로 출력
print("array1 array 형태 : ",array1.shape)
print(array1)

array1 type :  <class 'numpy.ndarray'>
array1 array 형태 :  (3,)
[1 2 3]


In [13]:
# 2차원 배열로 2개의 row와 3개의 column으로 구성 6개의 데이터

array2 = np.array([[1,2,3],[2,3,4]])
print("array2 type : ",type(array2))
print("array2 형태 : ",array2.shape)
print(array2)

array2 type :  <class 'numpy.ndarray'>
array2 형태 :  (2, 3)
[[1 2 3]
 [2 3 4]]


In [14]:
# 1개의 row와 3개의 column으로 구성된 2차원 배열

array3 = np.array([[1,2,3]])
print("array3 type : ",type(array3))
print("array3 array형태 : ",array3.shape)
print(array3)
print()
print(array1.ndim)   # 1차원 형태
print(array3.ndim)   # 2차원 형태

array3 type :  <class 'numpy.ndarray'>
array3 array형태 :  (1, 3)
[[1 2 3]]

1
2


In [23]:
# 데이터 값으로는 서로 동일하나 차원이 달라서 오류가 발생
# 차원의 차수를 변환하여 오류 방지 (참조 : reshape)

ar = np.arange(10)
ar1 = ar.reshape(2,5)
ar2 = ar.reshape(5,2)
ar3 = ar.reshape(1,10)
ar4 = ar.reshape(5,-1)
print(ar)
print(ar1)
print(ar2)
print(ar3)
print(ar4)

[0 1 2 3 4 5 6 7 8 9]
[[0 1 2 3 4]
 [5 6 7 8 9]]
[[0 1]
 [2 3]
 [4 5]
 [6 7]
 [8 9]]
[[0 1 2 3 4 5 6 7 8 9]]
[[0 1]
 [2 3]
 [4 5]
 [6 7]
 [8 9]]


In [25]:
# ndarray 데이터 타입

list1 = [1,2,3]
print(type(list1))
array1 = np.array(list1)
print(type(array1))
print(array1, array1.dtype)

<class 'list'>
<class 'numpy.ndarray'>
[1 2 3] int32


In [None]:
# 다른 데이터 유형이 섞여 있는 이스트를 ndarray로 변경하여
# 데이터 크기가 더 큰 데이터 타입으로 형 변환을 일괄 적용
# int형이 유니코드 문자열 값으로, int형이 float(64)형으로 변환


In [26]:
# int32형을 float64형으로 변환
array_int = np.array([1,2,3])
array_float = array_int.astype("float64")
print(array_float, array_float.dtype)

[1. 2. 3.] float64


In [27]:
# float64형을 다시 int32형으로 변환
array_int1 = array_float.astype("int32")
print(array_int1, array_int1.dtype)

[1 2 3] int32


In [28]:
array_float1 = np.array([1.1, 2.1, 3.1])
array_int2 = array_float1.astype("int32")
print(array_int2, array_int2.dtype)

[1 2 3] int32


##### Q. 정수와 실수로 구성된 list e = [1.2, 2.3, 3]을 numpy를 이용해서 실수형과 정수형으로 각각 출력하세요.

In [29]:
e = np.array([1.2, 2.3, 3])
e1 = e.astype("float64")
e2 = e.astype("int32")
print(e1, e1.dtype)
print(e2, e2.dtype)

[1.2 2.3 3. ] float64
[1 2 3] int32


### ndarray를 편리하게 생성하기 - arange, zeros, ones

In [30]:
# arange

sequence_array = np.arange(10)
sequence_array
print(sequence_array)
print(sequence_array.dtype, sequence_array.shape)

[0 1 2 3 4 5 6 7 8 9]
int32 (10,)


In [32]:
# zero

zero_array = np.zeros((3,2), dtype="int32")
print(zero_array)
print(zero_array.dtype, zero_array.shape)

[[0 0]
 [0 0]
 [0 0]]
int32 (3, 2)


In [37]:
# one

one_array = np.ones((3,2), dtype="int32")
print(one_array)
print(one_array.dtype, one_array.shape)

[[1 1]
 [1 1]
 [1 1]]
int32 (3, 2)


In [42]:
# ndarray의 차원과 크기를 변경하는 reshape()

array1 = np.arange(10)
print("array1", array1)
print()
array2 = array1.reshape(2,5)
print("array2 : \n", array2)
print()
array3 = array1.reshape(5,2)
print("array3 : \n", array3)

array1 [0 1 2 3 4 5 6 7 8 9]

array2 : 
 [[0 1 2 3 4]
 [5 6 7 8 9]]

array3 : 
 [[0 1]
 [2 3]
 [4 5]
 [6 7]
 [8 9]]


###### Q. arange() 함수를 이용해서 0 ~ 29 정수 배열을 생성하고 3 X 2 X 5 3차원 배열로 변환하세요.

In [47]:
array1 = np.arange(30)
array3d = array1.reshape((3,2,5))
print(array3d)
print()
print(array3d.tolist())

[[[ 0  1  2  3  4]
  [ 5  6  7  8  9]]

 [[10 11 12 13 14]
  [15 16 17 18 19]]

 [[20 21 22 23 24]
  [25 26 27 28 29]]]

[[[0, 1, 2, 3, 4], [5, 6, 7, 8, 9]], [[10, 11, 12, 13, 14], [15, 16, 17, 18, 19]], [[20, 21, 22, 23, 24], [25, 26, 27, 28, 29]]]


### reshape(-1, 1)
- 여러 개의 로우를 가지되 반드시 1개의 칼럼을 가진 ndarray로 변환 보장

In [48]:
# -1을 인자로 사용하여 원하는 shape로 변환

array1 = np.arange(10)
print(array1)
print()
array2 = array1.reshape(-1, 5)
print("array2 shape : ",array2.shape)
print(array2)

[0 1 2 3 4 5 6 7 8 9]

array2 shape :  (2, 5)
[[0 1 2 3 4]
 [5 6 7 8 9]]


In [52]:
# reshape(-1, 1)을 이용해 1차원을 2차원으로 3차원을 2차원으로 변환

array1 = np.arange(10)
print(array1)
array2a = array1.reshape(-1, 1)
print(array2a)
print()
array3d = array1.reshape((1,2,5))
print(array3d)
print()
array2b = array3d.reshape(-1,1)
print(array2b)

[0 1 2 3 4 5 6 7 8 9]
[[0]
 [1]
 [2]
 [3]
 [4]
 [5]
 [6]
 [7]
 [8]
 [9]]

[[[0 1 2 3 4]
  [5 6 7 8 9]]]

[[0]
 [1]
 [2]
 [3]
 [4]
 [5]
 [6]
 [7]
 [8]
 [9]]


###### Q. array1에 reshape() 함수를 이용, "array3 shape: (5,2)"가 되도록 array3을 출력하세요

In [54]:
# array1 = np.arange(10)
# array3 = array1.reshape(5, 2)
# print(array3.shape)
# print(array3)

array1 = np.arange(10)
array3 = array1.reshape(-1, 2)
print(array3.shape)
print(array3)

(5, 2)
[[0 1]
 [2 3]
 [4 5]
 [6 7]
 [8 9]]


###### Q. 3차원 ndarray array3d를 2차원 ndarray로 변환해서 array5에 저장하고 list로 출력하세요.

In [58]:
array3d = array1.reshape((2,1,5))
print(array3d)
array5 = array3d.reshape(2,5)
print("array5 : \n", array5.tolist())

[[[0 1 2 3 4]]

 [[5 6 7 8 9]]]
array5 : 
 [[0, 1, 2, 3, 4], [5, 6, 7, 8, 9]]


###### Q. 1차원 ndarray array1을 2차원 ndarray로 변환해서 array6에 저장하고 list로 출력하세요.

In [60]:
array6 = array1.reshape(-1, 2)
print(array6)
print()
print("array6 shape : ",array6.shape)

[[0 1]
 [2 3]
 [4 5]
 [6 7]
 [8 9]]

array6 shape :  (5, 2)


### ndarray의 데이터 세트 선택하기 - 인덱싱

In [62]:
# 배열 생성

import numpy as np

array1 = np.arange(start=1, stop=10)
print("array1 : ",array1)

array1 :  [1 2 3 4 5 6 7 8 9]


###### Q. array1 에서 3과 9를 출력하세요

In [67]:
# print(array1[2],array1[8])

value = array1[2]
print("value : ",value)
print(type(value))
print()
print("맨 뒤의 값 : ", array1[-1])

value :  3
<class 'numpy.int32'>

맨 뒤의 값 :  9


In [68]:
# 맨 뒤에서 두번째 값

print(array1[-2])

8


###### Q. 인덱스를 이용해서 첫번째와 아홉번째 값을 각각 9와 0으로 수정하세요

In [69]:
array1[0] = 9
array1[8] = 0
print(array1)

[9 2 3 4 5 6 7 8 0]
