# 1. NUMPY
- Numerical Python - 행렬 연산이나 다차원 배열을 편리하게 처리
- 배열(array) 단위로 벡터, 행렬 연산등을 파이썬의 기본 리스트에 비해 빠르고 적은양의 메모리로 연산
- 선형대수, 통계관련 빌트인 함수 내장
- 브로드캐스트 지원 - 형태(차원)가 다른 행렬끼리의 계산

In [5]:
import numpy as np

### 1.1 NUMPY 사용하는 이유?

###### 1.1.1 행렬합 구하기

In [2]:
matrix_1 = [[1, 2], [3, 4]]
matrix_2 = [[5, 6], [7, 8]]

matrix_result = []
for i in range(len(matrix_1)):
    tmp = []
    for j in range(len(matrix_2)) :
        tmp.append(matrix_1[i][j] + matrix_2[i][j])
    matrix_result.append(tmp)
print(matrix_result)

[[6, 8], [10, 12]]


In [3]:
matrix_result = np.array(matrix_1) + np.array(matrix_2)
print(matrix_result)

[[ 6  8]
 [10 12]]


###### 1.1.2 숫자 1씩 더하기

In [6]:
matrix_1 = [[1, 2], [3, 4]]

for i in range(len(matrix_1)) :
    for j in range(len(matrix_2)) :
        matrix_1[i][j] = matrix_1[i][j] + 1
        
print(matrix_1)

[[2, 3], [4, 5]]


###### 1.1.3 리스트와 넘파이 처리 속도 비교

In [5]:
%%time
import time

size = 10000000

# list
x = list(range(size))
y = list(range(size))

start_time = time.time()
z = [x[i]+x[i] for i in range(size)]
print("리스트 걸린 시간 : ", time.time() - start_time)

#numpy
import numpy as np
x = np.arange(size)
y = np.arange(size)

start_time = time.time()
z = x + y
print("Numpy 걸린 시간 : ", time.time()-start_time)

리스트 걸린 시간 :  1.28096604347229
Numpy 걸린 시간 :  0.13897156715393066
Wall time: 1.93 s


### 1.2 NUMPY 자료형

**int** : 8bit, 16bit, 32bit, 64bit (부호가 있음, 비트수 만큼 크기를 가지는 정수형)<br>
**uint** : 8bit, 16bit, 32bit, 64bit (부호가 없음, 비트수 만큼 크기를 가지는 정수형)<br>
**float** : 16bit, 32bit, 64bit, 128bit (부호가 있음, 비트수 만큼 크기를 가지는 실수형)<br>

**복소수형**<br>
- complex64 : 두개의 32비트 부동소수점으로 표시되는 복소수
- complex128 : 두개의 64비트 부동소수점으로 표시되는 복소수

**bool** <br>
True, False





### 1.3 ndarray
###### 1.3.1 넘파이 리스트 ndarray 만들기
- np.array(데이터)
- np.float32(데이터)
- np.int_(데이터)

In [10]:
x = np.uint(32)
print(x.dtype) # uint64

x = np.array([1, 2, 3, 4])
print(x.dtype) # int64

x = np.float32([1, 2, 3, 4])
print(x.dtype) #float32

uint32
int32
float32


###### 1.3.2 타입설정
- np.array(데이터, dtype=np.float32)

In [12]:
np.array([1, 2, 3, 4], dtype=np.float32)
print(x.dtype) #float32

float32


###### 1.3.3 형변환
- np.int32(ndarray)

In [3]:
np.int32(np.array([1.5, 2.2, 3.45, 4.86]))

array([1, 2, 3, 4])

###### 1.3.4 타입체크
- ndarray.dtype<br>
    np.issubdtype(ndarray.dtype, np.floating)

In [6]:
x = np.int32(x)
print(x.dtype)
np.issubdtype(x.dtype, np.int32) #float32

int32


True

### 1.4 다차원 ndarray

###### 1.4.1 0차원

In [7]:
x = np.array(1)
print(x.shape)
print(x.ndim)
print(x.size)

()
0
1


###### 1.4.2 1 차원

In [8]:
x = np.array([1, 2])
print(x.shape)
print(x.ndim)
print(x.size)

(2,)
1
2


###### 1.4.3 2차원 혹은 그 이상

In [9]:
x = np.array([[1, 2, 3], [4, 5, 6]])
print(x.shape)
print(x.ndim)
print(x.size)

(2, 3)
2
6


###### 1.4.4 차원확인

In [12]:
x = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
print(x.shape)
print(x.ndim)
print(x.size)

(3, 4)
2
12


### 1.5 arange
- 파이썬의 range 와 비슷



In [14]:
x = np.arange(10)
print(x)

[0 1 2 3 4 5 6 7 8 9]


In [15]:
x = np.arange(10.0)
print(x)

[0. 1. 2. 3. 4. 5. 6. 7. 8. 9.]


In [18]:
x = np.arange(1, 10, 2)
print(x)

[1 3 5 7 9]


In [19]:
x = np.arange(1, 10, 0.5)
print(x)

[1.  1.5 2.  2.5 3.  3.5 4.  4.5 5.  5.5 6.  6.5 7.  7.5 8.  8.5 9.  9.5]


In [20]:
x = np.arange(10, 1, -0.5)
print(x)

[10.   9.5  9.   8.5  8.   7.5  7.   6.5  6.   5.5  5.   4.5  4.   3.5
  3.   2.5  2.   1.5]


### 1.6 linspace
- 균일한 간격으로 리스트 크기만큼의 리스트 생성

###### 1.6.1 np.linspace(시작값, 끝값, 벡터크기)

In [21]:
x = np.linspace(1, 20, 5)
print(x)

[ 1.    5.75 10.5  15.25 20.  ]


###### 1.6.2 np.linspace(시작값, 끝값, 벡터크기, endpoint=False) <br>
끝값 포함여부

In [22]:
x = np.linspace(1, 20, 10, endpoint=False)
print(x)

[ 1.   2.9  4.8  6.7  8.6 10.5 12.4 14.3 16.2 18.1]


In [48]:
x=np.linspace(1, 20, 5)
x

array([ 1.  ,  5.75, 10.5 , 15.25, 20.  ])

In [4]:
x = np.linspace(1, 20, 10, endpoint=False)
print(x)

[ 1.   2.9  4.8  6.7  8.6 10.5 12.4 14.3 16.2 18.1]


### 1.7 reshape
- 데이터를 유지하면서 차원의 형태를 변경

###### 1.7.1 ndarray.reshape(3, 3)
###### 1.7.2 ndarray.reshape(2, 3, 4)
###### 1.7.3 ndarray.reshape(2, 2, 2, 2)

In [7]:
np.array([[1, 2],[3, 4], [5, 6]]).reshape(2, 3)

array([[1, 2, 3],
       [4, 5, 6]])

- -1 일 경우 자동으로 맞춰서 생성<br>
ndarray.reshape(3, -1)

In [11]:
x = np.arange(9).reshape(3, 3)
print(x) # 2차원

[[0 1 2]
 [3 4 5]
 [6 7 8]]


In [12]:
x = np.arange(24).reshape(2, 3, 4)
print(x) # 3차원

[[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]]


In [13]:
x = np.arange(16).reshape(2, 2, 2, 2)
print(x) # 4차원

[[[[ 0  1]
   [ 2  3]]

  [[ 4  5]
   [ 6  7]]]


 [[[ 8  9]
   [10 11]]

  [[12 13]
   [14 15]]]]


In [16]:
x = np.array([[1, 2], [3, 4], [5, 6]])
print(x)
print("2차원 형태 변형")
print(x.reshape(2, 3)) # 데이터를 유지하고 형태변경

[[1 2]
 [3 4]
 [5 6]]
2차원 형태 변형
[[1 2 3]
 [4 5 6]]


In [18]:
x = np.arange(9).reshape(3, -1)
print(x) # 개수에 맞춰 생성

[[0 1 2]
 [3 4 5]
 [6 7 8]]
