#  파이썬을 활용한딥러닝
# 7강. 파이썬 NumPy #3

## 1. NumPy 배열 재형성

### reshape
- NumPy에서 배열의 차원을 재구조화, 변경하고자 할 때 사용
- 요소의 개수는 동일해야 한다. 

In [None]:
import numpy as np

In [None]:
t_array = np.arange(1,9)
t_array

In [None]:
t_array.shape

In [None]:
a = t_array.reshape(2,4)
a

In [None]:
a.shape

In [None]:
a.reshape(4,2).shape

In [None]:
a.reshape(-1,2).shape # -1은 요소의 개수에 따라 산정된다.

In [None]:
a.reshape(2, 2, 2)  #다차원으로 자유로이 변형 가능

In [None]:
a.reshape(2, 2, 2).shape

### 평탄화
- 다차원 배열을 낮은차원으로 변환

#### ravel
- 다차원 배열을 낮은 차원으로 변환
- ravel은 원본의 뷰를 반환하기 때문에 ravel로 반환된 데이터
   를 수정하면 원본 데이터도 수정 된다.

In [None]:
t_arr = [ [[1, 2], [3, 4]], [[1, 2], [3, 4]] ]
b = np.array(t_arr)
c = b.ravel()

In [None]:
print("b =" , b )
print("c =", c)

In [None]:
c[3] = 0
print("c =", c)
print("b =", b)

#### flatten
- 다차원 배열을 낮은 차원으로 변환
- flatten 원본의 복사본을 반환한다
- flatten은 flatten으로 반환된 데이터를 수정하여도 원본데이터는 변하지 않는다.

In [None]:
t_arr = [[1, 2], [3, 4]]
b = np.array(t_arr)
c = b.flatten()
print("b =" , b )
print("c =", c)

In [None]:
c[3] = 0
print("c =", c)
print("b =" , b )

### 전치 – transpose
 - 행렬의 인덱스가 바뀌는 변환
 - transpose 또는 T 속성을 사용한다.

In [None]:
a = np.arange(1, 7).reshape(3, 2)
a

In [None]:
a.transpose()

In [None]:
a.T

### 배열결합 – concatenate
 - 배열과 배열을 결합하는 함수
 - axis 기준으로 결합

In [None]:
a = np.array([[1, 2, 3]])
b = np.array([[4, 5, 6]])
np.concatenate((a,b), axis = 0)

In [None]:
a = np.array([ [1, 2], [3, 4] ])
b = np.array([ [5, 6] ])
np.concatenate((a, b.T), axis = 1)

### 배열결합 – vstack, hstack
 - 배열과 배열을 결합하는 함수
 - vstack : axis = 0 기준으로 결합
 - hstack : axis = 1 기준으로 결합

In [None]:
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
np.vstack((a, b))

In [None]:
a = np.array([ [1], [2], [3] ])
b = np.array([ [4], [5], [6] ])
np.hstack((a, b))

## 2. NumPy 색인

### 색인 (indexing)
- 배열의 각 요소는 axis 인덱스 배열로 참조 할 수 있다.
- 1차원 배열은 1개의 인덱스, 2차원 배열은 2개의 인덱스,
     n차원 배열은 n개의 인덱스로 요소를 참조 할 수 있다.


In [None]:
a = np.arange(1, 5)
a

In [None]:
print("a의 0번째 요소 = ", a[0])  
print("a의 1번째 요소 = ", a[1])  

In [None]:
b = a.reshape(2,2)
b

In [None]:
print(b[0,0])  
print(b[1][1]) 

- 할당

In [None]:
b[0, 0] = 7   
print(b)

In [None]:
b[1][0] = 8   
print(b)

### 슬라이스 색인
- 여러 개의 배열 요소를 참조할 때 슬라이싱을 사용한다. 
- 다차원 객체는 하나 이상의 축(axis)을 기준으로 슬라이싱 한다.

In [None]:
a1 = np.arange(1, 21).reshape((4, 5)) #2차원 배열
print(a1)

In [None]:
a1[:, 1:]   # 전체 row의 1열 이상

In [None]:
a1[2, 1:4]  # 1 row의 2열~3열

In [None]:
a1[2:7]  # 2 row ~ 로우 전체 

- step을 활용한 슬라이싱

In [None]:
a1[:,::2]

In [None]:
a1[::2,::2]

### argmax, argmin
- array내의 최대값 또는 최소값의 인덱스 반환

In [None]:
a = np.array( [2, 3, 1, 5, 6, 22, 11 ] )
print("최대값 index =",np.argmax(a), "최소값 index=",np.argmin(a))

In [None]:
a2 = np.random.choice(np.arange(2, 22), 12).reshape(3, 4)
a2

In [None]:
np. argmax(a2, axis = 0), np.argmin(a2, axis = 1)

### boolean indexing
- 배열 각 요소에 조건에 대한 값을 True, False로 지정한 후,
   해당 index의 True값만 추출하는 방법

In [None]:
a = np.arange(1, 21).reshape(4, 5) #2차원 배열
print(a)

In [None]:
bool_a = a%2==0  # 몫의 나머지 = 0 일경우 true
print(bool_a)

In [None]:
a[bool_a]

In [None]:
b = np.logical_and(a > 10 , a < 17)

In [None]:
a[b]

### fancy indexing
- 정수 배열을 사용한 색인을 설명하기 위해 NumPy에서 차용한 
   단어이다.
- ndarray를 index value로 사용하여 값을 추출한다.

**1차원**

In [None]:
array_a = np.arange(1,7)
array_b = np.array( [1, 0, 2, 0, 1, 4], int )  # 반드시 integer로 선언
array_a[array_b]  # bracket index, b 배열의 값을 index로 하여 a의 값 추출

In [None]:
array_a.take(array_b)

**2차원**

In [None]:
array_a = np.arange(1,7).reshape(2,3)
array_b = np.array( [1, 0, 1, 0, 1], int ) 
array_c = np.array( [1, 1, 0, 0, 2], int ) 
array_a[array_b,array_c]

## 3. NumPy i/o

### loadtxt, savetxt
 - 텍스트 파일을 불러오고 저장하는 방법

#### save

In [None]:
a = np.arange(1, 200, 2).reshape(20, 5)
a

In [None]:
np.savetxt( "int_price_1.csv" , a, delimiter = "," )

In [None]:
np.savetxt( "int_price_2.csv" , a, fmt = '%d', delimiter = "," )

In [None]:
a = np.loadtxt( "./int_price_2.csv", delimiter = ","  )
a[:5] # python 기본타입 float 형태로 보임

#### load

In [None]:
b = np.loadtxt( "./int_price_2.csv", delimiter = ","  )
b[:5]  # python 기본타입 float 형태로 보임

In [None]:
b_int = b.astype(int)
b_int[:3]

#### npy
- Numpy object (pickle) 형태로 데이터를 저장하고 불러옴
- Binary 형태로 파일 저장

In [None]:
np.save( "npy_test" , arr = b_int )

In [None]:
npy_array = np.load( file = "npy_test.npy")
npy_array[:3]