# 딥러닝 개발 과정 
## 딥러닝 개발 과정

<img src="./img/딥러닝개발과정.jpg" width=600 align=left>

### 1. 학습 데이터를 준비한다. 
- 데이타 전처리
- 학습데이타, 검증데이타, 테스트데이타

### 2. 데이터에 적합한 모델을 정의 한다. --> 층 구성
- model = Sequential()
- model.add(Dense(32, input_shape = (2, ), activation = 'relu')) 
- model.add(Dense(1, activation = 'sigmoid'))

### 3. 컴파일 함수에 옵티마이저, 손실함수,  평가지표를 선택하여 학습 과정을 설정한다.
- 회귀문제 – 평균제곱오차
    - model.compile(optimizer= Adam(), loss=‘mse’ )
- 이항 분류 문제
    - model.compile(optimizer= Adam(), loss=‘binary_crossentropy’, metrics=['acc'])
- 다항 분류 문제
    - model.compile(optimizer= Adam(), loss=‘catrgorical_crossentropy’,  metrics=['acc'])
    
### 4. 모델을 학습 시킨다.
- model.fit(data, label, epochs = 100)
- model.fit(data, label, epochs = 100, validation_data=(val_data, val_label))

### 5. 모델을 평가 및 예측한다.
- model.evaluate(data, label)
- model.predict(data)

---------------
### 1. 학습 데이터를 정의한다. 
- 데이타 전처리
- 학습데이타, 검증데이타, 테스트데이타

### 2. 데이터에 적합한 모델을 정의한다. --> 층 구성
- Sequential()을 사용한 모델 구성

In [4]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

# 모델 구성하기
model = Sequential()
model.add(Dense(32, input_shape = (2, ), activation = 'relu')) # 입력층 : 2개, 은닉층 : 32개 노드
model.add(Dense(1, activation = 'sigmoid')) # 출력층 : 1개 

### 3. 컴파일 함수에 학습 과정을 설정한다.
- 옵티마이저(optimizer), 손실함수(loss), 평가지표(metrics) 설정

#### 1) 옵티마이저(optimizer)
- 최적화 방법을 설정
- SGD(), RMSProp(), Adam(), NAdam() 등이 있음
- 옵티마이저를 설정하는 방법 2가지 : 클래스 형태, 문자열로 지정
- tf.keras.optimizers 모듈 

#### 2)  손실 함수(loss function)
- 학습 과정에서 최적화시켜야 할 손실함수를 설정
- 평균제곱오차(mse; mean_squared_error), binary_crossentropy, categorical_crossentropy
- 문자열 형태로 지정하여 사용
- tf.keras.losses 모듈 

#### 3) 평가 지표(metrics)
- 학습 과정을 모니터링하기 위해 설정
- 객체를 호출하거나 'acc'와 같이 문자열 형태로 지정하여 전달할 수 있음
- tf.keras.metrics 모듈

In [5]:
from tensorflow.keras.optimizers import RMSprop
from tensorflow.keras.losses import mse

# 회귀 문제 - 평균제곱오차(mse)
model.compile(optimizer = RMSprop(), # optimizer = 'rmsprop'
              loss = 'mse', 
              metrics = ['mae'])

# 이항 분류 문제 - binary_crossentropy
model.compile(optimizer = RMSprop(), 
              loss = 'binary_crossentropy', 
              metrics = ['acc'])

# 다항 분류 문제 - categorical_crossentropy
model.compile(optimizer = RMSprop(), 
              loss = 'categorical_crossentropy', 
              metrics = ['acc'])

### 4. 모델을 학습 시킨다.
- model.fit() 함수
- model.fit(입력데이타, 정답데이타, 에폭, 배치크기, 검증데이타)

#### 1) 에폭(epochs)
- 전체 학습 데이타를 몇 회 반복할지 결정

#### 2) 배치 크기(batch size)
- 전달할 배치 크기 만큼 학습 데이타를 나누어 학습을 진행

#### 3) 검증 데이타(validation data)
- 모델의 성능을 모니터링하기 위해 사용
- 입력과 정답 데이타로 이루어진 검증 데이타를 전달하면 1회 에폭이 끝날 때마다 검증 데이타에서의 손실과 평가지표를 출력

In [9]:
model.fit(data, label, epochs = 100)
model.fit(data, label, epochs = 100, validation_data=(val_data, val_label))

### 5. 모델을 평가 및 예측한다.
- 모델 평가 : model.evaluate() 
    - 손실과 평가 지표에 대한 정보를 확인할 수 있다.
- 모델 예측 : model.predict()
    - 모델의 마지막 층의 형태와 동일한 형태를 가진 추론값을 전달한 데이타 개수만큼 반환해 준다.

In [None]:
model.evaluate(data, label)

In [None]:
model.predict(data)