<img src='https://user-images.githubusercontent.com/6457691/90080969-0f758d00-dd47-11ea-8191-fa12fd2054a7.png' width = '200' align = 'right'>

## *DATA SCIENCE / SECTION 4 / SPRINT 1 / Assingment 3*

---
# Neural Network Framework (Keras)




## 기본과제
### 케라스 라이브러리를 사용하여 Multi-Layer Perceptron 모델을 CIFAR100 데이터에 적용해보세요.

- 시드를 고정하십시오.
- 데이터를 Noramlized 해줍니다. 
- 케라스에서 모델은 다음과 같이 고정합니다. 
- 은닉층의 활성함수는 ReLU를 사용합니다.
- 단계별로 오늘 배운 규제방법을 적용해봅니다. 

In [1]:
import keras
import tensorflow as tf
import numpy as np
import random
import os
from tensorflow.keras.datasets import cifar100
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten, Dropout
from tensorflow.keras.optimizers import Adam
from tensorflow.keras import regularizers

### 1) Base model을 제작합니다.

In [2]:
# seed를 고정합니다.
random.seed(1)
np.random.seed(1)
os.environ["PYTHONHASHSEED"] = str(1)
os.environ['TF_DETERMINISTIC_OPS'] = str(1)
tf.random.set_seed(1)

# 데이터 불러오기
(X_train, y_train), (X_test, y_test) = cifar100.load_data()

# 정규화(전처리)
X_train = X_train / 255.
X_test = X_test / 255.

# 변수 설정을 따로 하는 방법을 적용하기 위한 코드입니다. 
batch_size = 100
epochs_max = 20

# model
model = Sequential()
model.add(Flatten(input_shape=((32, 32, 3))))
model.add(Dense(128, activation='relu'))
model.add(Dense(128, activation='relu'))
model.add(Dense(100, activation='softmax'))

# 컴파일 단계, 옵티마이저와 손실함수, 측정지표를 연결해서 계산 그래프를 구성함
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

results = model.fit(X_train, y_train, epochs=epochs_max, batch_size=batch_size, verbose=1, validation_data=(X_test,y_test))

Downloading data from https://www.cs.toronto.edu/~kriz/cifar-100-python.tar.gz
Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


In [3]:
test_loss, test_acc = model.evaluate(X_test,  y_test, verbose=1)



### 2) + Weight Decay

In [4]:
# seed를 고정합니다.
random.seed(1)
np.random.seed(1)
os.environ["PYTHONHASHSEED"] = str(1)
os.environ['TF_DETERMINISTIC_OPS'] = str(1)
tf.random.set_seed(1)

# 데이터 불러오기
(X_train, y_train), (X_test, y_test) = cifar100.load_data()

# 정규화(전처리)
X_train = X_train / 255.
X_test = X_test / 255.

# 변수 설정을 따로 하는 방법을 적용하기 위한 코드입니다. 
batch_size = 100
epochs_max = 20

# model
model = Sequential()
model.add(Flatten(input_shape=(32, 32, 3)))
model.add(Dense(128, activation='relu', 
                kernel_regularizer=regularizers.L2(0.00001),   
                activity_regularizer=regularizers.L1(0.00001)))
model.add(Dense(128, activation='relu'))
model.add(Dense(100, activation='softmax'))

# 컴파일 단계, 옵티마이저와 손실함수, 측정지표를 연결해서 계산 그래프를 구성함
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

results = model.fit(X_train, y_train, epochs=epochs_max, batch_size=batch_size, verbose=1, validation_data=(X_test,y_test))

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


In [5]:
test_loss, test_acc = model.evaluate(X_test,  y_test, verbose=1)



### 3) + Dropout

In [6]:
# seed를 고정합니다.
random.seed(1)
np.random.seed(1)
os.environ["PYTHONHASHSEED"] = str(1)
os.environ['TF_DETERMINISTIC_OPS'] = str(1)
tf.random.set_seed(1)

# 데이터 불러오기
(X_train, y_train), (X_test, y_test) = cifar100.load_data()

# 정규화(전처리)
X_train = X_train / 255.
X_test = X_test / 255.

# 변수 설정을 따로 하는 방법을 적용하기 위한 코드입니다. 
batch_size = 100
epochs_max = 20

# model
model = Sequential()
model.add(Flatten(input_shape=((32, 32, 3))))
model.add(Dense(128*1.1, activation='relu'))
model.add(Dropout(0.1))
model.add(Dense(128, activation='relu'))
model.add(Dense(100, activation='softmax'))

# 컴파일 단계, 옵티마이저와 손실함수, 측정지표를 연결해서 계산 그래프를 구성함
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

results = model.fit(X_train, y_train, epochs=epochs_max, batch_size=batch_size, verbose=1, validation_data=(X_test,y_test))


Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


### 문항 4) + Early Stopping

1. Early Stopping을 적용해봅시다. 멈추는 기준을 `val_loss(검증 데이터셋의 loss 값)`로 하고 loss가 Best 값보다 5번 높아질 때 Stop 하도록 설정합니다.

2. Best 모델을 저장해봅시다. Best 모델 역시 멈추는 기준을 `val_loss(검증 데이터셋의 loss 값)`로 하고 `save_best_only=True, save_weights_only=True` 로 설정합니다.

In [7]:
# seed를 고정합니다.
random.seed(1)
np.random.seed(1)
os.environ["PYTHONHASHSEED"] = str(1)
os.environ['TF_DETERMINISTIC_OPS'] = str(1)
tf.random.set_seed(1)


# 데이터 불러오기
(X_train, y_train), (X_test, y_test) = cifar100.load_data()


# 정규화(전처리)
X_train = X_train / 255.
X_test = X_test / 255.


# 학습시킨 데이터를 저장시키기 위한 코드입니다. 
checkpoint_filepath = "FMbest.hdf5"


# 변수 설정을 따로 하는 방법을 적용하기 위한 코드입니다. 
batch_size = 100
epochs_max = 50


model = Sequential()
model.add(Flatten(input_shape=(32, 32, 3)))
model.add(Dense(128, activation='relu'))
model.add(Dense(128, activation='relu'))
model.add(Dense(100, activation='softmax'))

# 컴파일 단계, 옵티마이저와 손실함수, 측정지표를 연결해서 계산 그래프를 구성함
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

                  
# early stopping
early_stop = tf.keras.callbacks.EarlyStopping(patience= 5, verbose= 1)

# Validation Set을 기준으로 가장 최적의 모델을 찾기
save_best = keras.callbacks.ModelCheckpoint( 
    filepath= checkpoint_filepath, verbose= 1,
    save_best_only= True, save_weights_only= True)

results = model.fit(X_train, y_train,
                    batch_size= batch_size, epochs= epochs_max,
                    validation_data= (X_test, y_test),
                    callbacks= [early_stop, save_best])

Epoch 1/50
Epoch 1: val_loss improved from inf to 3.86630, saving model to FMbest.hdf5
Epoch 2/50
Epoch 2: val_loss improved from 3.86630 to 3.72156, saving model to FMbest.hdf5
Epoch 3/50
Epoch 3: val_loss improved from 3.72156 to 3.68634, saving model to FMbest.hdf5
Epoch 4/50
Epoch 4: val_loss improved from 3.68634 to 3.59311, saving model to FMbest.hdf5
Epoch 5/50
Epoch 5: val_loss improved from 3.59311 to 3.52978, saving model to FMbest.hdf5
Epoch 6/50
Epoch 6: val_loss improved from 3.52978 to 3.51030, saving model to FMbest.hdf5
Epoch 7/50
Epoch 7: val_loss improved from 3.51030 to 3.49770, saving model to FMbest.hdf5
Epoch 8/50
Epoch 8: val_loss improved from 3.49770 to 3.46010, saving model to FMbest.hdf5
Epoch 9/50
Epoch 9: val_loss did not improve from 3.46010
Epoch 10/50
Epoch 10: val_loss improved from 3.46010 to 3.40081, saving model to FMbest.hdf5
Epoch 11/50
Epoch 11: val_loss did not improve from 3.40081
Epoch 12/50
Epoch 12: val_loss improved from 3.40081 to 3.39504, 

In [8]:
# 학습된 모델을 이용하여 테스트하는 코드
test_loss, test_acc = model.evaluate(X_test,  y_test, verbose=1)



In [9]:
model.load_weights(checkpoint_filepath)

# best model을 이용한 테스트 데이터 예측 정확도 재확인 코드
test_loss, test_acc = model.evaluate(X_test, y_test, verbose=1)

