# **0. 해커톤 진행 주의사항**

**1)  개발 관련 주의사항**
*   [1. 초기 환경 설정]은 절대 수정하지 말 것
 *  단, 사용할 데이터셋에 따라 is_mnist만 수정
*   모든 구현은 [2. 데이터 전처리]와 [3. 모델 생성]에서만 진행
 *  데이터 전처리 후 트레이닝, 데이터 셋은 x_train_after, x_test_after 변수명을 유지해주세요.
 *  데이터셋이 달라져도 같은 모델 구조를 유지하여야함.
*   [4. 모델 저장]과 [5. 모델 로드 및 평가]에서 team_name 변수 변경 (예.`team_name = 'team01'`)
 *  트레이닝 중간에 checkpoint를 활용하여 모델을 저장한 경우에도 파일 이름 양식 통일 필수
 *  team_name을 제외한 다른 부분은 수정하지 말 것
*   Colab 사용중 실수로 데이터 손실이 발생할 수도 있으니 중간 결과값을 github에 업로드 
 *    "런타임->모든 런타임 재설정"은 절대 누르지 말 것 (저장한 모델 데이터가 모두 삭제됨)
*   효율적인 구현 및 테스팅을 위해 GPU 가속 기능 활성화
 *    "런타임 -> 런타임 유형변경 -> 하드웨어 가속기 -> GPU 설정"
*   주석을 최대한 자세히 작성
*   Keras API 관련하여 [Keras Documentation](https://keras.io/) 참조

**2) 제출 관련 주의사항**
*  제출물
 *  소스코드 (hackathon_teamXX.ipynb)
 *  모델 구조 파일 (model_structure_teamXX.json)
 *  모델 weight 파일 (model_weight_teamXX.h5)
 *  컴파일된 모델 파일 (model_entire_teamXX.h5)
* 제출 기한: **오후 6시**
* 제출 방법: [GitHub README](https://github.com/cauosshackathonta/2019_cau_oss_hackathon/) 참조

 
**3) 평가 관련 주의사항**
*  모델 성능 = 테스트 데이터 셋 분류 정확도
 *  model.evaluate(x_test, y_test)
*  제출된 모델들의 테스트 데이터 셋 분류 정확도를 기준으로 수상작 결정
*  수상 후보들에 대해서는 소스코드를 기반으로 모델 재검증 
 
**4) 수상 실격 사유**
*  유사한 소스코드 or 알고리즘이 적발될 경우
*  소스코드와 제출된 모델이 상이한 경우
*  두 개의 데이터셋에 대해 다른 모델 구조를 사용한 경우
*  개발 관련 주의사항을 지키지 않은 경우
 *  예: [초기 환경 설정]을 수정한 경우
*  데이터 셋을 변조한 경우
 *  예. 테스트 데이터 셋을 트레이닝 데이터 셋에 포함하여 모델 생성 
*  주석이 소스코드와 맞지 않거나 미비할 경우






In [0]:
from numpy import newaxis
from skimage.transform import resize
def resize_image(input=None, output_shape=(48, 48)):
  resized = resize(input, output_shape, anti_aliasing=True) * 255
  result = resized.astype(np.uint8)
  return result

# **1. 초기 환경 설정**



In [0]:
from __future__ import absolute_import, division, print_function, unicode_literals, unicode_literals

# tensorflow와 tf.keras 및 관련 라이브러리 임포트
import tensorflow as tf
from tensorflow import keras
from keras.utils import np_utils

import numpy as np

is_mnist = False;

# 데이터셋 로드
# x_train, y_train: 트레이닝 데이터 및 레이블
# x_test, y_test: 테스트 데이터 및 레이블
if is_mnist:
  data_type = 'mnist'
  (x_train, y_train), (x_test, y_test) = keras.datasets.fashion_mnist.load_data() # fashion MNIST 데이터셋인 경우,
else:
  data_type = 'cifar10'
  (x_train, y_train), (x_test, y_test) = keras.datasets.cifar10.load_data() # cifar10 데이터셋인 경우,


# 분류를 위해 클래스 벡터를 바이너리 매트릭스로 변환
y_train = np_utils.to_categorical(y_train)
y_test = np_utils.to_categorical(y_test)

# 총 클래스 개수
num_classes = y_test.shape[1]

# 인풋 데이터 타입
input_shape = x_test.shape[1:]

# **2. 데이터 전처리**


In [18]:
# 데이터 전처리 (예: normalization)
channel = 1 if is_mnist else 3
x_train_resized = np.empty(shape=(x_train.shape[0], 48, 48, channel))
x_test_resized = np.empty(shape=(x_test.shape[0], 48, 48, channel))
for i in np.ndindex(x_train.shape[0]):
  if is_mnist:
    x_train_resized[i] = resize_image(x_train[i])[:, :, newaxis]
  else:
    x_train_resized[i] = resize_image(x_train[i])
print("x_train finished. ")

for i in np.ndindex(x_test.shape[0]):
  if is_mnist:
    x_test_resized[i] = resize_image(x_test[i])[:, :, newaxis]
  else:
    x_test_resized[i] = resize_image(x_test[i])
print("x_test finished. ")
  
  
  
# 총 클래스 개수
num_classes = y_test.shape[1]

# 인풋 데이터 타입
input_shape = x_test_resized.shape[1:]

#   x_train = resize_image(x_train)[:, :, newaxis]
#   y_train = resize_image(y_train)[:, :, newaxis]
#   x_test = resize_image(x_test)[:, :, newaxis]
#   y_test = resize_image(y_test)[:, :, newaxis]
  
x_train_after = x_train_resized / 255.0
x_test_after = x_test_resized / 255.0

x_train finished. 
x_test finished. 


# **3. 모델 생성**



In [22]:

def create_model():
  model = tf.keras.models.Sequential()
  model.add(tf.keras.layers.BatchNormalization(input_shape=x_train_after.shape[1:]))
  model.add(tf.keras.layers.Conv2D(128, (5, 5), kernel_initializer='glorot_uniform', padding='same', activation='relu'))
  model.add(tf.keras.layers.MaxPooling2D(pool_size=(3, 3), strides=(2,2)))
  model.add(tf.keras.layers.Dropout(0.3))
############## Layer 1
  model.add(tf.keras.layers.BatchNormalization(input_shape=x_train_after.shape[1:]))
  model.add(tf.keras.layers.Conv2D(128, (5, 5), kernel_initializer='glorot_uniform',  padding='same', activation='relu'))
  model.add(tf.keras.layers.MaxPooling2D(pool_size=(3, 3), strides=(2,2)))
  model.add(tf.keras.layers.Dropout(0.3))
############## Layer 2
  model.add(tf.keras.layers.BatchNormalization(input_shape=x_train_after.shape[1:]))
  model.add(tf.keras.layers.Conv2D(64, (3, 3), kernel_initializer='glorot_uniform',  padding='same', activation='relu'))
  model.add(tf.keras.layers.Dropout(0.3))
############## Layer 3
  model.add(tf.keras.layers.BatchNormalization(input_shape=x_train_after.shape[1:]))
  model.add(tf.keras.layers.Conv2D(64, (3, 3), kernel_initializer='glorot_uniform',  padding='same', activation='relu'))
  model.add(tf.keras.layers.Dropout(0.3))
############## Layer 4
  model.add(tf.keras.layers.BatchNormalization(input_shape=x_train_after.shape[1:]))
  model.add(tf.keras.layers.Conv2D(64, (3, 3), kernel_initializer='glorot_uniform',  padding='same', activation='relu'))
  model.add(tf.keras.layers.Dropout(0.3))
############## Layer 5
  
  model.add(tf.keras.layers.Flatten())
  model.add(tf.keras.layers.Dense(184, kernel_initializer='glorot_uniform'))
  model.add(tf.keras.layers.Activation('relu'))
  model.add(tf.keras.layers.Dropout(0.5))
  model.add(tf.keras.layers.Dense(10,  kernel_initializer='glorot_uniform'))
  model.add(tf.keras.layers.Activation('softmax'))
############## Layer 6 (FC Layer)
  return model

# Checkpoint callback 함수 생성
# save_best_only: 가장 높은 검증 정확도일때만 저장
# save_weights_only: weight만 저장

model = create_model()
model.compile(
      optimizer=tf.keras.optimizers.Adam(learning_rate=1e-3, ),
      loss='categorical_crossentropy',
      metrics=['accuracy'])

import os
# Weight 저장 주소
checkpoint_path = '/content/model_weight_best.h5'
checkpoint_dir = os.path.dirname(checkpoint_path)

cp_callback = tf.keras.callbacks.ModelCheckpoint(checkpoint_path, 
                                                 monitor='val_acc',
                                                 save_weight_only=False, 
                                                 save_best_only=True, 
                                                 verbose=1)


model.fit(x_train_after, y_train, batch_size = 128, 
          epochs = 30, shuffle=True, 
          validation_data=[x_test_after, y_test],
          callbacks=[cp_callback]
         )

Train on 50000 samples, validate on 10000 samples
Epoch 1/30
Epoch 00001: val_acc improved from -inf to 0.45350, saving model to /content/model_weight_best.h5
Epoch 2/30
Epoch 00002: val_acc improved from 0.45350 to 0.53470, saving model to /content/model_weight_best.h5
Epoch 3/30
Epoch 00003: val_acc improved from 0.53470 to 0.58750, saving model to /content/model_weight_best.h5
Epoch 4/30
Epoch 00004: val_acc improved from 0.58750 to 0.63180, saving model to /content/model_weight_best.h5
Epoch 5/30
Epoch 00005: val_acc improved from 0.63180 to 0.69150, saving model to /content/model_weight_best.h5
Epoch 6/30
Epoch 00006: val_acc did not improve from 0.69150
Epoch 7/30
Epoch 00007: val_acc improved from 0.69150 to 0.72900, saving model to /content/model_weight_best.h5
Epoch 8/30
Epoch 00008: val_acc improved from 0.72900 to 0.73450, saving model to /content/model_weight_best.h5
Epoch 9/30
Epoch 00009: val_acc improved from 0.73450 to 0.75340, saving model to /content/model_weight_best

<tensorflow.python.keras.callbacks.History at 0x7f02b70726d8>

# **4. 모델 저장**

In [0]:
save_path = '/content/'
team_name = 'team14'

# 모델의 weight 값만 저장합니다.
model.save_weights(save_path + 'model_weight_' + data_type + '_' + team_name + '.h5')

# 모델의 구조만을 저장합니다.
model_json = model.to_json()
with open(save_path + 'model_structure_' + data_type + '_' + team_name + '.json', 'w') as json_file : 
    json_file.write(model_json)

# 트레이닝된 전체 모델을 저장합니다.
model.save(save_path +  'model_entire_' + data_type + '_' + team_name + '.h5')

# **5. 모델 로드 및 평가**

In [28]:
save_path = '/content/'
team_name = 'team14'

model = keras.models.load_model('/content/model_weight_best.h5')
model.evaluate(x_test_after, y_test)



[0.5288052093029022, 0.8323]