<a href="https://colab.research.google.com/github/simba328/2020_cau_oss_hackathon/blob/master/hackathon_team10.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **0. 해커톤 진행 주의사항**

**1)  개발 관련 주의사항**
*   [1. 초기 환경 설정]은 절대 수정하지 말 것
*   모든 구현은 [2. 데이터 전처리] 및 [3.모델 생성]에서만 진행
*   [4. 모델 저장]에서 team_name 변수 변경 (예.`team_name = 'team01'`)
 *    트레이닝 중간에 checkpoint를 활용하여 모델을 저장한 경우에도 파일 이름 양식 통일 필수
*   Colab 사용중 실수로 데이터 손실이 발생할 수도 있으니 중간 결과값을 github에 업로드 
 *    "런타임->모든 런타임 재설정"은 절대 누르지 말 것 (저장한 모델 데이터가 모두 삭제됨)
*   효율적인 구현 및 테스팅을 위해 GPU 가속 기능 활성화
 *    "런타임 -> 런타임 유형변경 -> 하드웨어 가속기 -> GPU 설정"
*   주석을 최대한 자세히 작성
*   Keras API 관련하여 [Keras Documentation](https://keras.io/) 참조

**2) 제출 관련 주의사항**
*  제출물
 *  소스코드 (hackathon_teamXX.ipynb)
 *  컴파일된 모델 파일 (model_entire_teamXX.h5)
 *  모델 발표 자료 
* 제출 기한: **오후 5시 (단, 발표자료는 11시)**
* 제출 방법: [GitHub README](https://github.com/cauosshackathonta/2020_cau_oss_hackathon/) 참조

 
**3) 평가 관련 주의사항**
*  모델 성능 = 테스트 데이터 셋 분류 정확도
 *  model.evaluate(x_test, y_test)
*  제출된 모델들의 테스트 데이터 셋 분류 정확도를 기준으로 수상작 결정
*  수상 후보들에 대해서는 소스코드를 기반으로 모델 재검증 
 
**4) 수상 실격 사유**
*  유사한 소스코드 or 알고리즘이 적발될 경우
*  소스코드와 제출된 모델이 상이한 경우
*  개발 관련 주의사항을 지키지 않은 경우
 *  예: [초기 환경 설정]을 수정한 경우
*  데이터 셋을 변조한 경우
 *  예. 테스트 데이터 셋을 트레이닝 데이터 셋에 포함하여 모델 생성 
*  주석이 소스코드와 맞지 않거나 미비할 경우






# **1. 초기 환경 설정**



In [54]:
from __future__ import absolute_import, division, print_function, unicode_literals, unicode_literals

# tensorflow와 tf.keras 및 관련 라이브러리 임포트
import tensorflow as tf
from tensorflow import keras
from keras.utils import np_utils

import numpy as np

# 데이터셋 다운로드
check = !if [ -d 'dataset/' ]; then echo "1" ; else echo "0"; fi
if (check[0] is '0' ):
  !mkdir dataset
  !wget 'https://www.itl.nist.gov/iaui/vip/cs_links/EMNIST/matlab.zip'
  !unzip matlab.zip -d /content/dataset

# 데이터셋 로드
from scipy import io as spio
emnist = spio.loadmat("/content/dataset/matlab/emnist-balanced.mat")

x_train = emnist["dataset"][0][0][0][0][0][0]
y_train = emnist["dataset"][0][0][0][0][0][1]

x_test = emnist["dataset"][0][0][1][0][0][0]
y_test = emnist["dataset"][0][0][1][0][0][1]

# # 분류를 위해 클래스 벡터를 바이너리 매트릭스로 변환
y_train = np_utils.to_categorical(y_train)
y_test = np_utils.to_categorical(y_test)

# 데이터 28x28 이미지화
x_train = x_train.reshape(x_train.shape[0], 28, 28, 1).astype('float32')
x_test = x_test.reshape(x_test.shape[0], 28, 28, 1).astype('float32')

# 총 클래스 개수
num_classes = y_test.shape[1]
input_shape = x_test.shape[1:]

# **2. 데이터 전처리**



In [56]:
# 데이터 전처리
datagen = ImageDataGenerator(
        rotation_range=10,
        zoom_range = 0.1, 
        width_shift_range=0.1,
        height_shift_range=0.1)

datagen.fit(x_train)

x_train_after = x_train
x_test_after = x_test

# **3. 모델 생성**

In [None]:
# MNIST 데이터 로드
(mx_train, my_train), (mx_test, my_test) = mnist.load_data()

mx_train = mx_train.astype('float32').reshape([*mx_train.shape, 1])
mx_test = mx_test.astype('float32').reshape([*mx_test.shape, 1])

mnum_classes = 10
my_train = np_utils.to_categorical(my_train,mnum_classes)
my_test = np_utils.to_categorical(my_test,mnum_classes)

In [None]:
# MNIST 모델 생성
input_shape = (28, 28, 1)
mnist_model = Sequential()
mnist_model.add(Conv2D(32, kernel_size=(3, 3),activation='relu',kernel_initializer='he_normal',input_shape=input_shape))
mnist_model.add(Conv2D(32, kernel_size=(3, 3),activation='relu',kernel_initializer='he_normal'))
mnist_model.add(MaxPool2D((2, 2)))
mnist_model.add(Dropout(0.25))
mnist_model.add(Conv2D(filters = 64, kernel_size = (3,3),padding = 'Same', activation ='relu'))
mnist_model.add(Conv2D(filters = 64, kernel_size = (3,3),padding = 'Same', activation ='relu'))
mnist_model.add(MaxPool2D(pool_size=(2,2), strides=(2,2)))
mnist_model.add(Dropout(0.25))

mnist_model.add(Flatten())
mnist_model.add(Dense(256, activation = "relu"))
mnist_model.add(Dropout(0.5))
mnist_model.add(Dense(10, activation = "softmax"))

In [None]:
# MNIST 모델 학습
batch_size = 128
mnum_classes = 10
epoch = 50

opt_adm = keras.optimizers.Adadelta(lr=0.1)
mnist_model.compile(loss='categorical_crossentropy', optimizer=opt_adm, metrics=['accuracy'])
train = model.fit_generator(datagen.flow(mx_train, my_train, batch_size=batch_size),
                                    steps_per_epoch=x_train.shape[0] // batch_size,epochs=epoch,
                                    verbose=1,validation_data=(mx_test,my_test))
mnist_model.save("mnist_model.h5")
print(train.history)

In [65]:
# MNIST 데이터셋으로 학습한 모델 불러오기
transfer_model=load_model('mnist_model.h5')

feature_layers = [
    Conv2D(32, kernel_size=(3, 3),activation='relu',kernel_initializer='he_normal',input_shape=input_shape),
    Conv2D(32, kernel_size=(3, 3),activation='relu',kernel_initializer='he_normal'),
    MaxPool2D((2, 2)),
    Dropout(0.25),
    Conv2D(filters = 64, kernel_size = (3,3),padding = 'Same', activation ='relu'),
    Conv2D(filters = 64, kernel_size = (3,3),padding = 'Same', activation ='relu'),
    MaxPool2D(pool_size=(2,2), strides=(2,2)),
    Dropout(0.25),
    Flatten()
]
classification_layers = [
    Dense(256, activation = "relu"),
    Dropout(0.5),
    Dense(10, activation = "softmax")
]
for l in feature_layers:
    l.trainable = False


In [66]:
# 모델생성 및 transfering
weights= [layer.get_weights() for layer in transfer_model.layers]
model = Sequential()
model.add(Conv2D(32, kernel_size=(3, 3),activation='relu',kernel_initializer='he_normal',input_shape=input_shape))
model.add(Conv2D(32, kernel_size=(3, 3),activation='relu',kernel_initializer='he_normal'))
model.add(MaxPool2D((2, 2)))
model.add(Dropout(0.25))
model.add(Conv2D(filters = 64, kernel_size = (3,3),padding = 'Same', activation ='relu'))
model.add(Conv2D(filters = 64, kernel_size = (3,3),padding = 'Same', activation ='relu'))
model.add(MaxPool2D(pool_size=(2,2), strides=(2,2)))
model.add(Dropout(0.25))

model.add(Flatten())
model.add(Dense(256, activation = "relu"))
model.add(Dropout(0.5))
model.add(Dense(47, activation = "softmax"))

for i in np.arange(0,len(feature_layers),1):
    model.layers[i].set_weights(weights[i])

In [None]:
batch_size = 128
epoch = 100

opt_adm = keras.optimizers.Adadelta(lr=0.1)
model.compile(loss='categorical_crossentropy', optimizer=opt_adm, metrics=['accuracy'])
train = model.fit_generator(datagen.flow(x_train, y_train, batch_size=batch_size),
                                    steps_per_epoch=x_train.shape[0] // batch_size,epochs=epoch,
                                    verbose=1,validation_data=(x_test,y_test))
print(train.history)

# **4. 모델 저장**

In [75]:
save_path = '/content/'
team_name = 'team10'

# 트레이닝된 전체 모델을 저장합니다.
model.save(save_path +  'model_entire_'+ team_name + '.h5')

# **5. 모델 로드 및 평가**

In [77]:
save_path = '/content/'
team_name = 'team10'

model = keras.models.load_model(save_path + 'model_entire_' + team_name + '.h5')

model.evaluate(x_test_after, y_test)



[0.33276453614234924, 0.8871276378631592]