# Paper2Code : GoogLeNet (mini_ver)

## 2014년 ImageNet 1위 : 인셉션 모듈의 등장, 그 가벼움에 대하여


# 잠깐! 논문 보고 코드 계획부터 짜고 가실께요!

* [GoogLeNet](https://arxiv.org/pdf/1409.4842.pdf)
* [GoogLeNet 구조만 따로 보기](https://user-images.githubusercontent.com/25279765/35002702-d5dccb60-fb2d-11e7-88ac-e29d0319f32b.png)
* [지치고 힘들 때, 날 도와줄 치트키](https://gist.github.com/joelouismarino/a2ede9ab3928f999575423b9887abd14)

### 라이브러리 로딩

In [None]:
'''
matplolib inline 명령어를 통해서
matplot으로 그리는 플롯들을 주피터 노트북 내에서 볼 수 있게 해준다.
포맷을 retina로 바꾸면 그래프의 화질이 훨씬 좋아진다.
'''
%matplotlib inline
%config InlineBackend.figure_format = 'retina'

'''
라이브러리들을 불러오자.
'''
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import tensorflow as tf
import tensorflow.keras as keras

import random as rd

from sklearn.metrics import accuracy_score

In [None]:
(train_x, train_y), (test_x, test_y) = tf.keras.datasets.cifar10.load_data()

In [None]:
print(train_x.shape, train_y.shape, test_x.shape, test_y.shape)

In [None]:
labels = { 0 : 'Airplane',
          1 : 'Automobile',
          2 : 'Bird',
          3 : 'Cat',
          4 : 'Deer',
          5 : 'Dog',
          6 : 'Frog',
          7 : 'Horse',
          8 : 'Ship',
          9 : 'Truck' }

print(labels)

In [None]:
'''
Ctrl+Enter를 이용하여
반복 실행 해보자!
'''

id = rd.randrange(0,10000)

print('id = {}'.format(id))
print('다음 그림은 {} 입니다.'.format( labels[test_y[id][0]] ))
plt.imshow(test_x[id])
plt.show()

# X : 표준화 scaling 해보자(standardization)
* Global하게 할 것. (채널별로 하지 말고)

# Y : 원 핫 인코딩 해보자

# GoogLeNet

* **자기 자신의 미니버전을 만들어내는 것이 좋다.**
* 어렵다면, 일단 강사의 미니버전을 코드짜본다!

1. 인풋레이어를 제작한다.
2. 모든 히든레이어의 activation은 'relu'로 통일
3. 첫번째 히든레이어 : Conv 3*3, 32, same
4. BatchNorm
3. 두번째 히든레이어 : Conv 3*3, 64, same
4. BatchNorm
5. Maxpooling 2*2
6. 드랍아웃 (0.2)
2. 위의 드랍아웃 레이어에 연결되는 (왼쪽부터)첫번째 가지
    * Convolution : 필터개수 32개, 필터사이즈(1,1), 스트라이드(1,1), 패딩='same'
3. 위의 드랍아웃 레이어에 연결되는 두번째 가지
    * Convolution : 필터개수 64개, 필터사이즈(1,1), 스트라이드(1,1), 패딩='same'
    * Convolution : 필터개수 64개, 필터사이즈(3,3), 스트라이드 (1,1), 패딩='same'
4. 위의 드랍아웃 레이어에 연결되는 세번째 가지
    * Convolution : 필터개수 16개, 필터사이즈(1,1), 스트라이드(1,1), 패딩='same'
    * Convolution : 필터개수 16개, 필터사이즈(5,5), 스트라이드 (1,1), 패딩='same'
5. 위의 드랍아웃 레이어에 연결되는 네번째 가지
    * MaxPooling : 사이즈(3,3), 스트라이드(1,1), 패딩='same'
    * Convolution : 필터개수 16개, 필터사이즈(1,1), 패딩='same'
6. Concat.(채널기준으로 통합함. axis=-1 또는 axis=3)
7. GlobalAveragePooling2D 레이어
13. 아웃풋레이어 



In [None]:
# 모델 요약해보자!

# 모델 시각화 해보자!



In [None]:
# 데이터를 넣어서 학습시키자!


In [None]:
performance_test = model.evaluate(test_x, test_y, batch_size = 1024)

print('Test Loss : {:.6f},  Test Accuracy : {:.3f}%'.format(performance_test[0], performance_test[1]*100))

In [None]:
if not isinstance(history, dict):
    history = history.history

plt.plot(history['accuracy'])
plt.plot(history['val_accuracy'])
plt.title('Accuracy : Training vs Validation')
plt.ylabel('Accuracy')
plt.xlabel('Epoch')
plt.legend(['Training', 'Validation'], loc=0)
plt.show()

In [None]:
if not isinstance(history, dict):
    history = history.history

plt.plot(history['loss'])
plt.plot(history['val_loss'])
plt.title('Loss : Training vs Validation')
plt.ylabel('Loss')
plt.xlabel('Epoch')
plt.legend(['Training', 'Validation'], loc=0)
plt.show()

In [None]:
# 원핫인코딩 해제
train_y = train_y.argmax(axis=1)
test_y = test_y.argmax(axis=1)

In [None]:
pred_train = model.predict(train_x)
pred_test = model.predict(test_x)

single_pred_train = pred_train.argmax(axis=1)
single_pred_test = pred_test.argmax(axis=1)


logi_train_accuracy = accuracy_score(train_y, single_pred_train)
logi_test_accuracy = accuracy_score(test_y, single_pred_test)


print('CNN')
print('트레이닝 정확도 : {:.2f}%'.format(logi_train_accuracy*100))
print('테스트 정확도 : {:.2f}%'.format(logi_test_accuracy*100))

In [None]:
'''
성능 확인을 위해
Ctrl+Enter를 이용하여
반복 실행 해보자!
'''

id = rd.randrange(0,10000)

print('id = {}'.format(id))
print('다음 그림은 {} 입니다.'.format(labels[test_y[id]]))
print('모델의 예측 : {}'.format(labels[single_pred_test[id]]))

prob = np.floor(pred_test[id]*100).tolist()
prob_dict = {}

for idx, prob in enumerate(prob) :
    prob_dict[ labels[idx] ] = prob

print('모델의 카테고리별 확률 : ')
print(prob_dict)

if test_y[id] == single_pred_test[id] :
    print('정답입니다')
else : 
    print('틀렸어요')
plt.imshow(test_x[id].reshape([32,32,-1]))
plt.show()

In [None]:
'''
틀린 것만 관찰해보자!

Ctrl+Enter를 이용하여
반복 실행 해보자!
'''

true_false = (test_y == single_pred_test)
f_id = np.where(true_false == False)[0]
f_n = len(f_id)

id = f_id[rd.randrange(0,f_n)]


print('id = {}'.format(id))
print('다음 그림은 {} 입니다.'.format(labels[test_y[id]]))
print('모델의 예측 : {}'.format(labels[single_pred_test[id]]))

prob = np.floor(pred_test[id]*100).tolist()
prob_dict = {}

for idx, prob in enumerate(prob) :
    prob_dict[ labels[idx] ] = prob

print('모델의 카테고리별 확률 : ')
print(prob_dict)

if test_y[id] == single_pred_test[id] :
    print('정답입니다')
else : 
    print('틀렸어요')
plt.imshow(test_x[id].reshape([32,32,-1]))
plt.show()