## *SC43x*
# Major Neural Network Architectures

이번 스프린트 챌린지에서는 데이터 사이언스 분야에서 인지도가 높은 안정된 기술들을 다뤄보게 됩니다. 이번 한 주간 CNN, RNN, LSTM, Autoencoder, GAN 등 다양한 주요 신경망 구조들에 대해서 배워봤습니다. 오늘은 그 모델들을 복습하는 시간을 가지도록 하겠습니다. 이 SC는 **신경망 구조에 대한 이해와 지식**을 평가합니다. 높은 정확도를 가진 모델을 학습 시킬 수 있는지를 평가하려는 것이 아닙니다.

__*주의:*__  아래의 방식들은 복잡한 연산을 요구합니다. 모든 파트의 문제들은 어떤 환경에서라도 (e.g. 로컬 주피터, Google Colab, etc.) **5-10분 내외**로 결과값이 나오도록 제작이 됐기 때문에 만일 결과값을 도출하는데 그 이상의 시간이 걸린다면 여러분의 접근 방식을 재점검해보시기 바랍니다.

## 목차
* <a href="#p1">Part 1</a>: LSTM
* <a href="#p2">Part 2</a>: CNN
* <a href="#p3">Part 3</a>: Autoencoder
* <a href="#p4">Part 4</a>: Free Response

<a id="p1"></a>
## Part 1. LSTM
> LSTM을 활용해서 로이터 신문 기사를 주제별로 분류하는 다중분류 모델을 학습하세요. 데이터는 이미 LSTM 모델에 사용 될 수 있도록 적절하게 인코딩이 완료 됐습니다. 

수업에서 활용했었던 LSTM과 [Keras IMDB sentiment classification](https://www.tensorflow.org/api_docs/python/tf/keras/datasets/reuters/load_data)를 참고해서 문제를 푸신다면 도움이 되실 것입니다.

__*주의:*__  모델의 성능을 최대한 끌어올리는 것이 아닌 모델 구동에 초점을 맞춰주시길 바랍니다. 모든 문제를 완료 한 후에도 "시간이 남았다면" 정확도를 올리는 것에 도전하시는 것을 추천 합니다.

### 1.1 Keras를 활용해서 분류 예측 모델을 학습 후, 기사들을 주제별로 분류하세요

In [None]:
# 데이터셋을 불러옵니다
from tensorflow.keras.datasets import reuters

(X_train, y_train), (X_test, y_test) = reuters.load_data(num_words=None,
                                                         skip_top=0,
                                                         maxlen=None,
                                                         test_split=0.2,
                                                         seed=202012,
                                                         start_char=1,
                                                         oov_char=2,
                                                         index_from=3)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/reuters.npz


  x_train, y_train = np.array(xs[:idx]), np.array(labels[:idx])
  x_test, y_test = np.array(xs[idx:]), np.array(labels[idx:])


In [None]:
# 인코딩 확인
word_index = reuters.get_word_index(path="reuters_word_index.json")

print(f"Iran is encoded as {word_index['iran']} in the data")
print(f"London is encoded as {word_index['london']} in the data")
print("Words are encoded as numbers in our dataset.")

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/reuters_word_index.json
Iran is encoded as 779 in the data
London is encoded as 544 in the data
Words are encoded as numbers in our dataset.


In [None]:
label = set(y_test)
print(label)
print(len(label)+1)

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45}
46


In [None]:
import numpy as np
lenmax = len('1')
for x in X_train:
  tmp = len(x)
  lenmax = np.maximum(lenmax, tmp)
print(lenmax)

2376


In [None]:
# 아래 코드를 바꾸지 마십시오. +1은 반드시 있어야 합니다.
max_features = len(word_index.values()) + 1
print(max_features)

30980


In [None]:
from keras.preprocessing import sequence
X_train = sequence.pad_sequences(X_train, maxlen=80)
X_test = sequence.pad_sequences(X_test, maxlen=80)
print(X_train.shape, X_test.shape)

(8982, 80) (2246, 80)


### 1.2 모델의 성능 및 정확도를 계산하세요

In [None]:
# 이 곳에 답안을 작성하십시오
# 46개의 class로 구성되어 있으니, Top 5(41번째), 중위값(25번째) accuracy도 확인할 수 있는 코드를 넣어보세요 (도전과제).

from keras.models import Sequential
from keras.layers import Dense, LSTM, Embedding

model = Sequential()
model.add(Embedding(max_features, 128))
model.add(LSTM(128, activation='tanh'))
model.add(Dense(46, activation='softmax'))

model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
embedding (Embedding)        (None, None, 128)         3965440   
_________________________________________________________________
lstm (LSTM)                  (None, 128)               131584    
_________________________________________________________________
dense (Dense)                (None, 46)                5934      
Total params: 4,102,958
Trainable params: 4,102,958
Non-trainable params: 0
_________________________________________________________________


In [None]:
history = model.fit(X_train, y_train, batch_size=16, epochs=10, validation_data=(X_test, y_test))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


### 1.3 아래의 질문에 답하세요

#### a) 데이터셋을 학습할 때 사용하는 `pad_sequences`  메소드에 대해 설명하세요. 어떤 기능을 하나요? 왜 모델을 학습할 때 필요한가요?

#### b) 종래의 RNN(Recurrent Neural Networks) 대신 LSTM (Long-ShortTerm Memory Cell unit)을 사용하는 주요한 동기는 무엇인가요? (i.e. RNN에 비해 LSTM의 좋은 점을 설명하세요)

#### c) LSTM이나 RNN을 사용하는 예시를 **3개** 제시하고 왜 해당 경우에 사용하는게 적절한지 간단하게 설명하세요.


a) pad_sequences 문장 길이를 정해준 길이대로 일정하게 만들어 주기 위해서 사용되는 메서드입니다. 아래 링크를 통해 pad_sequences 메서드에 대해 더 자세히 알아보고, maxlen=None일 경우 고정 길이가 어떻게 변할지도 알아보세요. <br/>
https://www.tensorflow.org/api_docs/python/tf/keras/preprocessing/sequence/pad_sequences


b) 강의 노트에 충분히 나와있으니 강의 노트를 참고하여 작성해주세요. Hint) '장기 의존성' 혹은 'Vanishing Gradient'


c) RNN계열(LSTM, GRU 등)의 신경망은 Sequential 데이터를 처리하기에 용이합니다. Sequential 데이터에 어떤 것들이 있는지 구글링을 통해 조사해보세요. 

---

<a id="p2"></a>
## Part 2. CNN

### 객체 탐지 모델
Keras와  [ResNet50v2](https://www.tensorflow.org/api_docs/python/tf/keras/applications/resnet_v2) (pre-trained)을 활용하여 `im_frog` 폴더에 있는 이미지 중 어떤 이미지에 개구리가 있는지 찾는 객체 탐지 모델을 만들어 보겠습니다 (주의: 해당 이미지들을 Colab에 업로드 하셔야 합니다. 폴더이름은 다른 것을 사용하셔도 좋고, 아래 코드에서도 같이 바꾸셔야 합니다.)

<img align="left" src="https://d3i6fh83elv35t.cloudfront.net/newshour/app/uploads/2017/03/GettyImages-654745934-1024x687.jpg" width=400>

In [None]:
from google.colab import drive

drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
# 아래의 코드를 실행하면 skimage의 함수가 모든 이미지를 메모리로 읽어들입니다.
from skimage.io import imread_collection

images = imread_collection('/content/drive/My Drive/SC/im_frog/*.jpg')

In [None]:
print(type(images))
print(type(images[0]))

<class 'skimage.io.collection.ImageCollection'>
<class 'numpy.ndarray'>


## 2.1 Resnet$V_2$을 사용하기위해서 전처리 함수를 사용하여 이미지를 전처리 하고 이미지들의 사이즈를 재조정하세요 (Hint: scikit-image)

In [None]:
import numpy as np
from skimage.transform import resize

img_resize = np.array([resize(img, (224, 224, 3)) for img in images])

## 2.2 ResNet50v2 모델을 사용해 `images`를 분류하세요. 예측 결과는 자유롭게 출력하세요.
> 참고: `ResNet50v2`는 "frog"로 예측하지 않습니다. "frog"의 label은 "bullfrog, treefrog, tailed frog"입니다

In [None]:
from tensorflow.keras.applications.resnet_v2 import ResNet50V2

resnetV2 = ResNet50V2(weights='imagenet', include_top = True, input_shape=(224,224,3))
resnetV2.summary()

Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/resnet/resnet50v2_weights_tf_dim_ordering_tf_kernels.h5
Model: "resnet50v2"
__________________________________________________________________________________________________
Layer (type)                    Output Shape         Param #     Connected to                     
input_1 (InputLayer)            [(None, 224, 224, 3) 0                                            
__________________________________________________________________________________________________
conv1_pad (ZeroPadding2D)       (None, 230, 230, 3)  0           input_1[0][0]                    
__________________________________________________________________________________________________
conv1_conv (Conv2D)             (None, 112, 112, 64) 9472        conv1_pad[0][0]                  
__________________________________________________________________________________________________
pool1_pad (ZeroPadding2D)       (None, 114, 114, 

In [None]:
prediction = resnetV2.predict(img_resize)

In [None]:
# prediction
predict_class = np.argmax(prediction, axis=1) 
print(predict_class)

[883  30 308 807 985  32  31  30  30 750  58  58 985 985  31]


In [None]:
!git clone https://github.com/anishathalye/imagenet-simple-labels.git

Cloning into 'imagenet-simple-labels'...
remote: Enumerating objects: 21, done.[K
remote: Counting objects: 100% (11/11), done.[K
remote: Compressing objects: 100% (6/6), done.[K
remote: Total 21 (delta 1), reused 10 (delta 1), pack-reused 10[K
Unpacking objects: 100% (21/21), done.


In [None]:
import json

with open ('/content/imagenet-simple-labels/imagenet-simple-labels.json') as f:
    labels = json.load(f)

for i in predict_class:
    print(labels[i])

vase
American bullfrog
fly
solar thermal collector
daisy
tailed frog
tree frog
American bullfrog
American bullfrog
quilt
water snake
water snake
daisy
daisy
tree frog


<a id="p3"></a>
# Part 3. Autoencoders

## 3.1 오토인코더의 동작 원리와 Latent의 크기를 조절했을 때 달라지는 변화에 대해서 설명해보세요.

해당 부분은 강의 노트에 잘 나와 있습니다. 강의 노트 외에 참고할만한 링크를 하나 더 첨부하여 드립니다. 참고하여 작성해주시면 되겠습니다. <br/>

https://itrepo.tistory.com/46