In [1]:
import tensorflow as tf
from tensorflow import keras

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

In [2]:
from sklearn.model_selection import train_test_split

In [30]:
(train_input, train_target), (test_input, test_target) = \
keras.datasets.fashion_mnist.load_data()

print(train_input.shape)
print(test_input.shape)

(60000, 28, 28)
(10000, 28, 28)


In [31]:
train_scaled_pre = (train_input/255.0).reshape(-1, 28, 28, 1)       # 흑백 표시(1)
test_scaled_pre = (test_input/255.0).reshape(-1, 28, 28, 1)

In [32]:
print(train_scaled_pre.shape)

(60000, 28, 28, 1)


In [34]:
train_scaled, val_scaled, train_target, val_target = train_test_split(     # 잘못 설정됨
train_scaled_pre, train_target, test_size = 0.2, random_state=1)           # train_test_split의 경우 train_scal, train_targe, val_scal, val_targe
                                                                           # 의 순서로 들어가야 하는 것이 맞음
print(train_scaled.shape)
print(val_scaled.shape)

(48000, 28, 28, 1)
(12000, 28, 28, 1)


In [35]:
model = keras.Sequential()

## conv1
model.add(keras.layers.Conv2D(filters = 64, kernel_size = 3,                # 이미지를 CNN(도장)으로 찍어내기, 커널의 크기는 3x3
                             activation = 'relu', padding = 'same',          # 총 64개의 layer로 만들기.
                             strides = 1, input_shape = (28, 28, 1)))        # padding이 same일 경우 가장자리에 0, valid는 그대로
model.add(keras.layers.MaxPool2D(pool_size = 2))                            # maxpool로 사이즈 한 번 더 줄이기
##

model.add(keras.layers.Flatten())                                           # 이미지 데이터 펼치기
model.add(keras.layers.Dense(100, activation = 'relu'))                        # 딥러닝 돌리기
model.add(keras.layers.Dense(10, activation = 'softmax'))

model.summary()

Model: "sequential_3"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d_2 (Conv2D)            (None, 28, 28, 64)        640       
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 14, 14, 64)        0         
_________________________________________________________________
flatten_1 (Flatten)          (None, 12544)             0         
_________________________________________________________________
dense_2 (Dense)              (None, 100)               1254500   
_________________________________________________________________
dense_3 (Dense)              (None, 10)                1010      
Total params: 1,256,150
Trainable params: 1,256,150
Non-trainable params: 0
_________________________________________________________________


In [36]:
model.compile(loss = 'sparse_categorical_crossentropy',
             optimizer = 'adam',
             metrics = 'accuracy')

In [38]:
history = model.fit(train_scaled, train_target, epochs = 10,            # 위의 설정이 잘못 되었지만 결과적으로 봤을 때 순서는 맞음
                   validation_data=(val_scaled, val_target),          # 회귀의 경우 model.fit(x_train, y_train)의 순서로 들어가야 함
                   batch_size = 50)                                   # 즉, model.fit(train_scaled, val_scaled)가 들어가는 것이 정상
                                                                      # 하지만, 위에서 잘못 설정하고 여기서 순서를 제대로 맞춰 넣음

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


In [39]:
model = keras.Sequential()

## conv1
model.add(keras.layers.Conv2D(filters = 64, kernel_size = 3,                # 이미지를 CNN(도장)으로 찍어내기
                             activation = 'relu', padding = 'same',
                             strides = 1, input_shape = (28, 28, 1)))
model.add(keras.layers.MaxPool2D(pool_size = 2))                            # maxpool로 사이즈 한 번 더 줄이기
##


## conv2
model.add(keras.layers.Conv2D(filters = 64, kernel_size = 3,
                             activation = 'relu', padding = 'same',
                             strides = 2))
model.add(keras.layers.MaxPool2D(pool_size = 2))
##


model.add(keras.layers.Flatten())                                           # 이미지 데이터 펼치기
model.add(keras.layers.Dense(100, activation = 'relu'))                        # 딥러닝 돌리기
model.add(keras.layers.Dense(10, activation = 'softmax'))

model.summary()

Model: "sequential_4"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d_3 (Conv2D)            (None, 28, 28, 64)        640       
_________________________________________________________________
max_pooling2d_2 (MaxPooling2 (None, 14, 14, 64)        0         
_________________________________________________________________
conv2d_4 (Conv2D)            (None, 7, 7, 64)          36928     
_________________________________________________________________
max_pooling2d_3 (MaxPooling2 (None, 3, 3, 64)          0         
_________________________________________________________________
flatten_2 (Flatten)          (None, 576)               0         
_________________________________________________________________
dense_4 (Dense)              (None, 100)               57700     
_________________________________________________________________
dense_5 (Dense)              (None, 10)               

- <span style = 'color:blue'>Conv2D</span> : keras.layers 아래에 위치하며 CNN을 실행시키기 위한 함수.(CNN)
    - filters : 몇 개의 layer를 출력할 것인가
    - kernel_size : 커널(도장)의 크기는 몇 by 몇 으로 정할 것인가
    - paddig : same일 경우, 가장자리에 0을 대입. valid일 경우, 이미지 파일 그대로 사용.
    - strides : 커널의 가로, 세로를 몇 칸씩 이동시킬 것인가
    - input_shape : 맨 처음 층에 입력되는 값. (행, 열, 색상 또는 흑백)

- <span style = 'color:blue'>MaxPool2D</span> : 가장 높은 값으로 선정하는 것인데 대부분 Conv2D 다음에 사용

- <span style = 'color:blue'>Flatten</span> : CNN 완료한 이미지를 펼쳐서 Dense를 사용할 수 있도록 만들기.

In [40]:
# !pip install pydot
# !pip install graphviz

Collecting pydot
  Downloading pydot-1.4.2-py2.py3-none-any.whl (21 kB)
Installing collected packages: pydot
Successfully installed pydot-1.4.2
Collecting graphviz
  Downloading graphviz-0.20-py3-none-any.whl (46 kB)
Installing collected packages: graphviz
Successfully installed graphviz-0.20


In [41]:
keras.utils.plot_model(model, show_shapes = True,
                      to_file = 'cnn.png', dpi = 300)

('Failed to import pydot. You must `pip install pydot` and install graphviz (https://graphviz.gitlab.io/download/), ', 'for `pydotprint` to work.')


In [42]:
model.compile(loss = 'sparse_categorical_crossentropy',
             optimizer = 'adam',
             metrics = 'accuracy')

checkpoint = keras.callbacks.ModelCheckpoint('./model/best_cnn_model.h5')
early_stopping = keras.callbacks.EarlyStopping(patience = 5, monitor = 'val_loss')

In [43]:
history = model.fit(train_scaled, train_target, epochs = 10,
                   validation_data=(val_scaled, val_target),
                   batch_size = 50, callbacks = [checkpoint, early_stopping])

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<span style = 'color:blue'>교재 235p</span>

In [3]:
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()

print(x_train.shape)
print(x_test.shape)

(60000, 28, 28)
(10000, 28, 28)


In [4]:
x_train = (x_train/255.0).reshape(-1, 28, 28, 1)         # 255.0으로 나눈 이유는 팩셀의 밝기에 따라 0~255까지 책정된 등급을 0~1사이
x_test = (x_test/255.0).reshape(-1, 28, 28, 1)           # 값으로 바꿔야하기 때문에(데이터 정규화)
                                                              # 때문에 데이터의 값이 float가 되어야 한다.
print(x_train.shape)                                     # 또한, 정규화 데이터를 0,1의 값으로만 분류해야 하기 때문에 one-hot이 필요
print(x_train.dtype); print()
                                                  # 교재에서는 np_utils.to_categorical() 함수를 사용해 y 데이터를 바로 one-hot 시킴
print(y_test.shape)
print(x_test.shape)

print(y_train.dtype); print()


(60000, 28, 28, 1)
float64

(10000,)
(10000, 28, 28, 1)
uint8



In [5]:
model = keras.Sequential()
model.add(keras.layers.Conv2D(32, kernel_size = 3, activation = 'relu',
                             input_shape = (28, 28, 1)))
model.add(keras.layers.Conv2D(64, kernel_size = 3, activation = 'relu'))
model.add(keras.layers.MaxPool2D(pool_size = 2))
model.add(keras.layers.Flatten())
model.add(keras.layers.Dense(128, activation = 'relu'))
model.add(keras.layers.Dropout(0.3))
model.add(keras.layers.Dense(10, activation = 'softmax'))

model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d (Conv2D)              (None, 26, 26, 32)        320       
_________________________________________________________________
conv2d_1 (Conv2D)            (None, 24, 24, 64)        18496     
_________________________________________________________________
max_pooling2d (MaxPooling2D) (None, 12, 12, 64)        0         
_________________________________________________________________
flatten (Flatten)            (None, 9216)              0         
_________________________________________________________________
dense (Dense)                (None, 128)               1179776   
_________________________________________________________________
dropout (Dropout)            (None, 128)               0         
_________________________________________________________________
dense_1 (Dense)              (None, 10)                1

In [6]:
model.compile(loss = 'sparse_categorical_crossentropy',
             optimizer = 'adam',
             metrics = 'accuracy')

In [7]:
checkpoint = keras.callbacks.ModelCheckpoint('./model/best_mnist_model.h5')
early_stopping = keras.callbacks.EarlyStopping(patience=5)

history = model.fit(x_train, y_train, validation_data=(x_test, y_test),
                   epochs = 30, batch_size = 200,
                   callbacks = [checkpoint, early_stopping],
                   verbose = 1)

Epoch 1/30
Epoch 2/30
Epoch 3/30
Epoch 4/30
Epoch 5/30
Epoch 6/30
Epoch 7/30
Epoch 8/30
Epoch 9/30
Epoch 10/30
Epoch 11/30
Epoch 12/30


- <span style = 'color:blue'>Conv2D</span> : keras.layers 아래에 위치하며 CNN을 실행시키기 위한 함수.(CNN)
    - filters : 몇 개의 layer를 출력할 것인가
    - kernel_size : 커널(도장)의 크기는 몇 by 몇 으로 정할 것인가
    - paddig : same일 경우, 가장자리에 0을 대입. valid일 경우, 이미지 파일 그대로 사용.
    - strides : 커널의 가로, 세로를 몇 칸씩 이동시킬 것인가
    - input_shape : 맨 처음 층에 입력되는 값. (행, 열, 색상 또는 흑백)

- <span style = 'color:blue'>MaxPool2D</span> : 가장 높은 값으로 선정하는 것인데 대부분 Conv2D 다음에 사용

- <span style = 'color:blue'>Flatten</span> : CNN 완료한 이미지를 펼쳐서 Dense를 사용할 수 있도록 만들기.

- <span style = 'color:blue'>train_test_split_</span> 의 경우

     x_train, x_target, y_train, y_target 의 순서로 적는다.

- <span style = 'color:blue'>keras.datasets.OOOO.load_data()</span> 의 경우
    
    (x_train, y_train), (x_test, y_test) 의 순서로 적는다.