<a href="https://colab.research.google.com/github/BAEK-SEUNGYUN/modu_deep/blob/main/modu_wine_check_stop.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 학습의 자동 중단

학습이 진행될수록 학습셋의 정확도는 올라가지만 과적합 때문에 테스트셋의 실험 결과는 점점 나빠진다.

케라스에는 이렇게 학습이 진행되어도 테스트셋 오차가 줄지 않으면 학습을 멈추게 하는 함수가 있는데 -> **EarlyStopping()** 함수이다.

```
from keras.callbacks import EarlyStopping
```

EarlyStopping() 함수에 모니터할 값과 테스트 오차가 좋아지지 않아도 몇 번까지 기다릴지 정한다.

이를 early_stopping_callback에 저장

```
early_stopping_callback = EarlyStopping(monitor='val_loss', patience=100)
```

앞서 정한 그대로 에포크 획수와 배치 크기 등을 설정하고 early_stopping_callback 값을 불러온다.

```
model.fit(X,Y, validation_split=0.33, epochs = 2000, batch_size=500, callbacks=[early_stopping_calback
```

모두 코드에 적용해보자


In [3]:
from keras.models import Sequential
from keras.layers import Dense
from keras.callbacks import EarlyStopping

import pandas as pd
import numpy as np
import tensorflow as tf

In [4]:
# seed 값 설정
np.random.seed(3)
tf.random.set_seed(3)

In [5]:
df_pre = pd.read_csv('/content/drive/MyDrive/dataset/wine.csv', header=None)
df = df_pre.sample(frac=0.15)

In [6]:
dataset = df.values
dataset

array([[ 5.9  ,  0.18 ,  0.28 , ..., 10.65 ,  7.   ,  0.   ],
       [10.2  ,  0.67 ,  0.39 , ..., 10.   ,  5.   ,  1.   ],
       [ 8.4  ,  0.715,  0.2  , ...,  9.4  ,  5.   ,  1.   ],
       ...,
       [ 5.8  ,  0.2  ,  0.34 , ..., 11.7  ,  5.   ,  0.   ],
       [ 5.8  ,  0.33 ,  0.2  , ...,  8.9  ,  5.   ,  0.   ],
       [ 6.2  ,  0.47 ,  0.21 , ...,  9.2  ,  5.   ,  0.   ]])

In [7]:
X = dataset[:, 0:12]
Y = dataset[:, 12]

In [14]:
model = Sequential()
model.add(Dense(30, input_dim=12, activation='relu'))
model.add(Dense(12, activation='relu'))
model.add(Dense(8, activation='relu'))
model.add(Dense(1, activation='sigmoid'))

In [15]:
model.compile(loss='binary_crossentropy',
              optimizer = 'adam',
              metrics=['accuracy'])

In [16]:
# 학습 자동 중단 설정
early_stopping_callback = EarlyStopping(monitor='val_loss', patience=100)

In [17]:
# 모델 실행
model.fit(X, Y, validation_split=0.2, epochs = 2000,
          batch_size=500, callbacks=[early_stopping_callback])

Epoch 1/2000
Epoch 2/2000
Epoch 3/2000
Epoch 4/2000
Epoch 5/2000
Epoch 6/2000
Epoch 7/2000
Epoch 8/2000
Epoch 9/2000
Epoch 10/2000
Epoch 11/2000
Epoch 12/2000
Epoch 13/2000
Epoch 14/2000
Epoch 15/2000
Epoch 16/2000
Epoch 17/2000
Epoch 18/2000
Epoch 19/2000
Epoch 20/2000
Epoch 21/2000
Epoch 22/2000
Epoch 23/2000
Epoch 24/2000
Epoch 25/2000
Epoch 26/2000
Epoch 27/2000
Epoch 28/2000
Epoch 29/2000
Epoch 30/2000
Epoch 31/2000
Epoch 32/2000
Epoch 33/2000
Epoch 34/2000
Epoch 35/2000
Epoch 36/2000
Epoch 37/2000
Epoch 38/2000
Epoch 39/2000
Epoch 40/2000
Epoch 41/2000
Epoch 42/2000
Epoch 43/2000
Epoch 44/2000
Epoch 45/2000
Epoch 46/2000
Epoch 47/2000
Epoch 48/2000
Epoch 49/2000
Epoch 50/2000
Epoch 51/2000
Epoch 52/2000
Epoch 53/2000
Epoch 54/2000
Epoch 55/2000
Epoch 56/2000
Epoch 57/2000
Epoch 58/2000
Epoch 59/2000
Epoch 60/2000
Epoch 61/2000
Epoch 62/2000
Epoch 63/2000
Epoch 64/2000
Epoch 65/2000
Epoch 66/2000
Epoch 67/2000
Epoch 68/2000
Epoch 69/2000
Epoch 70/2000
Epoch 71/2000
Epoch 72/2000
E

<keras.callbacks.History at 0x7fa5d4ba8bd0>

epochs를 2000으로 설정했지만 627번만에 끝나버렸다.

In [12]:
#결과 출력
print("\n Accuracy : %.4f" % (model.evaluate(X,Y)[1]))


 Accuracy : 0.9867


모델 업데이트 함수와 학습 자동중단 함수를 동시에 사용해보자

In [25]:
from keras.callbacks import ModelCheckpoint

In [20]:
model = Sequential()
model.add(Dense(30, input_dim=12, activation='relu'))
model.add(Dense(12, activation='relu'))
model.add(Dense(8, activation='relu'))
model.add(Dense(1, activation='sigmoid'))

In [21]:
model.compile(loss='binary_crossentropy',
              optimizer = 'adam',
              metrics=['accuracy'])

In [22]:
# 모델 저장 폴더 만들기
MODEL_DIR = './model/'
if not os.path.exists(MODEL_DIR):
  os.mkdir(MODEL_DIR)

modelpath = "./model/{epoch:02d}-{val_loss:.4f}.hdf5"

In [26]:
# 모델 업데이트 및 저장
checkpointer = ModelCheckpoint(filepath=modelpath, monitor='val_loss',
                               verbose = 1, save_best_only=True)

In [27]:
# 학습 자동 중단 설정
early_stopping_callback = EarlyStopping(monitor='val_loss', patience=100)

In [28]:
model.fit(X, Y, validation_split=0.2, epochs = 3500,
          batch_size=500, callbacks=[early_stopping_callback])

Epoch 1/3500
Epoch 2/3500
Epoch 3/3500
Epoch 4/3500
Epoch 5/3500
Epoch 6/3500
Epoch 7/3500
Epoch 8/3500
Epoch 9/3500
Epoch 10/3500
Epoch 11/3500
Epoch 12/3500
Epoch 13/3500
Epoch 14/3500
Epoch 15/3500
Epoch 16/3500
Epoch 17/3500
Epoch 18/3500
Epoch 19/3500
Epoch 20/3500
Epoch 21/3500
Epoch 22/3500
Epoch 23/3500
Epoch 24/3500
Epoch 25/3500
Epoch 26/3500
Epoch 27/3500
Epoch 28/3500
Epoch 29/3500
Epoch 30/3500
Epoch 31/3500
Epoch 32/3500
Epoch 33/3500
Epoch 34/3500
Epoch 35/3500
Epoch 36/3500
Epoch 37/3500
Epoch 38/3500
Epoch 39/3500
Epoch 40/3500
Epoch 41/3500
Epoch 42/3500
Epoch 43/3500
Epoch 44/3500
Epoch 45/3500
Epoch 46/3500
Epoch 47/3500
Epoch 48/3500
Epoch 49/3500
Epoch 50/3500
Epoch 51/3500
Epoch 52/3500
Epoch 53/3500
Epoch 54/3500
Epoch 55/3500
Epoch 56/3500
Epoch 57/3500
Epoch 58/3500
Epoch 59/3500
Epoch 60/3500
Epoch 61/3500
Epoch 62/3500
Epoch 63/3500
Epoch 64/3500
Epoch 65/3500
Epoch 66/3500
Epoch 67/3500
Epoch 68/3500
Epoch 69/3500
Epoch 70/3500
Epoch 71/3500
Epoch 72/3500
E

<keras.callbacks.History at 0x7fa5d4a80590>

전체 샘플의 15%만 사용으로 780개의 샘플이 입력

epochs가 3500번 이었으나 1197번까지만 돌았습니다.