### 모델 저장과 복원
---
- 방법1) 모델 전체 저장 - 모델 구조 + 가중치 + 변수
    * save_model()
    * 복원시 추가 작업 필요 없이 파일 로딩해서 사용 가능  
  
- 방법2) 가중치만 저장
    * save_weights()
    * 복원시 모델 구조(Architechture) 생성 후, 가중치 적용
    
- 방법3) 모델 전체 or 가중치만 자동 저장
    * fit()에서 ModelCheckPoint Event에 대한 callbakcs 등록
    * save_best_only = True : 모니터링 기준에 따라서 좋은 성능의 모델만 저장
    * save_weight_only = True : 가중치만 저장
    
- 파일 or 폴더
    * 파일 확장자가 없으면 폴더로 저장
    * 파일 확장자
        - h5, hdf5 : HDF5 포맷으로 모델이나 가중치 저장 (多)
        - ckpf : 체크파일 형태로 저장
        - pd : 모델 저장

### [1] 데이터 준비 및 로딩

In [203]:
from sklearn.datasets import load_iris
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.utils import set_random_seed, plot_model
import numpy as np

In [204]:
iris = load_iris()

In [205]:
X_train = iris.data
y_train = iris.target
print('X_train : {}\ny_train : {}'.format(X_train.shape, y_train.shape))

X_train : (150, 4)
y_train : (150,)


In [206]:
iris.target_names, iris.feature_names

(array(['setosa', 'versicolor', 'virginica'], dtype='<U10'),
 ['sepal length (cm)',
  'sepal width (cm)',
  'petal length (cm)',
  'petal width (cm)'])

In [207]:
# 꽃잎의 길이, 너비
X_train = X_train[:,2:]
X_train.shape

(150, 2)

### [2] 데이터 전처리

In [208]:
# target => 문자 => 수치화를 위해 인코딩
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
lencoder = LabelEncoder()
y_train = lencoder.fit(y_train).transform(y_train)

In [209]:
ohencoder = OneHotEncoder()
y_train = ohencoder.fit(y_train.reshape(-1,1)).transform(y_train.reshape(-1,1))

In [210]:
y_train = y_train.toarray()

In [211]:
X_train.shape, y_train.shape, y_train[0]

((150, 2), (150, 3), array([1., 0., 0.]))

In [212]:
# 스케일링 (훈련데이터만 / target은 스케일링x)
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X_train_scaled = scaler.fit(X_train).transform(X_train)

In [213]:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X_train_scaled, y_train,
                                                    stratify=y_train)

# 이미 스케일링 한 것을 X_train으로 분리한 상태니까, 여기서 X_val도 분리해주면 됨
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train)

In [214]:
print('X_trian.shape : {}'.format(X_train.shape))
print('X_val.shape   : {}'.format(X_val.shape))
print('X_test.shape  : {}'.format(X_test.shape))
print()
print('y_train.shape : {}'.format(y_train.shape))
print('y_val.shape   : {}'.format(y_val.shape))
print('y_test.shape  : {}'.format(y_test.shape))

X_trian.shape : (84, 2)
X_val.shape   : (28, 2)
X_test.shape  : (38, 2)

y_train.shape : (84, 3)
y_val.shape   : (28, 3)
y_test.shape  : (38, 3)


### [3] 모델 구성 및 생성

In [215]:
irisModel = Sequential(name='irisModel')

In [216]:
irisModel.add(Dense(10, activation='relu', input_shape=(2,)))
irisModel.add(Dense(5, activation='relu'))
irisModel.add(Dense(3, activation='softmax'))

In [217]:
irisModel.summary()

Model: "irisModel"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_9 (Dense)             (None, 10)                30        
                                                                 
 dense_10 (Dense)            (None, 5)                 55        
                                                                 
 dense_11 (Dense)            (None, 3)                 18        
                                                                 
Total params: 103
Trainable params: 103
Non-trainable params: 0
_________________________________________________________________


In [218]:
# 모델생성
irisModel.compile(loss='categorical_crossentropy',
                 optimizer='adam',
                 metrics='accuracy')

### [4] 모델 학습

In [219]:
irisModel.fit(X_train, y_train, epochs=1000, verbose=False)

<keras.callbacks.History at 0x252a572e040>

### [5] 모델 평가

In [220]:
lossv, accv = irisModel.evaluate(X_test, y_test)



In [221]:
lossv, accv

(0.05027642846107483, 0.9736841917037964)

In [222]:
M_FILE = 'irisModel.h5'
W_FILE = 'irisWeight.h5'

In [223]:
from tensorflow.keras.models import save_model

In [224]:
if accv >= 0.95:
    save_model(irisModel, M_FILE)
    irisModel.save_weights(W_FILE)

### [6] 복원
---
- 모델 or 가중치 복원
- load_model(모델 파일 or 모델 폴더명)
- Sequencial.load_weights(가중치 파일 or 폴더명)

### [6-1] 모델 복원

In [225]:
from tensorflow.keras.models import load_model

In [226]:
reModel = load_model(M_FILE)

In [227]:
reModel.evaluate(X_test, y_test)



[0.05027642846107483, 0.9736841917037964]

In [228]:
reModel.summary()

Model: "irisModel"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_9 (Dense)             (None, 10)                30        
                                                                 
 dense_10 (Dense)            (None, 5)                 55        
                                                                 
 dense_11 (Dense)            (None, 3)                 18        
                                                                 
Total params: 103
Trainable params: 103
Non-trainable params: 0
_________________________________________________________________


### [6-2] 가중치 복원
---
- 모델 구조 (가중치 복원은 모델이 있어야, 컴파일까지 되어 있어야 함)
- 가중치 로딩  
=> 모델 아키텍처 구조를 알아야 그대로 모델을 만들어 놓고, 가중치를 넣어야 함

In [229]:
# 모델 구조 구성
irisModel_new = Sequential(name='irisModel')
irisModel_new.add(Dense(10, activation='relu', input_shape=(2,)))
irisModel_new.add(Dense(5, activation='relu'))
irisModel_new.add(Dense(3, activation='softmax'))
irisModel_new.summary()

Model: "irisModel"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_12 (Dense)            (None, 10)                30        
                                                                 
 dense_13 (Dense)            (None, 5)                 55        
                                                                 
 dense_14 (Dense)            (None, 3)                 18        
                                                                 
Total params: 103
Trainable params: 103
Non-trainable params: 0
_________________________________________________________________


In [233]:
# 모델 생성
irisModel_new.compile(loss='categorical_crossentropy',
                      optimizer='adam',
                      metrics='accuracy')

In [234]:
# 가중치 로딩
irisModel_new.load_weights(W_FILE)

In [None]:
# 훈련
irisModel_new.fit()

In [235]:
irisModel_new.evaluate(X_test, y_test)



[0.05027642846107483, 0.9736841917037964]

In [236]:
# 가중치와 bias 값을 최적화 시키기 위해 연산을 하는 것인데,
# 이렇게 모델 or 가중치만 저장해서 로딩하는 것

In [238]:
irisModel_new.fit(X_train, y_train, epochs=1000, verbose=False)

<keras.callbacks.History at 0x252a6b348b0>

In [243]:
pre_i = irisModel_new.predict(X_train[0].reshape(-1,2))
pre_i



array([[4.0919355e-07, 1.3240391e-03, 9.9867553e-01]], dtype=float32)