## 학습한 학습기를 저장하고 다시 사용하는 방법
- 머신러닝 프로그램 : 야간 처리 등을 사용해 학습하고 학습된 데이터를 저장
- 판정 전용 프로그램 : 프로그램을 실행할 때 학습된 데이터를 읽어 들이고 판정

### scikit-learn에서 학습된 데이터를 저장하고 읽어 들이는 방법
- `joblib.dump()` : 학습기, 매개변수, 학습된 데이터를 파일로 저장
    - `compress=True` : 압축

In [1]:
from sklearn import datasets, svm
import joblib

# 데이터 읽기
iris = datasets.load_iris()

# 데이터 학습
clf = svm.SVC()
clf.fit(iris.data, iris.target)

# 학습된 데이터 저장
joblib.dump(clf, '../models/iris.pkl', compress=True)

['../models/iris.pkl']

#### 테스트

In [2]:
from sklearn.metrics import accuracy_score
from sklearn import datasets
import joblib

# 학습된 데이터 읽기
clf = joblib.load('../models/iris.pkl')

# 데이터 읽기
iris = datasets.load_iris()

# 예측
pred = clf.predict(iris.data)

# 정답률 확인
print(accuracy_score(iris.target, pred))

0.9733333333333334


### Tensorflow와 Keras에서 학습된 데이터를 저장하고 읽어 들이는 방법
- `model.save()` : 모델 구조, 가중치 등 모델 전반적인 것을 저장하여 재학습이나 layer를 추가하는 등 재사용 가능
- `model.save_weights()` : 가중치만 저장하여 예측에만 사용 가능

In [3]:
from sklearn import datasets
from tensorflow import keras
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout
from tensorflow.keras.utils import to_categorical

# 데이터 읽기
iris = datasets.load_iris()
in_size = 4
nb_classes = 3

# 레이블 OHE 변환
x = iris.data
y = to_categorical(iris.target, nb_classes)

In [5]:
# 모델 정의
model = Sequential()
model.add(Dense(512, activation='relu', input_shape=(in_size, )))
model.add(Dense(512, activation='relu'))
model.add(Dropout(0.2))
model.add(Dense(nb_classes, activation='softmax'))

In [8]:
# 모델 컴파일
model.compile(loss='categorical_crossentropy',
             optimizer='adam', metrics=['accuracy'])

In [9]:
# 학습 실행
model.fit(x, y, batch_size=20, epochs=50)

Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50


<keras.callbacks.History at 0x2d4365a9490>

In [10]:
# 모델 저장하기
model.save('../models/iris_model.h5')

# 가중치 데이터 저장하기
model.save_weights('../models/iris_weight.h5')

#### 테스트

In [11]:
from sklearn import datasets
from tensorflow import keras
from tensorflow.keras.models import load_model
from tensorflow.keras.utils import to_categorical

# 데이터 읽기
iris = datasets.load_iris()
in_size = 4
nb_classes = 3

# 레이블 OHE 변환
x = iris.data
y = to_categorical(iris.target, nb_classes)

# 모델 읽기
model = load_model('../models/iris_model.h5')

# 평가
score = model.evaluate(x, y, verbose=1)
print('정답률 :', score[1])

정답률 : 0.9800000190734863


In [12]:
model.summary()

Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 512)               2560      
_________________________________________________________________
dense_1 (Dense)              (None, 512)               262656    
_________________________________________________________________
dropout (Dropout)            (None, 512)               0         
_________________________________________________________________
dense_2 (Dense)              (None, 3)                 1539      
Total params: 266,755
Trainable params: 266,755
Non-trainable params: 0
_________________________________________________________________
