## 사이킷런 모델을 저장하고 복원하기

In [1]:
from sklearn.ensemble import RandomForestClassifier
from sklearn import datasets
import joblib

In [2]:
iris=datasets.load_iris()

features=iris.data
target=iris.target

In [3]:
# 결정 트리 분류기 객체 생성

classifier=RandomForestClassifier()

In [4]:
# 모델 훈련

model=classifier.fit(features, target)

In [5]:
# 모델을 피클 파일로 저장

joblib.dump(model, 'model.pkl')

['model.pkl']

모델을 저장하고 나면 필요한 어플리케이션에서 사이킷런으로 모델을 복원할 수 있다

In [6]:
# 파일에서 모델 복원

classifier_loaded=joblib.load('model.pkl')

In [7]:
# 복원된 모델로 예측 수행

new_observation=[[5.2,3.2,1.1,0.1]]

In [8]:
# 샘플의 클래스 예측

classifier.predict(new_observation)

array([0])

혹시 모를 사이킷런 버전 간의 호환을 유의하기 위해
파일 이름에 모델에 사용된 사이킷런 버전을 포함시키는 것이 좋다

In [9]:
import sklearn

scikit_version=sklearn.__version__

In [10]:
# 모델을 피클 파일로 저장

joblib.dump(model,'model_{version}.pkl'.format(version=scikit_version))

['model_0.22.2.post1.pkl']

## 케라스 모델을 저장하고 복원하기

In [11]:
import numpy as np
from keras.datasets import imdb
from keras.preprocessing.text import Tokenizer
from keras import models
from keras import layers
from keras.models import load_model

In [12]:
np.random.seed(0)

In [13]:
number_of_features=1000

In [14]:
(x_train, y_train), (x_test, y_test)=imdb.load_data(num_words=number_of_features)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/imdb.npz


In [15]:
tokenizer=Tokenizer(num_words=number_of_features)
train_features=tokenizer.sequences_to_matrix(x_train, mode='binary')
test_features=tokenizer.sequences_to_matrix(x_test, mode='binary')

In [16]:
network=models.Sequential()

network.add(layers.Dense(units=16, activation='relu', input_shape=(number_of_features,)))
network.add(layers.Dense(units=1, activation='sigmoid'))

In [17]:
network.compile(loss='binary_crossentropy',
                optimizer='rmsprop',
                metrics=['accuracy'])

In [18]:
history=network.fit(train_features,
                    y_train,
                    epochs=3,
                    verbose=1,
                    batch_size=100,
                    validation_data=(test_features, y_test))

Epoch 1/3
Epoch 2/3
Epoch 3/3


In [19]:
# 신경망 모델 저장

network.save('model.h5')

In [20]:
# 신경망 모델 복원

network=load_model('model.h5')