# 훈련된 모형의 저장과 복원
* 모형을 훈련한 후 모형을 저장하고 애플리케이션에 필요할 때 이를 다시 복원 할 수 있어야 한다.
* 모형을 피클(pickle)로 저장한다.
* 피클이란? 파이썬 객체 자체를 binary 파일로 저장하는 것을 말한다.
* 사이킷런에는 피클 기능을 확장한 joblib 모듈을 제공한다.
* 주의 할 점 – 저장된 모델이 사이킷런 버전 간에 호환되지 않는지 주의해야 한다. 피클을 사용하기 때문에 버전이 맞지 않으면 로드시 에러가 발생한다.


### Pickle 파일의 입출력

* pickle 파일을 직접 사용하여 모형을 저장/복원할 수 있다.


In [None]:
from sklearn.ensemble import RandomForestClassifier
from sklearn import datasets

In [None]:
iris = datasets.load_iris()
features = iris.data
target = iris.target

In [None]:
classifier = RandomForestClassifier()
model = classifier.fit(features, target)

## Pickle model save

In [None]:
import pickle

In [None]:
with open('model.pickle', 'wb') as f:
    pickle.dump(model, f)

## Pickle model load

In [None]:
with open('model.pickle', 'rb') as f:
    loaded_model = pickle.load(f)
    
print(loaded_model)

RandomForestClassifier(bootstrap=True, ccp_alpha=0.0, class_weight=None,
                       criterion='gini', max_depth=None, max_features='auto',
                       max_leaf_nodes=None, max_samples=None,
                       min_impurity_decrease=0.0, min_impurity_split=None,
                       min_samples_leaf=1, min_samples_split=2,
                       min_weight_fraction_leaf=0.0, n_estimators=100,
                       n_jobs=None, oob_score=False, random_state=None,
                       verbose=0, warm_start=False)


---

## Model save


In [None]:
# import joblib  # version 0.23 이상
import sklearn.externals import joblib

In [None]:
joblib.dump(model, 'model.pkl')

['model.pkl']

## Model Load

In [None]:
loaded_model = joblib.load("model.pkl")
print(loaded_model)

RandomForestClassifier(bootstrap=True, ccp_alpha=0.0, class_weight=None,
                       criterion='gini', max_depth=None, max_features='auto',
                       max_leaf_nodes=None, max_samples=None,
                       min_impurity_decrease=0.0, min_impurity_split=None,
                       min_samples_leaf=1, min_samples_split=2,
                       min_weight_fraction_leaf=0.0, n_estimators=100,
                       n_jobs=None, oob_score=False, random_state=None,
                       verbose=0, warm_start=False)


In [None]:
new_obs = [[5.2, 3.2, 1.1, 0.1]]
loaded_model.predict(new_obs)

array([0])