In [1]:
# 前回のプログラムの読込
%run 1.ipynb
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import pickle

from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split, GridSearchCV

# 説明変数
X = df.loc[:, ['abv', 'ibu']]
# 目的変数
y = df['Style_id']
# トレーニングデータとテストデータに分割
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=0)

In [2]:
# グリッドサーチを使ってパラメータを最適化する

# グリッドサーチとは、
# 最適化したいパラメータと分類器（ここではk近傍法分類器）、
# 評価指標を与えるとパラメータを最適化する機能です。

# 未知のデータを入力すると、
# そのデータから距離が近い順にn個のデータのクラスを取得して
# 多数決で未知のデータが所属するクラスを決定します。
# 参照するデータの数はn_neighborsというパラメータで設定

# n_neighborsを1から30まで設定する
# グリッドサーチの第2引数は、dict or list of dictionaries
parameters={"n_neighbors":np.arange(1,31,1)}

# k近傍法分類器を取得(これの引数n_neighborsを探す)
neigh=KNeighborsClassifier()

# グリッドサーチにパラメータ、分類器を与える。モデルの良さはF値で評価する
clf=GridSearchCV(neigh,parameters,scoring="f1_micro",cv=3,iid=False)

# 最適化を実行
clf.fit(X_train,y_train)



GridSearchCV(cv=3, error_score='raise-deprecating',
             estimator=KNeighborsClassifier(algorithm='auto', leaf_size=30,
                                            metric='minkowski',
                                            metric_params=None, n_jobs=None,
                                            n_neighbors=5, p=2,
                                            weights='uniform'),
             iid=False, n_jobs=None,
             param_grid={'n_neighbors': array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
       18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30])},
             pre_dispatch='2*n_jobs', refit=True, return_train_score=False,
             scoring='f1_micro', verbose=0)

In [3]:
# best_params_属性に最適化されたパラメータが入っている
best_params=clf.best_params_
best_params

{'n_neighbors': 8}

In [4]:
# 最適化されたn_neighborsの値を変数に代入
best_n=best_params["n_neighbors"]

In [5]:
# 最適なパラメータを設定したk近傍法分類器を取得
neigh=KNeighborsClassifier(n_neighbors=best_n)

# トレーニングデータで学習し機械学習モデルを取得
model=neigh.fit(X_train,y_train)

In [6]:
# 機械学習モデルをpickle化(先回、データフレームもpickel済)
with open("KNeighbors_model.pkl","wb")as f:
    pickle.dump(model,f)