### SVM 최적의 파라미터 찾기
SVM의 파라미터는 두가지가 있습니다.

C : 비용 (cost), 결정경계선의 마진을 결정하는 파라미터입니다.  
  
gamma: 커널의 데이터포인트의 표준편차를 결정하는 파라미터입니다.  
  
결과적으로 C가 클수록, 결정경계선과 서포트 벡터의 간격(마진)이 작아집니다. 
  
결과적으로 gamma가 클수록, 결정경계선이 데이터포인트와 더욱 가까워집니다.  
  

#### 최적의 SVM 파라미터 찾기

In [1]:
import pandas as pd
import pickle
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline

In [6]:
with open('./data/pkl/basketball_train.pkl', 'rb') as train_data:
    train = pickle.load(train_data)
    
with open('./data/pkl/basketball_test.pkl', 'rb') as test_data:
    test = pickle.load(test_data)

In [2]:
from sklearn.model_selection import GridSearchCV
from sklearn.metrics import classification_report
from sklearn.metrics import accuracy_score
from sklearn.svm import SVC

import numpy as np

In [4]:
def svc_param_selection(x, y, nfolds):
    svm_parameters = [
        {
            'kernel' : ['rbf'],
            'gamma' : [0.00001, 0.0001, 0.001, 0.01, 0.1, 1],
            'C' : [0.01, 0.1, 1, 10, 100, 10000]
        }
    ]
    clf = GridSearchCV
    clf = GridSearchCV(SVC(), svm_parameters, cv = 10)
    clf.fit(x_train, y_train.values.ravel())
    print(clf.best_params_)
    
    return clf

In [7]:
x_train = train[['3P', 'BLK']]
y_train = train[['Pos']]

In [8]:
clf = svc_param_selection(x_train, y_train.values.ravel(), 10)

{'C': 0.1, 'gamma': 1, 'kernel': 'rbf'}




####  결정 경계선 시각화

In [7]:
C_canditables = []
C_canditables.append(clf.best_params_['C'] * 0.01)
C_canditables.append(clf.best_params_['C'] )
C_canditables.append(clf.best_params_['C'] * 100)

In [8]:
gamma_canditables = []
gamma_canditables.append(clf.best_params_['C'] * 0.01)
gamma_canditables.append(clf.best_params_['C'])
gamma_canditables.append(clf.best_params_['C'] * 100)

In [10]:
x = train[['3P', 'BLK']]
y = train['Pos'].tolist()

In [11]:
position = []
for gt in y:
    if gt == 'C':
        position.append(0)
    else:
        position.append(1)
classifiers = []

In [19]:
for C in C_canditables:
    for gamma in gamma_canditables:
        clf = SVC(C = C, gamma= gamma)
        clf.fit(x, y)
        classifiers.append((C,gamma, clf))
plt.figure(figsize=(18, 18))
xx, yy = np.meshgrid(np.linspace(0, 4, 100), np.linspace(0, 4, 100))

for (k, (C, gamma, clf)) in enumerate(classifiers):
    Z = clf.deci
