## 라이브러리 임포트
- 실습에 필요한 라이브러리 임포트.

In [2]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

## 데이터 불러오기(학습 데이터, 테스트 데이터)
- 데이터 분석 단계에서 생성한 농구 선수 포지션 예측하기의 학습 데이터 및 테스트 데이터를 로드.

In [3]:
train = pd.read_csv("data/csv/basketball_train.csv")
test = pd.read_csv("data/csv/basketball_test.csv")

## SVM 최적의 파라미터 찾기
- 1. C(cost, 비용) : 결정경계선의 마진을 결정하는 파라미터.
- 2. gamma : 커널의 데이터 포인트의 표준편차를 결정하는 파라미터.

### - sklearn에서 제공하는 GridSearchCV()를 사용하시면, 손쉽게 최적의 c, gamma를 구할 수 있음.

In [4]:
from sklearn.model_selection import GridSearchCV
from sklearn.svm import SVC

In [5]:
def svc_param_selection(X, y, nfolds):
    svm_parameters = [
        {
            'kernel' : ['rbf'],
            'gamma' : [0.00001, 0.0001, 0.001, 0.01, 0.1, 1],
            'C':[0.01, 0.1, 1, 10, 100, 1000]
        }
    ]
    
    clf = GridSearchCV(SVC(), svm_parameters, cv=nfolds)
    clf.fit(X, y)
    print(clf.best_params_)
    
    return clf
    

In [6]:
X_train = train[['3P', 'BLK']]
y_train = train[['Pos']]

# 최적의 파라미터를 sklearn의 GridSearchCV() 를 통해 구한다.
clf = svc_param_selection(X_train, y_train.values.ravel(), 10)

{'C': 0.1, 'gamma': 1, 'kernel': 'rbf'}
