## Musterlösung zur Aufgabe: Hyperparamter optimieren

Aufgabe: Finde gute Hyperparemter (`C` und `gamma`) für eine SVM (sklearn.svm.SVC).

In der Musterlösung werden wir hier folgende Werte für `C` bzw. `gamma` durchprobieren:

- **C:** 0.001, 0.01, 0.1, 1, 10
- **gamma:** 0.001, 0.01, 0.1, 1, 10

**Wichtig:** Der Parameter `random_state` bei der `train_test_split` - Funktion muss auf `0` gesetzt sein - sonst werden u.U. andere Werte herauskommen!

In [5]:
import pandas as pd
df = pd.read_csv("data/classification.csv")
df.head()

Unnamed: 0,age,interest,success
0,23.657801,18.859917,0.0
1,22.573729,17.969223,0.0
2,32.553424,29.463651,0.0
3,6.718035,25.704665,1.0
4,14.401919,16.770856,0.0


In [6]:
from sklearn.model_selection import train_test_split

X = df[["age", "interest"]].values
y = df["success"].values

X_train, X_validation, y_train, y_validation = train_test_split(X, y, random_state = 0)

In [7]:
from sklearn.pipeline import Pipeline

from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC

pipeline = Pipeline([
    ("scaler", StandardScaler()),
    ("svm", SVC())
])

In [8]:
from sklearn.model_selection import GridSearchCV

clf = GridSearchCV(pipeline, param_grid = {
    "svm__C": [0.001, 0.01, 0.1, 1, 10],
    "svm__gamma": [0.001, 0.01, 0.1, 1, 10]
})
clf.fit(X_train, y_train)

print(clf.best_params_)

{'svm__C': 10, 'svm__gamma': 1}


In [9]:
print(clf.score(X_validation, y_validation))

0.9333333333333333
