# RBF SVC - Model & Tahmin

Doğrusal olmayan destek vektör modeli bölümündeyiz.
* RBF: radial basis function
* SVC: support vector classification

In [1]:
import pandas as pd
# veri setimizi import edelim
diabetes = pd.read_csv("diabetes.csv")

In [2]:
df = diabetes.copy()
df = df.dropna()
y = df["Outcome"]
X = df.drop(["Outcome"], axis=1)

In [3]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X,
                                                    y,
                                                    test_size=0.30,
                                                   random_state=42)

In [4]:
from sklearn.svm import SVC
# ön tanımlı kernel rbf'dir.
# model oluşturuldu ve fit işlemi yapıldı
svc_model = SVC(kernel="rbf").fit(X_train, y_train)

In [5]:
# y için tahmini değerler
y_pred = svc_model.predict(X_test)

In [6]:
from sklearn.metrics import accuracy_score
accuracy_score(y_test, y_pred)

0.7359307359307359

# RBF SVC - Model Tuning

Daha önce regresyon bölümünde model tuning işlemleri sırasında C hiperparametresini görmüştük. C hiperparametresi, Aykırı gözlemlerin etkilerini kontrol ederek düzlemin oluşumunu denetlemek için kullanılır. İşte burada da C hiperparametresinin aynı görevi üstlendiğini gözlemliyoruz.

Ancak bu sefer C hiperparametresine ek olarak gama hiperparametresinin de önemi ortaya çıkıyor. rbf kernel ile ilgili verilmesi gereken bir parametredir. gama hiperparametresini ayarlamamız gerekiyor. Gama hiperparametresi olmadan da bu uygulamayı yapabiliriz, ancak bu durumda test hatası, sanki hiçbir işlem yapılmamış gibi bulunur, çünkü gama'nın etkisi oldukça büyüktür.

Sonuç olarak, hiperparametre ayarlamaları yaparken dikkate almanız gereken iki ana parametre bulunur: gama ve C.

In [11]:
svc_params = {
    "C":[0.0001, 0.001, 0.1, 1, 5, 10, 50, 100],
    "gamma":[0.0001, 0.001, 0.1, 1, 5, 10, 50, 100]
}

In [12]:
# model nesnesi
svc = SVC(kernel="rbf")

In [13]:
from sklearn.model_selection import GridSearchCV
# model nesnesini GridSearchCV içerisine koydum
svc_cv_model = GridSearchCV(svc,
                         svc_params,
                         cv=10,
                         n_jobs=-1,
                         verbose=2)

In [14]:
# modelin kurulumu
svc_cv_model.fit(X_train, y_train)

Fitting 10 folds for each of 64 candidates, totalling 640 fits


GridSearchCV(cv=10, estimator=SVC(), n_jobs=-1,
             param_grid={'C': [0.0001, 0.001, 0.1, 1, 5, 10, 50, 100],
                         'gamma': [0.0001, 0.001, 0.1, 1, 5, 10, 50, 100]},
             verbose=2)

[CV] END .............................C=0.0001, gamma=0.0001; total time=   1.3s
[CV] END ................................C=0.0001, gamma=0.1; total time=   0.0s
[CV] END ..................................C=0.0001, gamma=1; total time=   0.0s
[CV] END ..................................C=0.0001, gamma=5; total time=   0.0s
[CV] END .................................C=0.0001, gamma=10; total time=   0.0s
[CV] END ................................C=0.0001, gamma=100; total time=   0.0s
[CV] END ................................C=0.0001, gamma=100; total time=   0.0s
[CV] END ...............................C=0.001, gamma=0.001; total time=   0.0s
[CV] END ...............................C=0.001, gamma=0.001; total time=   0.0s
[CV] END ...................................C=0.001, gamma=5; total time=   0.0s
[CV] END ...................................C=0.001, gamma=5; total time=   0.0s
[CV] END ...................................C=0.001, gamma=5; total time=   0.0s
[CV] END ...................

In [15]:
# optimum parametreler
print("En iyi parametreler: " + str(svc_cv_model.best_params_))

En iyi parametreler: {'C': 10, 'gamma': 0.0001}


In [16]:
# bulmuş olduğumuz optimum parametreler ile final modelini kurdum
svc_tuned = SVC(kernel = "rbf", C = 10, gamma = 0.0001).fit(X_train, y_train)

In [17]:
# y tahmini değerler
y_pred = svc_tuned.predict(X_test)

In [18]:
# doğrusal olmayan destek vektör sınıflandırma modelinin accuracy doğruluk oranı
accuracy_score(y_test, y_pred)

0.7359307359307359

Doğrusal SVM'in sonucu 0.7445887445887446 idi.