# Destek Vektör Makineleri, DVM (Support Vector Machines, SVM)
Hazırlayan: Utku Karaca

- Sınıflandırma problemleri.
    - İkili
    - Çoklu

- İkili sınıflandırma: $\{+1, -1\}$
$$f: \mathbb{R}^D \rightarrow \{+1, -1\}$$

- Güdümlü öğrenme (Supervised Learning)
- Örneğin:
<table><tr>
<td> <img src="svm.png" alt="Veri kümesi" style="width: 250px;"/> </td>
<td> <img src="svm2.png" alt="Muhtemel Hiperdüzlem" style="width: 250px;"/> </td>
</tr></table>

- Ayırıcı hiperdüzlem (Seperating Hyperplane)
- Eğitim sırasında amaç öyle bir hiperdüzlem yaratmak ki
    - $y_n = +1$ ise $$\langle\mathbf{w}, x_n\rangle + b \geq 0$$
    - $y_n = -1$ ise $$\langle\mathbf{w}, x_n\rangle + b < 0$$
- İki sınıf arasındaki uzaklığı (margin) en çoklayan hiperdüzlem


Gerekli kütüphaneler

In [None]:
# Veri kümesi
from sklearn.datasets import load_breast_cancer
# Model
from sklearn.svm import SVC
# Model değerlendirilmesi
from sklearn.metrics import plot_confusion_matrix, classification_report
# Eğitim ve test kümelerinin oluşturulması
from sklearn.model_selection import train_test_split
# Görselleştirme
import matplotlib.pyplot as plt

Verinin yüklenmesi
- Meme kanseri veri kümesi
- Öznitelikler: Meme kitleleri görüntüleri
- Kaynak: https://archive.ics.uci.edu/ml/datasets/breast+cancer+wisconsin+(diagnostic)

In [None]:
veri = load_breast_cancer()
X = veri.data
y = veri.target

print("Öznitelik matris boyutları:",X.shape)
print("Etiket sayısı:",y.shape)

from collections import Counter
print("İyi huylu:",Counter(y)[0])
print("Kötü huylu:",Counter(y)[1])

Örnek veri

In [None]:
print('İlk veri öznitelikleri:\n',X[0])
print('İlk veri etiketi:', y[0])

Veri kümesini eğitim ve test olarak ikiye ayırma

In [None]:
# Egitim, test verisi yaratma
X_egitim, X_test, y_egitim, y_test = train_test_split(X, y,
                                                      test_size = 0.2,
                                                      random_state = 3,
                                                      stratify = y)

X_egitim.shape
print(Counter(y_egitim))

Model oluşturulması ve eğitilmesi

In [None]:
# Model olusturma
dvm = SVC(C = 1, kernel = 'linear')

# Modelin uydurulmasi
dvm.fit(X_egitim, y_egitim)

Test verilerinin kestirimi

In [None]:
tahmin_test = dvm.predict(X_test)

print(tahmin_test)

Sınıflandırma raporu

In [None]:
print('dvm için sınıflandırma raporu:\n', 
      classification_report(y_test, tahmin_test))

gorsel = plot_confusion_matrix(dvm, 
                               X_test,
                               y_test)

# precision: kesinlik
# recall: doğru bulma oranı

Hata matrisi

In [None]:
gorsel.figure_.suptitle("Hata matrisi")

print('Hata matrisi:\n', gorsel.confusion_matrix)

Farklı çekirdek ile yeni bir model

In [None]:
# Model olusturma
dvm = SVC(C = 1, kernel = 'poly')

# Modelin uydurulmasi
dvm.fit(X_egitim, y_egitim)

Test verilerinin kestirimi

In [None]:
tahmin_test = dvm.predict(X_test)

Hata matrisi

In [None]:
print('dvm için sınıflandırma raporu:\n', 
      classification_report(y_test, tahmin_test))

gorsel = plot_confusion_matrix(dvm, 
                               X_test,
                               y_test)

# precision: kesinlik
# recall: doğru bulma oranı