# Support Vector Machines

Referenznotebook zum Thema Support Vector Machines. Für die vollständigen Erklärungen bitte auch das Video nutzen.

## Daten einlesen

Wir verwenden hier wieder den Iris Datensatz, da wir diesen schon kennen.


In [1]:
library(ISLR)

In [2]:
head(iris)

Unnamed: 0,Sepal.Length,Sepal.Width,Petal.Length,Petal.Width,Species
1,5.1,3.5,1.4,0.2,setosa
2,4.9,3.0,1.4,0.2,setosa
3,4.7,3.2,1.3,0.2,setosa
4,4.6,3.1,1.5,0.2,setosa
5,5.0,3.6,1.4,0.2,setosa
6,5.4,3.9,1.7,0.4,setosa


## Das Modell erstellen

Wir verwenden hier die `e1071` Library. [Mehr Info hier.](https://cran.r-project.org/web/packages/e1071/index.html)


In [5]:
#install.packages('e1071',repos = 'http://cran.us.r-project.org')

In [14]:
library(e1071)

Wir können hier die `svm()` Funktion verwenden um das Modell zu erstellen und um das SVM Modell zu trainieren.


In [15]:
help(svm)

0,1
svm {e1071},R Documentation

0,1
formula,a symbolic description of the model to be fit.
data,an optional data frame containing the variables in the model. By default the variables are taken from the environment which ‘svm’ is called from.
x,"a data matrix, a vector, or a sparse matrix (object of class Matrix provided by the Matrix package, or of class matrix.csr provided by the SparseM package, or of class simple_triplet_matrix provided by the slam package)."
y,a response vector with one label for each row/component of x. Can be either a factor (for classification tasks) or a numeric vector (for regression).
scale,"A logical vector indicating the variables to be scaled. If scale is of length 1, the value is recycled as many times as needed. Per default, data are scaled internally (both x and y variables) to zero mean and unit variance. The center and scale values are returned and used for later predictions."
type,"svm can be used as a classification machine, as a regression machine, or for novelty detection. Depending of whether y is a factor or not, the default setting for type is C-classification or eps-regression, respectively, but may be overwritten by setting an explicit value. Valid options are:  C-classification  nu-classification  one-classification (for novelty detection)  eps-regression  nu-regression"
kernel,"the kernel used in training and predicting. You might consider changing some of the following parameters, depending on the kernel type. linear:u'*v polynomial:(gamma*u'*v + coef0)^degree radial basis:exp(-gamma*|u-v|^2) sigmoid:tanh(gamma*u'*v + coef0)"
degree,parameter needed for kernel of type polynomial (default: 3)
gamma,parameter needed for all kernels except linear (default: 1/(data dimension))
coef0,parameter needed for kernels of type polynomial and sigmoid (default: 0)

0,1
SV,The resulting support vectors (possibly scaled).
index,The index of the resulting support vectors in the data matrix. Note that this index refers to the preprocessed data (after the possible effect of na.omit and subset)
coefs,The corresponding coefficients times the training labels.
rho,The negative intercept.
sigma,"In case of a probabilistic regression model, the scale parameter of the hypothesized (zero-mean) laplace distribution estimated by maximum likelihood."
"probA, probB","numeric vectors of length k(k-1)/2, k number of classes, containing the parameters of the logistic distributions fitted to the decision values of the binary classifiers (1 / (1 + exp(a x + b)))."


In [7]:
model <- svm(Species ~ ., data=iris)

In [9]:
summary(model)


Call:
svm(formula = Species ~ ., data = iris)


Parameters:
   SVM-Type:  C-classification 
 SVM-Kernel:  radial 
       cost:  1 
      gamma:  0.25 

Number of Support Vectors:  51

 ( 8 22 21 )


Number of Classes:  3 

Levels: 
 setosa versicolor virginica







## Vorhersage Beispiel

Da wir einen kleinen Datensatz haben werden wir ihn nicht in Test- und Trainingsdatensatz aufteilen (was immer versucht werden sollte), sondern werden wir hier das Modell mit demselben Datensatz testen, mit dem wir es trainiert haben. 


In [11]:
predicted.values <- predict(model,iris[1:4])

In [13]:
table(predicted.values,iris[,5])

                
predicted.values setosa versicolor virginica
      setosa         50          0         0
      versicolor      0         48         2
      virginica       0          2        48

Wie wir schon mal bei dem Iris Datensatz gesehen haben, lassen sich die Setosa Werte leicht von dem Rauschen zwischen Versicolor und Virginica trennen. 



## Fortgeschrittenes Tuning

Wir können versuchen die Parameter zu tunen um unser Modell zu verbessern. Du kannst mit der `help()` Funktion die Dokumentation aufrufen um nachzuvollziehen was jeder Parameter bedeutet. Wir verwenden die `tune` Funktion:



In [19]:
# Tunen nach Kombinationen von gamma 0.5,1,2
# and costs 1/10 , 10 , 100
tune.results <- tune(svm,train.x=iris[1:4],train.y=iris[,5],kernel='radial',
                  ranges=list(cost=10^(-1:2), gamma=c(.5,1,2)))

In [20]:
summary(tune.results)


Parameter tuning of ‘svm’:

- sampling method: 10-fold cross validation 

- best parameters:
 cost gamma
    1   0.5

- best performance: 0.04666667 

- Detailed performance results:
    cost gamma      error dispersion
1    0.1   0.5 0.05333333 0.06885304
2    1.0   0.5 0.04666667 0.04499657
3   10.0   0.5 0.05333333 0.05258738
4  100.0   0.5 0.06000000 0.04919099
5    0.1   1.0 0.06666667 0.05443311
6    1.0   1.0 0.06000000 0.06629526
7   10.0   1.0 0.06000000 0.06629526
8  100.0   1.0 0.07333333 0.06629526
9    0.1   2.0 0.10000000 0.06478835
10   1.0   2.0 0.06000000 0.06629526
11  10.0   2.0 0.06000000 0.06629526
12 100.0   2.0 0.06666667 0.07027284


Wir können nun sehen, dass die beste Performance bei cost=1 und gamma=0.5 stattfindet. Du kannst nun das Modell mit diesen Parametern trainieren um eventuell besseres Modell zu bekommen.

In [21]:
tuned.svm <- svm(Species ~ ., data=iris, kernel="radial", cost=1, gamma=0.5)

In [22]:
summary(tuned.svm)


Call:
svm(formula = Species ~ ., data = iris, kernel = "radial", cost = 1, 
    gamma = 0.5)


Parameters:
   SVM-Type:  C-classification 
 SVM-Kernel:  radial 
       cost:  1 
      gamma:  0.5 

Number of Support Vectors:  59

 ( 11 23 25 )


Number of Classes:  3 

Levels: 
 setosa versicolor virginica




In [26]:
tuned.predicted.values <- predict(tuned.svm,iris[1:4])

In [27]:
table(tuned.predicted.values,iris[,5])

                      
tuned.predicted.values setosa versicolor virginica
            setosa         50          0         0
            versicolor      0         48         2
            virginica       0          2        48

Es sieht danach aus, dass wir unser Modell nicht verbessern konnten. Das Verfahren ein Modell einfach mit vielen verschiedenen Parametern zu Tunen wird Grid Search genannt. In diesem Fall hier haben wir vermutlich zu wenig Daten um unser Modell durch sorgfältige Parameterauswahl zu verbessern. 

## Gut gemacht! 