# SVM - Support Vector Machine.
É um algoritmo de classificação de aprendizado de máquina supervisionado, ela é um descriminador que formalmente projetado por um hiperplano separativo. É uma representação de exemplos como pontos no espaço que são mapeados de forma que os pontos de diferentes categorias seja separados por uma lacuna o mais ampla possivel alem disso SVM também pode realizar a classificação não linear.
$\newline$ O principal objetivo é fazer uma segregação, de distâncias entre os pontos mais próximos é conhecida como margem, a abordagem é selecionar um hiperplano com a margem máxima possivel entre os vetores de suporte nos conjuntos de dados.

![img](https://miro.medium.com/max/671/1*TxAz4VR3Liecnnjnh5vXQA.png)

### Definição.

$$\overrightarrow{w} \cdot \overrightarrow{x} - b = \left\{\begin{matrix}
 -1 & \text{primeiro vetor suport} \\ 0 &\text{hiperplano} \\ 1 & \text{segundo vetor suport}
\end{matrix}\right.$$

* Linear: Como mencionado anteriormente, é eficiente somente para problemas linearmente separáveis, uma vez que seu ajuste se da através da equação de uma reta. O kernel linear é definido apenas pelo produto entre duas amostra

$$ k(\overrightarrow{x_i}, \overrightarrow{x_j}) = \overrightarrow{x_i} \cdot \overrightarrow{x_j}$$

* Polinomial: s kernels polinomiais popularmente utilizados em tarefas de processamento de imagens, permitem adicionar curvas aos hiperplanos. Além das amostras $\overrightarrow{x_i}$ e $\overrightarrow{x_j}$ o kernel polinomial também recebe o a variável $d$ que indica o seu grau, como definido pela equação:

$$k(\overrightarrow{x_i}, \overrightarrow{x_j}) = (\overrightarrow{x_i} \cdot \overrightarrow{x_j} +1 )^d$$

* Função gaussiana de base radial:são recomendados quando não se tem um conhecimento prévio acerca dos dados. Esse kernel realiza uma transformação dos pontos utilizando uma função gaussiana, definida por:

$$k(\overrightarrow{x_i},\overrightarrow{x_j}) = exp(-\frac{||\overrightarrow{x_i} - \overrightarrow{x_j}||^2}{2\sigma^2})$$

## Pros.
* Eficaz em espaços dimensionais elevados.
* Ainda eficaz nos casos em que o número de dimensões é maior do que o número de amostras.
* Usa um subconjunto de pontos de treinamento da função de decisão que torna a memória eficiente.
* Diferentes funções do kernel podem ser especificadas para a função de decisão, o que também a torna versátil.

## Contra.
* Se o números de recursos foi muito maior do que o número de amostras, evite o sobreajuste na escolha das funções do kernel e o termo de regularização é crucial.
* Não fornecem estimativas de probabilidade diretamente, elassão calculadas usando validação cruzada quíntupla.

## Casos de uso.
* Detecção de rosto
* Categorização de texto e hipertexto
* Classificação de imagens
* Bioinformática
* Dobra de proteína e detecção de homologia remota
* Reconhecimento de caligrafia
* Controle preditivo generalizado

# Prática.

In [3]:
from sklearn import datasets

cancer = datasets.load_breast_cancer()

In [5]:
print("Features: ", cancer.feature_names)
print("Labels: ", cancer.target_names)


Features:  ['mean radius' 'mean texture' 'mean perimeter' 'mean area'
 'mean smoothness' 'mean compactness' 'mean concavity'
 'mean concave points' 'mean symmetry' 'mean fractal dimension'
 'radius error' 'texture error' 'perimeter error' 'area error'
 'smoothness error' 'compactness error' 'concavity error'
 'concave points error' 'symmetry error' 'fractal dimension error'
 'worst radius' 'worst texture' 'worst perimeter' 'worst area'
 'worst smoothness' 'worst compactness' 'worst concavity'
 'worst concave points' 'worst symmetry' 'worst fractal dimension']
Labels:  ['malignant' 'benign']


In [6]:
cancer.data.shape

(569, 30)

In [7]:
print(cancer.target)

[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 1 0 0 0 0 0 0 0 0 1 0 1 1 1 1 1 0 0 1 0 0 1 1 1 1 0 1 0 0 1 1 1 1 0 1 0 0
 1 0 1 0 0 1 1 1 0 0 1 0 0 0 1 1 1 0 1 1 0 0 1 1 1 0 0 1 1 1 1 0 1 1 0 1 1
 1 1 1 1 1 1 0 0 0 1 0 0 1 1 1 0 0 1 0 1 0 0 1 0 0 1 1 0 1 1 0 1 1 1 1 0 1
 1 1 1 1 1 1 1 1 0 1 1 1 1 0 0 1 0 1 1 0 0 1 1 0 0 1 1 1 1 0 1 1 0 0 0 1 0
 1 0 1 1 1 0 1 1 0 0 1 0 0 0 0 1 0 0 0 1 0 1 0 1 1 0 1 0 0 0 0 1 1 0 0 1 1
 1 0 1 1 1 1 1 0 0 1 1 0 1 1 0 0 1 0 1 1 1 1 0 1 1 1 1 1 0 1 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 1 1 1 1 1 1 0 1 0 1 1 0 1 1 0 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1
 1 0 1 1 0 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 0 1 0 1 1 1 1 0 0 0 1 1
 1 1 0 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 1 0 0
 0 1 0 0 1 1 1 1 1 0 1 1 1 1 1 0 1 1 1 0 1 1 0 0 1 1 1 1 1 1 0 1 1 1 1 1 1
 1 0 1 1 1 1 1 0 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 0 1 0 0 1 0 1 1 1 1 1 0 1 1
 0 1 0 1 1 0 1 0 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 0 1
 1 1 1 1 1 1 0 1 0 1 1 0 

In [8]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(cancer.data, cancer.target, test_size=0.3,random_state=109 )

In [9]:
from sklearn import svm

clf = svm.SVC(kernel='linear')

In [10]:
clf.fit(X_train,y_train)

SVC(kernel='linear')

In [11]:
y_pred = clf.predict(X_test)

In [12]:
from sklearn import metrics

print("Acurracy:", metrics.accuracy_score(y_test,y_pred))

Acurracy: 0.9649122807017544
