# Suport Vector Machine

[SMV](https://scikit-learn.org/stable/modules/svm.html) significa "Support Vector Machine" (Máquina de Vetores de Suporte) e é um tipo de algoritmo de aprendizado de máquina usado para __classificação__ e __regressão__. Ele funciona mapeando os dados em um espaço de alta dimensionalidade e encontrando um hiperplano que separa as diferentes classes de dados da melhor maneira possível.

- O SVM cria uma linha ou superfície (hiperplano) que divide os dados em dois grupos.
- Os pontos mais próximos do hiperplano, chamados de "vetores de suporte", são os que mais influenciam a posição do hiperplano.
- O objetivo do SVM é encontrar o hiperplano que maximiza a margem entre os dois grupos de dados.


<img src="../assets/4-svc.png"
     alt="Features and Labels"
     style="float: center; margin-right: 10px;" />
     


## Como funciona?

__Mapeamento para um espaço de alta dimensionalidade:__ O SVM pode mapear os dados para um espaço de alta dimensionalidade, onde é mais fácil encontrar um hiperplano que separa os dados.

__Encontrar o hiperplano:__ O SVM usa um algoritmo para encontrar o hiperplano que maximiza a margem entre os dois grupos de dados.

__Classificação de novos dados:__ Novos dados podem ser classificados usando o hiperplano aprendido. Se um novo dado estiver mais próximo do hiperplano de uma classe do que da outra, ele será classificado nessa classe.

## Kernel
No mundo do aprendizado de máquina, o termo kernel tem um significado diferente do utilizado para sistemas operacionais. Aqui, o kernel se refere à função kernel, usada em uma técnica chamada kernel trick (maneira do kernel).

Imagine que você tem dados que não podem ser facilmente separados em categorias usando um algoritmo linear, como um classificador linear. O kernel trick entra em cena para resolver esse problema.

Funciona assim:
- __Transformação:__ A função kernel pega seus dados originais e os mapeia para um espaço de alta dimensão. Pense como se estivesse esticando os dados em um espaço maior.
- __Separação em alta dimensão:__ Nesse espaço de alta dimensão, torna-se possível separar linearmente os seus dados. Isso porque o kernel pode ter criado novas dimensões que ajudam a destacar as diferenças entre as categorias.
- __Volta para a dimensão original__: Embora o algoritmo funcione no espaço de alta dimensão, o kernel trick evita a necessidade de realmente fazer cálculos complexos lá. Ele mapeia os resultados de volta para a dimensão original para serem interpretados.

Resumindo, o kernel é como uma ferramenta que transforma seus dados para torná-los separáveis por algoritmos lineares, mesmo que originalmente eles fossem não lineares. Isso é útil em tarefas de aprendizado de máquina como classificação e regressão.

In [None]:
from sklearn import datasets
from sklearn.model_selection import train_test_split
import numpy as np

In [None]:
iris = datasets.load_iris()

Split it in features and labels

In [None]:
x = iris.data
y = iris.target

In [None]:
x.shape, y.shape

Split it in Train set and Test set

In [None]:
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)

Importing SVM Algorith

In [None]:
from sklearn import svm

In [None]:
classes = ['Iris Setosa', 'Iris Versicolour', 'Iris Virginica']

Create model and train the model

In [None]:
model = svm.SVC()
model.fit(x_train, y_train)

In [None]:
model

In [None]:
x_train.shape, x_test.shape, y_train.shape, y_test.shape, 

Determine the accuracy

In [None]:
from sklearn.metrics import accuracy_score

In [None]:
predictions = model.predict(x_test)
accuracy = accuracy_score(y_test, predictions)

predictions, accuracy

In [None]:
print(f'prediciyion: {predictions}')
print(f'actual value: {y_test}')
print(f'accuracy: {accuracy}')

In [None]:
for i in range(len(predictions)):
    print(classes[predictions[i]])