# Support Vector Machine (SVM) e Como Usá-los com Scikit-Learn

## O que é SVM?
O **Support Vector Machine (SVM)** é um algoritmo de aprendizado supervisionado utilizado principalmente para problemas de **classificação**, mas também pode ser aplicado a **regressão** e **detecção de anomalias**. O principal objetivo do SVM é encontrar o **hiperplano** que melhor separa as classes em um espaço de características.

### Como Funciona o SVM?
O SVM busca o hiperplano que maximiza a **margem** entre as classes, ou seja, a distância entre os pontos mais próximos de cada classe e o hiperplano. Esses pontos são chamados de **vetores de suporte**.

Quando os dados não são linearmente separáveis, o SVM utiliza o **truque do kernel**, que mapeia os dados para um espaço de dimensão superior onde as classes podem ser separadas.

#### Tipos de Kernel:
Os principais tipos de kernel usados no SVM são:
- **Linear**: para dados linearmente separáveis.
- **Polinomial**: para problemas com fronteiras de decisão complexas.
- **RBF (Radial Basis Function)**: o mais usado para problemas não-lineares.
- **Sigmoid**: utilizado ocasionalmente, mas menos comum.

## Como Usar SVM no Scikit-Learn?
A biblioteca `scikit-learn` facilita a implementação de SVM com a classe `SVC` para **classificação** e `SVR` para **regressão**.

### Exemplo Prático: Classificação com SVM


In [1]:
# Importando as bibliotecas necessárias
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score, classification_report

# Carregando um dataset de exemplo
data = datasets.load_iris()
X = data.data  # Características
y = data.target  # Rótulos

# Dividindo o dataset em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Criando o modelo SVM com kernel RBF
svm_model = SVC(kernel='rbf', C=1, gamma='scale')  # C controla a margem e gamma controla a largura do kernel

# Treinando o modelo
svm_model.fit(X_train, y_train)

# Fazendo previsões
y_pred = svm_model.predict(X_test)

# Avaliando o modelo
accuracy = accuracy_score(y_test, y_pred)
print(f"Acurácia do modelo: {accuracy:.2f}")
print("Relatório de Classificação:\n", classification_report(y_test, y_pred))

Acurácia do modelo: 1.00
Relatório de Classificação:
               precision    recall  f1-score   support

           0       1.00      1.00      1.00        19
           1       1.00      1.00      1.00        13
           2       1.00      1.00      1.00        13

    accuracy                           1.00        45
   macro avg       1.00      1.00      1.00        45
weighted avg       1.00      1.00      1.00        45



### Parâmetros Importantes:
- **C**: Controla a penalidade para erros. Valores mais altos de `C` resultam em um modelo com uma margem menor, mas maior precisão no treinamento.
- **kernel**: Define o tipo de kernel a ser usado (`linear`, `poly`, `rbf`, `sigmoid`).
- **gamma**: Controla a influência de cada ponto de treinamento. Valores mais altos de `gamma` tornam o modelo mais focado nos dados de treinamento, o que pode levar ao overfitting.

### Ajuste dos Hiperparâmetros
Você pode usar técnicas como `GridSearchCV` para encontrar os melhores valores de `C,` `kernel`, e `gamma`:

In [2]:
from sklearn.model_selection import GridSearchCV

# Definindo a grade de parâmetros
param_grid = {
    'C': [0.1, 1, 10],
    'gamma': ['scale', 'auto', 0.1, 1],
    'kernel': ['linear', 'rbf', 'poly']
}

# Configurando a busca de grade
grid = GridSearchCV(SVC(), param_grid, refit=True, verbose=2)
grid.fit(X_train, y_train)

# Melhor modelo
print("Melhores parâmetros:", grid.best_params_)


Fitting 5 folds for each of 36 candidates, totalling 180 fits
[CV] END ..................C=0.1, gamma=scale, kernel=linear; total time=   0.0s
[CV] END ..................C=0.1, gamma=scale, kernel=linear; total time=   0.0s
[CV] END ..................C=0.1, gamma=scale, kernel=linear; total time=   0.0s
[CV] END ..................C=0.1, gamma=scale, kernel=linear; total time=   0.0s
[CV] END ..................C=0.1, gamma=scale, kernel=linear; total time=   0.0s
[CV] END .....................C=0.1, gamma=scale, kernel=rbf; total time=   0.0s
[CV] END .....................C=0.1, gamma=scale, kernel=rbf; total time=   0.0s
[CV] END .....................C=0.1, gamma=scale, kernel=rbf; total time=   0.0s
[CV] END .....................C=0.1, gamma=scale, kernel=rbf; total time=   0.0s
[CV] END .....................C=0.1, gamma=scale, kernel=rbf; total time=   0.0s
[CV] END ....................C=0.1, gamma=scale, kernel=poly; total time=   0.0s
[CV] END ....................C=0.1, gamma=scale