# Máquinas de Vetores de Suporte (Support Vector Machines - SVM)
# SVMs (Support Vector Machines) são modelos de aprendizado de máquina que são utilizados para classificação e regressão. Eles funcionam encontrando o hiperplano que melhor separa diferentes classes de dados. Em espaços de duas dimensões, este hiperplano é uma linha.

## Como Funcionam?

* Margem Máxima: SVMs tentam maximizar a margem entre as diferentes classes. A margem é a distância entre o hiperplano separador e os pontos de dados mais próximos de cada classe, conhecidos como vetores de suporte.
* Kernels: Em casos onde os dados não são linearmente separáveis, SVMs utilizam funções de kernel para transformar os dados em um espaço onde se tornem linearmente separáveis.

### Vantagens
* Eficaz em Espaços de Grandes Dimensões: SVMs são particularmente eficazes em casos onde o número de dimensões é maior que o número de amostras.
* Uso Eficiente de Memória: Utilizam um subconjunto de pontos de treinamento na função de decisão (os chamados vetores de suporte), o que os torna bastante eficientes em termos de memória.
* Versatilidade: A função do kernel pode ser adaptada às necessidades específicas dos dados, o que torna o SVM muito versátil. Kernels comuns incluem lineares, polinomiais, RBF (Radial Basis Function) e sigmóides.
* Alto Poder de Generalização: A característica de maximização da margem permite que o SVM tenha um bom desempenho de generalização, o que significa que tem uma menor tendência ao sobreajuste.

### Desvantagens
* Não Adequado para Grandes Conjuntos de Dados: Devido à sua complexidade computacional, os SVMs não são a melhor escolha para conjuntos de dados muito grandes.
* Escolha do Kernel e Ajuste de Parâmetros: A escolha do kernel e a otimização dos parâmetros do SVM (como o parâmetro C de regularização) podem ser complicadas e requerem uma boa compreensão de como funcionam os SVMs.
* Não Fornece Estimativas de Probabilidade Diretamente: SVMs não fornecem estimativas probabilísticas de forma direta, estas são calculadas usando uma validação cruzada cara em termos computacionais.
* Sensível à Escala dos Dados: SVMs são sensíveis à escala dos dados de entrada, portanto, geralmente é necessário normalizar os dados antes de aplicar SVM.

### Exemplo de código

#### Importação de Bibliotecas e Dados:

In [1]:
from sklearn import datasets
from sklearn.svm import SVC
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix, classification_report
from sklearn.preprocessing import StandardScaler

# Carregando o dataset de dígitos
digits = datasets.load_digits()
X = digits.data
y = digits.target

#### Pré-processamento: Normalizar os dados pode ser crucial para o desempenho do SVM.

In [2]:
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

#### Divisão do Dataset em Treino e Teste:

In [3]:
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.3, random_state=42)

### Treinamento do Modelo SVM:

In [4]:
svm_model = SVC(kernel='linear', random_state=42)
svm_model.fit(X_train, y_train)


#### Previsões e Avaliação:

In [5]:
y_pred = svm_model.predict(X_test)

# Matriz de Confusão e Relatório de Classificação
conf_matrix = confusion_matrix(y_test, y_pred)
class_report = classification_report(y_test, y_pred)

In [6]:
conf_matrix

array([[53,  0,  0,  0,  0,  0,  0,  0,  0,  0],
       [ 0, 49,  0,  0,  0,  0,  0,  0,  1,  0],
       [ 0,  0, 47,  0,  0,  0,  0,  0,  0,  0],
       [ 0,  0,  1, 52,  0,  1,  0,  0,  0,  0],
       [ 0,  0,  0,  0, 60,  0,  0,  0,  0,  0],
       [ 0,  0,  0,  1,  0, 63,  1,  0,  0,  1],
       [ 1,  0,  0,  0,  0,  0, 52,  0,  0,  0],
       [ 0,  0,  0,  0,  0,  0,  0, 54,  0,  1],
       [ 0,  1,  0,  0,  0,  1,  0,  0, 41,  0],
       [ 0,  0,  0,  1,  0,  0,  0,  0,  1, 57]])

In [8]:
print(class_report)

              precision    recall  f1-score   support

           0       0.98      1.00      0.99        53
           1       0.98      0.98      0.98        50
           2       0.98      1.00      0.99        47
           3       0.96      0.96      0.96        54
           4       1.00      1.00      1.00        60
           5       0.97      0.95      0.96        66
           6       0.98      0.98      0.98        53
           7       1.00      0.98      0.99        55
           8       0.95      0.95      0.95        43
           9       0.97      0.97      0.97        59

    accuracy                           0.98       540
   macro avg       0.98      0.98      0.98       540
weighted avg       0.98      0.98      0.98       540

