# <font color='red'>Algoritmo SVM</font>

###### Por: Marcus Rosa Godoi

As máquinas de vetores de suporte (SVMs) são um conjunto de métodos de aprendizado supervisionado usados ​​para classificação, regressão e detecção de outliers.

As vantagens das máquinas de vetores de suporte são:

 1. Eficaz em espaços de alta dimensão.

 2. Ainda é eficaz nos casos em que o número de dimensões é maior que o número de amostras.

 3. Utiliza um subconjunto de pontos de treinamento na função de decisão (denominada vetores de suporte), portanto, também é eficiente em termos de memória

Fonte:<a href="https://scikit-learn.org/stable/modules/svm.html#svm-classification">scikit-learn.org/</a>

# 1 - Scikit-learn
<a href="https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html#sklearn.svm.SVC">scikit-learn.org/</a>

In [None]:
#Import
from sklearn.svm import SVC #C-Support Vector Classification.

In [None]:
#Parametros
SVC(C=1.0, 
    kernel='rbf', 
    degree=3, 
    gamma='scale', 
    coef0=0.0, 
    shrinking=True, 
    probability=False, 
    tol=0.001, 
    cache_size=200, 
    class_weight=None, 
    verbose=False, 
    max_iter=-1, 
    decision_function_shape='ovr', 
    break_ties=False, 
    random_state=None) 

In [None]:
# Criando o modelo preditivo usando SCIKIT-LEARN
svm = SVC()

In [None]:
# Treinando o modelo
modelo.fit(x_treino, y_treino)

## 1.1 Seleção de Atributos
Usando abordagem estatística univariada.

In [None]:
resultados = cross_val_score(modelo, 
                         x_treino, 
                         y_treino, 
                         cv=10,
                         n_jobs= -1,
                         scoring = 'mean_squared_error')

In [None]:
media = resultados.mean()
std = resultados.std()
print('Média: ', media)
print('Std: ', std)

In [None]:
melhor_resultado = media

### Obter pontuação usando modelos com seleção de recursos

In [None]:
for i in range(1, x_treino_poly.shape[1]+1, 1):
    # Select i atributos
    select = SelectKBest(score_func=chi2, k=i) #chi2 = qui-quadrado
    select.fit(x_treino_poly, y_treino)
    x_treino_poly_selected = select.transform(x_treino_poly)

    # Modelo com i atributos selecionados
    modelo.fit(x_treino_poly_selected, y_treino)
    resultados = cross_val_score(modelo, x_treino_poly_selected, y_treino, cv=10)
    media = resultados.mean()
    std = resultados.std()
    print('Média: ', media)
    print('Std: ', desvio)
    print('CV acuracia: ', media, '+/- ', std)
    
    # Salvar resultados se melhorar a pontuação
    if np.mean(resultados) > melhor_resultado:
        melhor_resultado = media
        melhor_std = std
        k_atributos_melhor_resultado = i
    elif media == melhor_resultado:
        if std <  melhor_std:
            melhor_resultado = media
            melhor_std = std
            k_atributos_melhor_resultado = i

In [None]:
print('Número de atributos com melhor pontuação: ', k_atributos_melhor_resultado)

### Selecionar Atributos

In [None]:
select = SelectKBest(score_func = chi2, k = k_atributos_melhor_resultado)
select.fit(x_treino_poly, y_treino)
x_treino_poly_selected = select.transform(x_treino_poly)

### Treinar Modelo

In [None]:
modelo = SVC()

modelo.fit(x_treino_poly_selected, y_treino)

### Resultados


In [None]:
resultados = cross_val_score(modelo, 
                         x_treino_poly_selected, 
                         y_treino, 
                         cv=10,
                         n_jobs= -1,
                         scoring = 'mean_squared_error')

### Curva de Aprendizado

In [None]:
title = "Curva de Aprendizado (SVM)"
cv = 10
plot_learning_curve(modelo, 
                    title, 
                    x_treino_poly_selected,
                    y_treino, 
                    ylim = (0.7, 1.01), 
                    cv = cv, 
                    n_jobs = -1);

### Curva de Validação

In [None]:
title = 'Curva de Validação (SVM)'
param_name = 'C'
param_range =[0.001, 0.01, 0.1, 1, 10]
cv = 10
plot_validation_curve(estimator=modelo, 
                      title = title, 
                      X = x_treino_poly_selected, 
                      y = y_treino, 
                      param_name = param_name, 
                      ylim = (0.5, 1.01), 
                      param_range = param_range);

### Fazer a mesma transformação com os dados de teste.

## 1.2 - Verificando a exatidão no modelo nos dados de teste

In [None]:
previsao1 = modelo.predict(x_teste)
previsao2 = resultado.predict(x_teste)

In [None]:
print("Taxa de Acerto (Accuracy): {0:.6f}%".format(accuracy_score(y_teste, previsao1)*100))

In [None]:
print("Taxa de Acerto (Accuracy): {0:.6f}%".format(accuracy_score(y_teste, previsao2)*100))

In [None]:
print("Classification Report")
print(metrics.classification_report(y_teste, previsao1, labels = [1, 0]));

In [None]:
print("Classification Report")
print(metrics.classification_report(y_teste, previsao2, labels = [1, 0]));

In [None]:
# Criando uma Confusion Matrix

print("Confusion Matrix")
confusao1 = confusion_matrix(y_teste, previsao1)
confusao1

In [None]:
# Criando uma Confusion Matrix

print("Confusion Matrix")
confusao2 = confusion_matrix(y_teste, previsao2)
confusao2

## 1.3 - Tuning

C = [0.001, 0.01, 0.1, 1, 10]

gammas = [0.001, 0.01, 0.1, 1, "auto"]

kernel = ['linear', 'poly', 'rbf', 'sigmoid', 'precomputed']

# Fim

### Obrigado - Marcus Rosa Godoi 