# <h3 align="center"> **Atividade Prática**</h3> 




<h3 align="center"> Data: 02/07/2010</h3> 

Vamos iniciar estudando o comportamento de SVM Linear
- No SktLearn, trata-se do classificador **LinearSVC** ou **svm.SVC(kernel='linear')**, embora essas duas versões possam gerar soluções ligeiramente differentes.


In [None]:
# Importando bibliotecas necessárias
import matplotlib
import matplotlib.pyplot as plt
import numpy as np
import sklearn

Abaixo há uma função criada para plotar o hiperplano de separação ótima, os vetores de suporte e a margem. O código está oculto para não poluir o notebook. Não esqueça de executar essa função.

In [None]:
#@title Função para plotar hiperplano de separação ótima, vetores de suporte e margem (hiperplano_otimo_plot)
# Função criada para plotar hiperplano de separação ótima, vetores de suporte e margem
def hiperplano_otimo_plot(X, y, modelo, ax=None):
    if ax is None:
        ax = plt.gca()
    #ax.plot(x, y) ## example plot here
    plt.plot(X[:, 0][y==0], X[:, 1][y==0], "bs", label="Classe 0")
    plt.plot(X[:, 0][y==1], X[:, 1][y==1], "g^", label="Classe 1")
    plt.legend(loc="upper center", fontsize=14) 
    # plotando a função de decisão
    ax = plt.gca()
    xlim = ax.get_xlim()
    ylim = ax.get_ylim()

    # criando um grid para avaliar o modelo
    xx = np.linspace(xlim[0], xlim[1], 30)
    yy = np.linspace(ylim[0], ylim[1], 30)
    YY, XX = np.meshgrid(yy, xx)
    xy = np.vstack([XX.ravel(), YY.ravel()]).T
    Z = modelo.decision_function(xy).reshape(XX.shape)

    # plotando a superfície de decisão e as margens
    ax.contour(XX, YY, Z, colors='k', levels=[-1, 0, 1], alpha=0.5,
            linestyles=['--', '-', '--'])

    # plotando vetores de suporte
    ax.scatter(modelo.support_vectors_[:, 0], modelo.support_vectors_[:, 1], s=100,
            linewidth=1, facecolors='none', edgecolors='k')
    return(ax)

Nós vamos criar uma base artificial (base sintética) para conseguirmos visualizar melhor o resultado das modificações nos parâmetros de SVM. É uma base composta por dois atributos e 11 instâncias.

In [None]:
#Criando a base de dados X2D e rótulos correspondentes y.
X1D = np.linspace(-12, 12, 11).reshape(-1, 1)
X = np.c_[X1D, X1D**2]
y = np.array([0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0])

#Obtendo número de instâncias e de atributos da base
X.shape

In [None]:
#A base representada no espaço de atributos mostra que esse é um problema linearmente separável
plt.plot(X[:, 0][y==0], X[:, 1][y==0], "bs", label="Classe 0")
plt.plot(X[:, 0][y==1], X[:, 1][y==1], "g^", label="Classe 1")
plt.legend(loc="upper center", fontsize=14)

plt.show()

Agora nós vamos treinar SVM linear para resolver esse problema de classificação

In [None]:
from sklearn import svm

#Vamos criar um classificador SVM linear com parâmetro de regularização C = 10
modelo = svm.SVC(kernel='linear', C=10) # Kernel Linear com parâmetro de regularização C = 10

#Vamos treinar um modelo usando a base X
modelo.fit(X, y)

Aqui nós veremos o hiperplano de separação ótima, os vetores de suporte e a margem

In [None]:
hiperplano_otimo_plot(X, y, modelo)
plt.show()

In [None]:
#Uma vez treinado o modelo, nós vamos criar uma instância separada para ser testada pelo modelo treinado
novoX =  np.array([-3.5, 85.25]).reshape(1, -1)

#Vamos verificar para qual das duas classes a nova instância será atribuída
print("Classe predita", modelo.predict(novoX))

In [None]:
#Vamos verificar onde a nova instância está localizada no espaço de atributos. A nova instância está marcada como um * vermelho

hiperplano_otimo_plot(X, y, modelo)

plt.plot(novoX[:, 0], novoX[:, 1], "r*")

plt.show()

É possível verificar que, visualmente, a classificação está correta.

##**Entendendo o efeito de *outliers* e da regularização:** nós vamos adicionar essa nova instância à base de treinamento e verificar o efeito no hiperplano de separação ótima

In [None]:
#nX será a nova base de treinamento e ny será a nova lista de rótulos

nX = np.append(X,  novoX, axis = 0)
ny = np.append(y, np.array([1]), axis =0)


Nas células seguintes, **você deve fazer o seguinte**:


1.   Treinar SVM com a nova base nX e os mesmos parâmetros utilizados para treinar X, isto é, SVM com kernel linear e com C = 10
2.   Plotar o hiperplano resultante, junto com vetores de suporte e a margem



In [None]:
# Treinando SVM com a nova base

In [None]:
#Plotando o hiperplano de separação, os vetores de suporte e a margem

**Responda**: 


**1.**  Qual a diferença do hiperplano e da margem obtidos utilizando a nova base em comparação com esses itens obtidos ao treinar SVM com a base anterior?

**2.**   O que ocasionou essas mudanças?



Nós vimos que o parâmetro de regularização C ajuda SVM a estabelecer um melhor compromisso entre viés e variância e reduzir o impacto do *overfitting*, pois passa a permitir que SVM aceite erros de treinamento.


**3.**   Nesse caso, o valor de C deve aumentar ou diminuir?

**4.**   Tente modificar o valor de C para gerar um hiperplano com mais capacidade de generalização. Mostre a figura do resultado obtido.
* Você pode modificar o valor de C usando intervalos relativamente longos, por exemplo: C = 0.1; C = 1; C = 10 e C = 100. Se for necessário, teste intervalos menores.



In [None]:
# Variando o valor de C

In [None]:
# Melhor hiperplano de separaçao obtido

# Trabalhando com problemas mais reias e com diferentes tipos de kernel

Nesse exemplo, nós utilizaremos a base **Breast Cancer** disponível no sklearn, mas originário do repositório da UCI (https://archive.ics.uci.edu/ml/datasets/breast+cancer). Trata-se de uma base de dados que foi obtida a partir de imagens digitalizadas de massas mamárias e que descrevem **dois** tipos de classe: maligno (harmful) e benigno (not harmful). Os atributos descrevem características dos núcleos celulares presentes nas imagens.

No total, são **30 atributos** ordenados: raio médio, textura média, perímetro médio, área média, suavidade média, compacidade média, concavidade média, pontos côncavos médios, simetria média, dimensão fractal média, erro de raio, erro de textura, erro de perímetro, erro de área, erro de suavidade, erro de compactação, erro de concavidade, erro de pontos côncavos, erro de simetria, erro de dimensão fractal, pior raio, pior textura, pior perímetro, pior área, pior suavidade, pior compacidade, pior concavidade, piores pontos côncavos, pior simetria e pior dimensão fractal) e um alvo (tipo de câncer).

Nós vamos utilizar o Pandas para facilitar a visualização dos dados estruturados

In [None]:
#Importando as bibliotecas
import pandas as pd
from sklearn import datasets

#Carregando a base de dados
cancer = datasets.load_breast_cancer()

In [None]:
#Vamos visualizar os dados

cancer.data

In [None]:
cancer.target

In [None]:
#Convertendo o dataset do Sklearn para o Dataframe do Pandas. Para isso,  nós vamos concatenar target e data usang o numpy 

df = pd.DataFrame(np.c_[cancer['data'], cancer['target']], columns = np.append(cancer['feature_names'], ['target']))

#Para visualizar os dados na forma de tabela
df.head()

In [None]:
#Vamos dividir a base em duas partições: treino e teste. A base de treino terá 80% das instâncias, enquanto a de teste terá 20%

from sklearn.model_selection import train_test_split

#Vamos definir X para receber as instâncias, enquanto y terá os rótulos

X = df.iloc[:, 0:-1]
y = df.iloc[:, -1]

#Dividindo a base (com seleção aleatória)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state = 42)
print(X_train.shape, y_train.shape)
print(X_test.shape, y_test.shape)

(455, 30) (455,)
(114, 30) (114,)


In [None]:
#Como os atributos originais estão em diferentes escalas, nós vamos normalizar os dados aqui

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()  
X_train = sc.fit_transform(X_train)  
X_test = sc.transform(X_test)


# Trabalhando com problemas reais e com diferentes tipos de kernel#

Nesse exemplo, nós utilizaremos a base **Breast Cancer** disponível no sklearn, mas originária do repositório da UCI (https://archive.ics.uci.edu/ml/datasets/breast+cancer). Trata-se de uma base de dados que foi obtida a partir de imagens digitalizadas de massas mamárias e que descreve **dois** tipos de classe: maligno (harmful) e benigno (not harmful). Os atributos descrevem características dos núcleos celulares presentes nas imagens.

No total, são **30 atributos** ordenados: raio médio, textura média, perímetro médio, área média, suavidade média, compacidade média, concavidade média, pontos côncavos médios, simetria média, dimensão fractal média, erro de raio, erro de textura, erro de perímetro, erro de área, erro de suavidade, erro de compactação, erro de concavidade, erro de pontos côncavos, erro de simetria, erro de dimensão fractal, pior raio, pior textura, pior perímetro, pior área, pior suavidade, pior compacidade, pior concavidade, piores pontos côncavos, pior simetria e pior dimensão fractal.

Nós vamos utilizar o Pandas para facilitar a visualização dos dados estruturados

In [None]:
#Importando as bibliotecas
import pandas as pd
from sklearn import datasets

#Carregando a base de dados
cancer = datasets.load_breast_cancer()

In [None]:
#Verificando quantidade de instâncias e de atributos
# Vamos também acessar os dados

print(cancer.data.shape)
cancer.data

In [None]:
# E  as classes
cancer.target

In [None]:
#Convertendo o dataset do Sklearn para o Dataframe do Pandas. Para isso,  nós vamos concatenar target e data usando o numpy 

df = pd.DataFrame(np.c_[cancer['data'], cancer['target']], columns = np.append(cancer['feature_names'], ['target']))

#Para visualizar os dados na forma de tabela
df.head()

In [None]:
#Vamos dividir a base em duas partições: treino e teste. A base de treino terá 80% das instâncias, enquanto a de teste terá 20%

from sklearn.model_selection import train_test_split

#Vamos definir X para receber as instâncias, enquanto y terá os rótulos
X = df.iloc[:, 0:-1]
y = df.iloc[:, -1]

#Dividindo a base (com seleção de instâncias aleatória)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state = 42)

#Checando a divisão das instâncias entre as duas bases
print(X_train.shape, y_train.shape)
print(X_test.shape, y_test.shape)

In [None]:
#Como os atributos originais estão em diferentes escalas, nós vamos normalizar os dados aqui, pois é importante deixar os atributos todos nos mesmos intervalos de dados

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()  
X_train = sc.fit_transform(X_train)  
X_test = sc.transform(X_test)


Agora nós vamos criar dois modelos de SVM. Será um modelo não linear com kernel polinomial e um modelo não linear com kernel RBF. Vamos iniciar com o **kernel polinomial**.


In [None]:
# Definição do algoritmo e passagem de parâmetros. O kernel polinomial, além do grau, tem como parâmetro gamma. Neste caso, nós deixaremos gamma como o valor default.

modelo_polinomial = svm.SVC(kernel='poly', degree=2
                            , gamma='auto', C=10) # Kernel Polinomial com parâmetro de regularização C = 10

#Vamos treinar o modelo usando a base X_Train

modelo_polinomial.fit(X_train, y_train)


In [None]:
#Vamos fazer as predições para a base e teste

y_pred_poli = modelo_polinomial.predict(X_test)

Avaliação de modelos

In [None]:
#Importando o módulo de cálculo de métricas de avaliação do scikit-learn 
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score

# Avaliação do modelo

print(confusion_matrix(y_test,y_pred_poli))
print(classification_report(y_test,y_pred_poli))  
print("Acurácia Polinomial:", accuracy_score(y_test, y_pred_poli))

**Atividade**

1. Tente ajustar o parâmetro relacionado ao grau do polinômio do kernel polinomial e responda: É possível melhorar o resultado? Obs: O grau do polinômio é um valor discreto, portanto, você pode utilizar valores como 2, 3, 4, etc. O valor de C já está superficialmente otimizado. Portanto, você não precisa modificar o valor de C.
2. Utilize o kernel rfb e faça ajustes no parâmetro gamma. Qual tipo de kernel apresentou melhor resultado? Obs: o valor de gamma é contínuo. Novamente, você não precisa modificar o valor de C.
3. Compare os resultados obtidos por SVM aos resultados obtidos por kNN, Naive Bayes e Árvores de Decisão. Qual dos algoritmos de Aprendizagem de Máquina testados apresentou melhor resultado?


In [None]:
#Gerando o modelo com kernel RBF

modelo_rbf = svm.SVC(kernel='rbf', degree=0.7, C=10) # Kernel RBF com parâmetro de regularização C = 10