# Machine Learning

## SVM - Máquina Vetor de Suporte

* **Trabalhando com o conjunto de dados Iris**

In [None]:
# Carregando bibliotecas

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

from sklearn.model_selection import cross_val_predict
from sklearn import svm
from sklearn import datasets
from sklearn import metrics

In [None]:
# Carreando base de dados

dados = datasets.load_iris()

In [None]:
# Verificando o tipo do dataset

type(dados)

In [None]:
# Verificando o nome das colunas / features

dados.feature_names

In [None]:
# Verificando o nome das classes

dados.target_names

**Separando os dados em previsores e classes**

In [None]:
# Separando os dados

previsores = dados.data
classes = dados.target

In [None]:
# Visualizando a forma dos dados

print(previsores.shape)
print(classes.shape)

**Visualizando os dados gráficamente**

In [None]:
# Gráfico 1: dispersão dos dados de Sepal Width e Sepal Length

%matplotlib notebook

# Definindo o estilo do gráfico
from matplotlib import style
style.use('ggplot')

# Definindo os labels e o título do gráfico
plt.xlabel('Sepal Length')
plt.ylabel('Sepal Width')
plt.title('Sepal Width vs Sepal Length')

# Definindo o tipo do gráfico e as colunas a ser plotado(a)
plt.scatter(previsores[:, 0], previsores[:, 1], c = classes);

In [None]:
# Gráfico 2: dispersão dos dados de Petal Width e Petal Length

%matplotlib notebook

# Definindo o estilo do gráfico
from matplotlib import style
style.use('ggplot')

# Definindo o labels e título do gráfico
plt.xlabel('Petal Length')
plt.ylabel('Petak Width')
plt.title('Petal Width vs Petal Length')

# Definindo o tipo de gráfico e colunas a ser plotado(a)
plt.scatter(previsores[:, 2], previsores[:, 3], c = classes);

### Aplicando o SVM

* Usando **80%** dos dados para treino e **20%** dos dados para teste.

In [None]:
# Treinando o modelo

modelo = svm.SVC().fit(previsores[: -30], classes[: -30])

In [None]:
# Verificando o modelo treinado

modelo

In [None]:
# Criando um array com 20% dos dados de teste

teste = previsores[-30 :]

In [None]:
# Aplicando os SVM

resultado = modelo.predict(teste)

**Visualizando resultados graficamente**

In [None]:
# Gráfico 3: dispersão dos dados de Sepal Width e Sepal Length
# Os pontos e roxo significa erros do modelo

%matplotlib notebook

# Definindo o estilo do gráfico
from matplotlib import style
style.use('ggplot')

# Definindo os labels e o título do gráfico
plt.xlabel('Sepal Length')
plt.ylabel('Sepal Width')
plt.title('Sepal Width vs Sepal Length')

# Definindo o tipo do gráfico e as colunas a ser plotado(a)
plt.scatter(previsores[-30:,0], previsores[-30:,1], c = resultado);

In [None]:
# Gráfico 4: dispersão dos dados de Petal Width e Petal Length

%matplotlib notebook

# Definindo o estilo do gráfico
from matplotlib import style
style.use('ggplot')

# Definindo o labels e título do gráfico
plt.xlabel('Petal Length')
plt.ylabel('Petak Width')
plt.title('Petal Width vs Petal Length')

# Definindo o tipo de gráfico e colunas a ser plotado(a)
plt.scatter(previsores[-30:,2], previsores[-30:,3], c = resultado);

### Técnicas de Validação

**Matriz de Confusão**

In [None]:
print(pd.crosstab(classes[-30:], resultado, rownames = ['Real'], colnames = ['          Predito'], margins = True))

**Cross Validation**

In [None]:
# Criando uma função para retorno da acurácia

def Acuracia(modelo, X, y):
    resultados = cross_val_predict(modelo, X, y, cv = 10)
    return metrics.accuracy_score(y, resultados)

In [None]:
# Aplicando função

Acuracia(modelo, previsores, classes)

**Métricas de Validação**

In [None]:
resultados = cross_val_predict(modelo, previsores, classes, cv = 10)
valor_classes = [0, 1, 2]
print(metrics.classification_report(classes, resultados, valor_classes))