# Sumário
- [1. Máquinas de Vetores de Suporte - SVM](#1.-Máquinas-de-Vetores-de-Suporte---SVM)


- [2. Implementação](#2.-Implementação)
  - [2.1 Classificação](#2.1-Classificação)
    - [2.1.1 Base de Dados](#2.1.1-Base-de-Dados)
  - [2.2 Regressão](#2.2-Regressão)
    - [2.2.1 Base de Dados](#2.2.1-Base-de-Dados)

# 1. Máquinas de Vetores de Suporte - SVM

Esse algoritmo tem por objetivo traçar hiperplanos para dividir os registros. Ou seja, esse agoritimo é muito bom para classificar as coisas.

Por se tratar de um algoritmo que executa muitos cálculos é necessário fazer o escalonamento dos dados, caso contrário eles demorarão para serem executados.

O SVM também possíbilita trabalhar com problemas linearmente e não linearmente separáveis. E também é possível trabalhar com múltiplas classes.

![](https://raw.githubusercontent.com/LucasFDutra/Estudos/master/Machine%20Learning/Support%20Vector%20Machine/Imagens/Figura_1.gif)

---
- Links para aprender mais:
    - [Support Vector Machine - Cognitive Class](https://youtu.be/SekHI55Ukwk)
    - [Support Vector Machines: A Visual Explanation with Sample Python Code - Alice Zhao](https://www.youtube.com/watch?v=N1vOgolbjSc)
    - [Support Vector Machines - The Math of Intelligence - Siraj Raval](https://www.youtube.com/watch?v=g8D5YL6cOSE)
    - [Support Vector Machine - Georgia Tech - Machine Learning - Udacity](https://www.youtube.com/watch?v=eUfvyUEGMD8)
---    

> Com SVM pode-se fazer tanto classificação quanto regressão.

- **Parâmetros Importantes**:
    - Custo (C): É a penalidade que o código vai receber se efetuar a divisão erroneamente, ou seja, se o custo for alto ele vai evitar ao máximo errar, buscando 100% de acerto. Já se o custo for de 90% ele vai poder errar um pouco menos. Porém essa porcentagem não é exatamente igual a porcentagem de acertos que o modelo terá. É importante ressaltar que se o custo for o maior possível o algoritmo irá trabalha para que a divisão ocorra perfeitamente, porém nem sempre isso é possível e o gasto computacional para isso pode ser muito grande.
        - Valores limites de C: $10^{-3} < C < 10^3$
    - Kernel: Como existem registros que formam uma distribuição não linear, é necessário aplicar técnicas nos registros para tornar a distribuição linear. Um exemplo é se os registros estivem distribuidos de forma que não é possível traçar um hiperplano para dividir as classes, assim coloca-se os dados em três dimensões, passando a ser possível dividí-los. Existem diversas tecnicas, a sklearn nos oferece as seguintes técnicas:
        - rbf (gaussiana): default
        - linear 
        - poly
        - sigmoid 
        

# 2. Implementação

## 2.1 Classificação
Para a implementação do algoritmo foi utilizada a biblioteca Sklearn, veja a [Documentação](https://scikit-learn.org/stable/modules/classes.html#)

### 2.1.1 Base de Dados
A base de dados que será utilizada será a MNIST que já pode ser encontrada na base de dados do keras.
Porém para trabalhar com o algoritmo em questão ela deve modificada em sua dimensão.

In [1]:
from keras.datasets import mnist

# Importando base de dados
(x_train, y_train),(x_test, y_test) = mnist.load_data()

# Normalizando os valores
x_train, x_test = x_train/255, x_test/255

# Ajustando formato
x_train = x_train.reshape(x_train.shape[0], x_train.shape[1]*x_train.shape[2])
x_test = x_test.reshape(x_test.shape[0], x_test.shape[1]*x_test.shape[2])

Using TensorFlow backend.


Downloading data from https://s3.amazonaws.com/img-datasets/mnist.npz


In [2]:
#-------------------------------Bibliotecas-----------------------------------#
from sklearn.svm import SVC
from sklearn.metrics import confusion_matrix, accuracy_score

#------------------------Criando classificador linear-------------------------#
classificador_linear = SVC(kernel = 'linear', random_state = 0)
classificador_linear.fit(x_train, y_train)

#-------------------------Previsões kernel linear-----------------------------#
previsoes = classificador_linear.predict(x_test)

#----------Exibindo a precisão e a matriz de confusão kernel linear-----------#
precisao = accuracy_score(y_test, previsoes)
matriz = confusion_matrix(y_test, previsoes)
print('precisao com linear: {}'.format(precisao),'\n','matriz de confusão com linear: \n{}' .format(matriz))

precisao com linear: 0.9404 
 matriz de confusão com linear: 
[[ 957    0    4    1    1    6    9    1    0    1]
 [   0 1122    3    2    0    1    2    1    4    0]
 [   8    6  967   11    3    3    7    8   17    2]
 [   4    3   16  947    1   16    0    9   12    2]
 [   1    1   10    1  942    2    4    2    3   16]
 [  10    4    3   36    6  803   13    1   14    2]
 [   9    2   13    1    5   16  910    1    1    0]
 [   1    8   21   10    8    1    0  957    3   19]
 [   8    4    6   25    7   26    6    7  877    8]
 [   7    7    2   11   33    4    0   18    5  922]]


## 2.2 Regressão

- Observações importantes:
    - Utilizando kernel = linear: Temos uma regressão linear.
    - Utilizando kernel = poly: Temos uma regressão polinomial.

Para a implementação do algoritmo foi utilizada a biblioteca Sklearn, veja a [Documentação](https://scikit-learn.org/stable/modules/classes.html#)   

### 2.2.1 Base de Dados
A base de dados que será utilizada será a Boston housing price que já pode ser encontrada na base de dados do keras.
Porém para trabalhar com o algoritmo em questão ela deve modificada em sua dimensão.

In [3]:
from keras.datasets import boston_housing

(x_train, y_train),(x_test, y_test) = boston_housing.load_data()

Downloading data from https://s3.amazonaws.com/keras-datasets/boston_housing.npz


In [4]:
#-------------------------------Bibliotecas-----------------------------------#
from sklearn.svm import SVR
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_absolute_error, mean_squared_error

#------Escalonando e dividindo a base de treinamento e teste para o rbf-------#
# Exclusivamente para o rbf é necessário efetuar o escalonamento dos valores. #
#-----------------------------------------------------------------------------#
scaler_x = StandardScaler()
scaler_y = StandardScaler()
x_train = scaler_x.fit_transform(x_train)
x_test = scaler_x.transform(x_test)
y_train = scaler_y.fit_transform(y_train.reshape(y_train.shape[0],1))
y_test = scaler_y.transform(y_test.reshape(y_test.shape[0],1))

#---------------------------Criando regressor rbf-----------------------------#
regressor = SVR(kernel = 'rbf', gamma = 'auto')
regressor.fit(x_train, y_train)

#----------------------------------RBF----------------------------------------#
#--Ver a correlação do modelo rbf com relação a base de dados de Treinamento--#
score = regressor.score(x_train, y_train)
print('A correlação do modelo rbf com a base de dados de treinamento é de: {}'.format(score))

#-----Ver a correlação do modelo rbf com relação a base de dados de teste-----#
score = regressor.score(x_test, y_test)
print('A correlação do modelo rbf com a base de dados de teste é de: {}'.format(score))

#---------------------------Previsões kernel rbf------------------------------#
# inverse_transform: para colocar o resultado na escala original              #
# colocar o scaler_y pois o valor da previção sai no eixo y                   #
#-----------------------------------------------------------------------------#
previsoes = scaler_y.inverse_transform(regressor.predict(x_test))

#---------------Diferança entre valores reais e previstos_rbf-----------------#
erro_absoluto = mean_absolute_error(y_test, previsoes)
erro_quadratico = mean_squared_error(y_test, previsoes)
print('Erro absoluto: {}'.format(erro_absoluto))
print('Erro quadratico: {}'.format(erro_quadratico))

A correlação do modelo rbf com a base de dados de treinamento é de: 0.8829112180466158
A correlação do modelo rbf com a base de dados de teste é de: 0.8423733884585662
Erro absoluto: 22.084372609136693
Erro quadratico: 530.9056741659125


  y = column_or_1d(y, warn=True)
