# Exercício
## Suport Vector Machines e Multi-Layer Perceptron
### Alunos (Nome e número usp):
 - Lucas Henrique Mantovani Jacintho - 10258942
 - Victor Luiz Fortes Rivelo - 9762960
 - Vinicius Henrique Borges - 9771546
---

Para esse exercício, vamos utilizar o dataset [Wine](https://archive.ics.uci.edu/ml/datasets/Wine). Nesse dataset foram colhidas amostras de 3 tipos de vinhos. Cada amostra conta com 13 variáveis descritivas, tais como conteúdo alcoolico, fenóides etc. Ao todo são 178 amostras.



---

### Questão 1.
Importe o dataset através da classe `sklearn.datasets.load_wine()`. Para garantir uma melhor performance dos algoritmos, faça o preprocessamento desses dados através da classe `sklearn.preprocessing.scale`.


In [0]:
from sklearn.datasets import load_wine

In [0]:
X, y = load_wine(return_X_y=True)

In [0]:
from sklearn.preprocessing import scale

In [0]:
scaled_X = scale(X)



---

### Questão 2.

Agora para classificar os modelos que serão testados, implemente a função `evaluate_model()` prototipada abaixo. Essa função recebe um modelo de classificador genérico (`model`). Isso pode ser feito pois o Python trata funções como funções de primeira classe. Isso é, funções podem ser tratadas como variáveis, passadas como parâmetro etc. Avalie a acurácia do modelo utilizando 10-fold cross-validation estratificado (`sklearn.model_selection.StratifiedKFold`), retornando a média das 10 acurácias. O parâmetro `X` indica os dados e `y` os labels.

In [0]:
from sklearn.model_selection import StratifiedKFold
import numpy as np

In [0]:
def evaluate_model(model, X, y):
  accuracies = []
  skf = StratifiedKFold(n_splits=10)

  for train_index, test_index in skf.split(X, y):
    X_train, X_test = X[train_index], X[test_index]
    y_train, y_test = y[train_index], y[test_index]

    model.fit(X_train, y_train)
    score = model.score(X_test, y_test)

    accuracies.append(score)

  return np.mean(accuracies)



---

### Questão 3.

Agora para estruturar e organizar melhor nossos testes, vamos utilizar as estruturas de dicionário do Python. Por exemplo, se formos definir dois modelos de Multi-Layer Perceptron, podemos escrever:

```
experimentos = { 
    "MLP camada escondida (5,)" : MLPClassifier(hidden_layer_sizes=(5,)),
    "MLP camada escondida (5,5)" : MLPClassifier(hidden_layer_sizes=(5,5))      
}
```
Portanto, defina um dicionário de experimentos com ao menos 3 modelos de SVM (`sklearn.svm.SVC`) e 3 modelos de MLP (`sklearn.neural_network.MLPClassifier`). Para isso varie parâmetros como tipo de kernel e grau do polinômio (para kernels polinomiais) no caso da SVM e no caso das MLPs varie o número de camadas escondidas.

In [0]:
from sklearn.neural_network import MLPClassifier
from sklearn.svm import SVC

In [0]:
experiments = {
    "MLP camada escondida (2,)": MLPClassifier(hidden_layer_sizes=(2,), max_iter=5000),
    "MLP camada escondida (2,) com random_state=42": MLPClassifier(hidden_layer_sizes=(2,), max_iter=5000, random_state=42),
    "MLP camada escondida (5, 5)": MLPClassifier(hidden_layer_sizes=(5, 5), max_iter=5000),
    "MLP camada escondida (5, 5) com random_state=42": MLPClassifier(hidden_layer_sizes=(5, 5), max_iter=5000, random_state=42),
    "MLP camada escondida (7, 20)": MLPClassifier(hidden_layer_sizes=(7, 20), max_iter=5000),
    "MLP camada escondida (100,)": MLPClassifier(max_iter=5000),
    "MLP camada escondida (100,) com random_state=42": MLPClassifier(max_iter=5000, random_state=42),
    "MLP camada escondida (200,)": MLPClassifier(hidden_layer_sizes=(200), max_iter=5000),
    "SVM poly(5)": SVC(kernel='poly', degree=5),
    "SVM poly(3)": SVC(kernel='poly', degree=3),
    "SVM poly(2)": SVC(kernel='poly', degree=2),
    "SVM linear": SVC(kernel='linear'),
    "SVM rbf": SVC()
}



---

### Questão 4.

Para cada modelo instanciado na Questão 3, utilize a função criada na questão 2 para calcular sua acurácia. Exiba o nome do modelo e sua acurácia e determine qual o melhor classificador dentre os especificados.

In [0]:
for experiment, model in experiments.items():
  print(experiment, ':', evaluate_model(model, scaled_X, y))

MLP camada escondida (2,) : 0.9718954248366012
MLP camada escondida (2,) com random_state=42 : 0.9718954248366012
MLP camada escondida (5, 5) : 0.9666666666666666
MLP camada escondida (5, 5) com random_state=42 : 0.9777777777777779
MLP camada escondida (7, 20) : 0.9663398692810456
MLP camada escondida (100,) : 0.9888888888888889
MLP camada escondida (100,) com random_state=42 : 0.9777777777777779
MLP camada escondida (200,) : 0.9833333333333332
SVM poly(5) : 0.8215686274509804
SVM poly(3) : 0.949673202614379
SVM poly(2) : 0.8823529411764707
SVM linear : 0.9437908496732026
SVM rbf : 0.9777777777777779
