# Aula 14
### Aprendizado Supervisionado - Parte 2

- Testar o SVM, uma rede Perceptron e uma MLP para o dataset Wine
- Separe aleatoriamente 70% dos dados para treino e 30% para teste e reporte com um print da saída qual a acurácia do algoritmo (número de acertos).
- Descrever todos os parâmetros usados em seus algoritmos!

#### Setup do Dataset

- Instalação do UCI Machine Learning Repo para usar de maneira mais fácil o Dataset

- Inicializando [Dataset Wine](https://archive.ics.uci.edu/dataset/109/wine) e atribuindo ele para um Dataframe do Pandas

- Separação de Dados do Dataset entre 70% para treinamento e 30% para testes

In [None]:
pip install ucimlrepo

Collecting ucimlrepo
  Downloading ucimlrepo-0.0.7-py3-none-any.whl.metadata (5.5 kB)
Downloading ucimlrepo-0.0.7-py3-none-any.whl (8.0 kB)
Installing collected packages: ucimlrepo
Successfully installed ucimlrepo-0.0.7


In [None]:
from ucimlrepo import fetch_ucirepo
import pandas as pd

wine = fetch_ucirepo(id=109)
X = wine.data.features
Y = wine.data.targets['class']

print(wine.metadata)

print(wine.variables)
print(Y.head)

{'uci_id': 109, 'name': 'Wine', 'repository_url': 'https://archive.ics.uci.edu/dataset/109/wine', 'data_url': 'https://archive.ics.uci.edu/static/public/109/data.csv', 'abstract': 'Using chemical analysis to determine the origin of wines', 'area': 'Physics and Chemistry', 'tasks': ['Classification'], 'characteristics': ['Tabular'], 'num_instances': 178, 'num_features': 13, 'feature_types': ['Integer', 'Real'], 'demographics': [], 'target_col': ['class'], 'index_col': None, 'has_missing_values': 'no', 'missing_values_symbol': None, 'year_of_dataset_creation': 1992, 'last_updated': 'Mon Aug 28 2023', 'dataset_doi': '10.24432/C5PC7J', 'creators': ['Stefan Aeberhard', 'M. Forina'], 'intro_paper': {'ID': 246, 'type': 'NATIVE', 'title': 'Comparative analysis of statistical pattern recognition methods in high dimensional settings', 'authors': 'S. Aeberhard, D. Coomans, O. Vel', 'venue': 'Pattern Recognition', 'year': 1994, 'journal': None, 'DOI': '10.1016/0031-3203(94)90145-7', 'URL': 'https:

In [None]:
# Separando os dados entre treinamento (70%) e testagem (30%)
from sklearn.model_selection import train_test_split

X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=42) # 42 pois é bastante usado

#### SVM - Support Vector Machine

In [None]:
from sklearn import svm
from sklearn.metrics import accuracy_score

clf = svm.SVC(kernel='linear')
clf.fit(X_train, Y_train)

Y_pred = clf.predict(X_test)

accuracy = accuracy_score(Y_test, Y_pred)
print(f'SVM: \nAcertos: {sum(Y_pred == Y_test)} de {len(Y_test)} \nAcurácia de: {accuracy:.2f}')

SVM: 
Acertos: 53 de 54 
Acurácia de: 0.98


#### Rede Perceptron

In [None]:
from sklearn.linear_model import Perceptron

clf = Perceptron(tol=1e-3, random_state=0)
clf.fit(X_train, Y_train)

Y_pred = clf.predict(X_test)

accuracy = accuracy_score(Y_test, Y_pred)
print(f'Perceptron: \nAcertos: {sum(Y_pred == Y_test)} de {len(Y_test)} \nAcurácia de: {accuracy:.2f}')

Perceptron: 
Acertos: 28 de 54 
Acurácia de: 0.52


#### MLP - MultiLayer Perceptron

In [None]:
from sklearn.neural_network import MLPClassifier

clf = MLPClassifier(solver='lbfgs', alpha=1e-5, hidden_layer_sizes=(5, 2), random_state=1)
clf.fit(X_train, Y_train)

Y_pred = clf.predict(X_test)

accuracy = accuracy_score(Y_test, Y_pred)
print(f'MultiLayer Perceptron (MLP): \nAcertos: {sum(Y_pred == Y_test)} de {len(Y_test)} \nAcurácia de: {accuracy:.2f}')

MultiLayer Perceptron (MLP): 
Acertos: 21 de 54 
Acurácia de: 0.39


### Padronização de Dados

Como a Acurácia está baixa no Perceptron e em MLP (MultiLayer Perceptron), será realizada uma padronização dos dados com o fim de melhorar as predições realizadas por método de inferência.

- Utilizando Standard Scaler

In [None]:
from sklearn.preprocessing import StandardScaler

# Escalonando os dados
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

#### SVM (Support Vector Machine) com Dados Padronizados

In [None]:
clf = svm.SVC(kernel='linear')
clf.fit(X_train_scaled, Y_train)

Y_pred = clf.predict(X_test_scaled)

accuracy = accuracy_score(Y_test, Y_pred)
print(f'SVM: \nAcertos: {sum(Y_pred == Y_test)} de {len(Y_test)} \nAcurácia de: {accuracy:.2f}')

SVM: 
Acertos: 53 de 54 
Acurácia de: 0.98


#### Perceptron com Dados Padronizados

In [None]:
clf = Perceptron(tol=1e-3, random_state=0)
clf.fit(X_train_scaled, Y_train)

Y_pred = clf.predict(X_test_scaled)

accuracy = accuracy_score(Y_test, Y_pred)
print(f'Perceptron: \nAcertos: {sum(Y_pred == Y_test)} de {len(Y_test)} \nAcurácia de: {accuracy:.2f}')

Perceptron: 
Acertos: 53 de 54 
Acurácia de: 0.98


#### MLP (Multilayer Perceptron) com Dados Padronizados

In [None]:
clf = MLPClassifier(solver='lbfgs', alpha=1e-5, hidden_layer_sizes=(5, 2), random_state=1)
clf.fit(X_train_scaled, Y_train)

Y_pred = clf.predict(X_test_scaled)

accuracy = accuracy_score(Y_test, Y_pred)
print(f'MultiLayer Perceptron (MLP): \nAcertos: {sum(Y_pred == Y_test)} de {len(Y_test)} \nAcurácia de: {accuracy:.2f}')

MultiLayer Perceptron (MLP): 
Acertos: 53 de 54 
Acurácia de: 0.98
