FIAP - Redes Neurais Artificiais, Deep Learning e Algoritmos Genéticos 

# Aula 07 - Redes Perceptron com Sklearn

Vamos utilizar o [Iris dataset](https://archive.ics.uci.edu/ml/datasets/iris) para modelar Redes Neruais baseadas no Perceptron

In [1]:
!pip install pandas
!pip install warnings
!pip install seaborn
!pip install sklearn




In [2]:
# Apenas para evitar warnings 
import warnings
warnings.filterwarnings('ignore')

# Bibliotecas de Data Science
import pandas as pd
import seaborn as sns 

# Separação dos dados
from sklearn.model_selection import train_test_split

# Modelos a serem utilizados
from sklearn.linear_model import Perceptron
from sklearn.neural_network import MLPClassifier

# Métricas de avaliação
from sklearn.metrics import plot_confusion_matrix
from sklearn.metrics import accuracy_score

## Lendo o dataset

Como se trata de um dataset MUITO famoso em Ciência de Dados, o próprio sklearn já possui os dados salvos

In [3]:
from sklearn.datasets import load_iris
iris = load_iris()
iris

 'data': array([[5.1, 3.5, 1.4, 0.2],
        [4.9, 3. , 1.4, 0.2],
        [4.7, 3.2, 1.3, 0.2],
        [4.6, 3.1, 1.5, 0.2],
        [5. , 3.6, 1.4, 0.2],
        [5.4, 3.9, 1.7, 0.4],
        [4.6, 3.4, 1.4, 0.3],
        [5. , 3.4, 1.5, 0.2],
        [4.4, 2.9, 1.4, 0.2],
        [4.9, 3.1, 1.5, 0.1],
        [5.4, 3.7, 1.5, 0.2],
        [4.8, 3.4, 1.6, 0.2],
        [4.8, 3. , 1.4, 0.1],
        [4.3, 3. , 1.1, 0.1],
        [5.8, 4. , 1.2, 0.2],
        [5.7, 4.4, 1.5, 0.4],
        [5.4, 3.9, 1.3, 0.4],
        [5.1, 3.5, 1.4, 0.3],
        [5.7, 3.8, 1.7, 0.3],
        [5.1, 3.8, 1.5, 0.3],
        [5.4, 3.4, 1.7, 0.2],
        [5.1, 3.7, 1.5, 0.4],
        [4.6, 3.6, 1. , 0.2],
        [5.1, 3.3, 1.7, 0.5],
        [4.8, 3.4, 1.9, 0.2],
        [5. , 3. , 1.6, 0.2],
        [5. , 3.4, 1.6, 0.4],
        [5.2, 3.5, 1.5, 0.2],
        [5.2, 3.4, 1.4, 0.2],
        [4.7, 3.2, 1.6, 0.2],
        [4.8, 3.1, 1.6, 0.2],
        [5.4, 3.4, 1.5, 0.4],
        [5.2, 4.1, 1.5, 0.1],
  

In [4]:
# Podemos fuçar em parâmetros prontos do dataset, por exemplo, o nome das classes
iris.target_names

array(['setosa', 'versicolor', 'virginica'], dtype='<U10')

In [None]:
# Transformando em Dataframe Pandas: 
#   - os dados são iris.data
#   - as colunas são os nomes das características


In [None]:
data = pd.DataFrame(iris.data,columns=iris.feature_names)
data['class'] = iris.target
data

## Dividindo os dados em TREINO e TESTE

In [None]:
X = data.drop(columns=['class']
              
y = data['class']

X_train, X_test, Y_train, Y_test = train_test_split(X,Y,test_size=0.2,random_state=42)

## Perceptron

Vamos começar trabalhando com uma rede bem básica: o Perceptron

In [None]:
# Cria um perceptron e o treina (com o fit())
perceptron = Perceptron(random_state=42)
perceptron.fit(X_train,Y_train)

In [None]:
# Salva as predições do TESTE na variável y_pred
y_pred = perceptron.predict(X_test)

In [None]:
# Calcula a acurácia deste perceptron, por meio dos valores preditos para o teste
# e os valores reais 


In [None]:
# Estes são os pesos já treinados, sendo 3 classes (linhas) e 4 colunas (features)


In [None]:
# Estes são os bias do perceptron


In [None]:
# Matriz de confusão do perceptron


## Uma análise do resultado do Perceptron

Resultado não foi muito bom ne? Mas faz sentido porque esse tipo de rede resolve bem problemas LINEARMENTE SEPARÁVEIS. Será que é o caso deste dataset? 

In [None]:
sns.pairplot( data=data, vars=('sepal length (cm)', \
                               'sepal width (cm)', \
                               'petal length (cm)', \
                               'petal width (cm)'), \
             hue='class' );

## Multi-layer Perceptron (MLP)

Veja [aqui](https://scikit-learn.org/stable/modules/generated/sklearn.neural_network.MLPClassifier.html#sklearn.neural_network.MLPClassifier) todos os parâmetros e seus significados.

Vamos começar com a arquitetura mais simples: 

![Arquitetura inicial](https://miro.medium.com/max/381/1*Pff-9bCGTqE6iMW2sBSTmw.png)

In [None]:
#Arquitetura 


### Ajustando parâmetros...

Comparando os diferentes resultados alcançados com a alteração de parâmetros, fica clara (mais uma vez) a **importância de ajustar esses parâmetros**.

In [None]:
#Alterando a função de ativação...


In [None]:
#Alterando o solver para o que a própria documentação aconselha para datasets menores


In [None]:
#Testando outra arquitetura...


### Pesos da rede

In [None]:
print("pesos entre a camada de ENTRADA (4 neurônios) e a 1ª CAMADA OCULTA (5 neurônios):")
print(mlp.coefs_[0])
print("\npesos entre 1ª CAMADA OCULTA (5 neurônios) e a 2ª CAMADA OCULTA (3 neurônios):")
print(mlp.coefs_[1])
print("\npesos entre 2ª CAMADA OCULTA (3 neurônios) e camada de SAÍDA (3 neurônios):")
print(mlp.coefs_[2])