### Machine Learning e Data Science com Python
Rede neural MLPClassifier - Classificador Multilayer Perceptron

#### Dataset Iris

In [4]:
# Trabalhando com o dataset Iris Dataset
from sklearn import datasets

iris = datasets.load_iris()

In [10]:
print(f'feature_names - {iris.feature_names}')
print(f'target_names  - {iris.target_names}')
print(f'Quantidade de amostras - {len(iris.data)}')

feature_names - ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
target_names  - ['setosa' 'versicolor' 'virginica']
Quantidade de amostras - 150


In [55]:
# Dividindo em dados de treino e teste
from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2)

print(f'Quantidade de dados de treino entradas - {x_train.shape}')
print(f'Quantidade de dados de treino saídas   - {y_train.shape}')
print(f'Quantidade de dados de teste  entradas - {x_test.shape}')
print(f'Quantidade de dados de teste  saídas   - {y_test.shape}')

Quantidade de dados de treino entradas - (120, 4)
Quantidade de dados de treino saídas   - (120,)
Quantidade de dados de teste  entradas - (30, 4)
Quantidade de dados de teste  saídas   - (30,)


In [47]:
# Importando a rede neural e criando um classificador multilayer perceptron - MLP
# Documentação - https://scikit-learn.org/stable/modules/generated/sklearn.neural_network.MLPClassifier.html
from sklearn.neural_network import MLPClassifier

# solver é o algorítimo para otimização dos pesos da rede *default é adam
# alpha é um parâmetro que ajuda a evitar overfitting
# hidden_layer_sizes recebe uma tupla onde o iésimo elemento representa o número de neurônios na iésima camada escondida
# random_state é um controle para gerar números aleatórios
# learning_rate é a taxa de aprendizado, para "constant" vai ser o número dado pelo parâmetro learning_rate_init
# learning_rate_init é a taxa de aprendizado inicial
# max_iter é o número máximo de iterações
# activation defini a função de ativação para a camada escondida
# momentum é utilizado para evitar cair em um mínimo local
# verbose quando True imprime as mensagens do progresso
# tol é a tolerância, controla a melhoria da perda, caso não melhore em duas iterações considera atingida a convergência
mlp = MLPClassifier(solver='adam', alpha=0.001, hidden_layer_sizes=(5,), 
                    random_state=1, learning_rate='constant', 
                    learning_rate_init=0.01, max_iter=500, activation='logistic', 
                    momentum=0.9, verbose=False, tol=0.001)

In [48]:
# Treinando o MLP
mlp.fit(x_train, y_train)

MLPClassifier(activation='logistic', alpha=0.001, batch_size='auto', beta_1=0.9,
              beta_2=0.999, early_stopping=False, epsilon=1e-08,
              hidden_layer_sizes=(5,), learning_rate='constant',
              learning_rate_init=0.01, max_fun=15000, max_iter=500,
              momentum=0.9, n_iter_no_change=10, nesterovs_momentum=True,
              power_t=0.5, random_state=1, shuffle=True, solver='adam',
              tol=0.001, validation_fraction=0.1, verbose=False,
              warm_start=False)

In [49]:
# Realizando a previsão sobre os dados de teste
previsoes_mlp = mlp.predict(x_test)

In [50]:
# Avaliando a acurácia
from sklearn import metrics

acertos_mlp = metrics.accuracy_score(y_test, previsoes_mlp)
print(acertos_mlp)

0.9666666666666667



#### Dataset Breast_Cancer


In [124]:
# Trabalhando com o dataset Breast Cancer
from sklearn.datasets import load_breast_cancer

breast_cancer = load_breast_cancer()

In [125]:
print(f'feature_names - {breast_cancer.feature_names}')
print(f'target_names  - {breast_cancer.target_names}')
print(f'Quantidade de amostras - {len(breast_cancer.data)}')

feature_names - ['mean radius' 'mean texture' 'mean perimeter' 'mean area'
 'mean smoothness' 'mean compactness' 'mean concavity'
 'mean concave points' 'mean symmetry' 'mean fractal dimension'
 'radius error' 'texture error' 'perimeter error' 'area error'
 'smoothness error' 'compactness error' 'concavity error'
 'concave points error' 'symmetry error' 'fractal dimension error'
 'worst radius' 'worst texture' 'worst perimeter' 'worst area'
 'worst smoothness' 'worst compactness' 'worst concavity'
 'worst concave points' 'worst symmetry' 'worst fractal dimension']
target_names  - ['malignant' 'benign']
Quantidade de amostras - 569


In [126]:
# Dividindo em dados de treino e teste
from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(breast_cancer.data, breast_cancer.target, test_size=0.2)

print(f'Quantidade de dados de treino entradas - {x_train.shape}')
print(f'Quantidade de dados de treino saídas   - {y_train.shape}')
print(f'Quantidade de dados de teste  entradas - {x_test.shape}')
print(f'Quantidade de dados de teste  saídas   - {y_test.shape}')

Quantidade de dados de treino entradas - (455, 30)
Quantidade de dados de treino saídas   - (455,)
Quantidade de dados de teste  entradas - (114, 30)
Quantidade de dados de teste  saídas   - (114,)


In [127]:
# Normalização dos dados, colocando todos em uma mesma escala
# A MLP é senssível ao dimencionamento dos atributos
from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()

scaler.fit(x_train)

x_train = scaler.transform(x_train)
x_test  = scaler.transform(x_test)

In [128]:
# Configurando o MLP
mlp = MLPClassifier(solver='adam', alpha=0.001, hidden_layer_sizes=(30, 30, 30), 
                    random_state=1, learning_rate='constant', 
                    learning_rate_init=0.01, max_iter=500, activation='logistic', 
                    momentum=0.9, verbose=False, tol=0.001)

In [129]:
# Treinando o MLP
mlp.fit(x_train, y_train)

MLPClassifier(activation='logistic', alpha=0.001, batch_size='auto', beta_1=0.9,
              beta_2=0.999, early_stopping=False, epsilon=1e-08,
              hidden_layer_sizes=(30, 30, 30), learning_rate='constant',
              learning_rate_init=0.01, max_fun=15000, max_iter=500,
              momentum=0.9, n_iter_no_change=10, nesterovs_momentum=True,
              power_t=0.5, random_state=1, shuffle=True, solver='adam',
              tol=0.001, validation_fraction=0.1, verbose=False,
              warm_start=False)

In [130]:
# Realizando a previsão sobre os dados de teste
previsoes_mlp = mlp.predict(x_test)

In [131]:
# Avaliando a acurácia
from sklearn import metrics

acertos_mlp = metrics.accuracy_score(y_test, previsoes_mlp)
print(acertos_mlp)

0.9824561403508771


In [132]:
# Apresentando matris de confusão
#
#          Previsões    (0, 0) - 38 acertos
#   R ___|_0___1_       (0, 1) - 2 erros
#   e  0 | 38  2        (1, 0) - 0 erros
#   a  1 | 0   74       (1, 1) - 74 acertos
#   l
#
from sklearn.metrics import confusion_matrix

print(confusion_matrix(y_test, previsoes_mlp))

[[38  2]
 [ 0 74]]


In [134]:
# Apresentando as principais métrica de classificação
from sklearn.metrics import classification_report

print(classification_report(y_test, previsoes_mlp))

              precision    recall  f1-score   support

           0       1.00      0.95      0.97        40
           1       0.97      1.00      0.99        74

    accuracy                           0.98       114
   macro avg       0.99      0.97      0.98       114
weighted avg       0.98      0.98      0.98       114



In [137]:
# Acessando matris de pesos 'coeficientes'
# É possível ter essa matriz após o treino para que seja usado já ajustados
mlp.coefs_

[array([[-3.01678242e-01,  3.23202061e-01, -5.15685030e-01,
         -3.18384932e-01, -4.31924298e-01, -4.58473122e-01,
         -4.48607334e-01,  2.41069599e-01, -3.41134407e-01,
         -3.09283667e-01,  2.48782909e-01, -2.47211230e-01,
          5.82735274e-02,  2.88014130e-01, -4.80548631e-01,
         -2.60005720e-01, -3.56198255e-01, -2.46965206e-01,
          3.38652378e-02,  1.84727294e-01, -1.91888795e-01,
         -1.19852372e-01, -3.85529389e-01, -2.51204928e-01,
          3.82261843e-01, -2.01650251e-01,  4.27829299e-02,
         -4.82110693e-01, -4.02388565e-01, -1.69137118e-01],
        [-3.61885286e-01,  1.72572975e-01, -7.20196665e-02,
         -1.84632007e-01, -2.15567240e-01, -3.41402592e-01,
         -2.03864741e-01,  3.67778606e-01, -5.05943236e-01,
         -2.06973432e-01,  3.91965805e-01, -2.28134413e-01,
         -5.33664893e-04,  1.79571795e-01, -4.09674934e-01,
         -3.38532506e-01, -1.44130814e-01, -3.09415506e-01,
          1.35519925e-02,  1.19970243e-

In [138]:
# Acessando matris bias 
# É possível ter essa matriz após o treino para que seja usado já ajustados
mlp.intercepts_

[array([-0.23956405,  0.34388828, -0.36864311, -0.37663403, -0.23435512,
        -0.26620949, -0.13142683,  0.08435082, -0.25769952, -0.40901905,
         0.21922231, -0.3320183 ,  0.19527832,  0.45375992, -0.1006644 ,
        -0.32927092, -0.17803091, -0.18131659,  0.26932509,  0.20655836,
        -0.37858876, -0.26459238, -0.35809761, -0.20167546,  0.18840072,
        -0.33547263,  0.40688726, -0.27959592, -0.35153998, -0.37892264]),
 array([ 0.24904266, -0.42382182, -0.24554813,  0.03333336,  0.29843443,
        -0.46946561,  0.28528206, -0.43694403,  0.30883443, -0.19906065,
        -0.3653874 , -0.28392128,  0.40812943, -0.26920872, -0.33371347,
        -0.3117612 , -0.37594107, -0.26235469,  0.34082856, -0.45885305,
        -0.28601371, -0.20404544, -0.46951503, -0.25883807, -0.2182485 ,
         0.15102172, -0.50173427, -0.49460616,  0.36967093, -0.48188664]),
 array([ 0.2507508 , -0.16563098,  0.11138017,  0.17019965, -0.24192614,
        -0.01956898,  0.28426291,  0.2194398 , 