#Modelo de Classificação - Multi-Layer Perceptron - Dataset MNist

O algoritmo de redes neurais Multi-Layer Perceptron (MLP) é um tipo de rede neural artificial que é composta por várias camadas de neurônios interconectados. Cada neurônio recebe sinais de entrada de outros neurônios nas camadas anteriores e produz um sinal de saída que é enviado para outros neurônios nas camadas posteriores. A rede neural é treinada usando um conjunto de dados de treinamento, onde os pesos das conexões entre os neurônios são ajustados de modo a minimizar um erro entre as saídas desejadas e as saídas reais da rede.

O algoritmo MLP é amplamente utilizado em muitas aplicações, como processamento de linguagem natural, reconhecimento de imagem e sistemas de recomendação. Ele é capaz de aprender representações complexas dos dados e é um dos algoritmos de redes neurais mais poderosos e versáteis.

In [None]:
from sklearn.datasets import fetch_openml

import pandas as pd
import numpy as np

import matplotlib
import matplotlib.pyplot as plt

from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier

from sklearn.metrics import confusion_matrix,ConfusionMatrixDisplay

import time

In [None]:
mnist = fetch_openml('mnist_784')

In [None]:
mnist

In [None]:
X = mnist["data"]
y = mnist["target"]

print(X.shape)
print(y.shape)

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

Para treinar a rede neural, é necessário passar alguns hiperparâmetros, como por exemplo a quantidade de camadas escondidas e a quantidade de neurônios. Neste exemplo são implementadas três camadas ocultas contendo respectivamente 400, 200 e 50 neurônios. Também foi definido o máximo de 50.000 épocas de treinamento para o modelo.

In [None]:
inicio = time.time()
modelo_nn = MLPClassifier(solver='sgd', max_iter=50000, learning_rate_init = 0.01, hidden_layer_sizes=(400, 200, 50), random_state=42)
modelo_nn.fit(X_train,y_train)
termino = time.time()
print("--- %s segundos para treinar o modelo ---" % (termino - inicio))

In [None]:
inicio = time.time()
predicao = modelo_nn.predict(X_test)
termino = time.time()
print(predicao)
print("--- %s segundos para fazer o scoring do modelo ---" % (termino - inicio))

In [None]:
matriz_confusao = confusion_matrix(y_test, predicao)
print(matriz_confusao)

matriz_confusao_visual = ConfusionMatrixDisplay(confusion_matrix=matriz_confusao,display_labels = np.array([1,2]))
matriz_confusao_visual.plot();