#MNist com Multi-Layer Perceptron

Neste experimento foram exploradas configurações de hiper-parâmetros do algoritmo Multi-Layer Perceptron, variando a função de ativação (*activation*): entre Tangente Hiperbólica e Relu, o *solver* que é o otimizador do algoritmo entre o *sgd* (Gradiente Descendente Estocástico) e o *adam* (Gradiente Descendente Estocástico otimizado), por fim quantidade de neurônios nas camadas escondidas testando uma unica camada com 100 neurônios, depois são duas camadas com 10 neurônios cada, em seguida duas camadas com 15 e 15, e para finalizar duas camadas com 20 neurônios em cada.

Para garantir uma reproducibilidade entre este experimento e os demais, o conjunto de dados foi separado em 10 pastas com a técnica de Cross Validation utilizando o estado randômico 42.

A combinação dos hiper-parâmetros foi feita utilizando Grid Search, que cruza todas as opções dos dicionários e responde qual é a melhor configuração encontrada. Estas parametrizações são utilizadas para criar um modelo final, que é serializado em um objeto Pickle.

In [None]:
from sklearn.datasets import fetch_openml

import joblib
from sklearn.metrics import confusion_matrix,ConfusionMatrixDisplay
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import StratifiedKFold

from sklearn.neural_network import MLPClassifier

import time

In [None]:
mnist = fetch_openml('mnist_784')

In [None]:
X = mnist["data"]
y = mnist["target"]

print(X.shape)
print(y.shape)

In [None]:
param_grid = [{'activation': ['tanh', 'relu'],
               'solver':['sgd', 'adam'],
               'hidden_layer_sizes': ['(100)','(10,10)','(15,15)','(20,20)'] }]

kfolds = StratifiedKFold(n_splits=10, random_state=42, shuffle=True)

In [None]:
mlp = MLPClassifier()

inicio = time.time()
grid_search_mlp = GridSearchCV(mlp, param_grid, cv=kfolds, verbose=3)
resultado_modelo = grid_search_mlp.fit(X,y)
termino = time.time()
print("--- %s segundos para treinar o modelo ---" % (termino - inicio))

In [None]:
print("Melhores Parâmetros")
print(grid_search_mlp.best_params_)
print("**************")
print("Melhores Estimadores")
print(grid_search_mlp.best_estimator_)
print("**************")
print("Melhores Pontuações")
print(grid_search_mlp.best_score_)
print("**************")
print(grid_search_mlp.best_index_)
print("**************")

In [None]:
joblib.dump(grid_search_mlp, "modelo_mlp_mnist.pkl")