In [13]:
from sklearn import neighbors, datasets
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import cross_val_score, StratifiedShuffleSplit, GridSearchCV
import numpy as np
import matplotlib.pyplot as plt


In [14]:
#Carrega a base de dados
dados_cancer = datasets.load_breast_cancer()
dados_digits = datasets.load_digits()
dados_iris = datasets.load_iris()

print("Base de Dados Breast Cancer")
print("Número de instâncias: ",dados_cancer.data.shape[0]," Número de atributos: ",dados_cancer.data.shape[1])
print("Base de Dados Digits")
print("Número de instâncias: ",dados_digits.data.shape[0]," Número de atributos: ",dados_digits.data.shape[1])
print("Base de Dados Iris")
print("Número de instâncias: ",dados_iris.data.shape[0]," Número de atributos: ",dados_iris.data.shape[1])

Base de Dados Breast Cancer
Número de instâncias:  569  Número de atributos:  30
Base de Dados Digits
Número de instâncias:  1797  Número de atributos:  64
Base de Dados Iris
Número de instâncias:  150  Número de atributos:  4


In [30]:
#Setando os parâmetros (hidden_layer_sizes, solver) para procurar seus possíveis melhores valores para o mlp
#Sem o random_state, para cada execução do algoritmo pode variar a escolha do melhor parâmetro
mlp = MLPClassifier(random_state=3)

#Número de hidden layers 
# 1 - (100 neurônios na camada 1)
# 2 - (100 neurônios na camada 1 e 100 neurônios na camada 2)
# 3 - (100 neurônios na camada 1, 100 neurônios na camada 2 e 100 neurônios na camada 3)
layers = [(100,),(100,100),(100,100,100)]

#Testar os seguintes valores de solver
solver = ['lbfgs','sgd']

#Setando os parâmetros para o GridSearchCV
param_grid = dict(hidden_layer_sizes=layers, solver=solver)

print(param_grid)

#Usando GridSearchCV para estimar os melhores parâmetros com Cross Validation k-folds=10 e score='accuracy'
grid = GridSearchCV(mlp, param_grid, cv=10, scoring='accuracy')


{'hidden_layer_sizes': [(100,), (100, 100), (100, 100, 100)], 'solver': ['lbfgs', 'sgd']}


In [31]:
#Treinando o mlp para a Base de Dados Breast Cancer
grid.fit(dados_cancer.data,dados_cancer.target)

print("Melhor configuração para a Base de Dados Breast Cancer")
print(grid.best_estimator_)

print("Melhor score: ",grid.best_score_)
print("Melhores parâmetros: ",grid.best_params_)

#Treinando o mlp para a Base de Dados Digits
grid.fit(dados_digits.data,dados_digits.target)

print("\n\nMelhor configuração para a Base de Dados Digits")
print(grid.best_estimator_)

print("Melhor score: ",grid.best_score_)
print("Melhores parâmetros: ",grid.best_params_)

#Treinando o mlp para a Base de Dados Iris
grid.fit(dados_iris.data,dados_iris.target)

print("\n\nMelhor configuração para a Base de Dados Iris")
print(grid.best_estimator_)

print("Melhor score: ",grid.best_score_)
print("Melhores parâmetros: ",grid.best_params_)


Melhor configuração para a Base de Dados Breast Cancer
MLPClassifier(activation='relu', alpha=0.0001, batch_size='auto', beta_1=0.9,
       beta_2=0.999, early_stopping=False, epsilon=1e-08,
       hidden_layer_sizes=(100,), learning_rate='constant',
       learning_rate_init=0.001, max_iter=200, momentum=0.9,
       nesterovs_momentum=True, power_t=0.5, random_state=3, shuffle=True,
       solver='lbfgs', tol=0.0001, validation_fraction=0.1, verbose=False,
       warm_start=False)
Melhor score:  0.942003514938
Melhores parâmetros:  {'hidden_layer_sizes': (100,), 'solver': 'lbfgs'}


Melhor configuração para a Base de Dados Digits
MLPClassifier(activation='relu', alpha=0.0001, batch_size='auto', beta_1=0.9,
       beta_2=0.999, early_stopping=False, epsilon=1e-08,
       hidden_layer_sizes=(100, 100, 100), learning_rate='constant',
       learning_rate_init=0.001, max_iter=200, momentum=0.9,
       nesterovs_momentum=True, power_t=0.5, random_state=3, shuffle=True,
       solver='lbfgs





Melhor configuração para a Base de Dados Iris
MLPClassifier(activation='relu', alpha=0.0001, batch_size='auto', beta_1=0.9,
       beta_2=0.999, early_stopping=False, epsilon=1e-08,
       hidden_layer_sizes=(100, 100, 100), learning_rate='constant',
       learning_rate_init=0.001, max_iter=200, momentum=0.9,
       nesterovs_momentum=True, power_t=0.5, random_state=3, shuffle=True,
       solver='lbfgs', tol=0.0001, validation_fraction=0.1, verbose=False,
       warm_start=False)
Melhor score:  0.98
Melhores parâmetros:  {'hidden_layer_sizes': (100, 100, 100), 'solver': 'lbfgs'}
