Implementação de modelos e verificação de eficiência da estratégia adotada com redes neurais e busca de parâmetros por grid search/random
search

Sistema de classificação binária utilizando uma rede neural MLP (Multi-Layer Perceptron), onde os hiperparâmetros da rede serão definidos através de um método de Busca em Grade, com validação por meio da técnica de k-fold.

In [1]:
# Importar bibliotecas
from sklearn.datasets import load_breast_cancer
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import GridSearchCV
from sklearn.metrics import classification_report
from sklearn.model_selection import train_test_split
from sklearn.model_selection import cross_val_score

import numpy as np


In [2]:
# Carregar o dataset Breast Cancer
data = load_breast_cancer()

In [3]:
X = data.data
y = data.target

X.shape

(569, 30)

In [4]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [5]:
# Valores a serem testados
hidden_layer_sizes = [50, 100]
alpha = [0.01, 0.1]

# Lista para armazenar as acurácias médias
mean_accuracies = []

# Realizar a busca pelo melhor valor
for i in hidden_layer_sizes:
   for j in alpha:
    # Criar o modelo KNN
    mlp = MLPClassifier(hidden_layer_sizes=i, alpha=j, max_iter=2000, random_state=42)

    # Calcular a acurácia média utilizando a validação cruzada
    accuracies = cross_val_score(mlp, X, y, cv=5)
    mean_accuracy = np.mean(accuracies)

    # Armazenar a acurácia média na lista
    mean_accuracies.append(mean_accuracy)

# Encontrar o melhor valor base na acurácia média
best_value = hidden_layer_sizes[np.argmax(mean_accuracies)]
best_value2 = alpha[np.argmax(mean_accuracies)]
best_accuracy = np.max(mean_accuracies)

print(f"Melhor valor: {best_value}")
print(f"Melhor valor2: {best_value2}")
print(f"Acurácia média: {best_accuracy}")

Melhor valor: 100
Melhor valor2: 0.1
Acurácia média: 0.9402421984163949


In [6]:
# Valores de hidden_layer_sizes e alpha a serem testados
hidden_layer_sizes = [50, 100]
alpha = [0.01, 0.1]

# Lista para armazenar as acurácias médias
mean_accuracies = []

# Realizar a busca pelo melhor valor de hidden_layer_sizes e alpha
for i in hidden_layer_sizes:
    for j in alpha:
        # Criar o modelo MLP
        mlp = MLPClassifier(hidden_layer_sizes=i, alpha=j, max_iter=2000, random_state=42)

        # Calcular a acurácia média utilizando a validação cruzada (5-fold)
        accuracies = cross_val_score(mlp, X, y, cv=5)
        mean_accuracy = np.mean(accuracies)

        # Armazenar a acurácia média na lista
        mean_accuracies.append(mean_accuracy)

# Encontrar os melhores valores para hidden_layer_sizes e alpha com base na acurácia média
best_hidden_layer_size = hidden_layer_sizes[np.argmax(mean_accuracies)]
best_alpha = alpha[np.argmax(mean_accuracies)]
best_accuracy = np.max(mean_accuracies)

print(f"Melhor hidden_layer_sizes: {best_hidden_layer_size}")
print(f"Melhor alpha: {best_alpha}")
print(f"Acurácia média: {best_accuracy}")

Melhor hidden_layer_sizes: 100
Melhor alpha: 0.1
Acurácia média: 0.9402421984163949


In [7]:
# Criar o modelo do classificador MLP e definir max_iter
mlp = MLPClassifier(max_iter=2000, random_state=42)

In [8]:
# Criar o mapa de buscas com os valores dos hiperparâmetros
parameter_space = {
    'hidden_layer_sizes': [50, 100],
    'activation': ['tanh', 'relu'],
    'solver': ['sgd', 'adam'],
    'alpha': [0.01, 0.1],
    'learning_rate': ['constant', 'adaptive']
}

In [9]:
# Utilizar GridSearchCV
grid_search = GridSearchCV(mlp, parameter_space, n_jobs=1, cv=5)
grid_search.fit(X_train, y_train)

In [10]:
# Verificar os melhores hiperparâmetros
best_params = grid_search.best_params_
print("Melhores hiperparâmetros:", best_params)

Melhores hiperparâmetros: {'activation': 'relu', 'alpha': 0.01, 'hidden_layer_sizes': 50, 'learning_rate': 'constant', 'solver': 'adam'}


In [11]:
# Classification_report
best_model = grid_search.best_estimator_
y_pred = best_model.predict(X_test)
report = classification_report(y_test, y_pred)
print("Relatório de classificação:\n", report)

Relatório de classificação:
               precision    recall  f1-score   support

           0       1.00      0.91      0.95        43
           1       0.95      1.00      0.97        71

    accuracy                           0.96       114
   macro avg       0.97      0.95      0.96       114
weighted avg       0.97      0.96      0.96       114



In [12]:
# Criar o modelo do classificador MLP e definir max_iter
parameter_space = {
    'hidden_layer_sizes': [50],
    'activation': ['relu'],
    'solver': ['adam'],
    'alpha': [0.01],
    'learning_rate': ['constant']
}
mlp = MLPClassifier(max_iter=2000, random_state=42)
# Utilizar GridSearchCV
grid_search = GridSearchCV(mlp, parameter_space, n_jobs=1, cv=5)
grid_search.fit(X_train, y_train)

In [13]:
best_model = grid_search.best_estimator_
y_pred = best_model.predict(X_test)
report = classification_report(y_test, y_pred)
print("Relatório de classificação:\n", report)

Relatório de classificação:
               precision    recall  f1-score   support

           0       1.00      0.91      0.95        43
           1       0.95      1.00      0.97        71

    accuracy                           0.96       114
   macro avg       0.97      0.95      0.96       114
weighted avg       0.97      0.96      0.96       114

