In [1]:
import os
import pandas as pd
from sklearn.model_selection import KFold, GridSearchCV
from sklearn.neural_network import MLPRegressor
import joblib

In [2]:
# abrindo os metadados
df = pd.read_csv("./../../../meta_dados/input_data/experiment_4/best_accuracy_sample_4.csv")
X = df.drop(columns=["target"]).to_numpy()
y = df["target"].to_numpy()

In [3]:
# criando kfold
kf = KFold(n_splits=60, shuffle=True, random_state=42)

param_grid = [
    # Configuração para otimização com 'adam' (mais comum)
    {
        'activation': ['relu', 'tanh'],  
        'solver': ['adam'],
        'learning_rate': ['constant', 'adaptive'],  # Removido 'invscaling' (menos usado com Adam)
        'hidden_layer_sizes': [
            (50,), (100,), (150,), 
            (50, 50), (100, 100), (150, 150),
            (50, 50, 50), (100, 100, 100)
        ],  # Reduzido para arquiteturas mais práticas
        'alpha': [0.0001, 0.001, 0.01],  # Regularização L2
        'max_iter': [100,200, 300],
        'early_stopping': [True]  # Adicionado para evitar overfitting
    },
    # Configuração para otimização com 'sgd' (requer ajuste fino)
    {
        'activation': ['tanh', 'relu'],
        'solver': ['sgd'],
        'learning_rate': ['constant', 'invscaling', 'adaptive'],
        'hidden_layer_sizes': [
            (50,), (100,), (150,), 
            (50, 50), (100, 100), (150, 150),
            (50, 50, 50), (100, 100, 100)
        ],
        'alpha': [0.0001, 0.001, 0.01],
        'max_iter': [300],
        'max_iter': [100,200, 300],  # Adicionado (importante para SGD)
        'nesterovs_momentum': [True],  # Adicionado
        'early_stopping': [True]
    }
]


mlp = MLPRegressor(random_state=42)

# Configurar o GridSearchCV
grid_search = GridSearchCV(
    estimator=mlp,
    param_grid=param_grid,
    cv=kf, 
    scoring='neg_mean_squared_error', 
    n_jobs=-6,  
    verbose=1
)  

# Executar o GridSearchCV
grid_search.fit(X, y)

Fitting 60 folds for each of 720 candidates, totalling 43200 fits




















































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































0,1,2
,estimator,MLPRegressor(random_state=42)
,param_grid,"[{'activation': ['relu', 'tanh'], 'alpha': [0.0001, 0.001, ...], 'early_stopping': [True], 'hidden_layer_sizes': [(50,), (100,), ...], ...}, {'activation': ['tanh', 'relu'], 'alpha': [0.0001, 0.001, ...], 'early_stopping': [True], 'hidden_layer_sizes': [(50,), (100,), ...], ...}]"
,scoring,'neg_mean_squared_error'
,n_jobs,-6
,refit,True
,cv,KFold(n_split... shuffle=True)
,verbose,1
,pre_dispatch,'2*n_jobs'
,error_score,
,return_train_score,False

0,1,2
,loss,'squared_error'
,hidden_layer_sizes,"(100, ...)"
,activation,'relu'
,solver,'adam'
,alpha,0.01
,batch_size,'auto'
,learning_rate,'constant'
,learning_rate_init,0.001
,power_t,0.5
,max_iter,100


In [4]:
# Melhores parâmetros encontrados
print("Melhores parâmetros:", grid_search.best_params_)

# Melhor score
print("Melhor MSE:", -grid_search.best_score_)  # Converter de negativo para positivo

Melhores parâmetros: {'activation': 'relu', 'alpha': 0.01, 'early_stopping': True, 'hidden_layer_sizes': (100, 100, 100), 'learning_rate': 'constant', 'max_iter': 100, 'solver': 'adam'}
Melhor MSE: 0.06073242927522028


In [5]:
# salvando o melhor modelo
joblib.dump(grid_search.best_estimator_, "./saved_models/mlp.joblib")

['./saved_models/mlp.joblib']

In [6]:
# salvar resultados
def save_results(grid_search, filename="./resultados.csv"):
    """
    Verifica se o arquivo CSV existe, cria se não existir, e adiciona uma nova linha com model e best_score_.
    
    Args:
        grid_search (GridSearchCV): Objeto GridSearchCV treinado
        filename (str): Nome do arquivo CSV (padrão: './resultados.csv')
    """
    # Obtém o nome do modelo
    model_name = grid_search.estimator.__class__.__name__
    # Obtém o melhor score (neg_mean_squared_error, convertido para positivo se necessário)
    metric_score = grid_search.best_score_
    
    # Dados da nova linha
    new_data = pd.DataFrame({
        'model': [model_name],
        'metric_score': [metric_score]
    })
    
    # Verifica se o arquivo existe
    if not os.path.exists(filename):
        # Cria o arquivo com as colunas model e metric_score
        new_data.to_csv(filename, index=False)
    else:
        # Adiciona a nova linha ao arquivo existente
        existing_data = pd.read_csv(filename)
        updated_data = pd.concat([existing_data, new_data], ignore_index=True)
        updated_data.to_csv(filename, index=False)


In [7]:
save_results(grid_search)