<a href="https://colab.research.google.com/github/andryll/Cortisol-Estimator-with-DL/blob/main/notebooks/CortiRocket.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [10]:
!pip install aeon > /dev/null

## Carregando o repositório do GitHub com os dados

In [11]:
!git clone https://github.com/andryll/Cortisol-Estimator-with-DL

fatal: destination path 'Cortisol-Estimator-with-DL' already exists and is not an empty directory.


## Carregando e Preparando os Dados


1.   Os dados de treino, teste e validação são carregados e concatenados, de modo a desfazer a divisão feita anteriormente.

2.   Em seguida, os dados de teste são normalizados com o MinMaxScaler



In [8]:
import numpy as np
from sklearn.preprocessing import StandardScaler

data_X = np.load("../data/X_train.npy")
data_X = np.concatenate((data_X, np.load("../data/X_val.npy")), axis=0)
data_X = np.concatenate((data_X, np.load("../data/X_test.npy")), axis=0)

data_y = np.load("../data/y_train.npy")
data_y = np.concatenate((data_y, np.load("../data/y_val.npy")), axis=0)
data_y = np.concatenate((data_y, np.load("../data/y_test.npy")), axis=0)

scaler = StandardScaler()
n_samples, n_timesteps, n_features = data_X.shape
data_X_reshaped = data_X.reshape(-1, n_features)

data_X = scaler.fit_transform(data_X_reshaped)
data_X = data_X.reshape(n_samples, n_timesteps, n_features)

# data_X = data_X[:,:,[1,3]]

print("data_X shape:", data_X.shape)
print("data_y shape:", data_y.shape)

data_X shape: (148, 587, 4)
data_y shape: (148,)


## Realizando a Regressão com o ROCKET

In [9]:
from aeon.regression.convolution_based import RocketRegressor
from sklearn.model_selection import KFold
from sklearn.metrics import mean_squared_error, r2_score
import numpy as np

# Realizando o KFold split com 10 folds
n_splits = 10
kf = KFold(n_splits=n_splits, shuffle=True, random_state=42)

mses = [] # Lista para armazenar o MSE de cada Fold
r2s = [] # Lista para armazenar o R2 de cada Fold

print(f"Realizando o {n_splits}-fold cross-validation...")

# Loop iterando cada uma das pastas
for fold, (train_index, test_index) in enumerate(kf.split(data_X)): # Enumerando as pastas
    print(f"\nFold {fold+1}/{n_splits}")

    # Dividindo os dados de acordo com a pasta atual
    X_train_fold, X_test_fold = data_X[train_index], data_X[test_index]
    y_train_fold, y_test_fold = data_y[train_index], data_y[test_index]

    
    # Inicializando o RocketRegressor com 10000 kernels
    reg = RocketRegressor(n_kernels=10000)
    # Treinando o Regressor
    reg.fit(X_train_fold, y_train_fold)

    # Realizando as predições
    y_pred_fold = reg.predict(X_test_fold)

    # Calculando o MSE para a pasta atual
    mse_fold = mean_squared_error(y_test_fold, y_pred_fold)
    mses.append(mse_fold)

    # Calculando o R2 score para a pasta atual
    r2_fold = r2_score(y_test_fold, y_pred_fold)
    r2s.append(r2_fold)

    print(f"MSE para a pasta {fold+1}: {mse_fold:.4f}")
    print(f"R2 Score para a pasta {fold+1}: {r2_fold:.4f}")

# Calculando a média dos MSE e R2
average_mse = np.mean(mses)
average_r2 = np.mean(r2s)

print(f"\nAverage MSE across {n_splits} folds: {average_mse:.4f}")
print(f"Average R2 Score across {n_splits} folds: {average_r2:.4f}")


Realizando o 10-fold cross-validation...

Fold 1/10
MSE para a pasta 1: 50.0514
R2 Score para a pasta 1: 0.2138

Fold 2/10
MSE para a pasta 2: 91.5180
R2 Score para a pasta 2: 0.4060

Fold 3/10
MSE para a pasta 3: 92.9197
R2 Score para a pasta 3: 0.1675

Fold 4/10
MSE para a pasta 4: 92.3313
R2 Score para a pasta 4: -0.0115

Fold 5/10
MSE para a pasta 5: 52.7375
R2 Score para a pasta 5: 0.4056

Fold 6/10
MSE para a pasta 6: 16.9309
R2 Score para a pasta 6: 0.1983

Fold 7/10
MSE para a pasta 7: 74.4305
R2 Score para a pasta 7: -0.1078

Fold 8/10
MSE para a pasta 8: 44.5448
R2 Score para a pasta 8: -0.0586

Fold 9/10
MSE para a pasta 9: 43.2813
R2 Score para a pasta 9: 0.1557

Fold 10/10
MSE para a pasta 10: 140.3287
R2 Score para a pasta 10: 0.1541

Average MSE across 10 folds: 69.9074
Average R2 Score across 10 folds: 0.1523


## Salvar Resultados em Arquivo

In [10]:
import os

# Criando a pasta de resultados
os.makedirs('../results', exist_ok=True)

print(f"Pasta checada/criada com sucesso.")

Pasta checada/criada com sucesso.


In [11]:
import pandas as pd

# Criando a lista de fols + média
fold_labels = [f"Fold {i+1}" for i in range(len(mses))] + ["Average"]

# Criando um dicionário dos resultados
results_data = {
    'Fold': fold_labels,
    'MSE': mses + [average_mse],
    'R2 Score': r2s + [average_r2]
}

# Criando o DataFrame
results_df = pd.DataFrame(results_data)

# Salvando em CSV
results_df.to_csv("../results/rocket_results.csv", index=False)

print("Resultados Salvos")

print("\nResumo dos Resultados:")
print(results_df)

Resultados Salvos

Resumo dos Resultados:
       Fold         MSE  R2 Score
0    Fold 1   50.051428  0.213802
1    Fold 2   91.517980  0.406034
2    Fold 3   92.919685  0.167473
3    Fold 4   92.331255 -0.011497
4    Fold 5   52.737509  0.405639
5    Fold 6   16.930854  0.198304
6    Fold 7   74.430480 -0.107848
7    Fold 8   44.544838 -0.058572
8    Fold 9   43.281342  0.155719
9   Fold 10  140.328714  0.154083
10  Average   69.907409  0.152314
