# Imports

In [10]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from io import StringIO
import os 
import seaborn as sns
import mne  # Muy útil para EEG
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, confusion_matrix
import antropy as ant
from sklearn.svm import SVC
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import precision_score, recall_score, f1_score
from sklearn.decomposition import PCA
from sklearn.metrics import accuracy_score



# Carga de datos

In [19]:
# Ruta de las carpetas
channels_file = 'Data/channels.csv'
eeg_folder = 'Data/NBack/'

# Combinar todos los archivos EEG
all_eeg = []
eeg_files = [f for f in os.listdir(eeg_folder) if f.startswith('EEG_') and f.endswith('.csv')]

for eeg_file in eeg_files:
    with open(os.path.join(eeg_folder, eeg_file), 'r') as file:
        lines = file.readlines()
    lines[0] = lines[0].lstrip(',')  # Eliminar la coma inicial de la primera línea
    eeg_data = pd.read_csv(StringIO(''.join(lines)))
    eeg_data['source_file'] = eeg_file  # Agregar columna para identificar el archivo de origen
    all_eeg.append(eeg_data)

combined_eeg = pd.concat(all_eeg, ignore_index=True)

# Combinar todos los archivos NBack
all_nback = []
nback_files = [f for f in os.listdir(eeg_folder) if f.startswith('NBack_') and f.endswith('.csv')]

for nback_file in nback_files:
    nback_data = pd.read_csv(os.path.join(eeg_folder, nback_file))
    nback_data['source_file'] = nback_file  # Agregar columna para identificar el archivo de origen
    all_nback.append(nback_data)

combined_nback = pd.concat(all_nback, ignore_index=True)

# Leer los nombres de los canales desde el archivo channels.csv
channels = ['timestamp'] + pd.read_csv(channels_file, header=None).iloc[0].tolist()

# Cambiar los nombres de las columnas del DataFrame combinado de EEG
combined_eeg.columns = channels + ['source_file']  # Mantener la columna 'source_file' al final

# Mostrar un resumen del DataFrame combinado con los nuevos nombres de columnas
print("EEG combinado con nombres actualizados:")
print(combined_eeg.head())

# Opcional: Guardar los DataFrames combinados en archivos CSV
# combined_eeg.to_csv('combined_eeg.csv', index=False)
# combined_nback.to_csv('combined_nback.csv', index=False)

# Mostrar un resumen de los datos combinados
print("EEG combinado:")
print(combined_eeg.head())
print("\nNBack combinado:")
print(combined_nback.head())

EEG combinado con nombres actualizados:
   timestamp           F4            Oz            Fz            F8  \
0   0.045299  2327.497887  14123.593249  19397.060884  15709.190157   
1   0.049206  2370.036155  14146.383345  19430.449044  15774.822714   
2   0.053112  2344.581333  14114.430973  19402.548515  15743.916764   
3   0.057018  2391.159277  14158.879570  19451.718178  15794.388370   
4   0.060925  2308.747466  14097.809899  19366.471294  15694.175219   

            Pz            F5            T5           T3            C4  \
0  3360.109478  17359.494877  23611.987567  9074.315427  19640.499994   
1  3389.786490  17380.532825  23620.748308  9078.987823  19665.455941   
2  3350.107631  17357.085673  23599.345330  9150.229688  19653.215238   
3  3394.349377  17409.504111  23619.896570  9195.578694  19687.540310   
4  3320.880823  17326.848947  23567.526802  8976.560151  19600.456104   

             C3            T4            P4            T6           Cz  \
0  25970.245391  196

In [21]:
print("\nNBack combinado:")
print(combined_nback.head())


NBack combinado:
        Time  Event Code  Notes  source_file
0  17.921582           1    1.0  NBack_1.csv
1  20.567397           5    6.0  NBack_1.csv
2  23.127966           5    2.0  NBack_1.csv
3  25.646424           5    9.0  NBack_1.csv
4  28.122818           5    1.0  NBack_1.csv


# Segmentación por ventanas deslizantes

In [26]:
# --- PARTE 1: Configuración de ventana ---
freq = 256  # Frecuencia de muestreo (Hz)
segundos = 4
ventana = freq * segundos
desplazamiento = ventana // 2

# --- PARTE 2: Cargar eventos ---
bloques_n = combined_nback[combined_nback['Event Code'] == 4].reset_index(drop=True)

# --- PARTE 3: Crear ventanas deslizantes con etiquetas ---
ventanas_deslizantes = []
etiquetas = []

for i in range(0, len(combined_eeg) - ventana + 1, desplazamiento):
    ventana_df = combined_eeg.iloc[i:i + ventana].copy()
    tiempo_inicio = ventana_df['timestamp'].iloc[0]

    # Buscar el valor de n correspondiente a ese tiempo
    n_actual = None
    for j in range(len(bloques_n) - 1):
        if bloques_n['Time'][j] <= tiempo_inicio < bloques_n['Time'][j + 1]:
            n_actual = bloques_n['Notes'][j]
            break
    if n_actual is None:
        # Si está después del último evento de tipo 4, usar ese último valor
        if tiempo_inicio >= bloques_n['Time'].iloc[-1]:
            n_actual = bloques_n['Notes'].iloc[-1]
        else:
            continue  # Si no encaja en ningún bloque, descartar

    ventanas_deslizantes.append(ventana_df)
    etiquetas.append(n_actual)

print(f"Total de ventanas deslizantes etiquetadas: {len(ventanas_deslizantes)}")

# Mostrar un ejemplo
if ventanas_deslizantes:
    print("Primera ventana deslizante:")
    print(ventanas_deslizantes[0].head())
    print("Etiqueta:", etiquetas[0])


Total de ventanas deslizantes etiquetadas: 2426
Primera ventana deslizante:
      timestamp           F4            Oz            Fz            F8  \
8192  32.046504  2336.222125  15156.144001  19079.410991  15608.660646   
8193  32.050410  2337.755255  15127.562081  19076.381234  15602.771481   
8194  32.054317  2326.098602  15123.291220  19063.094109  15597.417694   
8195  32.058223  2327.412713  15150.875388  19067.097282  15599.425364   
8196  32.062129  2345.627755  15157.385106  19078.303730  15591.954398   

               Pz            F5            T5           T3            C4  \
8192  3740.070146  17117.966095  23900.434988  8900.548549  19526.379166   
8193  3721.319726  17117.199530  23871.609714  8894.184844  19521.597261   
8194  3712.206121  17099.751053  23869.017994  8909.370129  19514.710345   
8195  3727.415742  17105.688889  23886.466472  8894.683719  19514.807686   
8196  3730.092635  17113.354538  23891.333550  8895.766644  19529.262910   

                C3    

# Extracción de características

In [None]:
def extract_features(segment):
    features = []
    for channel in segment.T:
        features.append(np.mean(channel))
        features.append(np.std(channel))
        features.append(ant.petrosian_fd(channel))  # complejidad
        features.append(ant.spectral_entropy(channel, sf=fs))
    return features

X = np.array([extract_features(seg) for seg in segments])
y = np.array(labels)


# Preprocesamiento

In [None]:
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, stratify=y, test_size=0.2, random_state=42)

# Entrenamiento del modelo

## Random Forest

In [None]:
clf = RandomForestClassifier(n_estimators=100, random_state=42)
clf.fit(X_train, y_train)
y_pred_rf = clf.predict(X_test)

print(classification_report(y_test, y_pred_rf))


## SVM

In [None]:
svm_model = SVC(kernel='rbf', C=1, gamma='scale')
svm_model.fit(X_train, y_train)
y_pred_svm = svm_model.predict(X_test)

print("SVM Classification Report:")
print(classification_report(y_test, y_pred_svm))


## KNN

In [None]:
knn_model = KNeighborsClassifier(n_neighbors=5)
knn_model.fit(X_train, y_train)
y_pred_knn = knn_model.predict(X_test)

print("KNN Classification Report:")
print(classification_report(y_test, y_pred_knn))


# Visualización

## Matiz de confusión

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.metrics import ConfusionMatrixDisplay

def plot_confusion(y_true, y_pred, model_name):
    cm = confusion_matrix(y_true, y_pred)
    disp = ConfusionMatrixDisplay(confusion_matrix=cm)
    disp.plot(cmap='Blues')
    plt.title(f'Matriz de confusión: {model_name}')
    plt.grid(False)
    plt.show()

plot_confusion(y_test, y_pred_rf, "Random Forest")
plot_confusion(y_test, y_pred_svm, "SVM")
plot_confusion(y_test, y_pred_knn, "KNN")


## Métricas

In [None]:


def get_metrics(y_true, y_pred, model_name):
    return {
        "Modelo": model_name,
        "Accuracy": accuracy_score(y_true, y_pred),
        "Precision": precision_score(y_true, y_pred, average='weighted'),
        "Recall": recall_score(y_true, y_pred, average='weighted'),
        "F1-score": f1_score(y_true, y_pred, average='weighted')
    }

results = [
    get_metrics(y_test, y_pred_rf, "Random Forest"),
    get_metrics(y_test, y_pred_svm, "SVM"),
    get_metrics(y_test, y_pred_knn, "KNN")
]

metrics_df = pd.DataFrame(results)

# Visualización en barra
metrics_df.set_index("Modelo")[["Accuracy", "Precision", "Recall", "F1-score"]].plot(kind='bar', figsize=(10,6), ylim=(0,1), colormap="Set2")
plt.title("Comparación de Métricas")
plt.ylabel("Valor")
plt.xticks(rotation=0)
plt.grid(axis='y')
plt.show()


## Visualización 2D de los datos con PCA

In [None]:

pca = PCA(n_components=2)
X_pca = pca.fit_transform(X_scaled)

# Visualización con clases reales
plt.figure(figsize=(8,6))
sns.scatterplot(x=X_pca[:,0], y=X_pca[:,1], hue=y, palette='Set2', alpha=0.7)
plt.title("Visualización PCA por clase real")
plt.xlabel("Componente 1")
plt.ylabel("Componente 2")
plt.legend(title="Carga Cognitiva (n)")
plt.grid(True)
plt.show()