# Ticket 1: Configuración del Entorno y Carga de Datos

En este notebook preparamos el entorno de trabajo y cargamos el dataset de EEG almacenado en `v1p.mat`. Los datos fueron adquiridos utilizando el sistema de registro EEG según el estándar 10-20, con 19 canales y una frecuencia de muestreo de 128 Hz. Los electrodos A1 y A2 se usaron como referencias ubicadas en los lóbulos de las orejas.

## Descripción del Dataset
- **Canales de EEG:** Fz, Cz, Pz, C3, T3, C4, T4, Fp1, Fp2, F3, F4, F7, F8, P3, P4, T5, T6, O1, O2.
- **Frecuencia de muestreo:** 128 Hz.
- **Filas:** Cada fila representa una muestra en el tiempo de la actividad eléctrica cerebral.

Cada columna del DataFrame corresponderá a la señal capturada por uno de estos canales.

In [32]:
# Importar las librerías necesarias
import numpy as np
import pandas as pd
from scipy.io import loadmat

print('Entorno configurado y librerías importadas correctamente.')

Entorno configurado y librerías importadas correctamente.


In [33]:
# Cargar el archivo v1p.mat
mat_data = loadmat('v1p.mat', squeeze_me=True)

# Mostrar las llaves disponibles en el archivo .mat
print('Llaves en el archivo .mat:', mat_data.keys())

# Extraer la variable 'v1p'
data_array = mat_data['v1p']

print('Forma del array:', data_array.shape)
print('Tipo de datos:', data_array.dtype)

Llaves en el archivo .mat: dict_keys(['__header__', '__version__', '__globals__', 'v1p'])
Forma del array: (12258, 19)
Tipo de datos: int16


In [34]:
# Convertir la matriz en un DataFrame de pandas
df = pd.DataFrame(data_array)

# Asignar nombres de columnas correspondientes a cada canal de EEG
channel_names = ['Fz', 'Cz', 'Pz', 'C3', 'T3', 'C4', 'T4', 'Fp1', 'Fp2', 'F3', 'F4', 'F7', 'F8', 'P3', 'P4', 'T5', 'T6', 'O1', 'O2']

if df.shape[1] == len(channel_names):
    df.columns = channel_names
else:
    print('Advertencia: El número de columnas en el dataset no coincide con el número de canales esperados.')

print('Primeras 5 filas del DataFrame:')
print(df.head())

Primeras 5 filas del DataFrame:
    Fz   Cz   Pz   C3   T3   C4   T4  Fp1  Fp2    F3   F4   F7   F8   P3   P4  \
0   85 -407  200  191  420  457  310  310   16  1009  531  126  457  200  457   
1 -266  -55  -20  367  163  384  -20  310  494  1193  494  236  236  310  200   
2  -90  -19  126  437  420  568  347  457 -131  1156  384  384  494  384  494   
3  -90 -160  163  473  384  494  310  384  457  1340  494  420  310  420  273   
4 -301 -336  -20  473  200  531   89  420  200  1156  310  494  273  457  236   

    T5   T6   O1   O2  
0  384  -90  473  121  
1  457 -195  543   15  
2  531  -19  613  261  
3  531  -90  437  -19  
4  568 -160  578  121  


In [35]:
# Calcular estadísticas descriptivas generales para cada canal de EEG
print('\nEstadísticas descriptivas generales:')
print(df.describe())

# Calcular estadísticas específicas: media, desviación estándar, valor máximo y mínimo para cada canal
print('\nMedia de cada canal:')
print(df.mean())

print('\nDesviación estándar de cada canal:')
print(df.std())

print('\nValor máximo de cada canal:')
print(df.max())

print('\nValor mínimo de cada canal:')
print(df.min())


Estadísticas descriptivas generales:
                 Fz            Cz            Pz            C3            T3  \
count  12258.000000  12258.000000  12258.000000  12258.000000  12258.000000   
mean     140.703377    143.592429    148.368902    142.220346    148.598711   
std      406.245216    278.553994    311.195205    231.255983    182.955381   
min    -3117.000000  -2096.000000  -2817.000000  -1815.000000   -572.000000   
25%      -19.000000    -19.000000     16.000000     50.000000     16.000000   
50%      156.000000    156.000000    126.000000    156.000000    163.000000   
75%      297.000000    297.000000    273.000000    226.000000    273.000000   
max     4063.000000   2303.000000   3806.000000   2725.000000    862.000000   

                 C4            T4           Fp1           Fp2            F3  \
count  12258.000000  12258.000000  12258.000000  12258.000000  12258.000000   
mean     148.604666    148.605564    148.401697    148.659488    155.028145   
std      163.

## Conclusiones

El entorno se ha configurado correctamente y los datos de EEG han sido cargados en un DataFrame de pandas. Cada columna (correspondiente a los canales Fz, Cz, Pz, C3, T3, C4, T4, Fp1, Fp2, F3, F4, F7, F8, P3, P4, T5, T6, O1, O2) representa una señal EEG grabada a 128 Hz. Los electrodos de referencia A1 y A2 fueron usados para referenciar las señales, aunque estos no se incluyen directamente en el archivo.

Las estadísticas descriptivas ofrecen una visión inicial de la distribución y variabilidad de cada canal, lo cual es crucial para posteriores análisis y procesamiento en proyectos de inteligencia artificial.

**Consejo Profesional:**

Invertir tiempo en la correcta preparación y exploración de los datos es esencial para el éxito de cualquier proyecto de inteligencia artificial. Una base de datos bien entendida y documentada facilita la construcción de modelos precisos y robustos. Documenta cada paso y profundiza en el análisis de cada variable para extraer insights significativos que impulsen el desarrollo de soluciones innovadoras.