# Tutorial 5: Series Temporales con TDA

## An√°lisis Topol√≥gico de Se√±ales EEG y fMRI

**Autor:** MARK-126  
**Nivel:** Avanzado  
**Tiempo estimado:** 150-180 minutos

---

## Objetivos de Aprendizaje

1. ‚úÖ Comprender embeddings de Takens
2. ‚úÖ Aplicar TDA a se√±ales EEG
3. ‚úÖ Detectar eventos mediante caracter√≠sticas topol√≥gicas
4. ‚úÖ Clasificar estados cognitivos
5. ‚úÖ Analizar se√±ales fMRI con TDA

---

## 1. Introducci√≥n: Series Temporales en Neurociencias

### 1.1 Tipos de Se√±ales

**EEG (Electroencefalograf√≠a):**
- Frecuencia de muestreo: 250-2000 Hz
- Resoluci√≥n temporal: Milisegundos
- Resoluci√≥n espacial: Baja (electrodos en cuero cabelludo)
- Aplicaci√≥n: Detecci√≥n de eventos r√°pidos, epilepsia, sue√±o

**fMRI (Resonancia Magn√©tica Funcional):**
- Frecuencia de muestreo: ~0.5-2 Hz (TR = 0.5-2s)
- Resoluci√≥n temporal: Segundos
- Resoluci√≥n espacial: Alta (mm¬≥)
- Aplicaci√≥n: Conectividad funcional, mapeo cerebral

### 1.2 ¬øPor qu√© TDA para Series Temporales?

Ventajas de TDA:
- **Invarianza:** Robusto a ruido y amplitud
- **No linealidad:** Captura din√°micas complejas
- **Multi-escala:** Analiza diferentes frecuencias simult√°neamente
- **Caracter√≠sticas interpretables:** Ciclos, persistencia

---

In [None]:
# Importaciones
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from mpl_toolkits.mplot3d import Axes3D
import warnings
warnings.filterwarnings('ignore')

# TDA
from ripser import ripser
from persim import plot_diagrams
from gtda.time_series import takens_embedding_optimal_parameters

# Procesamiento de se√±ales
from scipy import signal
from scipy.fft import fft, fftfreq
from scipy.stats import zscore
from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA

# ML
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, confusion_matrix

import pandas as pd

np.random.seed(42)
print("‚úÖ Bibliotecas importadas")

---

## 2. Teorema de Takens y Embeddings

### 2.1 El Problema

Tenemos una **serie temporal 1D**, pero queremos:
- Aplicar TDA (necesita datos multi-dimensionales)
- Reconstruir la din√°mica subyacente del sistema

### 2.2 Teorema de Takens (1981)

Dada una serie temporal escalar $x(t)$, podemos reconstruir el **espacio de estados** usando:

$$\mathbf{y}(t) = [x(t), x(t+\tau), x(t+2\tau), ..., x(t+(d-1)\tau)]$$

Donde:
- **œÑ (tau):** Delay (retraso)
- **d:** Dimensi√≥n de embedding

**Resultado:** Si $d \geq 2D + 1$ (donde $D$ es la dimensi√≥n del atractor), la reconstrucci√≥n preserva propiedades topol√≥gicas.

### 2.3 Selecci√≥n de Par√°metros

- **œÑ:** Primer m√≠nimo de auto-informaci√≥n mutua o primer cero de autocorrelaci√≥n
- **d:** M√©todo de falsos vecinos m√°s cercanos

---

## 3. Implementaci√≥n: Takens Embedding

In [None]:
def takens_embedding(timeseries, delay=1, dimension=3):
    """
    Crea embedding de Takens de una serie temporal.
    
    Parameters:
    -----------
    timeseries : np.ndarray
        Serie temporal 1D
    delay : int
        Delay œÑ
    dimension : int
        Dimensi√≥n de embedding
    
    Returns:
    --------
    np.ndarray : Puntos en espacio de embedding (n_points x dimension)
    """
    n = len(timeseries)
    m = n - (dimension - 1) * delay
    
    if m <= 0:
        raise ValueError("Serie temporal muy corta para estos par√°metros")
    
    embedded = np.zeros((m, dimension))
    
    for i in range(dimension):
        start = i * delay
        end = start + m
        embedded[:, i] = timeseries[start:end]
    
    return embedded


def estimate_delay(timeseries, max_delay=100):
    """
    Estima delay √≥ptimo usando primer m√≠nimo de autocorrelaci√≥n.
    """
    autocorr = np.correlate(timeseries - np.mean(timeseries), 
                           timeseries - np.mean(timeseries), 
                           mode='full')
    autocorr = autocorr[len(autocorr)//2:]
    autocorr = autocorr / autocorr[0]
    
    # Primer cruce por cero o m√≠nimo local
    for i in range(1, min(max_delay, len(autocorr)-1)):
        if autocorr[i] < autocorr[i-1] and autocorr[i] < autocorr[i+1]:
            return i
    
    # Si no hay m√≠nimo, usar 1/e
    threshold = 1/np.e
    for i in range(1, min(max_delay, len(autocorr))):
        if autocorr[i] < threshold:
            return i
    
    return 1


print("‚úÖ Funciones de Takens embedding definidas")

### Ejemplo: Sistema de Lorenz

In [None]:
# Generar sistema de Lorenz (ca√≥tico)
def lorenz(xyz, t, sigma=10, rho=28, beta=8/3):
    x, y, z = xyz
    return [
        sigma * (y - x),
        x * (rho - z) - y,
        x * y - beta * z
    ]

from scipy.integrate import odeint

t = np.linspace(0, 50, 5000)
xyz0 = [1.0, 1.0, 1.0]
xyz = odeint(lorenz, xyz0, t)

# Usar solo componente x (como si fuera se√±al observada)
x_signal = xyz[:, 0]

print(f"üìä Se√±al de Lorenz generada: {len(x_signal)} puntos")

# Estimar delay
delay_opt = estimate_delay(x_signal)
print(f"\n‚è±Ô∏è  Delay √≥ptimo estimado: œÑ = {delay_opt}")

# Crear embedding
embedded = takens_embedding(x_signal, delay=delay_opt, dimension=3)
print(f"‚úÖ Embedding creado: {embedded.shape}")

# Visualizar
fig = plt.figure(figsize=(18, 5))

# 1. Serie temporal original
ax1 = fig.add_subplot(131)
ax1.plot(t[:1000], x_signal[:1000], linewidth=1)
ax1.set_xlabel('Tiempo', fontsize=11)
ax1.set_ylabel('x(t)', fontsize=11)
ax1.set_title('Serie Temporal: Componente x de Lorenz', fontsize=12, fontweight='bold')
ax1.grid(True, alpha=0.3)

# 2. Atractor verdadero (3D)
ax2 = fig.add_subplot(132, projection='3d')
ax2.plot(xyz[:, 0], xyz[:, 1], xyz[:, 2], linewidth=0.5, alpha=0.7)
ax2.set_xlabel('x')
ax2.set_ylabel('y')
ax2.set_zlabel('z')
ax2.set_title('Atractor Verdadero (x, y, z)', fontsize=12, fontweight='bold')

# 3. Atractor reconstruido (Takens)
ax3 = fig.add_subplot(133, projection='3d')
ax3.plot(embedded[:, 0], embedded[:, 1], embedded[:, 2], 
         linewidth=0.5, alpha=0.7, color='red')
ax3.set_xlabel(f'x(t)')
ax3.set_ylabel(f'x(t+{delay_opt})')
ax3.set_zlabel(f'x(t+{2*delay_opt})')
ax3.set_title(f'Atractor Reconstruido (Takens, œÑ={delay_opt})', 
             fontsize=12, fontweight='bold')

plt.tight_layout()
plt.show()

print("\nüí° El embedding de Takens reconstruye la geometr√≠a del atractor!")
print("   Compara el atractor verdadero vs reconstruido - ¬°son topol√≥gicamente equivalentes!")

---

## 4. Generaci√≥n de Se√±ales EEG Sint√©ticas

In [None]:
def generate_eeg_signal(duration=10, fs=250, state='normal'):
    """
    Genera se√±al EEG sint√©tica.
    
    Parameters:
    -----------
    duration : float
        Duraci√≥n en segundos
    fs : int
        Frecuencia de muestreo (Hz)
    state : str
        'normal', 'seizure' (crisis epil√©ptica), 'sleep'
    """
    n_samples = int(duration * fs)
    t = np.linspace(0, duration, n_samples)
    
    if state == 'normal':
        # Ritmos normales: alpha (8-13 Hz), beta (13-30 Hz)
        alpha = 0.5 * np.sin(2 * np.pi * 10 * t)  # 10 Hz
        beta = 0.3 * np.sin(2 * np.pi * 20 * t)   # 20 Hz
        noise = 0.2 * np.random.randn(n_samples)
        eeg = alpha + beta + noise
        
    elif state == 'seizure':
        # Crisis: spike-wave a 3 Hz, alta amplitud
        spike_wave = 2.0 * np.sin(2 * np.pi * 3 * t)
        harmonics = 0.5 * np.sin(2 * np.pi * 6 * t)
        noise = 0.1 * np.random.randn(n_samples)
        eeg = spike_wave + harmonics + noise
        
    elif state == 'sleep':
        # Sue√±o: delta (0.5-4 Hz), alta amplitud
        delta = 1.5 * np.sin(2 * np.pi * 2 * t)
        theta = 0.3 * np.sin(2 * np.pi * 6 * t)  # 6 Hz
        noise = 0.15 * np.random.randn(n_samples)
        eeg = delta + theta + noise
    
    return t, eeg


# Generar se√±ales de diferentes estados
print("üß† Generando se√±ales EEG sint√©ticas...\n")

states = ['normal', 'seizure', 'sleep']
eeg_signals = {}

for state in states:
    t, eeg = generate_eeg_signal(duration=10, fs=250, state=state)
    eeg_signals[state] = (t, eeg)
    print(f"‚úÖ {state.capitalize()}: {len(eeg)} muestras")

# Visualizar se√±ales
fig, axes = plt.subplots(3, 2, figsize=(16, 10))

for idx, state in enumerate(states):
    t, eeg = eeg_signals[state]
    
    # Serie temporal
    ax1 = axes[idx, 0]
    ax1.plot(t[:1000], eeg[:1000], linewidth=1)
    ax1.set_xlabel('Tiempo (s)', fontsize=10)
    ax1.set_ylabel('Amplitud (ŒºV)', fontsize=10)
    ax1.set_title(f'EEG: {state.capitalize()}', fontsize=11, fontweight='bold')
    ax1.grid(True, alpha=0.3)
    
    # Espectro de frecuencia
    ax2 = axes[idx, 1]
    freqs = fftfreq(len(eeg), 1/250)
    fft_vals = np.abs(fft(eeg))
    
    # Solo frecuencias positivas hasta 50 Hz
    mask = (freqs >= 0) & (freqs <= 50)
    ax2.plot(freqs[mask], fft_vals[mask], linewidth=1.5)
    ax2.set_xlabel('Frecuencia (Hz)', fontsize=10)
    ax2.set_ylabel('Potencia', fontsize=10)
    ax2.set_title(f'Espectro: {state.capitalize()}', fontsize=11, fontweight='bold')
    ax2.grid(True, alpha=0.3)
    
    # Marcar bandas de frecuencia
    ax2.axvspan(0.5, 4, alpha=0.2, color='purple', label='Delta')
    ax2.axvspan(8, 13, alpha=0.2, color='green', label='Alpha')
    ax2.axvspan(13, 30, alpha=0.2, color='orange', label='Beta')
    if idx == 0:
        ax2.legend(loc='upper right', fontsize=8)

plt.tight_layout()
plt.show()

---

## 5. An√°lisis Topol√≥gico de EEG

In [None]:
# Aplicar Takens y TDA a cada se√±al
print("‚è≥ Aplicando Takens embedding y TDA a se√±ales EEG...\n")

eeg_embeddings = {}
eeg_diagrams = {}

for state in states:
    t, eeg = eeg_signals[state]
    
    # Normalizar
    eeg_norm = zscore(eeg)
    
    # Estimar par√°metros
    delay = estimate_delay(eeg_norm, max_delay=50)
    
    # Embedding
    embedded = takens_embedding(eeg_norm, delay=delay, dimension=3)
    eeg_embeddings[state] = embedded
    
    # TDA
    result = ripser(embedded, maxdim=1, thresh=5.0)
    eeg_diagrams[state] = result['dgms']
    
    print(f"‚úÖ {state.capitalize()}:")
    print(f"   Delay: œÑ = {delay}")
    print(f"   Embedding: {embedded.shape}")
    print(f"   H‚ÇÅ (ciclos): {len(result['dgms'][1])}\n")

# Visualizar embeddings y diagramas
fig = plt.figure(figsize=(18, 10))

for idx, state in enumerate(states):
    # Embedding 3D
    ax1 = fig.add_subplot(2, 3, idx+1, projection='3d')
    emb = eeg_embeddings[state]
    ax1.plot(emb[:1000, 0], emb[:1000, 1], emb[:1000, 2], 
            linewidth=0.5, alpha=0.7)
    ax1.set_title(f'Embedding: {state.capitalize()}', 
                 fontsize=11, fontweight='bold')
    ax1.set_xlabel('x(t)')
    ax1.set_ylabel('x(t+œÑ)')
    ax1.set_zlabel('x(t+2œÑ)')
    
    # Diagrama de persistencia
    ax2 = fig.add_subplot(2, 3, idx+4)
    plot_diagrams(eeg_diagrams[state], ax=ax2)
    ax2.set_title(f'Persistencia: {state.capitalize()}\nH‚ÇÅ={len(eeg_diagrams[state][1])} ciclos',
                 fontsize=11, fontweight='bold')

plt.tight_layout()
plt.show()

print("\nüí° Observaciones:")
print("   ‚Ä¢ Estado Normal: Embedding complejo, m√∫ltiples ciclos")
print("   ‚Ä¢ Seizure: Estructura m√°s simple y regular (3 Hz dominante)")
print("   ‚Ä¢ Sleep: Ciclos lentos y persistentes (ondas delta)")

---

## 6. Clasificaci√≥n de Estados usando TDA

In [None]:
def extract_tda_features_from_signal(signal, fs=250):
    """
    Extrae caracter√≠sticas topol√≥gicas de una se√±al temporal.
    """
    # Normalizar
    signal_norm = zscore(signal)
    
    # Embedding
    delay = estimate_delay(signal_norm, max_delay=30)
    embedded = takens_embedding(signal_norm, delay=delay, dimension=3)
    
    # TDA
    result = ripser(embedded, maxdim=1, thresh=5.0)
    dgm1 = result['dgms'][1]
    
    # Caracter√≠sticas
    features = {}
    
    if len(dgm1) > 0:
        dgm1_finite = dgm1[np.isfinite(dgm1[:, 1])]
        if len(dgm1_finite) > 0:
            lifetimes = dgm1_finite[:, 1] - dgm1_finite[:, 0]
            features['n_cycles'] = len(dgm1_finite)
            features['max_persistence'] = np.max(lifetimes)
            features['mean_persistence'] = np.mean(lifetimes)
            features['std_persistence'] = np.std(lifetimes)
            features['total_persistence'] = np.sum(lifetimes)
        else:
            features = {k: 0 for k in ['n_cycles', 'max_persistence', 
                                      'mean_persistence', 'std_persistence', 
                                      'total_persistence']}
    else:
        features = {k: 0 for k in ['n_cycles', 'max_persistence', 
                                  'mean_persistence', 'std_persistence', 
                                  'total_persistence']}
    
    # Caracter√≠sticas tradicionales
    features['mean_amplitude'] = np.mean(np.abs(signal))
    features['std_amplitude'] = np.std(signal)
    
    # Caracter√≠sticas espectrales
    freqs = fftfreq(len(signal), 1/fs)
    fft_vals = np.abs(fft(signal))
    
    # Potencia en bandas
    delta_mask = (freqs >= 0.5) & (freqs <= 4)
    alpha_mask = (freqs >= 8) & (freqs <= 13)
    beta_mask = (freqs >= 13) & (freqs <= 30)
    
    features['delta_power'] = np.sum(fft_vals[delta_mask])
    features['alpha_power'] = np.sum(fft_vals[alpha_mask])
    features['beta_power'] = np.sum(fft_vals[beta_mask])
    
    return features


# Generar dataset de entrenamiento
print("üìä Generando dataset de clasificaci√≥n...\n")

n_samples_per_class = 100
X_data = []
y_data = []

for class_idx, state in enumerate(states):
    print(f"‚è≥ Generando {n_samples_per_class} muestras de '{state}'...")
    for i in range(n_samples_per_class):
        _, eeg = generate_eeg_signal(duration=5, fs=250, state=state)
        features = extract_tda_features_from_signal(eeg, fs=250)
        X_data.append(list(features.values()))
        y_data.append(class_idx)

X = np.array(X_data)
y = np.array(y_data)

print(f"\n‚úÖ Dataset creado: {X.shape}")
print(f"   Caracter√≠sticas: {list(features.keys())}")

# Dividir en train/test
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=42, stratify=y
)

# Entrenar clasificador
print("\nüéØ Entrenando clasificador Random Forest...")
clf = RandomForestClassifier(n_estimators=100, random_state=42)
clf.fit(X_train, y_train)

# Evaluar
y_pred = clf.predict(X_test)
accuracy = np.mean(y_pred == y_test)

print(f"\n‚úÖ Precisi√≥n en test: {accuracy:.1%}")
print("\nüìä Reporte de clasificaci√≥n:\n")
print(classification_report(y_test, y_pred, 
                          target_names=states))

# Matriz de confusi√≥n
cm = confusion_matrix(y_test, y_pred)

fig, ax = plt.subplots(figsize=(8, 6))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', 
           xticklabels=states, yticklabels=states, ax=ax)
ax.set_xlabel('Predicho', fontsize=12)
ax.set_ylabel('Verdadero', fontsize=12)
ax.set_title(f'Matriz de Confusi√≥n\n(Precisi√≥n: {accuracy:.1%})', 
            fontsize=14, fontweight='bold')
plt.tight_layout()
plt.show()

# Importancia de caracter√≠sticas
feature_names = list(features.keys())
importances = clf.feature_importances_
indices = np.argsort(importances)[::-1]

fig, ax = plt.subplots(figsize=(12, 6))
ax.barh(range(len(importances)), importances[indices], alpha=0.7)
ax.set_yticks(range(len(importances)))
ax.set_yticklabels([feature_names[i] for i in indices])
ax.set_xlabel('Importancia', fontsize=12)
ax.set_title('Importancia de Caracter√≠sticas TDA para Clasificaci√≥n', 
            fontsize=14, fontweight='bold')
ax.grid(True, alpha=0.3, axis='x')
plt.tight_layout()
plt.show()

print("\nüí° Caracter√≠sticas m√°s importantes:")
for i in range(5):
    idx = indices[i]
    print(f"   {i+1}. {feature_names[idx]}: {importances[idx]:.3f}")

---

## 7. Resumen y Conclusiones

### ‚úÖ Lo que aprendimos:

1. **Teorema de Takens:** Reconstrucci√≥n de din√°mica desde serie 1D
2. **Embeddings:** Transformar series temporales en nubes de puntos
3. **TDA en se√±ales:** Aplicar homolog√≠a persistente a EEG
4. **Clasificaci√≥n:** Usar caracter√≠sticas topol√≥gicas para ML
5. **Aplicaciones:** Detecci√≥n de crisis, estados de sue√±o, etc.

### üß† Aplicaciones Cl√≠nicas:

- **Epilepsia:** Detecci√≥n temprana de crisis (cambios topol√≥gicos)
- **Sue√±o:** Clasificaci√≥n autom√°tica de etapas
- **Anestesia:** Monitoreo de profundidad
- **Coma:** Evaluaci√≥n de nivel de consciencia
- **Cognici√≥n:** An√°lisis de estados atencionales

### üîë Ventajas de TDA:

- **Robustez:** Invariante a ruido y amplitud
- **Interpretabilidad:** Ciclos tienen significado f√≠sico
- **Multi-escala:** Captura m√∫ltiples frecuencias
- **No linealidad:** Detecta din√°micas complejas

---

## Referencias

1. Takens, F. (1981). "Detecting strange attractors in turbulence"
2. Perea et al. (2015). "Sliding windows and persistence for time series"
3. Myers et al. (2019). "Persistent homology of complex networks for dynamic state detection"
4. Khalid et al. (2020). "TDA for EEG signal analysis"

---

## üéâ ¬°Completaste todos los tutoriales!

Has dominado:
1. ‚úÖ Fundamentos de TDA
2. ‚úÖ Homolog√≠a persistente avanzada
3. ‚úÖ Conectividad cerebral
4. ‚úÖ Algoritmo Mapper
5. ‚úÖ Series temporales neuronales

**Pr√≥ximos pasos:**
- Aplica estos m√©todos a datos reales
- Explora bibliotecas adicionales (Giotto-TDA, GUDHI)
- Lee papers de investigaci√≥n
- ¬°Contribuye al campo!

---

**Autor:** MARK-126  
**Licencia:** MIT