# Tutorial 2: Homolog√≠a Persistente Avanzada

## Aplicaciones a Patrones Neuronales

**Autor:** MARK-126  
**Nivel:** Intermedio-Avanzado  
**Tiempo estimado:** 120-150 minutos

---

## Objetivos de Aprendizaje

1. ‚úÖ Dominar diferentes tipos de filtraciones (Rips, Alpha, ƒåech)
2. ‚úÖ Calcular distancias entre diagramas de persistencia
3. ‚úÖ Aplicar TDA a spike trains neuronales
4. ‚úÖ Optimizar c√°lculos para datasets grandes
5. ‚úÖ Interpretar resultados en contexto neurobiol√≥gico

---

## 1. Repaso y Motivaci√≥n

En el Tutorial 1 aprendimos los fundamentos de TDA. Ahora vamos m√°s profundo:

### ¬øPor qu√© necesitamos m√©todos avanzados?

En neurociencias nos encontramos con:
- **Datos masivos:** Miles de neuronas registradas simult√°neamente
- **Alta dimensi√≥n:** Espacios de activaci√≥n de 100+ dimensiones
- **Comparaciones:** Necesitamos cuantificar similitud entre estados
- **Temporalidad:** Datos din√°micos que evolucionan en el tiempo

### Preguntas que responderemos:

1. ¬øC√≥mo comparar la topolog√≠a de dos estados cerebrales?
2. ¬øQu√© filtraci√≥n es mejor para datos neuronales?
3. ¬øC√≥mo analizar patrones temporales de activaci√≥n?
4. ¬øQu√© caracter√≠sticas topol√≥gicas son m√°s informativas?

---

In [None]:
# Importaciones
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from mpl_toolkits.mplot3d import Axes3D
import warnings
warnings.filterwarnings('ignore')

# TDA avanzado
from ripser import ripser
from persim import plot_diagrams, bottleneck, sliced_wasserstein
import gudhi as gd
from gtda.homology import VietorisRipsPersistence
from gtda.diagrams import Amplitude, PersistenceEntropy
from gtda.plotting import plot_diagram

# Procesamiento de datos
from scipy.spatial.distance import pdist, squareform, euclidean
from scipy.stats import poisson
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
import pandas as pd

# Visualizaci√≥n avanzada
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import plotly.express as px

# Configuraci√≥n
plt.style.use('seaborn-v0_8-whitegrid')
sns.set_context("notebook", font_scale=1.2)
np.random.seed(42)

print("‚úÖ Bibliotecas importadas correctamente")
print(f"üì¶ GUDHI version: {gd.__version__}")

---

## 2. Tipos de Filtraciones

### 2.1 ¬øQu√© es una filtraci√≥n?

Una **filtraci√≥n** es una secuencia de complejos simpliciales anidados:
$$\emptyset = K_0 \subseteq K_1 \subseteq K_2 \subseteq \ldots \subseteq K_n = K$$

Cada tipo de filtraci√≥n tiene **ventajas espec√≠ficas** para diferentes tipos de datos.

### 2.2 Comparaci√≥n de Filtraciones

| Filtraci√≥n | Ventaja | Desventaja | Aplicaci√≥n Neural |
|-----------|---------|------------|-------------------|
| **Vietoris-Rips** | R√°pido, simple | Puede a√±adir simplejos espurios | An√°lisis de conectividad general |
| **ƒåech** | Te√≥ricamente √≥ptimo | Computacionalmente costoso | Estudios te√≥ricos |
| **Alpha** | Geom√©tricamente preciso | Solo para baja dimensi√≥n | Visualizaci√≥n de subredes |
| **Filtraci√≥n de grafo** | Natural para redes | Requiere estructura de grafo | Conectomas cerebrales |

---

## 3. Implementaci√≥n Pr√°ctica: Comparaci√≥n de Filtraciones

In [None]:
def compare_filtrations(points, max_dim=2):
    """
    Compara diferentes tipos de filtraciones en los mismos datos.
    
    Parameters:
    -----------
    points : numpy array
        Puntos a analizar (n_points x n_dimensions)
    max_dim : int
        Dimensi√≥n m√°xima de homolog√≠a
    """
    results = {}
    
    # 1. Vietoris-Rips (usando ripser - r√°pido)
    print("üîÑ Calculando Vietoris-Rips...")
    import time
    start = time.time()
    rips_result = ripser(points, maxdim=max_dim)
    rips_time = time.time() - start
    results['Vietoris-Rips'] = {
        'diagrams': rips_result['dgms'],
        'time': rips_time
    }
    
    # 2. Alpha complex (usando GUDHI)
    if points.shape[1] <= 3:  # Alpha solo funciona bien en 2D/3D
        print("üîÑ Calculando Alpha complex...")
        start = time.time()
        alpha_complex = gd.AlphaComplex(points=points)
        simplex_tree = alpha_complex.create_simplex_tree()
        persistence = simplex_tree.persistence()
        
        # Convertir a formato de diagrama
        alpha_diagrams = [[] for _ in range(max_dim + 1)]
        for dim, (birth, death) in persistence:
            if dim <= max_dim:
                alpha_diagrams[dim].append([birth, death])
        
        alpha_diagrams = [np.array(d) if len(d) > 0 else np.array([]).reshape(0, 2) 
                         for d in alpha_diagrams]
        alpha_time = time.time() - start
        
        results['Alpha'] = {
            'diagrams': alpha_diagrams,
            'time': alpha_time
        }
    
    return results

# Generar datos de prueba: red neuronal sint√©tica
print("üß† Generando red neuronal sint√©tica...\n")
n_neurons = 50
neural_data_2d = np.random.randn(n_neurons, 2) * 0.5
neural_data_2d[:20] += np.array([2, 0])  # Comunidad 1
neural_data_2d[20:35] += np.array([0, 2])  # Comunidad 2
# Comunidad 3 en el origen

# Comparar filtraciones
results = compare_filtrations(neural_data_2d, max_dim=1)

# Visualizar resultados
fig, axes = plt.subplots(1, len(results) + 1, figsize=(18, 5))

# Plot 1: Datos originales
axes[0].scatter(neural_data_2d[:, 0], neural_data_2d[:, 1], 
                c='blue', s=100, alpha=0.6, edgecolors='black')
axes[0].set_title('Red Neuronal\n(3 comunidades)', fontsize=12, fontweight='bold')
axes[0].set_aspect('equal')
axes[0].grid(True, alpha=0.3)

# Plots de diagramas
for idx, (name, result) in enumerate(results.items(), start=1):
    plot_diagrams(result['diagrams'], ax=axes[idx])
    axes[idx].set_title(f'{name}\n(tiempo: {result["time"]:.3f}s)', 
                       fontsize=12, fontweight='bold')

plt.tight_layout()
plt.show()

print("\n‚úÖ An√°lisis completado")
print("\nüìä Tiempos de c√≥mputo:")
for name, result in results.items():
    print(f"   ‚Ä¢ {name}: {result['time']:.4f} segundos")

### üí° Observaciones

- **Vietoris-Rips** es generalmente m√°s r√°pido
- **Alpha** es m√°s preciso geom√©tricamente pero limitado a 2D/3D
- Para datos neuronales de alta dimensi√≥n, **Rips es la elecci√≥n pr√°ctica**

---

## 4. Distancias entre Diagramas de Persistencia

### 4.1 ¬øPor qu√© necesitamos distancias?

Para comparar estados cerebrales, necesitamos **cuantificar diferencias** entre sus topolog√≠as.

### 4.2 Principales M√©tricas

#### A. Distancia de Bottleneck
$$d_B(D_1, D_2) = \inf_{\gamma} \sup_{p \in D_1} \|p - \gamma(p)\|_\infty$$

**Interpretaci√≥n:** Peor caso de emparejamiento entre puntos
- **Robusta** a outliers
- Mide la **m√°xima diferencia** entre caracter√≠sticas

#### B. Distancia de Wasserstein
$$W_p(D_1, D_2) = \left(\inf_{\gamma} \sum_{p \in D_1} \|p - \gamma(p)\|^p\right)^{1/p}$$

**Interpretaci√≥n:** Costo promedio de transporte
- **Sensible** a todas las caracter√≠sticas
- Mide **diferencia global**

#### C. Sliced Wasserstein
Aproximaci√≥n r√°pida de Wasserstein mediante proyecciones 1D.

---

## 5. Aplicaci√≥n: Comparaci√≥n de Estados Cerebrales

In [None]:
def generate_brain_state_realistic(state_type, n_neurons=100, noise=0.1):
    """
    Genera estados cerebrales sint√©ticos con propiedades realistas.
    
    Parameters:
    -----------
    state_type : str
        'sleep', 'wakeful', 'attention', 'memory'
    n_neurons : int
        N√∫mero de neuronas
    noise : float
        Nivel de ruido
    """
    if state_type == 'sleep':
        # Sue√±o: activaci√≥n sincronizada, baja dimensionalidad
        base = np.random.randn(n_neurons, 1) @ np.random.randn(1, 5)
        data = base + np.random.randn(n_neurons, 5) * noise
        
    elif state_type == 'wakeful':
        # Vigilia: activaci√≥n dispersa, alta dimensionalidad
        data = np.random.randn(n_neurons, 5) * 1.5
        
    elif state_type == 'attention':
        # Atenci√≥n: subredes focales activas
        data = np.zeros((n_neurons, 5))
        # Subred atencional activa
        data[:n_neurons//3] = np.random.randn(n_neurons//3, 5) * 2.0
        # Resto con actividad basal
        data[n_neurons//3:] = np.random.randn(2*n_neurons//3, 5) * 0.3
        
    elif state_type == 'memory':
        # Memoria: patrones c√≠clicos (bucles de retroalimentaci√≥n)
        theta = np.linspace(0, 4*np.pi, n_neurons)
        data = np.column_stack([
            np.cos(theta),
            np.sin(theta),
            np.cos(2*theta) * 0.5,
            np.sin(2*theta) * 0.5,
            np.random.randn(n_neurons) * noise
        ])
    
    return data

# Generar diferentes estados
print("üß† Generando estados cerebrales sint√©ticos...\n")
states = {
    'Sue√±o': generate_brain_state_realistic('sleep', n_neurons=80),
    'Vigilia': generate_brain_state_realistic('wakeful', n_neurons=80),
    'Atenci√≥n': generate_brain_state_realistic('attention', n_neurons=80),
    'Memoria': generate_brain_state_realistic('memory', n_neurons=80)
}

# Calcular persistencia para cada estado
print("‚è≥ Calculando homolog√≠a persistente...\n")
diagrams = {}
for name, data in states.items():
    result = ripser(data, maxdim=1, thresh=3.0)
    diagrams[name] = result['dgms']
    print(f"‚úì {name}: H‚ÇÄ={len(result['dgms'][0])}, H‚ÇÅ={len(result['dgms'][1])}")

# Calcular matriz de distancias
print("\nüìè Calculando distancias entre estados...\n")
state_names = list(states.keys())
n_states = len(state_names)

# Matrices para diferentes m√©tricas
bottleneck_matrix = np.zeros((n_states, n_states))
wasserstein_matrix = np.zeros((n_states, n_states))

for i, name1 in enumerate(state_names):
    for j, name2 in enumerate(state_names):
        if i <= j:
            # Usar H‚ÇÅ (ciclos) para comparaci√≥n
            d1 = diagrams[name1][1]
            d2 = diagrams[name2][1]
            
            if len(d1) > 0 and len(d2) > 0:
                bottleneck_matrix[i, j] = bottleneck(d1, d2)
                bottleneck_matrix[j, i] = bottleneck_matrix[i, j]
                
                wasserstein_matrix[i, j] = sliced_wasserstein(d1, d2)
                wasserstein_matrix[j, i] = wasserstein_matrix[i, j]

# Visualizar matrices de distancia
fig, axes = plt.subplots(1, 2, figsize=(16, 6))

# Bottleneck
im1 = axes[0].imshow(bottleneck_matrix, cmap='YlOrRd', aspect='auto')
axes[0].set_xticks(range(n_states))
axes[0].set_yticks(range(n_states))
axes[0].set_xticklabels(state_names, rotation=45)
axes[0].set_yticklabels(state_names)
axes[0].set_title('Distancia de Bottleneck\n(H‚ÇÅ - Ciclos)', fontsize=14, fontweight='bold')
plt.colorbar(im1, ax=axes[0])

# Agregar valores en las celdas
for i in range(n_states):
    for j in range(n_states):
        text = axes[0].text(j, i, f'{bottleneck_matrix[i, j]:.2f}',
                          ha="center", va="center", color="black", fontweight='bold')

# Wasserstein
im2 = axes[1].imshow(wasserstein_matrix, cmap='YlGnBu', aspect='auto')
axes[1].set_xticks(range(n_states))
axes[1].set_yticks(range(n_states))
axes[1].set_xticklabels(state_names, rotation=45)
axes[1].set_yticklabels(state_names)
axes[1].set_title('Distancia de Sliced Wasserstein\n(H‚ÇÅ - Ciclos)', fontsize=14, fontweight='bold')
plt.colorbar(im2, ax=axes[1])

# Agregar valores
for i in range(n_states):
    for j in range(n_states):
        text = axes[1].text(j, i, f'{wasserstein_matrix[i, j]:.2f}',
                          ha="center", va="center", color="black", fontweight='bold')

plt.tight_layout()
plt.show()

print("\n‚úÖ An√°lisis de distancias completado")
print("\nüí° Interpretaci√≥n:")
print("   ‚Ä¢ Estados con distancia BAJA son topol√≥gicamente similares")
print("   ‚Ä¢ Estados con distancia ALTA tienen estructuras diferentes")
print(f"   ‚Ä¢ Par m√°s similar: {state_names[np.unravel_index(np.argmin(bottleneck_matrix + np.eye(n_states)*999), bottleneck_matrix.shape)]}")

### üî¨ An√°lisis Neurobiol√≥gico

**Observaciones esperadas:**

1. **Sue√±o vs Vigilia:** Distancia alta (estructuras muy diferentes)
2. **Atenci√≥n vs Memoria:** Ambos pueden tener ciclos (retroalimentaci√≥n)
3. **Vigilia vs Atenci√≥n:** Similar en estructura global, diferente en localizaci√≥n

**Significado de ciclos (H‚ÇÅ):**
- Sue√±o: Pocos ciclos (actividad sincronizada)
- Memoria: Muchos ciclos (bucles de retroalimentaci√≥n)
- Vigilia: Ciclos distribuidos uniformemente

---

## 6. Aplicaci√≥n Real: An√°lisis de Spike Trains

### 6.1 ¬øQu√© son los Spike Trains?

Los **spike trains** son secuencias de potenciales de acci√≥n (spikes) de neuronas:
```
Neurona 1: |-----|---------|---|-----|--------|
Neurona 2: |---|-----|----------|--|----------|
Neurona 3: |--------|---|-----|---------------|--|
           0   100   200   300   400   500   600 ms
```

### 6.2 Construcci√≥n del Espacio de Estados

Para aplicar TDA:
1. **Ventana deslizante:** Dividir en bins temporales
2. **Vector de activaci√≥n:** Contar spikes por neurona en cada bin
3. **Espacio de estados:** Cada bin = punto en espacio de dimensi√≥n N (N = # neuronas)
4. **Analizar topolog√≠a** de la trayectoria

---

In [None]:
def generate_spike_trains(n_neurons=20, duration=1000, base_rate=5.0, 
                         correlation=0.3, pattern_type='random'):
    """
    Genera spike trains sint√©ticos con diferentes patrones.
    
    Parameters:
    -----------
    n_neurons : int
        N√∫mero de neuronas
    duration : int
        Duraci√≥n en ms
    base_rate : float
        Tasa de disparo base (Hz)
    correlation : float
        Nivel de correlaci√≥n entre neuronas
    pattern_type : str
        'random', 'synchronized', 'sequential'
    """
    spike_trains = np.zeros((n_neurons, duration))
    
    if pattern_type == 'random':
        # Actividad aleatoria independiente
        for i in range(n_neurons):
            spike_trains[i] = poisson.rvs(base_rate/1000, size=duration)
            
    elif pattern_type == 'synchronized':
        # Actividad sincronizada (todas disparan juntas)
        common_pattern = poisson.rvs(base_rate/1000, size=duration)
        for i in range(n_neurons):
            spike_trains[i] = common_pattern * (np.random.rand(duration) < 0.8)  # 80% sync
            
    elif pattern_type == 'sequential':
        # Actividad secuencial (onda de activaci√≥n)
        for t in range(duration):
            active_neuron = (t // 20) % n_neurons  # Cambia cada 20ms
            spike_trains[active_neuron, t] = poisson.rvs(base_rate*3/1000)
    
    return spike_trains

def spike_trains_to_state_space(spike_trains, bin_size=50, stride=25):
    """
    Convierte spike trains a representaci√≥n en espacio de estados.
    
    Parameters:
    -----------
    spike_trains : numpy array
        Matriz de spikes (n_neurons x time)
    bin_size : int
        Tama√±o de ventana en ms
    stride : int
        Paso de la ventana deslizante
    """
    n_neurons, duration = spike_trains.shape
    n_bins = (duration - bin_size) // stride + 1
    
    state_space = np.zeros((n_bins, n_neurons))
    
    for i in range(n_bins):
        start = i * stride
        end = start + bin_size
        state_space[i] = np.sum(spike_trains[:, start:end], axis=1)
    
    return state_space

# Generar spike trains con diferentes patrones
print("üî• Generando spike trains con diferentes patrones...\n")

patterns = ['random', 'synchronized', 'sequential']
spike_data = {}
state_spaces = {}

for pattern in patterns:
    spikes = generate_spike_trains(n_neurons=15, duration=1000, 
                                  pattern_type=pattern, base_rate=8.0)
    spike_data[pattern] = spikes
    state_spaces[pattern] = spike_trains_to_state_space(spikes, bin_size=50, stride=25)

# Visualizar spike trains
fig, axes = plt.subplots(3, 2, figsize=(18, 12))

for idx, pattern in enumerate(patterns):
    # Raster plot
    ax1 = axes[idx, 0]
    for neuron in range(spike_data[pattern].shape[0]):
        spike_times = np.where(spike_data[pattern][neuron] > 0)[0]
        ax1.scatter(spike_times, [neuron]*len(spike_times), 
                   c='black', s=1, marker='|')
    ax1.set_ylabel('Neurona #', fontsize=11)
    ax1.set_xlabel('Tiempo (ms)', fontsize=11)
    ax1.set_title(f'Spike Raster: {pattern.capitalize()}', 
                 fontsize=12, fontweight='bold')
    ax1.set_xlim([0, 1000])
    
    # Espacio de estados (proyecci√≥n 2D con PCA)
    ax2 = axes[idx, 1]
    if state_spaces[pattern].shape[0] > 2:
        pca = PCA(n_components=2)
        reduced = pca.fit_transform(state_spaces[pattern])
        
        ax2.plot(reduced[:, 0], reduced[:, 1], 'o-', 
                alpha=0.6, linewidth=2, markersize=4)
        ax2.scatter(reduced[0, 0], reduced[0, 1], 
                   c='green', s=200, marker='o', zorder=5, 
                   edgecolors='black', linewidth=2, label='Inicio')
        ax2.scatter(reduced[-1, 0], reduced[-1, 1], 
                   c='red', s=200, marker='s', zorder=5, 
                   edgecolors='black', linewidth=2, label='Final')
        ax2.set_xlabel(f'PC1 ({pca.explained_variance_ratio_[0]:.1%})', fontsize=11)
        ax2.set_ylabel(f'PC2 ({pca.explained_variance_ratio_[1]:.1%})', fontsize=11)
        ax2.set_title(f'Trayectoria en Espacio de Estados: {pattern.capitalize()}',
                     fontsize=12, fontweight='bold')
        ax2.legend(loc='best')
        ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print("‚úÖ Visualizaci√≥n completada")

### üß† Interpretaci√≥n de Patrones

**Random (Aleatorio):**
- Spikes distribuidos uniformemente
- Trayectoria err√°tica en espacio de estados
- Topolog√≠a: pocas caracter√≠sticas persistentes

**Synchronized (Sincronizado):**
- Todas las neuronas disparan juntas
- Trayectoria lineal (baja dimensionalidad intr√≠nseca)
- Topolog√≠a: estructura simple, sin ciclos

**Sequential (Secuencial):**
- Activaci√≥n en cascada
- Trayectoria **c√≠clica** (patr√≥n repetitivo)
- Topolog√≠a: **bucles detectables** (H‚ÇÅ > 0)

---

In [None]:
# An√°lisis topol√≥gico de spike trains
print("üîç Analizando topolog√≠a de patrones de disparo...\n")

spike_diagrams = {}

for pattern in patterns:
    print(f"‚è≥ Procesando patr√≥n: {pattern}")
    result = ripser(state_spaces[pattern], maxdim=1, thresh=15.0)
    spike_diagrams[pattern] = result['dgms']
    print(f"   H‚ÇÄ: {len(result['dgms'][0])} componentes")
    print(f"   H‚ÇÅ: {len(result['dgms'][1])} ciclos\n")

# Visualizar diagramas de persistencia
fig, axes = plt.subplots(1, 3, figsize=(18, 5))

for idx, pattern in enumerate(patterns):
    plot_diagrams(spike_diagrams[pattern], ax=axes[idx])
    axes[idx].set_title(f'Persistencia: {pattern.capitalize()}\n' + 
                       f'H‚ÇÅ = {len(spike_diagrams[pattern][1])} ciclos',
                       fontsize=12, fontweight='bold')

plt.tight_layout()
plt.show()

print("\nüí° Hallazgos Clave:")
print("   ‚Ä¢ El patr√≥n SECUENCIAL debe mostrar ciclos robustos (H‚ÇÅ alto)")
print("   ‚Ä¢ El patr√≥n SINCRONIZADO debe tener estructura simple (H‚ÇÅ bajo)")
print("   ‚Ä¢ El patr√≥n ALEATORIO debe tener caracter√≠sticas cerca de la diagonal")
print("\n‚úÖ TDA detecta exitosamente patrones temporales en actividad neuronal!")

---

## 7. Caracter√≠sticas Topol√≥gicas para Machine Learning

### 7.1 Vectorizaci√≥n de Diagramas

Para usar TDA en ML, necesitamos convertir diagramas a vectores de caracter√≠sticas:

1. **Amplitud de Persistencia:** $\max(death - birth)$
2. **Entrop√≠a de Persistencia:** $-\sum p_i \log(p_i)$ donde $p_i = \frac{L_i}{\sum L_j}$
3. **N√∫mero de Betti:** Contar caracter√≠sticas en umbrales espec√≠ficos
4. **Estad√≠sticas de lifetime:** Media, mediana, desviaci√≥n

### 7.2 Aplicaci√≥n: Clasificaci√≥n de Estados

---

In [None]:
def extract_topological_features(diagram, dim=1):
    """
    Extrae caracter√≠sticas escalares de un diagrama de persistencia.
    
    Parameters:
    -----------
    diagram : numpy array
        Diagrama de persistencia (n_points x 2)
    dim : int
        Dimensi√≥n homol√≥gica
    """
    features = {}
    
    if len(diagram[dim]) == 0:
        return {'n_features': 0, 'max_persistence': 0, 
                'mean_persistence': 0, 'entropy': 0}
    
    # Filtrar infinitos
    dgm = diagram[dim][np.isfinite(diagram[dim][:, 1])]
    
    if len(dgm) == 0:
        return {'n_features': 0, 'max_persistence': 0, 
                'mean_persistence': 0, 'entropy': 0}
    
    # Lifetimes (persistencias)
    lifetimes = dgm[:, 1] - dgm[:, 0]
    
    # Caracter√≠sticas
    features['n_features'] = len(dgm)
    features['max_persistence'] = np.max(lifetimes)
    features['mean_persistence'] = np.mean(lifetimes)
    features['std_persistence'] = np.std(lifetimes)
    features['total_persistence'] = np.sum(lifetimes)
    
    # Entrop√≠a de persistencia
    if np.sum(lifetimes) > 0:
        probs = lifetimes / np.sum(lifetimes)
        entropy = -np.sum(probs * np.log(probs + 1e-10))
        features['entropy'] = entropy
    else:
        features['entropy'] = 0
    
    return features

# Extraer caracter√≠sticas de todos los patrones
print("üìä Extrayendo caracter√≠sticas topol√≥gicas...\n")

feature_summary = []

for pattern in patterns:
    feats = extract_topological_features(spike_diagrams[pattern], dim=1)
    feats['pattern'] = pattern
    feature_summary.append(feats)

# Crear DataFrame
df_features = pd.DataFrame(feature_summary)
df_features = df_features[['pattern', 'n_features', 'max_persistence', 
                           'mean_persistence', 'entropy']]

print("Caracter√≠sticas Topol√≥gicas (H‚ÇÅ - Ciclos):\n")
print(df_features.to_string(index=False))
print("\n")

# Visualizar caracter√≠sticas
fig, axes = plt.subplots(2, 2, figsize=(14, 10))

features_to_plot = ['n_features', 'max_persistence', 'mean_persistence', 'entropy']
titles = ['N√∫mero de Ciclos', 'M√°xima Persistencia', 
          'Persistencia Promedio', 'Entrop√≠a de Persistencia']
colors = ['#e74c3c', '#3498db', '#2ecc71']

for idx, (feat, title) in enumerate(zip(features_to_plot, titles)):
    ax = axes[idx // 2, idx % 2]
    values = [df_features[df_features['pattern'] == p][feat].values[0] for p in patterns]
    bars = ax.bar(patterns, values, color=colors, alpha=0.7, edgecolor='black', linewidth=2)
    ax.set_ylabel(title, fontsize=12, fontweight='bold')
    ax.set_xlabel('Patr√≥n', fontsize=11)
    ax.set_title(f'{title} por Patr√≥n de Activaci√≥n', fontsize=12, fontweight='bold')
    ax.grid(True, alpha=0.3, axis='y')
    
    # Agregar valores en las barras
    for bar in bars:
        height = bar.get_height()
        ax.text(bar.get_x() + bar.get_width()/2., height,
                f'{height:.2f}',
                ha='center', va='bottom', fontweight='bold')

plt.tight_layout()
plt.show()

print("‚úÖ Extracci√≥n de caracter√≠sticas completada")
print("\nüí° Observa c√≥mo cada patr√≥n tiene una 'firma topol√≥gica' √∫nica!")

### üéØ Firmas Topol√≥gicas

Cada tipo de actividad neuronal tiene caracter√≠sticas topol√≥gicas distintivas:

| Patr√≥n | N¬∞ Ciclos | Max Persist | Entrop√≠a | Interpretaci√≥n |
|--------|-----------|-------------|----------|----------------|
| **Random** | Bajo | Bajo | Baja | Sin estructura | 
| **Synchronized** | Muy bajo | Bajo | Muy baja | Colapso dimensional |
| **Sequential** | Alto | Alto | Alta | Estructura c√≠clica robusta |

**Aplicaci√≥n pr√°ctica:** Estas caracter√≠sticas pueden usarse para:
- Clasificar estados cerebrales
- Detectar patrones anormales
- Predecir transiciones de estado

---

## 8. Optimizaci√≥n para Grandes Datasets

### 8.1 Desaf√≠os Computacionales

En neurociencias reales:
- **Miles de neuronas:** N = 1000-10000
- **Alta dimensionalidad:** Espacios de 100+ dimensiones
- **Datos temporales:** Miles de time bins

### 8.2 Estrategias de Optimizaci√≥n

1. **Subsampling:** Reducir n√∫mero de puntos
2. **Landmark selection:** Elegir puntos representativos
3. **Threshold early:** Limitar radio m√°ximo
4. **Dimensi√≥n reducida:** PCA/UMAP antes de TDA
5. **Sparse distance matrix:** Solo distancias < threshold

---

In [None]:
def benchmark_tda_methods(n_points_list, n_dimensions=10):
    """
    Compara tiempos de c√≥mputo para diferentes tama√±os de datos.
    """
    import time
    
    results = {'n_points': [], 'time': [], 'method': []}
    
    for n_points in n_points_list:
        print(f"\nüìä Benchmarking con {n_points} puntos...")
        data = np.random.randn(n_points, n_dimensions)
        
        # M√©todo 1: Ripser est√°ndar
        start = time.time()
        result = ripser(data, maxdim=1, thresh=2.0)
        elapsed = time.time() - start
        results['n_points'].append(n_points)
        results['time'].append(elapsed)
        results['method'].append('Ripser (full)')
        print(f"   Ripser (full): {elapsed:.3f}s")
        
        # M√©todo 2: Con reducci√≥n dimensional (PCA)
        start = time.time()
        pca = PCA(n_components=min(5, n_dimensions))
        data_reduced = pca.fit_transform(data)
        result = ripser(data_reduced, maxdim=1, thresh=2.0)
        elapsed = time.time() - start
        results['n_points'].append(n_points)
        results['time'].append(elapsed)
        results['method'].append('PCA + Ripser')
        print(f"   PCA + Ripser: {elapsed:.3f}s")
        
        # M√©todo 3: Subsampling
        if n_points > 100:
            start = time.time()
            indices = np.random.choice(n_points, size=min(100, n_points), replace=False)
            data_sub = data[indices]
            result = ripser(data_sub, maxdim=1, thresh=2.0)
            elapsed = time.time() - start
            results['n_points'].append(n_points)
            results['time'].append(elapsed)
            results['method'].append('Subsampling (100)')
            print(f"   Subsampling: {elapsed:.3f}s")
    
    return pd.DataFrame(results)

# Ejecutar benchmark
print("‚è±Ô∏è Ejecutando benchmark de m√©todos TDA...")
n_points_to_test = [50, 100, 200, 500]
benchmark_df = benchmark_tda_methods(n_points_to_test, n_dimensions=10)

# Visualizar resultados
fig, ax = plt.subplots(figsize=(12, 6))

for method in benchmark_df['method'].unique():
    data = benchmark_df[benchmark_df['method'] == method]
    ax.plot(data['n_points'], data['time'], 'o-', 
            linewidth=2, markersize=8, label=method)

ax.set_xlabel('N√∫mero de Puntos', fontsize=12, fontweight='bold')
ax.set_ylabel('Tiempo de C√≥mputo (s)', fontsize=12, fontweight='bold')
ax.set_title('Comparaci√≥n de Eficiencia: M√©todos TDA', fontsize=14, fontweight='bold')
ax.legend(fontsize=11)
ax.grid(True, alpha=0.3)
ax.set_yscale('log')
plt.tight_layout()
plt.show()

print("\n‚úÖ Benchmark completado")
print("\nüí° Recomendaciones:")
print("   ‚Ä¢ Para N < 200: Usa Ripser directamente")
print("   ‚Ä¢ Para N > 200: Considera PCA o subsampling")
print("   ‚Ä¢ Para dimensi√≥n alta: PCA a 5-10 dimensiones")
print("   ‚Ä¢ Siempre usa threshold adecuado para tu escala de datos")

---

## 9. Ejercicios Avanzados

### Ejercicio 1: An√°lisis de tus propios spike trains

Genera spike trains con par√°metros personalizados y analiza su topolog√≠a:

```python
# Crea un patr√≥n intermitente (alterna entre sincronizado y aleatorio)
# Analiza c√≥mo cambia la topolog√≠a en el tiempo
```

---

In [None]:
# Espacio para Ejercicio 1


### Ejercicio 2: Clasificador topol√≥gico

Usa caracter√≠sticas topol√≥gicas para entrenar un clasificador:

```python
from sklearn.ensemble import RandomForestClassifier

# 1. Genera m√∫ltiples ejemplos de cada patr√≥n
# 2. Extrae caracter√≠sticas topol√≥gicas
# 3. Entrena un clasificador
# 4. Eval√∫a precisi√≥n
```

---

In [None]:
# Espacio para Ejercicio 2


### Ejercicio 3: An√°lisis temporal

Estudia c√≥mo evoluciona la topolog√≠a durante una transici√≥n de estados:

```python
# Genera datos que transicionan de 'synchronized' a 'random'
# Calcula topolog√≠a en ventanas deslizantes
# Visualiza la evoluci√≥n de n√∫meros de Betti
```

---

In [None]:
# Espacio para Ejercicio 3


## 10. Resumen y Conclusiones

### ‚úÖ Lo que dominamos:

1. **Filtraciones:** Diferentes m√©todos (Rips, Alpha, ƒåech) y cu√°ndo usar cada uno
2. **Distancias:** Bottleneck y Wasserstein para comparar diagramas
3. **Spike trains:** Conversi√≥n a espacio de estados y an√°lisis topol√≥gico
4. **Caracter√≠sticas:** Vectorizaci√≥n para machine learning
5. **Optimizaci√≥n:** Estrategias para datos masivos

### üîë Mensajes Clave:

- **TDA captura patrones temporales** en actividad neuronal
- **Ciclos (H‚ÇÅ)** revelan retroalimentaci√≥n y patrones repetitivos
- **Firmas topol√≥gicas** son distintivas para cada tipo de actividad
- **Distancias entre diagramas** cuantifican similitud entre estados
- **Optimizaci√≥n es crucial** para aplicaciones reales

### üß† Impacto en Neurociencias:

TDA proporciona:
- **Descripci√≥n invariante** de patrones neuronales
- **Detecci√≥n robusta** de estructuras funcionales
- **Comparaci√≥n cuantitativa** entre condiciones
- **Base para biomarcadores** topol√≥gicos

---

## 11. Pr√≥ximo Tutorial

En el **Tutorial 3: Conectividad Cerebral**, exploraremos:

- An√°lisis de conectomas (matrices de conectividad)
- TDA aplicado a redes funcionales vs estructurales
- Detecci√≥n de comunidades topol√≥gicas
- An√°lisis de grafos cerebrales ponderados
- Estudios de caso con datos fMRI reales

---

## 12. Referencias

### Papers Clave:
1. Giusti et al. (2015). "Clique topology reveals intrinsic structure in neural correlations". *PNAS*
2. Petri et al. (2014). "Homological scaffolds of brain functional networks". *Journal of the Royal Society Interface*
3. Curto (2017). "What can topology tell us about the neural code?". *Bulletin of the AMS*
4. Sizemore et al. (2019). "Cliques and cavities in the human connectome". *Journal of Computational Neuroscience*

### Software:
- [Ripser](https://ripser.scikit-tda.org/)
- [GUDHI](https://gudhi.inria.fr/)
- [Giotto-TDA](https://giotto-ai.github.io/gtda-docs/)
- [Persim](https://persim.scikit-tda.org/)

---

**Autor:** MARK-126  
**√öltima actualizaci√≥n:** 2025-01-13  
**Licencia:** MIT