# Tutorial 1: Introducci√≥n al An√°lisis Topol√≥gico de Datos (TDA)

## Aplicaciones en Neurociencias

**Autor:** MARK-126  
**Nivel:** Principiante-Intermedio  
**Tiempo estimado:** 90-120 minutos

---

## üéØ Objetivos de Aprendizaje

Al completar este tutorial, ser√°s capaz de:

1. ‚úÖ Comprender los conceptos fundamentales de topolog√≠a aplicados a datos
2. ‚úÖ Construir y analizar complejos simpliciales
3. ‚úÖ Calcular homolog√≠a y n√∫meros de Betti
4. ‚úÖ Aplicar TDA a datos neurocient√≠ficos simples
5. ‚úÖ Visualizar e interpretar resultados topol√≥gicos

---

## ‚ö†Ô∏è Nota Importante sobre Ejercicios

Este notebook contiene **ejercicios interactivos** donde deber√°s completar c√≥digo.

- Los ejercicios est√°n marcados con `# YOUR CODE STARTS HERE` y `# YOUR CODE ENDS HERE`
- Despu√©s de cada ejercicio hay un **test autom√°tico** para verificar tu implementaci√≥n
- Si ves `‚úÖ Todos los tests pasaron`, ¬°lo hiciste bien!
- Si ves `‚ùå Error`, revisa tu c√≥digo y vuelve a intentar

---

<a name='toc'></a>
## üìö Tabla de Contenidos

- [1 - Setup e Importaciones](#1)
- [2 - Conceptos Fundamentales de Topolog√≠a](#2)
- [3 - Complejos Simpliciales](#3)
    - [Ejercicio 1 - build_simplicial_complex](#ex-1)
- [4 - N√∫meros de Betti y Homolog√≠a](#4)
    - [Ejercicio 2 - compute_betti_numbers](#ex-2)
- [5 - Aplicaci√≥n: Redes Neuronales](#5)
    - [Ejercicio 3 - generate_neural_network](#ex-3)
- [6 - Aplicaci√≥n: Estados Cerebrales](#6)
    - [Ejercicio 4 - generate_brain_state](#ex-4)
- [6.5 - Ejercicios Avanzados](#6.5)
    - [Ejercicio 5 - compare_topological_features](#ex-5)
    - [Ejercicio 6 - filter_by_persistence](#ex-6)
    - [Ejercicio 7 - compute_persistence_entropy](#ex-7)
- [7 - Resumen y Pr√≥ximos Pasos](#7)

---

<a name='1'></a>
## 1 - Setup e Importaciones

[Volver al √≠ndice](#toc)

In [None]:
# Importaciones est√°ndar
import numpy as np
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings('ignore')

# TDA libraries
from ripser import ripser
from scipy.spatial.distance import pdist, squareform
from sklearn.datasets import make_circles, make_moons

# M√≥dulos locales
from tda_utils import (
    plot_persistence_diagram_manual,
    plot_betti_curves,
    visualize_simplicial_complex_simple,
    print_section_header,
    create_test_cases_tutorial1
)
from tda_tests import (
    test_build_simplicial_complex,
    test_compute_betti_numbers,
    test_generate_neural_network,
    test_generate_brain_state
)

# Configuraci√≥n de visualizaci√≥n
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 10

# Reproducibilidad
np.random.seed(42)

print("‚úÖ Todas las bibliotecas importadas correctamente")
print(f"‚úÖ NumPy version: {np.__version__}")

<a name='2'></a>
## 2 - Conceptos Fundamentales de Topolog√≠a

[Volver al √≠ndice](#toc)

### 2.1 ¬øQu√© es la Topolog√≠a?

La **topolog√≠a** es la rama de las matem√°ticas que estudia las propiedades que se preservan bajo deformaciones continuas.

**Piensa en ello as√≠:**
- Una taza de caf√© y una dona (rosquilla) son topol√≥gicamente equivalentes
- Ambas tienen **un hueco** (caracter√≠stica topol√≥gica fundamental)
- Puedes deformar una en la otra sin cortar ni pegar

### 2.2 ¬øPor qu√© es √∫til en Neurociencias?

El cerebro es un sistema complejo donde:
- Las **neuronas** forman redes con estructura topol√≥gica
- Los **patrones de activaci√≥n** crean espacios de alta dimensi√≥n
- La **conectividad funcional** puede verse como un grafo complejo
- Las caracter√≠sticas topol√≥gicas son **robustas al ruido**

**Ejemplo concreto:** Si dos estados cerebrales tienen la misma topolog√≠a, esto sugiere que son funcionalmente similares, ¬°incluso si las activaciones neuronales espec√≠ficas difieren!

---

<a name='3'></a>
## 3 - Complejos Simpliciales

[Volver al √≠ndice](#toc)

Un **complejo simplicial** es una construcci√≥n matem√°tica que nos permite representar la "forma" de un conjunto de datos.

**Componentes:**
- **0-simplejo:** Un punto (v√©rtice)
- **1-simplejo:** Una arista (l√≠nea entre dos puntos)
- **2-simplejo:** Un tri√°ngulo (cara)
- **3-simplejo:** Un tetraedro

**Analog√≠a neuronal:**
- Neuronas = v√©rtices (0-simplejos)
- Conexiones pareadas = aristas (1-simplejos)
- Triadas funcionales = tri√°ngulos (2-simplejos)

### 3.1 Construcci√≥n: Complejo de Vietoris-Rips

Dado un conjunto de puntos y un radio $\epsilon$:
1. Conecta dos puntos si su distancia es $\leq \epsilon$
2. Si todos los puntos de un conjunto est√°n conectados entre s√≠, forma un simplejo de dimensi√≥n superior

---

<a name='ex-1'></a>
### Ejercicio 1 - build_simplicial_complex

Implementa la construcci√≥n de un complejo simplicial usando el m√©todo de Vietoris-Rips.

**Instrucciones:**
1. Calcula la matriz de distancias entre todos los puntos
2. Conecta dos puntos (i, j) si su distancia es ‚â§ epsilon
3. Encuentra tri√°ngulos: tres puntos donde todos est√°n conectados entre s√≠

**Pasos:**
- Paso 1: Conectar puntos cercanos (aristas)
- Paso 2: Encontrar tri√°ngulos

In [None]:
# EJERCICIO 1: Construir Complejo Simplicial

def build_simplicial_complex(points, epsilon):
    """
    Construye un complejo de Vietoris-Rips.
    
    Arguments:
    points -- numpy array (n_points, 2) con las coordenadas de los puntos
    epsilon -- radio de conexi√≥n (scalar)
    
    Returns:
    edges -- lista de tuplas (i, j) representando aristas
    triangles -- lista de listas [i, j, k] representando tri√°ngulos
    """
    n_points = len(points)
    
    # Calcular matriz de distancias
    distances = squareform(pdist(points))
    
    edges = []
    
    # Paso 1: Conectar puntos cercanos
    # (approx. 4 lines)
    # Recorre todos los pares de puntos (i, j) donde i < j
    # Si la distancia es <= epsilon, agrega la arista (i, j)
    # YOUR CODE STARTS HERE
    
    
    
    
    # YOUR CODE ENDS HERE
    
    # Paso 2: Encontrar tri√°ngulos
    triangles = []
    # (approx. 6 lines)
    # Recorre todas las ternas de puntos (i, j, k)
    # Si todos los pares est√°n conectados (dist <= epsilon), agrega el tri√°ngulo
    # YOUR CODE STARTS HERE
    
    
    
    
    
    
    # YOUR CODE ENDS HERE
    
    return edges, triangles

In [None]:
# Test del Ejercicio 1
test_cases = create_test_cases_tutorial1()
neural_positions = test_cases['neural_positions']

edges, triangles = build_simplicial_complex(neural_positions, epsilon=1.0)

print(f"Puntos: {len(neural_positions)}")
print(f"Aristas: {len(edges)}")
print(f"Tri√°ngulos: {len(triangles)}")

# Test autom√°tico
test_build_simplicial_complex(build_simplicial_complex)

**Expected Output:**
```
Puntos: 5
Aristas: 4 (o similar dependiendo de epsilon)
Tri√°ngulos: 1 (o similar)
‚úÖ Todos los tests de build_simplicial_complex pasaron!
```

In [None]:
# Visualizar el complejo construido
visualize_simplicial_complex_simple(neural_positions, edges, triangles, epsilon=1.0,
                                    title="Red Neuronal: Complejo Simplicial")

<div style="background-color:#e3f2fd; padding:15px; border-left:5px solid #2196f3; margin: 20px 0;">
    
**üí° Lo que debes recordar:**
    
- Un **complejo simplicial** representa la estructura de datos mediante v√©rtices, aristas y caras
- El par√°metro **Œµ (epsilon)** controla qu√© tan "gruesa" es la estructura
- Mayor Œµ ‚Üí m√°s conexiones ‚Üí estructura m√°s densa
- En neurociencia: **neuronas = v√©rtices**, **conexiones = aristas**
    
</div>

---

<a name='4'></a>
## 4 - N√∫meros de Betti y Homolog√≠a

[Volver al √≠ndice](#toc)

### 4.1 Teor√≠a

La **homolog√≠a** es una herramienta algebraica para contar "huecos" en diferentes dimensiones:

- **H‚ÇÄ (Dimensi√≥n 0):** Componentes conectadas
- **H‚ÇÅ (Dimensi√≥n 1):** Ciclos/bucles (como el hueco en una dona)
- **H‚ÇÇ (Dimensi√≥n 2):** Cavidades (como el interior de una esfera)
- **H‚Çô (Dimensi√≥n n):** Huecos n-dimensionales

### 4.2 N√∫meros de Betti

Los **n√∫meros de Betti** ($\beta_i$) cuentan el n√∫mero de huecos en cada dimensi√≥n:
- $\beta_0$ = n√∫mero de componentes conectadas
- $\beta_1$ = n√∫mero de ciclos
- $\beta_2$ = n√∫mero de cavidades

### 4.3 Aplicaci√≥n Neural

En una red neuronal:
- $\beta_0$: N√∫mero de subredes desconectadas
- $\beta_1$: Circuitos recurrentes (loops de retroalimentaci√≥n)
- $\beta_2$: Estructuras volum√©tricas complejas

---

<a name='ex-2'></a>
### Ejercicio 2 - compute_betti_numbers

Implementa el c√°lculo de n√∫meros de Betti para diferentes valores de epsilon.

**Instrucciones:**
1. Calcula homolog√≠a persistente una sola vez con `ripser`
2. Para cada valor de epsilon, cuenta cu√°ntas caracter√≠sticas est√°n "vivas" (nacieron antes de epsilon y mueren despu√©s)
3. Retorna los arrays de n√∫meros de Betti para cada dimensi√≥n

**Hint:** Una caracter√≠stica est√° viva en epsilon si:
- `birth <= epsilon` AND (`death > epsilon` OR `death == inf`)

In [None]:
# EJERCICIO 2: Calcular N√∫meros de Betti

def compute_betti_numbers(points, max_epsilon=2.0, num_steps=50):
    """
    Calcula n√∫meros de Betti para diferentes valores de epsilon.
    
    Arguments:
    points -- numpy array con los puntos a analizar
    max_epsilon -- m√°ximo radio de an√°lisis
    num_steps -- n√∫mero de pasos de epsilon
        
    Returns:
    epsilons -- array de valores de epsilon
    betti_0, betti_1, betti_2 -- arrays con n√∫meros de Betti en cada dimensi√≥n
    """
    epsilons = np.linspace(0.01, max_epsilon, num_steps)
    betti_0 = np.zeros(num_steps)
    betti_1 = np.zeros(num_steps)
    betti_2 = np.zeros(num_steps)
    
    # Calcular homolog√≠a persistente una sola vez
    result = ripser(points, maxdim=2, thresh=max_epsilon)
    diagrams = result['dgms']
    
    # Para cada epsilon, contar caracter√≠sticas que existen
    for i, eps in enumerate(epsilons):
        # Dimensi√≥n 0 (componentes)
        # (approx. 2 lines)
        # Cuenta cu√°ntas features en diagrams[0] tienen birth <= eps y (death > eps o death = inf)
        # YOUR CODE STARTS HERE
        
        
        # YOUR CODE ENDS HERE
        
        # Dimensi√≥n 1 (ciclos)
        # (approx. 3 lines)
        # Similar pero para diagrams[1]
        # YOUR CODE STARTS HERE
        
        
        
        # YOUR CODE ENDS HERE
        
        # Dimensi√≥n 2 (cavidades)
        # (approx. 3 lines)
        # Similar pero para diagrams[2]
        # YOUR CODE STARTS HERE
        
        
        
        # YOUR CODE ENDS HERE
    
    return epsilons, betti_0, betti_1, betti_2

In [None]:
# Test del Ejercicio 2
circle_points = test_cases['circle_points']

eps, b0, b1, b2 = compute_betti_numbers(circle_points, max_epsilon=1.0)

print(f"Valores de epsilon: {len(eps)}")
print(f"Œ≤‚ÇÄ final: {int(b0[-1])} (debe ser 1 = una componente)")
print(f"Œ≤‚ÇÅ m√°ximo: {int(np.max(b1))} (debe ser ‚â•1 = c√≠rculo detectado)")

# Test autom√°tico
test_compute_betti_numbers(compute_betti_numbers)

In [None]:
# Visualizar curvas de Betti
plot_betti_curves(eps, b0, b1, b2, title="Topolog√≠a de un C√≠rculo")

<div style="background-color:#e3f2fd; padding:15px; border-left:5px solid #2196f3; margin: 20px 0;">
    
**üí° Lo que debes recordar:**
    
- **Œ≤‚ÇÄ** cuenta componentes conectadas (empieza alto, converge a 1)
- **Œ≤‚ÇÅ** cuenta ciclos/loops (detecta estructuras circulares)
- **Œ≤‚ÇÇ** cuenta cavidades (detecta estructuras esf√©ricas/volum√©tricas)
- Un c√≠rculo tiene **Œ≤‚ÇÅ = 1** en un rango de Œµ
- La **persistencia** (cu√°nto dura una caracter√≠stica) indica su importancia
    
</div>

---

<a name='5'></a>
## 5 - Aplicaci√≥n: Redes Neuronales

[Volver al √≠ndice](#toc)

Ahora aplicaremos TDA a una red neuronal sint√©tica con dos comunidades.

---

<a name='ex-3'></a>
### Ejercicio 3 - generate_neural_network

Implementa la generaci√≥n de una red neuronal sint√©tica con dos comunidades y una neurona puente.

**Instrucciones:**
1. Crea dos comunidades de neuronas en posiciones diferentes
2. Agrega una neurona "puente" entre ellas
3. Agrega ruido a todas las posiciones

In [None]:
# EJERCICIO 3: Generar Red Neuronal Sint√©tica

def generate_neural_network(n_neurons=50, connectivity=0.3, noise_level=0.1):
    """
    Genera una red neuronal sint√©tica con estructura de comunidades.
    
    Arguments:
    n_neurons -- n√∫mero de neuronas
    connectivity -- nivel de conectividad (0-1), no usado en esta versi√≥n
    noise_level -- cantidad de ruido
    
    Returns:
    neurons -- array (n_neurons+1, 2) con posiciones de neuronas
    """
    # Crear dos comunidades de neuronas
    # (approx. 2 lines)
    # Comunidad 1 centrada en [0, 0], Comunidad 2 centrada en [3, 0]
    # YOUR CODE STARTS HERE
    
    
    # YOUR CODE ENDS HERE
    
    # Agregar una neurona puente
    # (approx. 1 line)
    # Posici√≥n [1.5, 0]
    # YOUR CODE STARTS HERE
    
    # YOUR CODE ENDS HERE
    
    # Combinar todas las neuronas
    # (approx. 1 line)
    # YOUR CODE STARTS HERE
    
    # YOUR CODE ENDS HERE
    
    # Agregar ruido
    neurons += np.random.randn(*neurons.shape) * noise_level
    
    return neurons

In [None]:
# Test del Ejercicio 3
neural_network = generate_neural_network(n_neurons=60, noise_level=0.08)

print(f"Red generada: {neural_network.shape}")

# Visualizar
plt.figure(figsize=(10, 6))
plt.scatter(neural_network[:, 0], neural_network[:, 1], 
            c='blue', s=100, alpha=0.6, edgecolors='black')
plt.title('Red Neuronal Sint√©tica\n(2 comunidades + neurona puente)', fontsize=14, fontweight='bold')
plt.xlabel('Dimensi√≥n 1', fontsize=12)
plt.ylabel('Dimensi√≥n 2', fontsize=12)
plt.grid(True, alpha=0.3)
plt.axis('equal')
plt.show()

# Test autom√°tico
test_generate_neural_network(generate_neural_network)

<div style="background-color:#fff3cd; padding:15px; border-left:5px solid #ffc107; margin: 20px 0;">
    
**üß† Interpretaci√≥n Neuronal:**
    
- Las **dos comunidades** representan diferentes regiones cerebrales
- La **neurona puente** conecta ambas regiones (comunicaci√≥n inter-regional)
- TDA puede detectar esta estructura autom√°ticamente
- Œ≤‚ÇÄ alto inicial ‚Üí muchas neuronas desconectadas
- Œ≤‚ÇÄ ‚Üí 1 ‚Üí la red se conecta completamente
    
</div>

---

<a name='6'></a>
## 6 - Aplicaci√≥n: Estados Cerebrales

[Volver al √≠ndice](#toc)

Compararemos la topolog√≠a de diferentes estados cerebrales (reposo vs. activo).

---

<a name='ex-4'></a>
### Ejercicio 4 - generate_brain_state

Implementa la generaci√≥n de estados cerebrales sint√©ticos.

**Instrucciones:**
1. Estado "resting": activaci√≥n dispersa (ruido gaussiano)
2. Estado "active": estructura organizada (esfera)

In [None]:
# EJERCICIO 4: Generar Estados Cerebrales

def generate_brain_state(state_type='resting', n_neurons=100):
    """
    Genera patrones de activaci√≥n neuronal para diferentes estados cerebrales.
    
    Arguments:
    state_type -- 'resting' o 'active'
    n_neurons -- n√∫mero de neuronas
    
    Returns:
    data -- array (n_neurons, 3) con coordenadas en espacio de activaci√≥n
    """
    if state_type == 'resting':
        # Estado de reposo: activaci√≥n dispersa
        # (approx. 1 line)
        # Generar puntos aleatorios en 3D con desviaci√≥n est√°ndar 1.5
        # YOUR CODE STARTS HERE
        
        # YOUR CODE ENDS HERE
        
    elif state_type == 'active':
        # Estado activo: estructura m√°s organizada (esfera)
        # (approx. 8 lines)
        # Generar puntos en una esfera usando coordenadas esf√©ricas
        # theta: √°ngulo azimutal [0, 2œÄ]
        # phi: √°ngulo polar [0, œÄ]
        # r: radio ~1 + peque√±o ruido
        # Convertir a cartesianas: x = r*sin(phi)*cos(theta), etc.
        # YOUR CODE STARTS HERE
        
        
        
        
        
        
        
        
        # YOUR CODE ENDS HERE
    
    return data

In [None]:
# Test del Ejercicio 4
resting_state = generate_brain_state('resting', n_neurons=150)
active_state = generate_brain_state('active', n_neurons=150)

print(f"Estado de reposo: {resting_state.shape}")
print(f"Estado activo: {active_state.shape}")

# Test autom√°tico
test_generate_brain_state(generate_brain_state)

In [None]:
# Visualizar estados cerebrales en 3D
from mpl_toolkits.mplot3d import Axes3D

fig = plt.figure(figsize=(16, 6))

# Estado de reposo
ax1 = fig.add_subplot(121, projection='3d')
ax1.scatter(resting_state[:, 0], resting_state[:, 1], resting_state[:, 2],
            c='blue', alpha=0.4, s=30)
ax1.set_title('Estado de Reposo\n(activaci√≥n dispersa)', fontsize=12, fontweight='bold')
ax1.set_xlabel('X')
ax1.set_ylabel('Y')
ax1.set_zlabel('Z')

# Estado activo
ax2 = fig.add_subplot(122, projection='3d')
ax2.scatter(active_state[:, 0], active_state[:, 1], active_state[:, 2],
            c='red', alpha=0.4, s=30)
ax2.set_title('Estado Activo\n(estructura esf√©rica)', fontsize=12, fontweight='bold')
ax2.set_xlabel('X')
ax2.set_ylabel('Y')
ax2.set_zlabel('Z')

plt.tight_layout()
plt.show()

<div style="background-color:#e8f5e9; padding:15px; border-left:5px solid #4caf50; margin: 20px 0;">
    
**üí° Interpretaci√≥n:**
    
- **Estado de reposo:** Disperso, sin estructura clara (Œ≤‚ÇÇ ‚âà 0)
- **Estado activo:** Estructura esf√©rica clara (Œ≤‚ÇÇ > 0)
- TDA puede **diferenciar estados cerebrales** autom√°ticamente
- Las diferencias topol√≥gicas reflejan **diferencias funcionales**
    
</div>

---

<a name='6.5'></a>
## 6.5 - Ejercicios Avanzados: An√°lisis Topol√≥gico Profundo

[Volver al √≠ndice](#toc)

Ahora aplicaremos t√©cnicas m√°s avanzadas para comparar y analizar caracter√≠sticas topol√≥gicas.

---

### Ejercicio 5 - compare_topological_features

Compara caracter√≠sticas topol√≥gicas entre dos datasets.

**Objetivo:** Cuantificar similitud topol√≥gica entre estados cerebrales

**Instrucciones:**
1. Calcular homolog√≠a persistente para ambos datasets
2. Extraer caracter√≠sticas: max persistence, total persistence, n_cycles
3. Calcular distancia euclidiana entre vectores de caracter√≠sticas
4. Retornar diccionario con caracter√≠sticas y distancia

In [None]:
# EJERCICIO 5: Comparar Caracter√≠sticas Topol√≥gicas

def compare_topological_features(data1, data2, max_dim=2):
    """
    Compara caracter√≠sticas topol√≥gicas entre dos datasets.

    Arguments:
    data1 -- primer dataset (n_samples1, n_features)
    data2 -- segundo dataset (n_samples2, n_features)
    max_dim -- dimensi√≥n m√°xima para homolog√≠a

    Returns:
    features1 -- diccionario con caracter√≠sticas del dataset 1
    features2 -- diccionario con caracter√≠sticas del dataset 2
    distance -- distancia euclidiana entre vectores de caracter√≠sticas
    """

    # 1. Calcular homolog√≠a para data1
    # (approx. 2 lines)
    # YOUR CODE STARTS HERE


    # YOUR CODE ENDS HERE

    # 2. Calcular homolog√≠a para data2
    # (approx. 2 lines)
    # YOUR CODE STARTS HERE


    # YOUR CODE ENDS HERE

    # 3. Extraer caracter√≠sticas de H1 (ciclos) para data1
    # (approx. 8 lines)
    # Caracter√≠sticas: n_cycles, max_persistence, total_persistence
    # YOUR CODE STARTS HERE








    # YOUR CODE ENDS HERE

    # 4. Extraer caracter√≠sticas de H1 para data2
    # (approx. 8 lines)
    # YOUR CODE STARTS HERE








    # YOUR CODE ENDS HERE

    # 5. Calcular distancia euclidiana entre vectores de caracter√≠sticas
    # (approx. 4 lines)
    # Crear vectores [n_cycles, max_persistence, total_persistence]
    # YOUR CODE STARTS HERE




    # YOUR CODE ENDS HERE

    return features1, features2, distance

In [None]:
# Test del Ejercicio 5
f1, f2, dist = compare_topological_features(resting_state, active_state, max_dim=2)

print("Caracter√≠sticas topol√≥gicas:")
print(f"\nEstado de reposo:")
print(f"  ‚Ä¢ Ciclos (H‚ÇÅ): {f1['n_cycles']}")
print(f"  ‚Ä¢ Max persistencia: {f1['max_persistence']:.3f}")
print(f"  ‚Ä¢ Persistencia total: {f1['total_persistence']:.3f}")

print(f"\nEstado activo:")
print(f"  ‚Ä¢ Ciclos (H‚ÇÅ): {f2['n_cycles']}")
print(f"  ‚Ä¢ Max persistencia: {f2['max_persistence']:.3f}")
print(f"  ‚Ä¢ Persistencia total: {f2['total_persistence']:.3f}")

print(f"\nüìä Distancia topol√≥gica: {dist:.3f}")
print("(Mayor distancia ‚Üí estados m√°s diferentes topol√≥gicamente)")

# Test autom√°tico
from tda_tests import test_compare_topological_features
test_compare_topological_features(compare_topological_features)

<div style="background-color:#e3f2fd; padding:15px; border-left:5px solid #2196f3; margin: 20px 0;">

**üí° Interpretaci√≥n:**

- **Distancia alta** ‚Üí Estados cerebrales topol√≥gicamente diferentes
- **Distancia baja** ‚Üí Estados similares (mismo nivel de organizaci√≥n)
- √ötil para **clasificaci√≥n de estados** cognitivos
- Robusto al ruido en comparaci√≥n con m√©tricas tradicionales

</div>

---

### Ejercicio 6 - filter_by_persistence

Filtra caracter√≠sticas topol√≥gicas por su persistencia.

**Objetivo:** Eliminar ruido y mantener solo caracter√≠sticas significativas

**Concepto:** La persistencia (death - birth) mide cu√°n "robusta" es una caracter√≠stica.
Caracter√≠sticas con baja persistencia suelen ser ruido.

**Instrucciones:**
1. Calcular persistencia para cada caracter√≠stica
2. Filtrar caracter√≠sticas con persistencia >= threshold
3. Retornar diagrama filtrado

In [None]:
# EJERCICIO 6: Filtrar por Persistencia

def filter_by_persistence(persistence_diagram, threshold=0.1):
    """
    Filtra caracter√≠sticas topol√≥gicas por persistencia m√≠nima.

    Arguments:
    persistence_diagram -- array (n_features, 2) con (birth, death)
    threshold -- persistencia m√≠nima para mantener caracter√≠stica

    Returns:
    filtered_diagram -- diagrama filtrado
    n_removed -- n√∫mero de caracter√≠sticas removidas
    """

    # 1. Calcular persistencia para cada caracter√≠stica
    # (approx. 1 line)
    # Persistencia = death - birth
    # YOUR CODE STARTS HERE

    # YOUR CODE ENDS HERE

    # 2. Identificar caracter√≠sticas significativas
    # (approx. 2 lines)
    # Mantener solo donde persistencia >= threshold Y death es finito
    # YOUR CODE STARTS HERE


    # YOUR CODE ENDS HERE

    # 3. Filtrar diagrama
    # (approx. 1 line)
    # YOUR CODE STARTS HERE

    # YOUR CODE ENDS HERE

    # 4. Contar cu√°ntas se removieron
    # (approx. 1 line)
    # YOUR CODE STARTS HERE

    # YOUR CODE ENDS HERE

    return filtered_diagram, n_removed

In [None]:
# Test del Ejercicio 6
# Generar diagrama de prueba
result = ripser(circle_points, maxdim=1)
dgm_h1 = result['dgms'][1]

print(f"Diagrama original (H‚ÇÅ): {len(dgm_h1)} caracter√≠sticas")

# Filtrar con diferentes thresholds
filtered_01, n_removed_01 = filter_by_persistence(dgm_h1, threshold=0.1)
filtered_02, n_removed_02 = filter_by_persistence(dgm_h1, threshold=0.2)

print(f"\nCon threshold 0.1: {len(filtered_01)} caracter√≠sticas ({n_removed_01} removidas)")
print(f"Con threshold 0.2: {len(filtered_02)} caracter√≠sticas ({n_removed_02} removidas)")

# Visualizar
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Original
from persim import plot_diagrams
plot_diagrams([dgm_h1], ax=axes[0])
axes[0].set_title('Diagrama Original', fontsize=12, fontweight='bold')

# Filtrado
plot_diagrams([filtered_02], ax=axes[1])
axes[1].set_title(f'Diagrama Filtrado (threshold=0.2)\n{len(filtered_02)} caracter√≠sticas persistentes',
                 fontsize=12, fontweight='bold')

plt.tight_layout()
plt.show()

# Test autom√°tico
from tda_tests import test_filter_by_persistence
test_filter_by_persistence(filter_by_persistence)

<div style="background-color:#fff3cd; padding:15px; border-left:5px solid #ffc107; margin: 20px 0;">

**‚öôÔ∏è Uso Pr√°ctico:**

- **Preprocesamiento:** Eliminar ruido antes de an√°lisis
- **Visualizaci√≥n:** Diagramas m√°s limpios y legibles
- **Machine Learning:** Features m√°s robustas
- **Regla general:** threshold = 10-20% del rango de distancias

</div>

---

### Ejercicio 7 - compute_persistence_entropy

Calcula la entrop√≠a de persistencia como medida de complejidad.

**Concepto:** La entrop√≠a mide cu√°n uniforme es la distribuci√≥n de persistencias.
- **Alta entrop√≠a:** Muchas caracter√≠sticas con persistencias similares
- **Baja entrop√≠a:** Pocas caracter√≠sticas dominan

**F√≥rmula:** $E = -\sum p_i \log(p_i)$ donde $p_i = \frac{\text{persistence}_i}{\sum \text{persistence}_j}$

**Aplicaci√≥n:** Cuantificar complejidad estructural de estados cerebrales

In [None]:
# EJERCICIO 7: Entrop√≠a de Persistencia

def compute_persistence_entropy(persistence_diagram):
    """
    Calcula entrop√≠a de persistencia como medida de complejidad.

    Arguments:
    persistence_diagram -- array (n_features, 2) con (birth, death)

    Returns:
    entropy -- entrop√≠a de persistencia
    """

    # 1. Filtrar caracter√≠sticas infinitas
    # (approx. 2 lines)
    # Mantener solo donde death es finito
    # YOUR CODE STARTS HERE


    # YOUR CODE ENDS HERE

    # 2. Calcular persistencias
    # (approx. 1 line)
    # YOUR CODE STARTS HERE

    # YOUR CODE ENDS HERE

    # 3. Normalizar a probabilidades
    # (approx. 2 lines)
    # p_i = persistence_i / sum(persistences)
    # YOUR CODE STARTS HERE


    # YOUR CODE ENDS HERE

    # 4. Calcular entrop√≠a
    # (approx. 3 lines)
    # E = -sum(p * log(p)) donde p > 0
    # YOUR CODE STARTS HERE



    # YOUR CODE ENDS HERE

    return entropy

In [None]:
# Test del Ejercicio 7
# Comparar entrop√≠a de diferentes estados
result_resting = ripser(resting_state, maxdim=1)
result_active = ripser(active_state, maxdim=1)

entropy_resting_h1 = compute_persistence_entropy(result_resting['dgms'][1])
entropy_active_h1 = compute_persistence_entropy(result_active['dgms'][1])

print("Entrop√≠a de Persistencia (H‚ÇÅ):")
print(f"\nEstado de reposo: {entropy_resting_h1:.3f}")
print(f"Estado activo:    {entropy_active_h1:.3f}")

diff = abs(entropy_resting_h1 - entropy_active_h1)
print(f"\nDiferencia: {diff:.3f}")

if entropy_resting_h1 > entropy_active_h1:
    print("‚Üí Estado de reposo tiene mayor complejidad topol√≥gica (H‚ÇÅ)")
else:
    print("‚Üí Estado activo tiene mayor complejidad topol√≥gica (H‚ÇÅ)")

# Calcular tambi√©n para H‚ÇÇ
if len(result_resting['dgms']) > 2:
    entropy_resting_h2 = compute_persistence_entropy(result_resting['dgms'][2])
    entropy_active_h2 = compute_persistence_entropy(result_active['dgms'][2])
    print(f"\nEntrop√≠a H‚ÇÇ (cavidades):")
    print(f"  Reposo: {entropy_resting_h2:.3f}")
    print(f"  Activo: {entropy_active_h2:.3f}")

# Test autom√°tico
from tda_tests import test_compute_persistence_entropy
test_compute_persistence_entropy(compute_persistence_entropy)

<div style="background-color:#e8f5e9; padding:15px; border-left:5px solid #4caf50; margin: 20px 0;">

**üí° Interpretaci√≥n Cl√≠nica:**

- **Alta entrop√≠a** ‚Üí Complejidad distribuida (muchas estructuras similares)
- **Baja entrop√≠a** ‚Üí Pocas estructuras dominantes
- √ötil para clasificar **trastornos neurol√≥gicos**:
  - Alzheimer: Reducci√≥n en entrop√≠a H‚ÇÅ (p√©rdida de ciclos funcionales)
  - Esquizofrenia: Alteraci√≥n en entrop√≠a H‚ÇÇ (organizaci√≥n jer√°rquica)
- Puede usarse como **biomarcador diagn√≥stico**

</div>

---

<a name='7'></a>
## 7 - Resumen y Pr√≥ximos Pasos

[Volver al √≠ndice](#toc)

### ‚úÖ Lo que aprendimos:

1. **TDA** estudia la "forma" de los datos mediante conceptos topol√≥gicos
2. **Complejos simpliciales** representan estructura multi-escala
3. **Homolog√≠a** cuenta huecos en diferentes dimensiones
4. **N√∫meros de Betti** cuantifican caracter√≠sticas topol√≥gicas:
   - Œ≤‚ÇÄ: Componentes conectadas
   - Œ≤‚ÇÅ: Ciclos/loops
   - Œ≤‚ÇÇ: Cavidades
5. **Aplicaciones neurales**: redes, conectividad, estados cerebrales

### üîë Conceptos Clave:

- **Robustez:** TDA es invariante a deformaciones continuas
- **Multi-escala:** El par√°metro Œµ captura estructura a diferentes escalas
- **Interpretable:** Los n√∫meros de Betti tienen significado claro

### üß† Intuici√≥n Neural:

El cerebro no es solo un conjunto de neuronas conectadas, sino una estructura **topol√≥gica compleja** donde:
- Los ciclos representan memoria y retroalimentaci√≥n
- Las cavidades indican organizaci√≥n jer√°rquica
- La persistencia revela patrones funcionalmente significativos

---

## üìö Pr√≥ximos Tutoriales

### Tutorial 2: Homolog√≠a Persistente Avanzada
- C√°lculo eficiente con grandes datasets
- Diferentes filtraciones (Rips, Alpha, ƒåech)
- Distancias entre diagramas (Wasserstein, Bottleneck)
- Aplicaci√≥n a spike trains

### Tutorial 3: Conectividad Cerebral
- An√°lisis de matrices de correlaci√≥n fMRI
- Detecci√≥n de comunidades topol√≥gicas
- Redes funcionales vs estructurales

---

<div style="background-color:#f3e5f5; padding:15px; border-left:5px solid #9c27b0; margin: 20px 0;">
    
## üéâ ¬°Felicitaciones!

Has completado la introducci√≥n al An√°lisis Topol√≥gico de Datos aplicado a neurociencias. Ahora tienes las herramientas fundamentales para explorar la "forma" de datos neuronales complejos.

**¬øListo para el siguiente desaf√≠o?** ‚Üí Tutorial 2: Homolog√≠a Persistente Avanzada
    
</div>

---

**Autor:** MARK-126  
**√öltima actualizaci√≥n:** 2024-11-13  
**Licencia:** MIT