# üöÄ Entrenamiento de Red Neuronal CNN para Super-Resoluci√≥n de Se√±ales

## üìã Descripci√≥n
Este notebook te guiar√° paso a paso para entrenar una red neuronal convolucional (CNN) que convierte se√±ales de **baja resoluci√≥n** a **alta resoluci√≥n**.

### ¬øQu√© hace este modelo?
- **Entrada**: Se√±al con pocos puntos (ejemplo: 1000 puntos)
- **Salida**: Se√±al con muchos puntos (ejemplo: 5000 puntos)
- **Aplicaci√≥n**: Reconstrucci√≥n de se√±ales ECG, se√±ales de audio, series temporales, etc.

---

## üì¶ 1. Instalaci√≥n de Librer√≠as

### Librer√≠as necesarias:
- **PyTorch**: Framework de deep learning
- **NumPy**: Manejo de arrays y matrices
- **Matplotlib**: Visualizaci√≥n de gr√°ficos
- **tqdm**: Barras de progreso
- **temana**: Librer√≠a personalizada para lectura de datos (debe estar en tu carpeta)

### Instalaci√≥n:
Si no tienes las librer√≠as instaladas, ejecuta esta celda (descomenta las l√≠neas):

In [None]:
# Descomenta y ejecuta si necesitas instalar las librer√≠as
# !pip install torch torchvision
# !pip install numpy matplotlib tqdm

---
## üìö 2. Importar Librer√≠as

In [None]:
import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
import matplotlib.pyplot as plt
from tqdm import tqdm
import os
import random

# Librer√≠a personalizada (aseg√∫rate de tener temana.py en tu carpeta)
import temana as tm

print("‚úÖ Librer√≠as importadas correctamente")
print(f"PyTorch versi√≥n: {torch.__version__}")

---
## üèóÔ∏è 3. Definici√≥n del Modelo

### ¬øQu√© es TimeSeriesSRNet?
Es una red neuronal convolucional con:
- **Encoder**: Extrae caracter√≠sticas de la se√±al de entrada
- **Upsampler**: Aumenta la resoluci√≥n de la se√±al

### Par√°metros:
- `upsample_factor`: Factor de aumento (5 = convierte 1000 puntos ‚Üí 5000 puntos)

In [None]:
class TimeSeriesSRNet(nn.Module):
    def __init__(self, upsample_factor=5):
        super(TimeSeriesSRNet, self).__init__()
        
        # Encoder: Extrae caracter√≠sticas de la se√±al
        self.encoder = nn.Sequential(
            nn.Conv1d(1, 64, kernel_size=9, stride=1, padding=4),
            nn.ReLU(),
            nn.Conv1d(64, 128, kernel_size=5, stride=1, padding=2),
            nn.ReLU(),
            nn.Conv1d(128, 256, kernel_size=5, stride=1, padding=2),
            nn.ReLU(),
        )
        
        # Upsampler: Aumenta la resoluci√≥n
        self.upsample = nn.Sequential(
            nn.Upsample(scale_factor=upsample_factor, mode='linear', align_corners=True),
            nn.Conv1d(256, 128, kernel_size=5, stride=1, padding=2),
            nn.ReLU(),
            nn.Conv1d(128, 64, kernel_size=5, stride=1, padding=2),
            nn.ReLU(),
            nn.Conv1d(64, 1, kernel_size=9, stride=1, padding=4)
        )
    
    def forward(self, x):
        x = self.encoder(x)
        x = self.upsample(x)
        return x

print("‚úÖ Modelo definido correctamente")

---
## üìÇ 4. Carga de Datos

### Formato de los datos:
Los datos deben estar en archivos `.txt` con el siguiente formato:
- **Cada fila** = Una se√±al completa
- **Cada columna** = Un punto de la se√±al

Ejemplo:
```
0.5  0.6  0.7  ...  (1000 columnas para baja resoluci√≥n)
0.3  0.4  0.5  ...  (otra se√±al)
```

### Archivos necesarios:
1. **x_train**: Se√±ales de baja resoluci√≥n (entrada)
2. **y_train**: Se√±ales de alta resoluci√≥n (objetivo)

### ‚ö†Ô∏è Importante:
- Las se√±ales `x_train` y `y_train` deben tener **el mismo n√∫mero de filas** (mismo n√∫mero de muestras)
- `x_train` debe tener menos columnas que `y_train` (menor resoluci√≥n)

In [None]:
# Rutas de tus archivos de datos
# CAMBIA ESTAS RUTAS seg√∫n donde tengas tus datos

x_train_path = 'Samples/SamplesAV_FV2024_07_09/SignalAVFV_Sub_Sample.txt'
y_train_path = 'Samples/SamplesAV_FV2024_07_09/SignalAVFV_Super_Sample.txt'

# Cargar datos usando temana
x_train = tm.read_data(x_train_path)
y_train = tm.read_data(y_train_path)

print(f"‚úÖ Datos cargados correctamente")
print(f"üìä x_train shape: {x_train.shape} (Muestras, Puntos)")
print(f"üìä y_train shape: {y_train.shape} (Muestras, Puntos)")
print(f"üìà Factor de aumento: {y_train.shape[1] // x_train.shape[1]}x")

---
## üëÄ 5. Visualizaci√≥n de los Datos

Veamos c√≥mo se ven las se√±ales de baja y alta resoluci√≥n:

In [None]:
# Seleccionar una muestra aleatoria
sample_idx = np.random.randint(0, x_train.shape[0])

# Crear dominio temporal
tx_train = np.linspace(0, 4*np.pi, x_train.shape[1])
ty_train = np.linspace(0, 4*np.pi, y_train.shape[1])

# Graficar
plt.figure(figsize=(14, 5))
plt.plot(tx_train, x_train[sample_idx, :], 'o-', label='Baja Resoluci√≥n (Entrada)', markersize=4)
plt.plot(ty_train, y_train[sample_idx, :], '-', label='Alta Resoluci√≥n (Objetivo)', linewidth=2)
plt.title(f'Ejemplo de Se√±al - Muestra #{sample_idx}')
plt.xlabel('Tiempo')
plt.ylabel('Amplitud')
plt.legend()
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

print(f"üí° La se√±al de baja resoluci√≥n tiene {x_train.shape[1]} puntos")
print(f"üí° La se√±al de alta resoluci√≥n tiene {y_train.shape[1]} puntos")

---
## ‚öôÔ∏è 6. Configuraci√≥n de Hiperpar√°metros

### Hiperpar√°metros explicados:
- **low_res_points**: N√∫mero de puntos en se√±al de entrada
- **high_res_points**: N√∫mero de puntos en se√±al de salida
- **upsample_factor**: Factor de aumento (debe ser high_res / low_res)
- **epochs**: N√∫mero de veces que el modelo ver√° todos los datos
- **batch_size**: N√∫mero de se√±ales procesadas simult√°neamente
- **learning_rate**: Velocidad de aprendizaje (t√≠picamente entre 0.0001 y 0.01)

In [None]:
# Configuraci√≥n autom√°tica basada en los datos
low_res_points = x_train.shape[1]
high_res_points = y_train.shape[1]
upsample_factor = high_res_points // low_res_points

# Hiperpar√°metros de entrenamiento
epochs = 100           # Puedes aumentar para mejor resultado (pero toma m√°s tiempo)
batch_size = 32        # Reduce si tienes poca memoria RAM
learning_rate = 1e-3   # 0.001

print("‚öôÔ∏è Configuraci√≥n:")
print(f"  - Puntos entrada: {low_res_points}")
print(f"  - Puntos salida: {high_res_points}")
print(f"  - Factor de aumento: {upsample_factor}x")
print(f"  - √âpocas: {epochs}")
print(f"  - Batch size: {batch_size}")
print(f"  - Learning rate: {learning_rate}")

---
## üéØ 7. Inicializaci√≥n del Modelo

Creamos el modelo, el optimizador y la funci√≥n de p√©rdida:

In [None]:
# Crear el modelo
model = TimeSeriesSRNet(upsample_factor=upsample_factor)

# Optimizador (Adam es el m√°s usado)
optimizer = optim.Adam(model.parameters(), lr=learning_rate)

# Funci√≥n de p√©rdida (L1 Loss = Mean Absolute Error)
criterion = nn.L1Loss()

# Contar par√°metros del modelo
total_params = sum(p.numel() for p in model.parameters())
trainable_params = sum(p.numel() for p in model.parameters() if p.requires_grad)

print("‚úÖ Modelo inicializado")
print(f"üìä Par√°metros totales: {total_params:,}")
print(f"üéì Par√°metros entrenables: {trainable_params:,}")

---
## üèãÔ∏è 8. Funci√≥n de Entrenamiento

Esta funci√≥n entrena el modelo durante varias √©pocas:

In [None]:
def train(model, optimizer, criterion, epochs, batch_size, x_train, y_train):
    """
    Entrena el modelo de super-resoluci√≥n.
    
    Args:
        model: Modelo de red neuronal
        optimizer: Optimizador (Adam, SGD, etc.)
        criterion: Funci√≥n de p√©rdida
        epochs: N√∫mero de √©pocas de entrenamiento
        batch_size: Tama√±o del batch
        x_train: Datos de entrada (baja resoluci√≥n)
        y_train: Datos objetivo (alta resoluci√≥n)
    """
    model.train()
    dataset_size = x_train.shape[0]
    indices = np.arange(dataset_size)
    
    # Lista para guardar el historial de p√©rdidas
    loss_history = []
    
    print("üöÄ Iniciando entrenamiento...\n")
    
    for epoch in range(epochs):
        # Mezclar los datos al inicio de cada √©poca
        np.random.shuffle(indices)
        epoch_loss = 0.0
        
        # Procesar por batches
        for start_idx in range(0, dataset_size, batch_size):
            end_idx = min(start_idx + batch_size, dataset_size)
            batch_idx = indices[start_idx:end_idx]
            
            # Preparar batch y convertir a tensores
            x_batch = torch.tensor(x_train[batch_idx][:, np.newaxis, :], dtype=torch.float32)
            y_batch = torch.tensor(y_train[batch_idx][:, np.newaxis, :], dtype=torch.float32)
            
            # Forward pass
            optimizer.zero_grad()
            output = model(x_batch)
            loss = criterion(output, y_batch)
            
            # Backward pass
            loss.backward()
            optimizer.step()
            
            epoch_loss += loss.item() * x_batch.size(0)
        
        # Calcular p√©rdida promedio de la √©poca
        avg_loss = epoch_loss / dataset_size
        loss_history.append(avg_loss)
        
        # Mostrar progreso cada 10 √©pocas
        if (epoch + 1) % 10 == 0 or epoch == 0:
            print(f"√âpoca [{epoch+1}/{epochs}] - Loss: {avg_loss:.6f}")
    
    print("\n‚úÖ Entrenamiento completado")
    return loss_history

print("‚úÖ Funci√≥n de entrenamiento definida")

---
## üéì 9. Entrenar el Modelo

¬°Ahora s√≠! Vamos a entrenar el modelo. **Esto puede tomar varios minutos**:

In [None]:
# Entrenar el modelo
loss_history = train(
    model=model,
    optimizer=optimizer,
    criterion=criterion,
    epochs=epochs,
    batch_size=batch_size,
    x_train=x_train,
    y_train=y_train
)

print(f"\nüéâ Entrenamiento finalizado con √©xito")
print(f"üìâ Loss final: {loss_history[-1]:.6f}")

---
## üìà 10. Visualizar Curva de Aprendizaje

Veamos c√≥mo mejor√≥ el modelo durante el entrenamiento:

In [None]:
plt.figure(figsize=(10, 5))
plt.plot(loss_history, linewidth=2)
plt.title('Curva de Aprendizaje', fontsize=14, fontweight='bold')
plt.xlabel('√âpoca')
plt.ylabel('Loss (L1)')
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

print(f"üí° El modelo comenz√≥ con loss = {loss_history[0]:.6f}")
print(f"üí° El modelo termin√≥ con loss = {loss_history[-1]:.6f}")
print(f"üìä Mejora: {((loss_history[0] - loss_history[-1]) / loss_history[0] * 100):.1f}%")

---
## üíæ 11. Guardar el Modelo

Guardamos el modelo entrenado para usarlo despu√©s:

In [None]:
# Crear carpeta Models si no existe
os.makedirs('Models', exist_ok=True)

# Nombre del archivo
model_name = f"timeseries_srnet_{low_res_points}_to_{high_res_points}.pth"
model_path = os.path.join('Models', model_name)

# Guardar el modelo
torch.save(model.state_dict(), model_path)

print(f"‚úÖ Modelo guardado en: {model_path}")
print(f"üì¶ Tama√±o del archivo: {os.path.getsize(model_path) / (1024**2):.2f} MB")

---
## üîç 12. Funciones de Evaluaci√≥n

Definimos funciones para evaluar el modelo:

In [None]:
def calculate_l1_distance(model, x, y_true):
    """
    Calcula la distancia L1 (error absoluto medio) entre la se√±al real y la predicci√≥n.
    """
    model.eval()
    x_tensor = torch.tensor(x[np.newaxis, np.newaxis, :], dtype=torch.float32)
    y_true = np.array(y_true)
    
    with torch.no_grad():
        y_pred = model(x_tensor).squeeze().numpy()
    
    l1_distance = np.mean(np.abs(y_true - y_pred))
    return l1_distance


def mean_l1_loss(model, x_val, y_val):
    """
    Calcula el loss L1 promedio sobre un conjunto de validaci√≥n.
    """
    model.eval()
    total_loss = 0.0
    
    for i in range(x_val.shape[0]):
        x = x_val[i]
        y_true = y_val[i]
        loss = calculate_l1_distance(model, x, y_true)
        total_loss += loss
    
    mean_loss = total_loss / x_val.shape[0]
    return mean_loss

print("‚úÖ Funciones de evaluaci√≥n definidas")

---
## üìä 13. Visualizar Predicciones

Veamos qu√© tan bien funciona el modelo entrenado:

In [None]:
def plot_predictions(model, x_data, y_data, num_samples=4):
    """
    Grafica predicciones del modelo vs se√±ales reales.
    """
    model.eval()
    indices = random.sample(range(x_data.shape[0]), num_samples)
    
    plt.figure(figsize=(16, 3 * num_samples))
    
    for i, idx in enumerate(indices):
        x = torch.tensor(x_data[idx][np.newaxis, np.newaxis, :], dtype=torch.float32)
        y_true = y_data[idx]
        
        with torch.no_grad():
            y_pred = model(x).squeeze().numpy()
        
        # Calcular error
        l1_error = calculate_l1_distance(model, x_data[idx], y_true)
        
        # Graficar
        plt.subplot(num_samples, 1, i + 1)
        plt.plot(y_true, label='Real (Alta Res)', linewidth=2, alpha=0.7)
        plt.plot(y_pred, label='Predicci√≥n', linestyle='--', linewidth=2)
        plt.scatter(np.linspace(0, len(y_true)-1, len(x_data[idx])), 
                   np.interp(np.linspace(0, len(y_true)-1, len(x_data[idx])), 
                            np.arange(len(y_true)), y_true),
                   color='red', label='Entrada (Baja Res)', s=20, zorder=5)
        plt.title(f'Muestra {idx} - Error L1: {l1_error:.4f}')
        plt.legend()
        plt.grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.show()

# Visualizar predicciones en datos de entrenamiento
print("üé® Predicciones del modelo en datos de entrenamiento:\n")
plot_predictions(model, x_train, y_train, num_samples=4)

---
## üìà 14. Calcular M√©tricas en Conjunto de Entrenamiento

In [None]:
# Calcular error promedio en datos de entrenamiento
train_loss = mean_l1_loss(model, x_train, y_train)

print("üìä M√©tricas en Conjunto de Entrenamiento:")
print(f"  - Loss L1 promedio: {train_loss:.6f}")
print(f"  - N√∫mero de muestras: {x_train.shape[0]}")

---
## üîÑ 15. OPCIONAL: Cargar Datos de Validaci√≥n

Si tienes un conjunto de validaci√≥n separado, c√°rgalo aqu√≠:

In [None]:
# Descomenta y modifica estas l√≠neas si tienes datos de validaci√≥n

# x_val_path = 'Samples/SamplesAV_FV2024_07_09/SignalAVFV_Sub_Sample_Val.txt'
# y_val_path = 'Samples/SamplesAV_FV2024_07_09/SignalAVFV_Super_Sample_Val.txt'

# x_val = tm.read_data(x_val_path)
# y_val = tm.read_data(y_val_path)

# print(f"‚úÖ Datos de validaci√≥n cargados")
# print(f"üìä x_val shape: {x_val.shape}")
# print(f"üìä y_val shape: {y_val.shape}")

# # Calcular m√©tricas en validaci√≥n
# val_loss = mean_l1_loss(model, x_val, y_val)
# print(f"\nüìä Loss en validaci√≥n: {val_loss:.6f}")

# # Visualizar predicciones en validaci√≥n
# plot_predictions(model, x_val, y_val, num_samples=4)

print("‚ÑπÔ∏è Secci√≥n de validaci√≥n opcional (descomenta para usar)")

---
## üîÑ 16. Transfer Learning: Cargar Modelo Pre-entrenado

### ¬øQu√© es Transfer Learning?
Es cuando cargas un modelo ya entrenado y lo entrenas un poco m√°s con datos nuevos.

**√ötil cuando:**
- Tienes un modelo entrenado con datos sint√©ticos y quieres mejorarlo con datos reales
- Quieres continuar el entrenamiento desde donde lo dejaste

In [None]:
def load_model_for_transfer_learning(model_path, upsample_factor):
    """
    Carga un modelo pre-entrenado para transfer learning.
    """
    model = TimeSeriesSRNet(upsample_factor=upsample_factor)
    model.load_state_dict(torch.load(model_path))
    model.train()  # Poner en modo entrenamiento
    print(f"‚úÖ Modelo cargado desde: {model_path}")
    return model

# Ejemplo de uso (descomenta para usar):
# model_pretrained = load_model_for_transfer_learning('Models/timeseries_srnet_1000_to_5000.pth', upsample_factor=5)

# # Cargar nuevos datos (por ejemplo, datos reales)
# x_real = tm.read_data('RealSamples/ecg_low_5000.txt')
# y_real = tm.read_data('RealSamples/ecg_high_5000.txt')

# # Escalar datos si es necesario
# x_real_scaled = x_real / 40.0
# y_real_scaled = y_real / 40.0

# # Nuevo optimizador (puedes usar learning rate m√°s bajo)
# optimizer_transfer = optim.Adam(model_pretrained.parameters(), lr=1e-4)

# # Entrenar con menos √©pocas
# loss_history_transfer = train(
#     model=model_pretrained,
#     optimizer=optimizer_transfer,
#     criterion=criterion,
#     epochs=20,
#     batch_size=32,
#     x_train=x_real_scaled,
#     y_train=y_real_scaled
# )

# # Guardar modelo ajustado
# torch.save(model_pretrained.state_dict(), 'Models/timeseries_srnet_transfer_learned.pth')

print("‚ÑπÔ∏è Secci√≥n de transfer learning (descomenta para usar)")

---
## üîß 17. Troubleshooting Com√∫n

### ‚ùå Problema: "Out of Memory"
**Soluci√≥n:**
- Reduce `batch_size` (ejemplo: de 32 a 16 o 8)
- Si usas GPU, libera memoria: `torch.cuda.empty_cache()`

### ‚ùå Problema: El loss no baja
**Posibles causas:**
- Learning rate muy alto ‚Üí Prueba con `1e-4` en lugar de `1e-3`
- Learning rate muy bajo ‚Üí Prueba con `1e-2`
- Datos mal escalados ‚Üí Normaliza tus datos
- Necesitas m√°s √©pocas ‚Üí Aumenta `epochs`

### ‚ùå Problema: "FileNotFoundError"
**Soluci√≥n:**
- Verifica que las rutas de los archivos sean correctas
- Usa rutas absolutas si tienes problemas con rutas relativas

### ‚ùå Problema: Las predicciones son malas
**Soluciones:**
1. Entrena por m√°s √©pocas
2. Aumenta el tama√±o del dataset
3. Verifica que los datos de entrada y salida est√©n bien alineados
4. Prueba con transfer learning si tienes pocos datos

---
## üìù 18. Resumen y Pr√≥ximos Pasos

### ‚úÖ Lo que hicimos:
1. ‚úÖ Instalamos y cargamos librer√≠as
2. ‚úÖ Definimos el modelo CNN para super-resoluci√≥n
3. ‚úÖ Cargamos y visualizamos los datos
4. ‚úÖ Entrenamos el modelo
5. ‚úÖ Evaluamos el rendimiento
6. ‚úÖ Guardamos el modelo

### üöÄ Pr√≥ximos pasos sugeridos:
1. **Experimentar con hiperpar√°metros:**
   - Prueba diferentes `learning_rate`
   - Aumenta `epochs` para mejor resultado
   - Experimenta con diferentes `batch_size`

2. **Mejorar el modelo:**
   - Usa transfer learning con datos reales
   - Prueba con diferentes arquitecturas
   - Implementa data augmentation

3. **Validaci√≥n:**
   - Crea un conjunto de validaci√≥n separado
   - Usa cross-validation
   - Compara con otros m√©todos (interpolaci√≥n lineal, splines)

4. **Aplicaci√≥n:**
   - Usa el modelo entrenado en datos nuevos
   - Crea una funci√≥n de inferencia
   - Exporta el modelo para producci√≥n

### üìö Recursos adicionales:
- [Documentaci√≥n de PyTorch](https://pytorch.org/docs/stable/index.html)
- [Tutorial de CNNs](https://pytorch.org/tutorials/beginner/blitz/neural_networks_tutorial.html)
- [Transfer Learning en PyTorch](https://pytorch.org/tutorials/beginner/transfer_learning_tutorial.html)

---
## üí° 19. Guardar y Cargar Modelos - Referencia R√°pida

In [None]:
# === GUARDAR MODELO ===
# torch.save(model.state_dict(), 'ruta/del/modelo.pth')

# === CARGAR MODELO PARA INFERENCIA ===
# model = TimeSeriesSRNet(upsample_factor=5)
# model.load_state_dict(torch.load('ruta/del/modelo.pth'))
# model.eval()  # Modo evaluaci√≥n

# === CARGAR MODELO PARA CONTINUAR ENTRENAMIENTO ===
# model = TimeSeriesSRNet(upsample_factor=5)
# model.load_state_dict(torch.load('ruta/del/modelo.pth'))
# model.train()  # Modo entrenamiento
# optimizer = optim.Adam(model.parameters(), lr=1e-4)

print("üìñ Referencia r√°pida de guardado/carga de modelos")

---
## üéâ ¬°Felicidades!

Has completado el entrenamiento de tu modelo de super-resoluci√≥n de se√±ales.

**Creado por:** GitHub Copilot con Claude Sonnet 4.5  
**Fecha:** Noviembre 2025