# M√©todo GPU: Distribuci√≥n Estacionaria con RTX 5060

Este notebook implementa el c√°lculo de distribuciones estacionarias de cadenas de Markov usando **exclusivamente GPU** con optimizaciones CuPy.

**M√©todo implementado**: Vectores propios optimizado para GPU  
**GPU**: RTX 5060 con CUDA 13.0  
**Framework**: CuPy con optimizaciones de memoria

**An√°lisis de tiempos**: Variando **n** (tama√±o de la cadena) y **p** (probabilidad de transici√≥n)

**Resultados guardados** en CSV para an√°lisis posterior.

In [1]:
import sys
import os
sys.path.append(os.path.join(os.path.dirname('__file__'), '..'))

from src.markov_matrix import (
    crear_matriz_probabilidad,
    calcular_distribucion_metodo_autovalores_gpu,
    GPU_AVAILABLE,
    get_gpu_info,
    clear_gpu_memory,
    optimal_gpu_method
)

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import time
from datetime import datetime
import warnings
warnings.filterwarnings('ignore')

# Verificar disponibilidad de GPU
print(f"üîç Estado de GPU: {GPU_AVAILABLE}")

if not GPU_AVAILABLE:
    print("‚ùå ERROR: GPU no disponible")
    print("üí° Este notebook requiere GPU funcionando")
    print("üí° Ejecute: source ~/.bashrc y reinicie kernel")
    raise RuntimeError("GPU requerida pero no disponible")

# Mostrar informaci√≥n de GPU
gpu_info = get_gpu_info()
print(f"‚úÖ GPU: {gpu_info['name']}")
print(f"üìä Memoria: {gpu_info['total_memory_mb']} MB")
print(f"üîß Compute Capability: {gpu_info['compute_capability']}")
print(f"üöÄ CUDA Version: {gpu_info['cuda_version']}")

# Limpiar memoria GPU al inicio
clear_gpu_memory()
print(f"üßπ Memoria GPU limpiada")

‚úÖ CuPy disponible: NVIDIA GeForce RTX 5060 Laptop GPU (8150 MB)
üîç Estado de GPU: True
‚úÖ GPU: NVIDIA GeForce RTX 5060 Laptop GPU
üìä Memoria: 8150 MB
üîß Compute Capability: 12.0
üöÄ CUDA Version: 13000
üßπ Memoria GPU limpiada


## Configuraci√≥n del An√°lisis: Variando n y p

In [None]:
# Configuraci√≥n id√©ntica a los notebooks m√©todo existentes
max_n = 3000
fixed_interval_p = 0.1

# Crear grids para n y p
grid_n = np.arange(1, max_n)          # n: 1, 2, 3, ..., 2999
grid_p = np.arange(0.1, 1, fixed_interval_p)  # p: 0.1, 0.2, 0.3, ..., 0.9

print(f"üìä Configuraci√≥n del an√°lisis:")
print(f"‚Ä¢ Valores de n: {len(grid_n)} valores (1 a {max_n-1})")
print(f"‚Ä¢ Valores de p: {len(grid_p)} valores ({grid_p[0]:.1f} a {grid_p[-1]:.1f})")
print(f"‚Ä¢ Total combinaciones: {len(grid_n)} √ó {len(grid_p)} = {len(grid_n) * len(grid_p):,}")
print(f"‚Ä¢ Tiempo estimado: ~{len(grid_n) * len(grid_p) / 1000:.0f} minutos")

# Mostrar valores de p
print(f"\nüéØ Valores de p: {[f'{p:.1f}' for p in grid_p]}")
print(f"üéØ Rango de n: 1 ‚Üí {max_n-1}")

üìä Configuraci√≥n del an√°lisis:
‚Ä¢ Valores de n: 2999 valores (1 a 2999)
‚Ä¢ Valores de p: 9 valores (0.1 a 0.9)
‚Ä¢ Total combinaciones: 2999 √ó 9 = 26,991
‚Ä¢ Tiempo estimado: ~27 minutos

üéØ Valores de p: ['0.1', '0.2', '0.3', '0.4', '0.5', '0.6', '0.7', '0.8', '0.9']
üéØ Rango de n: 1 ‚Üí 2999


## Ejecuci√≥n del An√°lisis GPU

In [3]:
# Crear matriz para almacenar los tiempos
# Filas: valores de p, Columnas: valores de n
matriz_tiempos = np.zeros((len(grid_p), len(grid_n)))

print(f"üöÄ Iniciando an√°lisis GPU...")
print(f"Fecha/hora: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

start_time = time.time()
total_combinaciones = len(grid_p) * len(grid_n)
combinacion_actual = 0

# Llenar la matriz con los tiempos medidos
for i, p in enumerate(grid_p):
    print(f"\nüìà Procesando p = {p:.1f} ({i+1}/{len(grid_p)})...")
    
    for j, n in enumerate(grid_n):
        combinacion_actual += 1
        
        # Mostrar progreso cada 1000 combinaciones
        if combinacion_actual % 1000 == 0:
            progreso = (combinacion_actual / total_combinaciones) * 100
            tiempo_transcurrido = time.time() - start_time
            tiempo_estimado = (tiempo_transcurrido / combinacion_actual) * (total_combinaciones - combinacion_actual)
            print(f"  [{progreso:5.1f}%] n={n:3d} | Transcurrido: {tiempo_transcurrido/60:.1f}min | ETA: {tiempo_estimado/60:.1f}min")
        
        try:
            # Crear matriz de transici√≥n
            matriz = crear_matriz_probabilidad(n, p)
            
            # Medir tiempo de ejecuci√≥n GPU
            start_gpu = time.time()
            pi = calcular_distribucion_metodo_autovalores_gpu(matriz)
            tiempo_gpu = time.time() - start_gpu
            
            # Guardar en la matriz
            matriz_tiempos[i, j] = tiempo_gpu
            
        except Exception as e:
            # En caso de error, marcar como tiempo muy alto
            print(f"    ‚ö†Ô∏è Error en n={n}, p={p:.1f}: {str(e)[:50]}")
            matriz_tiempos[i, j] = np.nan
        
        # Limpiar memoria GPU cada 100 iteraciones
        if combinacion_actual % 100 == 0:
            clear_gpu_memory()

tiempo_total = time.time() - start_time
print(f"\n‚úÖ An√°lisis completado en {tiempo_total/60:.1f} minutos")
print(f"üìä Combinaciones procesadas: {combinacion_actual:,}")
print(f"‚ö° Velocidad promedio: {combinacion_actual/tiempo_total:.1f} combinaciones/segundo")

# Convertir a DataFrame para mejor visualizaci√≥n
df_tiempos = pd.DataFrame(matriz_tiempos, 
                         index=[f'p={p:.1f}' for p in grid_p],
                         columns=[f'n={n}' for n in grid_n])

# Mostrar estad√≠sticas b√°sicas
tiempos_validos = matriz_tiempos[~np.isnan(matriz_tiempos)]
print(f"\nüìà Estad√≠sticas de tiempos GPU:")
print(f"‚Ä¢ Mediciones exitosas: {len(tiempos_validos):,}/{total_combinaciones:,} ({len(tiempos_validos)/total_combinaciones*100:.1f}%)")
if len(tiempos_validos) > 0:
    print(f"‚Ä¢ Tiempo m√≠nimo: {np.min(tiempos_validos):.6f} s")
    print(f"‚Ä¢ Tiempo m√°ximo: {np.max(tiempos_validos):.6f} s")
    print(f"‚Ä¢ Tiempo promedio: {np.mean(tiempos_validos):.6f} s")
    print(f"‚Ä¢ Desviaci√≥n est√°ndar: {np.std(tiempos_validos):.6f} s")

üöÄ Iniciando an√°lisis GPU...
Fecha/hora: 2025-09-29 10:33:39

üìà Procesando p = 0.1 (1/9)...
  [  3.7%] n=1000 | Transcurrido: 0.1min | ETA: 2.8min
  [  7.4%] n=2000 | Transcurrido: 0.6min | ETA: 7.9min

üìà Procesando p = 0.2 (2/9)...
  [ 11.1%] n=  1 | Transcurrido: 5.7min | ETA: 45.3min
  [ 14.8%] n=1001 | Transcurrido: 5.8min | ETA: 33.2min
  [ 18.5%] n=2001 | Transcurrido: 6.3min | ETA: 27.7min


KeyboardInterrupt: 

## Guardar Matriz de Tiempos en CSV

In [None]:
# Guardar resultados en carpeta resultados (igual que otros notebooks m√©todo)
df_tiempos.to_csv('../resultados/matriz_tiempos_gpu_final.csv')
print(f"üíæ Resultados guardados en: resultados/matriz_tiempos_gpu_final.csv")

# Mostrar informaci√≥n del archivo
print(f"\nüíΩ Informaci√≥n de la matriz guardada:")
print(f"‚Ä¢ Forma matriz: {df_tiempos.shape}")
print(f"‚Ä¢ Memoria DataFrame: {df_tiempos.memory_usage(deep=True).sum() / 1024**2:.2f} MB")

# Mostrar estad√≠sticas b√°sicas de los tiempos
tiempos_validos = matriz_tiempos[~np.isnan(matriz_tiempos)]
print(f"\nüìà Estad√≠sticas de tiempos GPU:")
print(f"‚Ä¢ Mediciones exitosas: {len(tiempos_validos):,}/{len(grid_p) * len(grid_n):,} ({len(tiempos_validos)/(len(grid_p) * len(grid_n))*100:.1f}%)")
if len(tiempos_validos) > 0:
    print(f"‚Ä¢ Tiempo m√≠nimo: {np.min(tiempos_validos):.6f} s")
    print(f"‚Ä¢ Tiempo m√°ximo: {np.max(tiempos_validos):.6f} s")
    print(f"‚Ä¢ Tiempo promedio: {np.mean(tiempos_validos):.6f} s")

## Visualizaciones (igual que notebooks m√©todo)

In [None]:
# Visualizaci√≥n usando la matriz de tiempos
plt.style.use('seaborn-v0_8')
fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 12))
fig.suptitle('An√°lisis de Rendimiento GPU - RTX 5060', fontsize=16, fontweight='bold')

# Gr√°fico 1: Heatmap de la matriz de tiempos
# Usar solo datos v√°lidos para el heatmap
matriz_viz = matriz_tiempos.copy()
matriz_viz[np.isnan(matriz_viz)] = np.nanmax(matriz_viz)  # Reemplazar NaN con max para visualizaci√≥n

im1 = ax1.imshow(matriz_viz, aspect='auto', cmap='viridis', 
                 extent=[grid_n[0], grid_n[-1], grid_p[0], grid_p[-1]])
ax1.set_xlabel('N√∫mero de estados (n)')
ax1.set_ylabel('Probabilidad (p)')
ax1.set_title('Matriz de tiempos GPU: Heatmap n vs p')
plt.colorbar(im1, ax=ax1, label='Tiempo GPU (s)')

# Gr√°fico 2: Tiempo promedio vs n (promedio sobre todas las p)
tiempos_promedio_n = np.nanmean(matriz_tiempos, axis=0)
indices_validos = ~np.isnan(tiempos_promedio_n)
ax2.plot(grid_n[indices_validos], tiempos_promedio_n[indices_validos], 'b-o', linewidth=2, markersize=2)
ax2.set_xlabel('N√∫mero de estados (n)')
ax2.set_ylabel('Tiempo promedio GPU (s)')
ax2.set_title('Tiempo promedio vs n')
ax2.set_yscale('log')
ax2.grid(True, alpha=0.3)

# Gr√°fico 3: Tiempo promedio vs p (promedio sobre todas las n)
tiempos_promedio_p = np.nanmean(matriz_tiempos, axis=1)
ax3.plot(grid_p, tiempos_promedio_p, 'r-s', linewidth=2, markersize=6)
ax3.set_xlabel('Probabilidad (p)')
ax3.set_ylabel('Tiempo promedio GPU (s)')
ax3.set_title('Tiempo promedio vs p')
ax3.grid(True, alpha=0.3)

# Gr√°fico 4: Distribuci√≥n de todos los tiempos
tiempos_flat = matriz_tiempos.flatten()
tiempos_flat_validos = tiempos_flat[~np.isnan(tiempos_flat)]
ax4.hist(tiempos_flat_validos, bins=50, alpha=0.7, color='green', edgecolor='black')
ax4.set_xlabel('Tiempo de ejecuci√≥n GPU (s)')
ax4.set_ylabel('Frecuencia')
ax4.set_title('Distribuci√≥n de tiempos de ejecuci√≥n')
ax4.set_yscale('log')
ax4.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

## Estad√≠sticas Finales del An√°lisis GPU

In [None]:
# Estad√≠sticas detalladas del an√°lisis
print("üìä ESTAD√çSTICAS FINALES DEL AN√ÅLISIS GPU")
print("=" * 50)

# Informaci√≥n de la matriz de tiempos
print(f"\nüîç Informaci√≥n de la matriz:")
print(f"‚Ä¢ Forma de la matriz: {matriz_tiempos.shape}")
print(f"‚Ä¢ Total de combinaciones: {matriz_tiempos.size:,}")

if len(tiempos_validos) > 0:
    print(f"\n‚è±Ô∏è Estad√≠sticas de tiempo:")
    print(f"‚Ä¢ Tiempo m√≠nimo: {np.min(tiempos_validos):.6f} s")
    print(f"‚Ä¢ Tiempo m√°ximo: {np.max(tiempos_validos):.6f} s")
    print(f"‚Ä¢ Tiempo promedio: {np.mean(tiempos_validos):.6f} s")
    print(f"‚Ä¢ Mediana: {np.median(tiempos_validos):.6f} s")
    print(f"‚Ä¢ Desviaci√≥n est√°ndar: {np.std(tiempos_validos):.6f} s")
    print(f"‚Ä¢ Percentil 95: {np.percentile(tiempos_validos, 95):.6f} s")

# An√°lisis por rangos de n
print(f"\nüìà An√°lisis por rangos de tama√±o:")
rangos_n = [(1, 100), (101, 300), (301, 600), (601, 999)]
for n_min, n_max in rangos_n:
    mask_n = (grid_n >= n_min) & (grid_n <= n_max)
    if np.any(mask_n):
        tiempos_rango = matriz_tiempos[:, mask_n]
        tiempos_rango_validos = tiempos_rango[~np.isnan(tiempos_rango)]
        if len(tiempos_rango_validos) > 0:
            print(f"  n={n_min:3d}-{n_max:3d}: promedio={np.mean(tiempos_rango_validos):.5f}s, "
                  f"mediciones={len(tiempos_rango_validos):,}")

# Efecto de la probabilidad p
print(f"\nüéØ An√°lisis por probabilidad p:")
for i, p in enumerate(grid_p):
    tiempos_p = matriz_tiempos[i, :]
    tiempos_p_validos = tiempos_p[~np.isnan(tiempos_p)]
    if len(tiempos_p_validos) > 0:
        print(f"  p={p:.1f}: promedio={np.mean(tiempos_p_validos):.5f}s, "
              f"mediciones={len(tiempos_p_validos):,}")

# Rendimiento de GPU
if len(tiempos_validos) > 0:
    throughput = len(tiempos_validos) / tiempo_total
    print(f"\nüöÄ Rendimiento GPU:")
    print(f"‚Ä¢ Throughput: {throughput:.2f} c√°lculos/segundo")
    print(f"‚Ä¢ Tiempo por c√°lculo: {np.mean(tiempos_validos)*1000:.2f} ms (promedio)")
    print(f"‚Ä¢ Eficiencia: {len(tiempos_validos)/(len(grid_p) * len(grid_n))*100:.1f}% √©xito")

# Informaci√≥n de GPU final
gpu_info_final = get_gpu_info()
print(f"\nüíª Estado final de GPU:")
print(f"‚Ä¢ Memoria libre: {gpu_info_final['free_memory_mb']} MB")
print(f"‚Ä¢ Memoria usada: {gpu_info_final['used_memory_mb']} MB")

print(f"\nüìÅ Archivo generado:")
print(f"‚Ä¢ resultados/matriz_tiempos_gpu_final.csv")

print(f"\nüéâ An√°lisis GPU completado exitosamente!")
print(f"‚ö° Tu RTX 5060 proces√≥ {len(tiempos_validos):,} c√°lculos de cadenas de Markov")

# Limpiar memoria GPU final
clear_gpu_memory()
print(f"üßπ Memoria GPU final limpiada")