# Análisis: Tiempos de Resolución vs Tamaño de Instancia

Este notebook analiza el comportamiento de los tiempos de resolución del solver a medida que aumenta el tamaño de las instancias.

**Solver utilizado:** PuLP con CBC

In [None]:
import json
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
from pathlib import Path

# Configuración de estilo
sns.set_theme(style="whitegrid")
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.size'] = 10

## 1. Carga de Datos

In [None]:
# Cargar todos los resultados
datos = []

for tamano in ['small', 'medium', 'large']:
    carpeta = Path(f'../resultados/{tamano}')
    
    for archivo in carpeta.glob('resultado_*.json'):
        with open(archivo, 'r') as f:
            resultado = json.load(f)
            
            datos.append({
                'id': resultado['id_instancia'],
                'tipo': resultado['tipo'],
                'trabajadores': resultado['trabajadores'],
                'dias': resultado['dias'],
                'tiempo_segundos': resultado['tiempo_resolucion_segundos'],
                'tamano_problema': resultado['trabajadores'] * resultado['dias'],
                'factible': resultado['factible'],
                'num_variables': resultado['trabajadores'] * resultado['dias'] * (2 if resultado['tipo'] == 'small' else 3)
            })

df = pd.DataFrame(datos)
df = df.sort_values('tamano_problema')

print(f"Total de instancias: {len(df)}")
print(f"Factibles: {df['factible'].sum()}")
print(f"Infactibles: {(~df['factible']).sum()}")
df.head(10)

In [None]:
# Estadísticas por tipo
print("Estadísticas de tiempo por tipo:\n")
df.groupby('tipo')['tiempo_segundos'].describe()

## 2. Tiempo vs Tamaño del Problema

In [None]:
# Análisis ejecutado desde generar_graficos_tiempos.py
# Ver gráfico: graficos/tiempos_vs_tamano.png
from IPython.display import Image
Image('graficos/tiempos_vs_tamano.png')

## 3. Análisis de Escalabilidad

In [None]:
# Calcular factores de crecimiento
tiempo_small = df[df['tipo'] == 'small']['tiempo_segundos'].mean()
tiempo_medium = df[df['tipo'] == 'medium']['tiempo_segundos'].mean()
tiempo_large = df[df['tipo'] == 'large']['tiempo_segundos'].mean()

print(f"Tiempo promedio Small: {tiempo_small:.4f}s")
print(f"Tiempo promedio Medium: {tiempo_medium:.4f}s")
print(f"Tiempo promedio Large: {tiempo_large:.4f}s")
print(f"\nFactores de crecimiento:")
print(f"  Medium/Small: {tiempo_medium/tiempo_small:.2f}x")
print(f"  Large/Medium: {tiempo_large/tiempo_medium:.2f}x")
print(f"  Large/Small: {tiempo_large/tiempo_small:.2f}x")

In [None]:
# Ver gráfico de escalabilidad
Image('graficos/tiempos_comparacion_escalabilidad.png')

## 4. Comparación: Factibles vs Infactibles

In [None]:
print("Tiempos por factibilidad:\n")
df.groupby(['tipo', 'factible'])['tiempo_segundos'].agg(['count', 'mean', 'std']).round(4)

## 5. Conclusiones

### Hallazgos principales:

1. **Crecimiento Superlineal**: Los tiempos muestran un crecimiento aproximadamente cuadrático con el tamaño del problema, coherente con la complejidad de programación lineal entera.

2. **Alta Eficiencia**: Todas las instancias se resuelven en menos de 0.3 segundos, demostrando la eficiencia del solver CBC incluso para instancias large.

3. **Factores de Escalamiento**:
   - Small → Medium: 3.4x más tiempo
   - Medium → Large: 5.0x más tiempo
   - Small → Large: 17.2x más tiempo

4. **Detección Rápida de Infactibilidad**: Las instancias infactibles (12 y 15) se detectan relativamente rápido (~0.1-0.2s) sin necesidad de explorar exhaustivamente el espacio de soluciones.

5. **Viabilidad Práctica**: El tiempo máximo de 0.27s para instancias large hace que el solver sea totalmente viable para aplicaciones en tiempo real o producción.

6. **Variabilidad por Tamaño**: La desviación estándar aumenta con el tamaño, indicando que las características específicas de cada instancia (demanda, disponibilidad) influyen más en instancias grandes.