# NOTEBOOK 4: ANÁLISIS DE TIEMPO VS PRECISIÓN\n\nEste notebook analiza el rendimiento de los 6 modelos entrenados, comparando su precisión (Accuracy) con el tiempo de entrenamiento.\nEl objetivo es identificar el modelo más eficiente (mejor trade-off entre calidad y costo computacional).

In [None]:
import pickle\nimport pandas as pd\nimport matplotlib.pyplot as plt\nimport seaborn as sns\nimport os\n\nMODELS_DIR = "models"\nHIST_FILE = f"{MODELS_DIR}/histories.pkl"\n\nif not os.path.exists(HIST_FILE):\n    print(f"⚠️ No se encontró el archivo {HIST_FILE}. Asegúrate de ejecutar el Notebook 2 primero.")\nelse:\n    print("Cargando historial de entrenamiento...")\n    with open(HIST_FILE, "rb") as f:\n        histories = pickle.load(f)

In [None]:
# Procesar datos para el DataFrame\ndata = []\n\nif 'histories' in locals():\n    for name, hist in histories.items():\n        best_acc = max(hist['val_acc'])\n        best_loss = min(hist['val_loss'])\n        total_time = hist.get('total_time', 0) # En segundos\n        \n        data.append({\n            'Model': name,\n            'Best Val Accuracy': best_acc,\n            'Best Val Loss': best_loss,\n            'Training Time (s)': total_time\n        })\n    \n    df = pd.DataFrame(data).sort_values(by='Best Val Accuracy', ascending=False)\n    print(df)

In [None]:
# Visualización 1: Tiempo de Entrenamiento\nplt.figure(figsize=(10, 6))\nsns.barplot(x='Model', y='Training Time (s)', data=df, palette='Blues_d')\nplt.title('Tiempo de Entrenamiento por Modelo')\nplt.xticks(rotation=45)\nplt.ylabel('Segundos')\nplt.tight_layout()\nplt.show()

In [None]:
# Visualización 2: Precisión vs Tiempo (Trade-off)\nplt.figure(figsize=(10, 6))\nsns.scatterplot(x='Training Time (s)', y='Best Val Accuracy', data=df, s=100, hue='Model', style='Model')\n\n# Etiquetas\nfor line in range(0, df.shape[0]):\n     plt.text(df['Training Time (s)'].iloc[line]+0.2, df['Best Val Accuracy'].iloc[line], df['Model'].iloc[line], horizontalalignment='left', size='medium', color='black', weight='semibold')\n\nplt.title('Trade-off: Precisión vs Tiempo de Entrenamiento')\nplt.xlabel('Tiempo de Entrenamiento (s)')\nplt.ylabel('Mejor Accuracy en Validación')\nplt.grid(True, linestyle='--', alpha=0.7)\nplt.tight_layout()\nplt.show()

## Conclusiones\n\nObservando el gráfico de dispersión (Scatter Plot):\n- Los modelos en la **esquina superior izquierda** son los más eficientes (alta precisión, bajo tiempo).\n- Los modelos en la **esquina inferior derecha** son los menos deseables (baja precisión, alto costo).\n\n**Análisis:**\n1. ¿El mecanismo de atención justifica el tiempo extra?\n2. ¿Es LSTM significativamente mejor que GRU en este dataset?\n3. ¿La bidireccionalidad aporta suficiente ganancia para el doble de cómputo?