# Informe: Clustering & Reducción (Ejecutado)
Este notebook carga los artefactos generados por `scripts/run_unsupervised_ad_hoc.py` y muestra tablas, gráficos y conclusiones.

In [None]:
# Configuración de rutas
from pathlib import Path
import pandas as pd
from IPython.display import display, Image, Markdown
ROOT = Path('.').resolve()
# buscar el directorio del proyecto que contenga data/05_train
for p in [ROOT] + list(ROOT.parents):
    if (p / 'data' / '05_train').exists():
        ROOT = p
        break
DATA_DIR = ROOT / 'data' / '05_train'
display(Markdown(f'**Usando artefactos en:** `{DATA_DIR}`'))

In [None]:
# Cargar métricas y tablas principales
summary = pd.read_csv(DATA_DIR / 'summary_metrics.csv') if (DATA_DIR / 'summary_metrics.csv').exists() else None
elbow = pd.read_csv(DATA_DIR / 'elbow.csv') if (DATA_DIR / 'elbow.csv').exists() else None
kmeans = pd.read_csv(DATA_DIR / 'kmeans_metrics.csv') if (DATA_DIR / 'kmeans_metrics.csv').exists() else None
clusters_k = pd.read_csv(DATA_DIR / 'kmeans_clusters.csv') if (DATA_DIR / 'kmeans_clusters.csv').exists() else None
display(Markdown('## Elbow (inertia por k)'))
display(elbow.head() if elbow is not None else 'No elbow file')
display(Markdown('## Métricas KMeans (seleccionado)'))
display(kmeans if kmeans is not None else 'No kmeans metrics file')
display(Markdown('## Muestra de clusters (primeras filas)'))
display(clusters_k.head() if clusters_k is not None else 'No kmeans clusters file')

In [None]:
# Mostrar dendrograma y scatter plots si existen
def show_image(path, caption=None):
    if path.exists():
        display(Markdown(f'**{caption or path.name}**'))
        display(Image(str(path)))
    else:
        display(Markdown(f'_No encontrado:_ `{path}`'))

show_image(DATA_DIR / 'dendrogram.png', 'Dendrograma')
show_image(DATA_DIR / 'elbow.png', 'Elbow plot')
show_image(DATA_DIR / 'pca_kmeans_scatter.png', 'PCA scatter (KMeans)')
show_image(DATA_DIR / 'tsne_kmeans_scatter.png', 't-SNE scatter (KMeans)')
show_image(DATA_DIR / 'tsne_dbscan_scatter.png', 't-SNE scatter (DBSCAN)')
show_image(DATA_DIR / 'tsne_hier_scatter.png', 't-SNE scatter (Hierarchical)')

## Conclusiones rápidas
- El método elbow y las métricas disponibles ayudan a justificar la elección de k para KMeans (revisar `summary_metrics.csv`).
- La métrica de Silhouette debe interpretarse junto con DBSCAN y Hierarchical para ver consistencia entre métodos.
- Visualizaciones PCA y t-SNE muestran la separación espacial; revisar países en clusters atípicos.
- Recomendación: incluir en la entrega `summary_metrics.csv`, `kmeans_clusters.csv`, `dbscan_clusters.csv`, `hier_clusters.csv`, `dendrogram.png` y los scatter plots para interpretación visual.