# Bloque 1.3 ‚Äî Clustering Jer√°rquico
**M√°ster en Ciencia de Datos ¬∑ M√≥dulo: Algoritmos de Clustering**
**Sesi√≥n 1 ¬∑ Duraci√≥n: 65 min**

---
> üìå **C√≥mo usar este notebook:**
> Ejecuta las celdas **en orden**. Cada secci√≥n comienza con explicaci√≥n te√≥rica (en Markdown) seguida del c√≥digo correspondiente.
> Los comentarios `# ---` delimitan ejercicios opcionales para profundizar.


In [None]:
# ============================================================
# BLOQUE 1.3 ‚Äî Clustering Jer√°rquico
# ============================================================

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

from sklearn.cluster import AgglomerativeClustering
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import make_blobs
from scipy.cluster.hierarchy import dendrogram, linkage, fcluster
from scipy.spatial.distance import pdist

plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.size'] = 12
sns.set_style("whitegrid")
np.random.seed(42)

print("‚úì Imports correctos")

---

#### Celda 2 ‚Äî Visualizaci√≥n del algoritmo aglomerativo paso a paso (dataset m√≠nimo)

In [None]:
# -------------------------------------------------------
# Demostraci√≥n con un dataset MUY peque√±o (8 puntos)
# para ver cada fusi√≥n de forma expl√≠cita
# -------------------------------------------------------

# 8 puntos en 2D con estructura de 3 grupos
X_mini = np.array([
    [1.0, 1.0],  # grupo A
    [1.5, 1.2],
    [1.2, 0.8],
    [5.0, 5.0],  # grupo B
    [5.3, 4.8],
    [4.8, 5.2],
    [9.0, 1.0],  # grupo C
    [9.2, 1.3],
])
etiquetas_reales = ['A1','A2','A3','B1','B2','B3','C1','C2']

# Calculamos la matriz de linkage con Ward
Z = linkage(X_mini, method='ward')

print("Historial de fusiones (m√©todo Ward):")
print(f"{'Paso':>4}  {'Cluster i':>10}  {'Cluster j':>10}  {'Distancia':>10}  {'Tama√±o':>7}")
print("-" * 50)
n = len(X_mini)
for i, (ci, cj, dist, size) in enumerate(Z):
    label_i = etiquetas_reales[int(ci)] if ci < n else f"Cluster-{int(ci)-n+1}"
    label_j = etiquetas_reales[int(cj)] if cj < n else f"Cluster-{int(cj)-n+1}"
    print(f"{i+1:>4}  {label_i:>10}  {label_j:>10}  {dist:>10.3f}  {int(size):>7}")

**Script de explicaci√≥n:**

*"Este es el historial completo de fusiones. En el paso 1 se fusionan los puntos m√°s cercanos ‚Äîprobablemente dos puntos dentro del mismo grupo real. Despu√©s se van formando grupos m√°s grandes. En los √∫ltimos pasos, la distancia da un salto grande: esos son los grupos 'reales' fusion√°ndose forzosamente."*

*"Ahora vamos a visualizar exactamente este historial como dendrograma."*

---

#### Celda 3 ‚Äî El dendrograma explicado capa a capa

In [None]:
fig, axes = plt.subplots(1, 2, figsize=(14, 6))

# --- Izquierda: los puntos en 2D ---
ax = axes[0]
colores_reales = ['#e41a1c','#e41a1c','#e41a1c',
                   '#377eb8','#377eb8','#377eb8',
                   '#4daf4a','#4daf4a']
for i, (x, y) in enumerate(X_mini):
    ax.scatter(x, y, c=colores_reales[i], s=150, zorder=5)
    ax.annotate(etiquetas_reales[i], (x, y),
                textcoords="offset points", xytext=(8, 5), fontsize=11)
ax.set_title("Puntos en el espacio original", fontsize=12, fontweight='bold')
ax.set_xlabel("Caracter√≠stica 1")
ax.set_ylabel("Caracter√≠stica 2")
ax.set_xlim(-0.5, 11)
ax.set_ylim(-0.5, 7)

# --- Derecha: el dendrograma ---
ax2 = axes[1]
dendrogram(
    Z,
    labels=etiquetas_reales,
    ax=ax2,
    color_threshold=4.0,    # umbral visual para colorear ramas
    leaf_font_size=11,
    above_threshold_color='gray'
)
ax2.set_title("Dendrograma (m√©todo Ward)", fontsize=12, fontweight='bold')
ax2.set_xlabel("Puntos")
ax2.set_ylabel("Distancia de fusi√≥n (Ward)")

# L√≠nea de corte sugerida
ax2.axhline(y=4.0, color='red', linestyle='--', linewidth=2,
            label='Corte ‚Üí 3 clusters')
ax2.legend(fontsize=10)

plt.suptitle("Del espacio 2D al dendrograma ‚Äî lectura directa",
             fontsize=13, fontweight='bold')
plt.tight_layout()
plt.savefig("img_dendrograma_mini.png", dpi=150, bbox_inches='tight')
plt.show()

print("Lectura del dendrograma:")
print("  Eje X ‚Üí puntos individuales (hojas del √°rbol)")
print("  Eje Y ‚Üí altura de la fusi√≥n (mayor = m√°s distintos al fusionarse)")
print("  L√≠nea roja ‚Üí corte que produce k=3 clusters")
print("  Grupos formados al cortar: {A1,A2,A3}, {B1,B2,B3}, {C1,C2}")

**Script de explicaci√≥n del dendrograma:**

*"Mirad la estructura del √°rbol. Abajo est√°n los puntos individuales. Las ramas que se unen bajas son fusiones de puntos muy cercanos ‚Äîdentro del mismo grupo real. Conforme subimos, vemos c√≥mo se consolidan los grupos. El salto m√°s grande est√° justo antes de que los tres grupos se fusionen en uno. La l√≠nea roja corta el √°rbol en ese punto y nos da tres clusters."*

*"La altura de cada fusi√≥n en el eje Y es vuestra informaci√≥n m√°s valiosa. Un salto grande indica una discontinuidad real en los datos."*

---

#### Celda 4 ‚Äî Comparaci√≥n de criterios de enlace

In [None]:
# -------------------------------------------------------
# ¬øC√≥mo cambia el dendrograma seg√∫n el criterio de enlace?
# -------------------------------------------------------

# Dataset con estructura m√°s compleja para ver diferencias
np.random.seed(7)
X_comp, _ = make_blobs(n_samples=80,
                        centers=[[-4,0],[0,0],[4,0],[0,4]],
                        cluster_std=[0.5, 0.5, 0.5, 1.5])

metodos = ['single', 'complete', 'average', 'ward']
titulos = [
    'Single linkage\n(par m√°s cercano)',
    'Complete linkage\n(par m√°s lejano)',
    'Average linkage\n(media de pares)',
    'Ward\n(m√≠nimo WCSS)'
]

fig, axes = plt.subplots(1, 4, figsize=(20, 6))

for ax, metodo, titulo in zip(axes, metodos, titulos):
    Z_m = linkage(X_comp, method=metodo)
    dendrogram(Z_m, ax=ax, no_labels=True,
               color_threshold=0.6 * max(Z_m[:, 2]))
    ax.set_title(titulo, fontsize=11, fontweight='bold')
    ax.set_ylabel("Distancia de fusi√≥n")
    ax.set_xlabel("Puntos")

plt.suptitle("Mismo dataset ‚Äî cuatro criterios de enlace, cuatro dendrogramas",
             fontsize=13, fontweight='bold')
plt.tight_layout()
plt.savefig("img_linkage_comparacion.png", dpi=150, bbox_inches='tight')
plt.show()

**Script de explicaci√≥n de cada criterio:**

*"Fij√©monos en Single linkage ‚Äîel primero. La estructura es muy 'plana' en los niveles bajos: muchas fusiones peque√±as antes del gran salto. Este es el efecto cadena: los puntos se van encadenando de uno en uno. Funciona bien para clusters de forma arbitraria pero es muy sensible a outliers."*

*"Complete linkage fuerza clusters m√°s compactos. Aqu√≠ el √°rbol es m√°s 'equilibrado'."*

*"Ward es el que produce los saltos m√°s claros y la estructura m√°s limpia. Si busc√°is un criterio por defecto, Ward es casi siempre el mejor punto de partida."*

---

#### Celda 5 ‚Äî C√≥mo leer el codo del dendrograma para elegir k

In [None]:
# -------------------------------------------------------
# T√©cnica del "mayor salto" para elegir k
# -------------------------------------------------------

Z_ward = linkage(X_comp, method='ward')

# Las alturas de fusi√≥n en orden (las √∫ltimas n-1 fusiones son las m√°s relevantes)
alturas = Z_ward[:, 2]
alturas_ordenadas = np.sort(alturas)[::-1]  # de mayor a menor

# Aceleraciones: diferencia entre fusiones consecutivas
aceleraciones = np.diff(alturas_ordenadas)
k_sugerido = np.argmax(aceleraciones) + 2  # +2 porque diff reduce en 1 y empezamos en k=2

fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Dendrograma con l√≠nea de corte autom√°tica
ax1 = axes[0]
umbral = (alturas_ordenadas[k_sugerido - 2] + alturas_ordenadas[k_sugerido - 1]) / 2
dendrogram(Z_ward, ax=ax1, no_labels=True,
           color_threshold=umbral)
ax1.axhline(y=umbral, color='red', linestyle='--', linewidth=2,
            label=f'Corte autom√°tico ‚Üí k={k_sugerido}')
ax1.set_title(f"Dendrograma Ward ‚Äî Corte sugerido: k={k_sugerido}",
              fontsize=11, fontweight='bold')
ax1.set_ylabel("Distancia de fusi√≥n")
ax1.legend(fontsize=10)

# Gr√°fico de aceleraciones (an√°logo al codo de K-Means)
ax2 = axes[1]
ks = range(2, len(aceleraciones) + 2)
ax2.bar(ks, aceleraciones[:len(ks)], color='steelblue', alpha=0.8)
ax2.axvline(x=k_sugerido, color='red', linestyle='--', linewidth=2,
            label=f'k sugerido = {k_sugerido}')
ax2.set_xlabel("N√∫mero de clusters (k)")
ax2.set_ylabel("Aceleraci√≥n de la distancia de fusi√≥n")
ax2.set_title("Mayor salto ‚Üí k √≥ptimo sugerido", fontsize=11, fontweight='bold')
ax2.legend(fontsize=10)

plt.suptitle("Selecci√≥n autom√°tica de k desde el dendrograma",
             fontsize=12, fontweight='bold')
plt.tight_layout()
plt.savefig("img_dendrograma_corte.png", dpi=150, bbox_inches='tight')
plt.show()

print(f"K sugerido por el criterio del mayor salto: k = {k_sugerido}")

**Script de explicaci√≥n:**

*"El gr√°fico de la derecha es el equivalente del 'm√©todo del codo' para clustering jer√°rquico. En lugar de graficar la WCSS, graficamos la aceleraci√≥n de las distancias de fusi√≥n: cu√°nto sube el umbral de un paso al siguiente. La barra m√°s alta indica la mayor discontinuidad ‚Äî ah√≠ est√° el 'corte natural'."*

---

#### Celda 6 ‚Äî Caso pr√°ctico: Agrupaci√≥n de pa√≠ses por indicadores econ√≥micos

In [None]:
# -------------------------------------------------------
# CASO PR√ÅCTICO: Pa√≠ses agrupados por indicadores
# econ√≥micos (dataset simplificado tipo World Bank)
# -------------------------------------------------------

# Dataset sint√©tico que replica la estructura de datos reales
# de indicadores macroecon√≥micos por pa√≠s (escala 0-100 normalizada)
np.random.seed(0)

paises_data = {
    'Pa√≠s': [
        'Alemania','Francia','Italia','Espa√±a','Pa√≠ses Bajos',
        'Polonia','Hungr√≠a','Ruman√≠a','Bulgaria','Eslovaquia',
        'Nigeria','Ghana','Kenia','Sud√°frica','Etiop√≠a',
        'Brasil','M√©xico','Argentina','Colombia','Chile',
        'China','India','Indonesia','Vietnam','Tailandia',
        'EEUU','Canad√°','Australia','Jap√≥n','Corea del Sur'
    ],
    'PIB_per_capita_idx': [
        88,84,74,72,90, 52,48,38,35,50,
        22,25,28,45,15, 45,40,38,35,50,
        55,32,38,35,42, 95,92,88,85,80
    ],
    'IDH': [
        93,90,88,88,93, 77,77,74,70,77,
        52,55,55,68,45, 74,74,79,72,80,
        74,64,68,68,70, 92,92,92,91,90
    ],
    'Gini_inv': [  # invertido: mayor = m√°s equitativo
        60,59,56,52,55, 54,52,56,58,50,
        48,50,52,48,62, 42,48,45,48,50,
        52,60,55,60,56, 58,65,68,70,65
    ],
    'Esperanza_vida': [
        80,82,83,83,82, 77,75,74,72,76,
        54,60,61,62,64, 73,75,76,73,79,
        75,68,69,73,75, 79,82,83,84,82
    ]
}

df_paises = pd.DataFrame(paises_data).set_index('Pa√≠s')
print(f"Dataset: {df_paises.shape[0]} pa√≠ses, {df_paises.shape[1]} indicadores")
print(df_paises.head(5))

---

#### Celda 7 ‚Äî Dendrograma de pa√≠ses + corte e interpretaci√≥n

In [None]:
# Escalamos los datos
scaler = StandardScaler()
X_paises = scaler.fit_transform(df_paises)

# Calculamos el linkage con Ward
Z_paises = linkage(X_paises, method='ward', metric='euclidean')

# ---- Dendrograma anotado ----
fig, ax = plt.subplots(figsize=(14, 7))

dend = dendrogram(
    Z_paises,
    labels=df_paises.index.tolist(),
    ax=ax,
    orientation='top',
    color_threshold=3.5,
    leaf_font_size=10,
    leaf_rotation=45
)

# L√≠nea de corte para k=4
ax.axhline(y=3.5, color='red', linestyle='--', linewidth=2,
           label='Corte ‚Üí 4 grupos')
ax.set_title("Clustering Jer√°rquico de pa√≠ses ‚Äî Indicadores econ√≥micos (Ward)",
             fontsize=13, fontweight='bold')
ax.set_ylabel("Distancia Ward (disimilitud)", fontsize=11)
ax.legend(fontsize=11)

plt.tight_layout()
plt.savefig("img_dendrograma_paises.png", dpi=150, bbox_inches='tight')
plt.show()

**Script de explicaci√≥n:**

*"Este dendrograma ya habla por s√≠ solo. Las hojas del √°rbol son los pa√≠ses. Los que se fusionan en niveles bajos son los m√°s parecidos seg√∫n los cuatro indicadores. Mirad c√≥mo Alemania y Pa√≠ses Bajos se fusionan muy pronto, igual que EEUU, Canad√° y Australia. En cambio, el grupo africano se fusiona con los dem√°s en niveles muy altos, lo que indica una gran diferencia estructural."*

*"La l√≠nea roja corta el √°rbol en cuatro grupos. Pero podr√≠a cortarse en tres o en cinco ‚Äî dependiendo de qu√© granularidad tiene sentido para vuestro an√°lisis."*

---

#### Celda 8 ‚Äî Extracci√≥n de clusters y visualizaci√≥n con perfiles

In [None]:
# Extraemos las etiquetas para k=4
from scipy.cluster.hierarchy import fcluster

labels_paises = fcluster(Z_paises, t=4, criterion='maxclust') - 1  # 0-indexed
df_paises['Cluster'] = labels_paises

# ---- Perfil medio de cada cluster ----
perfil = df_paises.groupby('Cluster')[
    ['PIB_per_capita_idx','IDH','Gini_inv','Esperanza_vida']
].mean().round(1)

print("Perfil medio de cada cluster:")
print(perfil)
print()

# ---- Lista de pa√≠ses por cluster ----
for c in sorted(df_paises['Cluster'].unique()):
    miembros = df_paises[df_paises['Cluster'] == c].index.tolist()
    print(f"Cluster {c}: {', '.join(miembros)}")

---

#### Celda 9 ‚Äî Heatmap de perfiles para comunicar resultados

In [None]:
# El heatmap es una forma muy efectiva de comunicar los clusters
# a una audiencia no t√©cnica

fig, axes = plt.subplots(1, 2, figsize=(16, 6))

# Heatmap de perfiles medios por cluster
ax1 = axes[0]
perfil_norm = (perfil - perfil.min()) / (perfil.max() - perfil.min())
sns.heatmap(perfil_norm, annot=perfil, fmt='.0f',
            cmap='RdYlGn', ax=ax1,
            linewidths=0.5, linecolor='white',
            cbar_kws={'label': 'Nivel relativo (0=m√≠nimo, 1=m√°ximo)'})
ax1.set_title("Perfil de cada cluster\n(valor real anotado, color = nivel relativo)",
              fontsize=11, fontweight='bold')
ax1.set_xticklabels(ax1.get_xticklabels(), rotation=25, ha='right')
ax1.set_yticklabels([f'Cluster {c}' for c in perfil.index], rotation=0)

# Scatter: PIB vs IDH coloreado por cluster
ax2 = axes[1]
colores_c = ['#e41a1c','#377eb8','#4daf4a','#ff7f00']
for c in sorted(df_paises['Cluster'].unique()):
    mask = df_paises['Cluster'] == c
    ax2.scatter(
        df_paises.loc[mask,'PIB_per_capita_idx'],
        df_paises.loc[mask,'IDH'],
        c=colores_c[c], s=100, label=f'Cluster {c}', alpha=0.85
    )
    for pais in df_paises[mask].index:
        ax2.annotate(pais,
                     (df_paises.loc[pais,'PIB_per_capita_idx'],
                      df_paises.loc[pais,'IDH']),
                     fontsize=7, alpha=0.8,
                     textcoords="offset points", xytext=(4, 3))
ax2.set_xlabel("PIB per c√°pita (√≠ndice)", fontsize=11)
ax2.set_ylabel("IDH", fontsize=11)
ax2.set_title("Pa√≠ses en el espacio PIB-IDH\ncoloreados por cluster jer√°rquico",
              fontsize=11, fontweight='bold')
ax2.legend(fontsize=9)

plt.suptitle("Interpretaci√≥n de los clusters jer√°rquicos de pa√≠ses",
             fontsize=13, fontweight='bold')
plt.tight_layout()
plt.savefig("img_paises_clusters_heatmap.png", dpi=150, bbox_inches='tight')
plt.show()

**Script de interpretaci√≥n:**

*"El heatmap es vuestra herramienta de comunicaci√≥n con negocio. El color verde indica nivel alto, el rojo nivel bajo. Mirad el patr√≥n: un cluster tiene verde en todo ‚Äîlos pa√≠ses desarrollados de alto PIB, IDH y equidad‚Äî. Otro tiene rojo en casi todo ‚Äîlos pa√≠ses de bajo desarrollo‚Äî. Los otros dos son posiciones intermedias diferenciadas."*

*"Notad que este resultado no requiri√≥ especificar k de antemano. Lo descubrimos del propio dendrograma. Esa es la ventaja de la exploraci√≥n jer√°rquica."*

---

#### Celda 10 ‚Äî Uso de scikit-learn: AgglomerativeClustering

In [None]:
# -------------------------------------------------------
# Interfaz de scikit-learn ‚Äî m√°s integrada con pipelines
# -------------------------------------------------------

from sklearn.cluster import AgglomerativeClustering

# Equivalente al scipy + fcluster anterior, pero con API sklearn
hc = AgglomerativeClustering(
    n_clusters=4,
    linkage='ward',       # 'ward', 'complete', 'average', 'single'
    metric='euclidean'    # Ward solo funciona con euclidiana
)
labels_sklearn = hc.fit_predict(X_paises)

# Verificar que produce los mismos clusters (pueden tener numeraci√≥n distinta)
from sklearn.metrics import adjusted_rand_score
ari = adjusted_rand_score(labels_paises, labels_sklearn)
print(f"Adjusted Rand Index scipy vs sklearn: {ari:.4f}")
print("(1.0 = asignaciones id√©nticas, ajustado por numeraci√≥n)")

# Para distancias no-euclidianas, usar connectivity o precomputed
# Ejemplo conceptual (no ejecutar sin un dataset adecuado):
# hc_coseno = AgglomerativeClustering(
#     n_clusters=4, linkage='average', metric='cosine'
# )
print("\nNota: Para m√©tricas distintas a euclidiana, usar linkage='average'")
print("Ward solo est√° definido para distancia euclidiana.")

---

#### Celda 11 ‚Äî Comparaci√≥n final: Jer√°rquico vs K-Means en el mismo dataset

In [None]:
from sklearn.cluster import KMeans

km_paises = KMeans(n_clusters=4, n_init=20, random_state=42)
labels_km_paises = km_paises.fit_predict(X_paises)

ari_comparacion = adjusted_rand_score(labels_paises, labels_km_paises)
print(f"Coincidencia K-Means vs Jer√°rquico (ARI): {ari_comparacion:.4f}")
print()

# Mostrar diferencias
df_comp = pd.DataFrame({
    'Jer√°rquico (Ward)': labels_paises,
    'K-Means': labels_km_paises
}, index=df_paises.index)

# Pa√≠ses donde difieren
diferencias = df_comp[df_comp.iloc[:,0] != df_comp.iloc[:,1]]
if len(diferencias) > 0:
    print("Pa√≠ses con asignaci√≥n diferente entre ambos m√©todos:")
    print(diferencias)
else:
    print("Ambos m√©todos producen la misma agrupaci√≥n (tras ajuste de numeraci√≥n).")

print("""
Reflexi√≥n:
  Si K-Means y Jer√°rquico coinciden ‚Üí la estructura es robusta.
  Si difieren ‚Üí explorar con el dendrograma para entender por qu√©.
  El jer√°rquico siempre aporta m√°s informaci√≥n (el √°rbol completo).
""")

**Script de discusi√≥n de cierre:**

*"En datasets peque√±os como este, K-Means y el clustering jer√°rquico suelen dar resultados muy parecidos si los datos tienen estructura clara. La ventaja del jer√°rquico no est√° en que d√© mejores clusters: est√° en que da un √°rbol, que es informaci√≥n adicional. Pod√©is ver qu√© pa√≠ses est√°n 'a punto de' pertenecer a otro cluster, qu√© nivel de granularidad tiene sentido, y c√≥mo se estructuran las relaciones entre grupos."*

---

## NOTAS DE PRODUCCI√ìN

### Para las slides

- **Slide 1:** Portada del bloque. Pregunta ret√≥rica: *"¬øCu√°ntos clusters tiene este dataset?"* con un dendrograma como imagen de fondo.
- **Slide 2:** Bottom-up vs. top-down ‚Äî dos diagramas de √°rbol en espejo. Una flecha sube, otra baja.
- **Slide 3:** Los 4 pasos del algoritmo aglomerativo en pseudoc√≥digo visual.
- **Slide 4:** Los 4 criterios de enlace ‚Äî f√≥rmula + diagrama geom√©trico mostrando qu√© distancia mide cada uno en un par de clusters.
- **Slide 5:** C√≥mo leer un dendrograma ‚Äî diagrama anotado con flechas explicando: hojas, altura de fusi√≥n, c√≥mo cortar.
- **Slide 6:** Tabla resumen de criterios de enlace.
- **Slide 7:** Comparaci√≥n de 4 dendrogramas del mismo dataset con distintos criterios de enlace (de la Celda 4).
- **Slide 8:** Cu√°ndo s√≠ / cu√°ndo no usar jer√°rquico ‚Äî dos columnas con iconos.

### Para el handout

- Tabla de criterios de enlace con f√≥rmulas y caracter√≠sticas.
- Imagen del dendrograma anotado (Celda 3) con gu√≠a de lectura.
- Imagen comparativa de los 4 criterios de enlace (Celda 4).
- Heatmap de perfiles de pa√≠ses (Celda 9) como ejemplo de output interpretable.
- Tabla de decisi√≥n: Jer√°rquico vs. K-Means vs. K-Medoids.

### Para el Jupyter Notebook (ejercicios a completar por los alumnos)

**Ejercicio 1 (Celda 7 ampliada):** Probar cortes a k=3, k=4 y k=5 sobre el dataset de pa√≠ses. Para cada uno, listar los pa√≠ses de cada cluster e interpretar qu√© agrupaci√≥n tiene m√°s sentido geopol√≠ticamente.

**Ejercicio 2 (Celda 4 ampliada):** A√±adir el criterio de Ward al dataset de lunas (`make_moons`). ¬øQu√© sucede? ¬øEl jer√°rquico puede resolver clusters no convexos con alg√∫n criterio de enlace? (Respuesta esperada: single linkage puede, Ward no.)

**Ejercicio 3 (Celda 10 ampliada):** Repetir el an√°lisis de pa√≠ses usando `metric='cosine'` y `linkage='average'`. ¬øLos grupos cambian? ¬øPor qu√© la similitud coseno podr√≠a tener sentido para comparar perfiles de pa√≠ses?

**Ejercicio 4 (avanzado):** Implementar el algoritmo de Single Linkage desde cero usando solo NumPy y una matriz de distancias. Verificar que produce el mismo historial de fusiones que `scipy.cluster.hierarchy.linkage(method='single')`.

---

## GESTI√ìN DEL TIEMPO

| Segmento | Duraci√≥n | Indicador de progreso |
|---|---|---|
| Transici√≥n y motivaci√≥n | 4 min | Pregunta de enganche respondida |
| Aglomerativo vs. divisivo | 6 min | Diagrama en pantalla |
| Algoritmo y criterios de enlace | 8 min | Tabla de criterios en pantalla |
| Dendrograma: lectura e interpretaci√≥n | 7 min | Dendrograma anotado en pantalla |
| Celda 1-2 (imports + pasos manuales) | 8 min | Tabla de fusiones en pantalla |
| Celda 3 (dendrograma mini) | 7 min | Dendrograma generado e interpretado |
| Celda 4-5 (comparaci√≥n criterios + corte) | 10 min | Los 4 dendrogramas comparados |
| Celda 6-9 (caso pa√≠ses) | 12 min | Heatmap de perfiles generado |
| Celda 10-11 (sklearn + comparaci√≥n K-Means) | 3 min | ARI calculado |
| Discusi√≥n de cierre | 3 min + 2 buffer | Pregunta respondida |
| **Total** | **65 min** | |

---

*Bloque 1.3 desarrollado para el m√≥dulo "Algoritmos de Clustering" ‚Äî M√°ster en Ciencia de Datos*

---
## üí° Para explorar m√°s ‚Äî Ejercicios propuestos

Los ejercicios pr√°cticos est√°n marcados con comentarios `# EJERCICIO` en el c√≥digo.

**Entrega sugerida:** Exporta este notebook como HTML o PDF (`File ‚Üí Download ‚Üí HTML`)
y a√±ade tus conclusiones en una celda Markdown al final de cada secci√≥n.

---
*M√°ster en Ciencia de Datos ¬∑ M√≥dulo Clustering ¬∑ Bloque 1.3*