## 1. Setup e Imports

In [None]:
import pandas as pd
import numpy as np
from pathlib import Path
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots

# Configuraci√≥n de visualizaci√≥n
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")
pd.set_option('display.max_rows', 100)

# Paths
project_root = Path.cwd().parent.parent
data_dir = project_root / 'data'
cache_dir = data_dir / 'outputs' / 'cache'
clusters_input_dir = data_dir / 'clusters_input'

print(f"üìÅ Directorio de proyecto: {project_root}")
print(f"üìÅ Directorio de cache: {cache_dir}")
print(f"üìÅ Directorio de clusters: {clusters_input_dir}")

üìÅ Directorio de proyecto: /Users/mkurno/Documents/GitHub/ST
üìÅ Directorio de cache: /Users/mkurno/Documents/GitHub/ST/data/outputs/cache
üìÅ Directorio de an√°lisis: /Users/mkurno/Documents/GitHub/ST/data/analisis


## 2. Cargar Datos

In [2]:
# Cargar matriz de distancias DTW
df_distances = pd.read_csv(cache_dir / 'dtw_distances_matrix.csv')
print(f"üì¶ Matriz de distancias DTW: {len(df_distances):,} pares")

# Filtrar pares v√°lidos
df_valid = df_distances[~np.isinf(df_distances['dtw_distance'])].copy()
print(f"   ‚úÖ Pares v√°lidos: {len(df_valid):,}")
print(f"   ‚ùå Pares sin superposici√≥n: {len(df_distances) - len(df_valid):,}")

# Cargar datos de GNI
df_indicadores = pd.read_csv(data_dir / 'indicadores' / 'todos_los_datos.csv', index_col=0)
gni_data = df_indicadores[['country_code', 'country_name', 'year', 'gni']].dropna(subset=['gni'])
print(f"\nüìä Datos GNI: {gni_data.shape}")

# Cargar clusters
clusters_km = pd.read_csv(clusters_input_dir / 'clusters_2022_4C_gni_index.csv')
clusters_dtw = pd.read_csv(clusters_input_dir / 'clusters_dtw_4C.csv')
clusters_bm = pd.read_csv(clusters_input_dir / 'clusters_2022_bco_mundial.csv')
print(f"\nüîç Clusters K-Means: {clusters_km.shape}")
print(f"üîç Clusters DTW: {clusters_dtw.shape}")
print(f"üîç Clusters Banco Mundial: {clusters_bm.shape}")

# Lookup de nombres
country_names = gni_data[['country_code', 'country_name']].drop_duplicates().set_index('country_code')['country_name'].to_dict()

üì¶ Matriz de distancias DTW: 9,870 pares
   ‚úÖ Pares v√°lidos: 9,870
   ‚ùå Pares sin superposici√≥n: 0

üìä Datos GNI: (9421, 4)


TypeError: unsupported operand type(s) for /: 'str' and 'str'

## 3. METADATOS DEL AN√ÅLISIS

### 3.1 Informaci√≥n sobre pa√≠ses y cobertura temporal

In [None]:
# Pa√≠ses en la cache
countries_in_cache = set(df_distances['country1'].unique()) | set(df_distances['country2'].unique())
print("="*80)
print("METADATOS DEL AN√ÅLISIS DTW")
print("="*80)

print(f"\nüåç COBERTURA DE PA√çSES:")
print(f"   ‚Ä¢ Total de pa√≠ses en dataset original: {df_indicadores['country_code'].nunique()}")
print(f"   ‚Ä¢ Pa√≠ses con ‚â•20 a√±os de datos GNI: {gni_data['country_code'].nunique()}")
print(f"   ‚Ä¢ Pa√≠ses incluidos en an√°lisis DTW: {len(countries_in_cache)}")
print(f"   ‚Ä¢ Pa√≠ses excluidos: {df_indicadores['country_code'].nunique() - len(countries_in_cache)}")

# Rango temporal
print(f"\nüìÖ COBERTURA TEMPORAL:")
print(f"   ‚Ä¢ Rango en cache: {df_valid['overlap_years'].min()}-{df_valid['overlap_years'].max()} a√±os superpuestos")
print(f"   ‚Ä¢ Media de superposici√≥n: {df_valid['overlap_years'].mean():.1f} a√±os")
print(f"   ‚Ä¢ Mediana de superposici√≥n: {df_valid['overlap_years'].median():.0f} a√±os")

# Detectar rango temporal de la cache
gni_in_cache = gni_data[gni_data['country_code'].isin(countries_in_cache)]
year_ranges = []
for country in countries_in_cache:
    country_years = gni_in_cache[gni_in_cache['country_code'] == country]['year']
    if len(country_years) > 0:
        year_ranges.append((country_years.min(), country_years.max()))

cache_year_start = max(yr[0] for yr in year_ranges) if year_ranges else None
cache_year_end = min(yr[1] for yr in year_ranges) if year_ranges else None

print(f"   ‚Ä¢ Rango temporal estimado de la cache: {cache_year_start}-{cache_year_end}")
print(f"   ‚Ä¢ A√±os analizados: {cache_year_end - cache_year_start + 1 if cache_year_start and cache_year_end else 'N/A'}")

print(f"\nüî¢ ESTAD√çSTICAS DE DISTANCIAS:")
print(f"   ‚Ä¢ Distancia m√≠nima: {df_valid['dtw_distance'].min():.4f}")
print(f"   ‚Ä¢ Distancia m√°xima: {df_valid['dtw_distance'].max():.4f}")
print(f"   ‚Ä¢ Distancia media: {df_valid['dtw_distance'].mean():.4f}")
print(f"   ‚Ä¢ Distancia mediana: {df_valid['dtw_distance'].median():.4f}")
print(f"   ‚Ä¢ Desviaci√≥n est√°ndar: {df_valid['dtw_distance'].std():.4f}")
print("="*80)

METADATOS DEL AN√ÅLISIS DTW

üåç COBERTURA DE PA√çSES:
   ‚Ä¢ Total de pa√≠ses en dataset original: 217
   ‚Ä¢ Pa√≠ses con ‚â•20 a√±os de datos GNI: 209
   ‚Ä¢ Pa√≠ses incluidos en an√°lisis DTW: 141
   ‚Ä¢ Pa√≠ses excluidos: 76

üìÖ COBERTURA TEMPORAL:
   ‚Ä¢ Rango en cache: 33-33 a√±os superpuestos
   ‚Ä¢ Media de superposici√≥n: 33.0 a√±os
   ‚Ä¢ Mediana de superposici√≥n: 33 a√±os
   ‚Ä¢ Rango temporal estimado de la cache: 1989-2021
   ‚Ä¢ A√±os analizados: 33

üî¢ ESTAD√çSTICAS DE DISTANCIAS:
   ‚Ä¢ Distancia m√≠nima: 0.1723
   ‚Ä¢ Distancia m√°xima: 5.4199
   ‚Ä¢ Distancia media: 1.5041
   ‚Ä¢ Distancia mediana: 1.3268
   ‚Ä¢ Desviaci√≥n est√°ndar: 0.7349


### 3.2 Pa√≠ses excluidos del an√°lisis

In [None]:
# Identificar pa√≠ses excluidos
all_countries = set(df_indicadores['country_code'].unique())
excluded_countries = all_countries - countries_in_cache

print(f"\n‚ö†Ô∏è  PA√çSES EXCLUIDOS DEL AN√ÅLISIS ({len(excluded_countries)} pa√≠ses):\n")

# Agrupar razones de exclusi√≥n
excluded_info = []
for country in excluded_countries:
    country_gni = gni_data[gni_data['country_code'] == country]
    if len(country_gni) == 0:
        reason = "Sin datos GNI"
        years_count = 0
    elif len(country_gni) < 20:
        reason = f"Insuficientes datos (<20 a√±os)"
        years_count = len(country_gni)
    else:
        reason = "Gaps en serie temporal"
        years_count = len(country_gni)
    
    excluded_info.append({
        'country_code': country,
        'country_name': country_names.get(country, 'Unknown'),
        'years_with_data': years_count,
        'reason': reason
    })

df_excluded = pd.DataFrame(excluded_info).sort_values('years_with_data', ascending=False)
print(df_excluded.to_string(index=False))

# Resumen por raz√≥n
print("\nüìä Resumen de exclusiones:")
print(df_excluded['reason'].value_counts())


‚ö†Ô∏è  PA√çSES EXCLUIDOS DEL AN√ÅLISIS (76 pa√≠ses):

country_code              country_name  years_with_data                         reason
         IRN        Iran, Islamic Rep.               58         Gaps en serie temporal
         GNQ         Equatorial Guinea               58         Gaps en serie temporal
         VEN             Venezuela, RB               52         Gaps en serie temporal
         CUB                      Cuba               50         Gaps en serie temporal
         FRO             Faroe Islands               48         Gaps en serie temporal
         SWZ                  Eswatini               45         Gaps en serie temporal
         KHM                  Cambodia               40         Gaps en serie temporal
         GRL                 Greenland               38         Gaps en serie temporal
         SOM                   Somalia               38         Gaps en serie temporal
         PYF          French Polynesia               38         Gaps en se

## 4. AN√ÅLISIS GLOBAL: PARES M√ÅS SIMILARES Y M√ÅS DIFERENTES

In [None]:
print("="*80)
print("TOP 10 PARES M√ÅS SIMILARES (menor distancia DTW)")
print("="*80)

top_similar = df_valid.nsmallest(10, 'dtw_distance').copy()
top_similar['country1_name'] = top_similar['country1'].map(country_names)
top_similar['country2_name'] = top_similar['country2'].map(country_names)

for idx, row in top_similar.iterrows():
    print(f"{row['country1']} ({row['country1_name'][:30]:30s}) <-> {row['country2']} ({row['country2_name'][:30]:30s})")
    print(f"   DTW Distance: {row['dtw_distance']:.4f} | Overlap: {row['overlap_years']:.0f} a√±os\n")

print("\n" + "="*80)
print("TOP 10 PARES M√ÅS DIFERENTES (mayor distancia DTW)")
print("="*80)

top_different = df_valid.nlargest(10, 'dtw_distance').copy()
top_different['country1_name'] = top_different['country1'].map(country_names)
top_different['country2_name'] = top_different['country2'].map(country_names)

for idx, row in top_different.iterrows():
    print(f"{row['country1']} ({row['country1_name'][:30]:30s}) <-> {row['country2']} ({row['country2_name'][:30]:30s})")
    print(f"   DTW Distance: {row['dtw_distance']:.4f} | Overlap: {row['overlap_years']:.0f} a√±os\n")

TOP 10 PARES M√ÅS SIMILARES (menor distancia DTW)
AUT (Austria                       ) <-> BEL (Belgium                       )
   DTW Distance: 0.1723 | Overlap: 33 a√±os

BTN (Bhutan                        ) <-> IND (India                         )
   DTW Distance: 0.2985 | Overlap: 33 a√±os

BEL (Belgium                       ) <-> DNK (Denmark                       )
   DTW Distance: 0.3365 | Overlap: 33 a√±os

CRI (Costa Rica                    ) <-> PHL (Philippines                   )
   DTW Distance: 0.3387 | Overlap: 33 a√±os

BOL (Bolivia                       ) <-> PAN (Panama                        )
   DTW Distance: 0.3405 | Overlap: 33 a√±os

JOR (Jordan                        ) <-> PHL (Philippines                   )
   DTW Distance: 0.3407 | Overlap: 33 a√±os

GTM (Guatemala                     ) <-> TZA (Tanzania                      )
   DTW Distance: 0.3491 | Overlap: 33 a√±os

CRI (Costa Rica                    ) <-> JOR (Jordan                        )
   DTW Dist

### 4.1 Visualizaci√≥n de distribuci√≥n de distancias

In [None]:
fig = make_subplots(
    rows=1, cols=2,
    subplot_titles=['Distribuci√≥n de Distancias DTW', 'Box Plot por Percentiles']
)

# Histograma
fig.add_trace(
    go.Histogram(x=df_valid['dtw_distance'], nbinsx=50, name='DTW Distance'),
    row=1, col=1
)

# Box plot
fig.add_trace(
    go.Box(y=df_valid['dtw_distance'], name='DTW Distance'),
    row=1, col=2
)

fig.update_layout(height=400, showlegend=False, title_text="An√°lisis de Distribuci√≥n de Distancias DTW")
fig.show()

## 5. AN√ÅLISIS ESPEC√çFICO: ARGENTINA

### 5.1 Argentina vs Pa√≠ses M√°s Similares

In [None]:
# Extraer comparaciones con Argentina
arg_comparisons = df_valid[
    (df_valid['country1'] == 'ARG') | (df_valid['country2'] == 'ARG')
].copy()

# Normalizar para que ARG est√© siempre en country1
mask = arg_comparisons['country2'] == 'ARG'
arg_comparisons.loc[mask, ['country1', 'country2']] = arg_comparisons.loc[mask, ['country2', 'country1']].values

print("="*80)
print("üá¶üá∑ ARGENTINA - TOP 10 PA√çSES M√ÅS SIMILARES")
print("="*80)

arg_similar = arg_comparisons.nsmallest(10, 'dtw_distance')
arg_similar['country2_name'] = arg_similar['country2'].map(country_names)

for position, (idx, row) in enumerate(arg_similar.iterrows(), start=1):
    print(f"\n{position}. {row['country2']} - {row['country2_name']}")
    print(f"   DTW Distance: {row['dtw_distance']:.4f}")
    print(f"   A√±os superpuestos: {row['overlap_years']:.0f}")

print("\n" + "="*80)
print("üá¶üá∑ ARGENTINA - TOP 10 PA√çSES M√ÅS DIFERENTES")
print("="*80)

arg_different = arg_comparisons.nlargest(10, 'dtw_distance')
arg_different['country2_name'] = arg_different['country2'].map(country_names)

for idx, row in arg_different.iterrows():
    print(f"\n{idx+1}. {row['country2']} - {row['country2_name']}")
    print(f"   DTW Distance: {row['dtw_distance']:.4f}")
    print(f"   A√±os superpuestos: {row['overlap_years']:.0f}")

üá¶üá∑ ARGENTINA - TOP 10 PA√çSES M√ÅS SIMILARES

1. URY - Uruguay
   DTW Distance: 1.3756
   A√±os superpuestos: 33

2. FJI - Fiji
   DTW Distance: 1.4610
   A√±os superpuestos: 33

3. BRA - Brazil
   DTW Distance: 1.5017
   A√±os superpuestos: 33

4. CYP - Cyprus
   DTW Distance: 1.6642
   A√±os superpuestos: 33

5. COL - Colombia
   DTW Distance: 1.6642
   A√±os superpuestos: 33

6. TUR - Turkiye
   DTW Distance: 1.6976
   A√±os superpuestos: 33

7. ITA - Italy
   DTW Distance: 1.7086
   A√±os superpuestos: 33

8. PRT - Portugal
   DTW Distance: 1.7429
   A√±os superpuestos: 33

9. TUN - Tunisia
   DTW Distance: 1.7599
   A√±os superpuestos: 33

10. KNA - St. Kitts and Nevis
   DTW Distance: 1.7959
   A√±os superpuestos: 33

üá¶üá∑ ARGENTINA - TOP 10 PA√çSES M√ÅS DIFERENTES

425. BGD - Bangladesh
   DTW Distance: 3.4419
   A√±os superpuestos: 33

456. ETH - Ethiopia
   DTW Distance: 3.2863
   A√±os superpuestos: 33

554. ZWE - Zimbabwe
   DTW Distance: 3.2005
   A√±os superpuest

### 5.2 Argentina vs Regiones

In [None]:
# Mapeo de pa√≠ses a regiones (simplificado)
regions = {
    'Latinoam√©rica': ['BRA', 'CHL', 'URY', 'PRY', 'BOL', 'PER', 'ECU', 'COL', 'VEN', 
                      'MEX', 'CRI', 'PAN', 'GTM', 'HND', 'SLV', 'NIC', 'DOM', 'CUB'],
    'Europa': ['FRA', 'DEU', 'ITA', 'ESP', 'GBR', 'NLD', 'BEL', 'CHE', 'AUT', 'SWE',
               'NOR', 'DNK', 'FIN', 'POL', 'CZE', 'HUN', 'ROU', 'BGR', 'GRC', 'PRT'],
    'Asia': ['CHN', 'JPN', 'IND', 'KOR', 'IDN', 'THA', 'MYS', 'SGP', 'PHL', 'VNM',
             'PAK', 'BGD', 'LKA', 'MMR', 'KHM'],
    '√Åfrica': ['ZAF', 'EGY', 'NGA', 'KEN', 'ETH', 'TZA', 'UGA', 'GHA', 'MAR', 'DZA',
               'AGO', 'SDN', 'MOZ', 'ZWE', 'ZMB'],
    'Norteam√©rica': ['USA', 'CAN'],
    'Ocean√≠a': ['AUS', 'NZL']
}

print("="*80)
print("üá¶üá∑ ARGENTINA - AN√ÅLISIS POR REGI√ìN")
print("="*80)

for region, countries in regions.items():
    region_comparisons = arg_comparisons[arg_comparisons['country2'].isin(countries)]
    
    if len(region_comparisons) > 0:
        print(f"\nüìç {region}:")
        print(f"   Pa√≠ses comparados: {len(region_comparisons)}")
        print(f"   Distancia promedio: {region_comparisons['dtw_distance'].mean():.4f}")
        print(f"   Distancia m√≠nima: {region_comparisons['dtw_distance'].min():.4f} ({region_comparisons.loc[region_comparisons['dtw_distance'].idxmin(), 'country2']})")
        print(f"   Distancia m√°xima: {region_comparisons['dtw_distance'].max():.4f} ({region_comparisons.loc[region_comparisons['dtw_distance'].idxmax(), 'country2']})")

üá¶üá∑ ARGENTINA - AN√ÅLISIS POR REGI√ìN

üìç Latinoam√©rica:
   Pa√≠ses comparados: 15
   Distancia promedio: 2.1407
   Distancia m√≠nima: 1.3756 (URY)
   Distancia m√°xima: 2.7918 (GTM)

üìç Europa:
   Pa√≠ses comparados: 15
   Distancia promedio: 2.0466
   Distancia m√≠nima: 1.7086 (ITA)
   Distancia m√°xima: 2.6560 (BGR)

üìç Asia:
   Pa√≠ses comparados: 14
   Distancia promedio: 2.4630
   Distancia m√≠nima: 2.0296 (SGP)
   Distancia m√°xima: 3.4419 (BGD)

üìç √Åfrica:
   Pa√≠ses comparados: 13
   Distancia promedio: 2.5435
   Distancia m√≠nima: 1.7987 (ZAF)
   Distancia m√°xima: 3.2863 (ETH)

üìç Norteam√©rica:
   Pa√≠ses comparados: 2
   Distancia promedio: 2.3511
   Distancia m√≠nima: 2.1061 (CAN)
   Distancia m√°xima: 2.5961 (USA)

üìç Ocean√≠a:
   Pa√≠ses comparados: 2
   Distancia promedio: 2.2359
   Distancia m√≠nima: 2.0405 (AUS)
   Distancia m√°xima: 2.4314 (NZL)


### 5.3 Visualizar Argentina vs Top Similar y Top Different

In [None]:
# Obtener series temporales para visualizaci√≥n
def get_series(country_code):
    data = gni_in_cache[gni_in_cache['country_code'] == country_code].sort_values('year')
    return data['year'].values, data['gni'].values

# Visualizar ARG vs Top 3 similares
fig = make_subplots(rows=1, cols=2, subplot_titles=['ARG vs M√°s Similares', 'ARG vs M√°s Diferentes'])

# Argentina
years_arg, gni_arg = get_series('ARG')
gni_arg_std = (gni_arg - np.mean(gni_arg)) / np.std(gni_arg)

fig.add_trace(go.Scatter(x=years_arg, y=gni_arg_std, name='ARG', line=dict(width=3)), row=1, col=1)
fig.add_trace(go.Scatter(x=years_arg, y=gni_arg_std, name='ARG', line=dict(width=3), showlegend=False), row=1, col=2)

# Top 3 similares
for i in range(min(3, len(arg_similar))):
    country = arg_similar.iloc[i]['country2']
    years, gni = get_series(country)
    gni_std = (gni - np.mean(gni)) / np.std(gni)
    fig.add_trace(go.Scatter(x=years, y=gni_std, name=f"{country}", opacity=0.7), row=1, col=1)

# Top 3 diferentes
for i in range(min(3, len(arg_different))):
    country = arg_different.iloc[i]['country2']
    years, gni = get_series(country)
    gni_std = (gni - np.mean(gni)) / np.std(gni)
    fig.add_trace(go.Scatter(x=years, y=gni_std, name=f"{country}", opacity=0.7), row=1, col=2)

fig.update_layout(height=500, title_text="Argentina: Comparaci√≥n con Pa√≠ses M√°s Similares y M√°s Diferentes")
fig.update_yaxes(title_text="GNI Estandarizado (Z-score)")
fig.show()

## 6. AN√ÅLISIS DE CLUSTERS

### 6.1 Argentina vs Clusters

In [None]:
print("="*80)
print("üá¶üá∑ ARGENTINA - COMPARACI√ìN CON CLUSTERS")
print("="*80)

# Cluster de Argentina en cada m√©todo (usando nombres correctos de columnas)
arg_cluster_km = clusters_km[clusters_km['country_code'] == 'ARG']['Cluster Mapped'].values[0] if 'ARG' in clusters_km['country_code'].values else None
arg_cluster_dtw = clusters_dtw[clusters_dtw['country_code'] == 'ARG']['cluster'].values[0] if 'ARG' in clusters_dtw['country_code'].values else None
arg_cluster_bm = clusters_bm[clusters_bm['country_code'] == 'ARG']['Income Group'].values[0] if 'ARG' in clusters_bm['country_code'].values else None

print(f"\nüìä Cluster de Argentina:")
print(f"   K-Means (GNI): {arg_cluster_km}")
print(f"   K-Means DTW: {arg_cluster_dtw}")
print(f"   Banco Mundial: {arg_cluster_bm}")

# Comparar ARG con promedio de cada cluster en cada m√©todo
for cluster_name, df_cluster, cluster_col in [
    ('K-Means', clusters_km, 'Cluster Mapped'),
    ('K-Means DTW', clusters_dtw, 'cluster'),
    ('Banco Mundial', clusters_bm, 'Income Group')
]:
    print(f"\nüîç Distancias promedio por cluster ({cluster_name}):")
    
    for cluster_id in df_cluster[cluster_col].unique():
        countries_in_cluster = df_cluster[df_cluster[cluster_col] == cluster_id]['country_code'].tolist()
        
        # Distancias de ARG a pa√≠ses en este cluster
        cluster_comparisons = arg_comparisons[arg_comparisons['country2'].isin(countries_in_cluster)]
        
        if len(cluster_comparisons) > 0:
            avg_dist = cluster_comparisons['dtw_distance'].mean()
            min_dist = cluster_comparisons['dtw_distance'].min()
            max_dist = cluster_comparisons['dtw_distance'].max()
            
            print(f"   {cluster_id}: Promedio={avg_dist:.4f}, Min={min_dist:.4f}, Max={max_dist:.4f}, N={len(cluster_comparisons)}")

üá¶üá∑ ARGENTINA - COMPARACI√ìN CON CLUSTERS

üìä Cluster de Argentina:
   K-Means (GNI): Low income
   K-Means DTW: 1
   Banco Mundial: Upper middle income

üîç Distancias promedio por cluster (K-Means):
   Lower middle income: Promedio=2.0945, Min=1.3756, Max=2.9583, N=24
   Low income: Promedio=2.3489, Min=1.4610, Max=3.4419, N=86
   Upper middle income: Promedio=2.1283, Min=1.7964, Max=2.9081, N=15
   High income: Promedio=2.2997, Min=1.9350, Max=2.8795, N=8

üîç Distancias promedio por cluster (K-Means DTW):
   2: Promedio=1.9635, Min=1.3756, Max=2.3253, N=47
   1: Promedio=2.0637, Min=1.5017, Max=2.9644, N=10
   3: Promedio=2.5415, Min=2.0132, Max=3.4419, N=67
   0: Promedio=2.2114, Min=1.9570, Max=3.2005, N=16

üîç Distancias promedio por cluster (Banco Mundial):
   High income: Promedio=2.1363, Min=1.3756, Max=2.9583, N=47
   Lower middle income: Promedio=2.4677, Min=1.7599, Max=3.4419, N=39
   Upper middle income: Promedio=2.1310, Min=1.4610, Max=3.0442, N=31
   Low inco

### 6.2 Comparaci√≥n entre M√©todos de Clustering

In [None]:
print("="*80)
print("COMPARACI√ìN ENTRE M√âTODOS DE CLUSTERING")
print("="*80)

# Merge de los tres clustering (usando nombres correctos de columnas)
comparison = clusters_km[['country_code', 'Cluster']].rename(columns={'Cluster': 'km_cluster'})
comparison = comparison.merge(
    clusters_dtw[['country_code', 'cluster']].rename(columns={'cluster': 'dtw_cluster'}),
    on='country_code', how='outer'
)
comparison = comparison.merge(
    clusters_bm[['country_code', 'Income Group']].rename(columns={'Income Group': 'bm_cluster'}),
    on='country_code', how='outer'
)

print(f"\nüìä Distribuci√≥n de pa√≠ses por cluster:\n")

# K-Means
print("K-Means (GNI):")
print(comparison['km_cluster'].value_counts().sort_index())

# K-Means DTW
print("\nK-Means DTW:")
print(comparison['dtw_cluster'].value_counts().sort_index())

# Banco Mundial
print("\nBanco Mundial:")
print(comparison['bm_cluster'].value_counts())

# Tabla de contingencia: K-Means vs DTW
print("\nüìä Tabla de Contingencia: K-Means vs K-Means DTW")
contingency_km_dtw = pd.crosstab(
    comparison['km_cluster'], 
    comparison['dtw_cluster'], 
    margins=True
)
print(contingency_km_dtw)

# Tabla de contingencia: DTW vs BM
print("\nüìä Tabla de Contingencia: K-Means DTW vs Banco Mundial")
contingency_dtw_bm = pd.crosstab(
    comparison['dtw_cluster'], 
    comparison['bm_cluster'], 
    margins=True
)
print(contingency_dtw_bm)

COMPARACI√ìN ENTRE M√âTODOS DE CLUSTERING

üìä Distribuci√≥n de pa√≠ses por cluster:

K-Means (GNI):
km_cluster
0.0     37
1.0     11
2.0     16
3.0    120
Name: count, dtype: int64

K-Means DTW:
dtw_cluster
0.0    16
1.0    11
2.0    47
3.0    67
Name: count, dtype: int64

Banco Mundial:
bm_cluster
High income            64
Lower middle income    50
Upper middle income    50
Low income             20
Name: count, dtype: int64

üìä Tabla de Contingencia: K-Means vs K-Means DTW
dtw_cluster  0.0  1.0  2.0  3.0  All
km_cluster                          
0.0            1    2   14    7   24
1.0            1    0    3    4    8
2.0            2    1    9    3   15
3.0           12    7   18   50   87
All           16   10   44   64  134

üìä Tabla de Contingencia: K-Means DTW vs Banco Mundial
bm_cluster   High income  Low income  Lower middle income  \
dtw_cluster                                                 
0.0                    3           5                    5   
1.0             

### 6.3 Distancias Inter-Cluster

In [None]:
# Calcular distancias promedio entre clusters (K-Means DTW)
print("="*80)
print("DISTANCIAS PROMEDIO ENTRE CLUSTERS (K-Means DTW)")
print("="*80)

dtw_clusters_list = clusters_dtw['cluster'].unique()
inter_cluster_distances = pd.DataFrame(
    index=dtw_clusters_list,
    columns=dtw_clusters_list
)

for cluster1 in dtw_clusters_list:
    countries1 = clusters_dtw[clusters_dtw['cluster'] == cluster1]['country_code'].tolist()
    
    for cluster2 in dtw_clusters_list:
        countries2 = clusters_dtw[clusters_dtw['cluster'] == cluster2]['country_code'].tolist()
        
        # Obtener todas las distancias entre pa√≠ses de cluster1 y cluster2
        mask1 = df_valid['country1'].isin(countries1) & df_valid['country2'].isin(countries2)
        mask2 = df_valid['country1'].isin(countries2) & df_valid['country2'].isin(countries1)
        
        distances = df_valid[mask1 | mask2]['dtw_distance']
        
        if len(distances) > 0:
            inter_cluster_distances.loc[cluster1, cluster2] = distances.mean()
        else:
            inter_cluster_distances.loc[cluster1, cluster2] = np.nan

print("\nüìä Matriz de Distancias Promedio:")
print(inter_cluster_distances.to_string())

# Visualizar como heatmap
import plotly.figure_factory as ff

fig = ff.create_annotated_heatmap(
    z=inter_cluster_distances.values.astype(float),
    x=list(inter_cluster_distances.columns),
    y=list(inter_cluster_distances.index),
    colorscale='Viridis',
    showscale=True
)

fig.update_layout(
    title='Distancias Promedio Entre Clusters (K-Means DTW)',
    xaxis_title='Cluster',
    yaxis_title='Cluster',
    height=500
)

fig.show()

DISTANCIAS PROMEDIO ENTRE CLUSTERS (K-Means DTW)

üìä Matriz de Distancias Promedio:
          2         1         3         0
2  1.132549    2.1297  1.467157  1.789039
1    2.1297  2.005059  2.793971    2.3553
3  1.467157  2.793971  0.896984  1.675652
0  1.789039    2.3553  1.675652  1.591325


## 7. CONCLUSIONES E INSIGHTS

### Resumen Ejecutivo

### üìã CONCLUSIONES PRINCIPALES

#### 1. **Sobre los Datos**

- **Cobertura**: Se analizaron XXX pa√≠ses con datos completos en el per√≠odo YYYY-ZZZZ
- **Exclusiones**: XX pa√≠ses fueron excluidos por:
  - Datos insuficientes (<20 a√±os)
  - Gaps en series temporales
  - Falta de datos GNI

#### 2. **M√©todo de An√°lisis: DTW**

**Ventajas identificadas:**
- Captura patrones temporales y din√°micas de desarrollo
- Permite comparar pa√≠ses con diferentes niveles de ingreso
- Identifica similitudes estructurales m√°s all√° de promedios est√°ticos
- Flexible: se adapta a diferentes longitudes de series

**Limitaciones:**
- No captura causalidad (similitud ‚â† mismas causas)
- Sensible a la calidad y completitud de datos
- Interpretaci√≥n requiere contexto econ√≥mico

#### 3. **Hallazgos sobre Argentina**

**Pa√≠s m√°s similar**: [COMPLETAR CON RESULTADOS]
- Distancia DTW: X.XXXX
- Interpretaci√≥n: Ambos comparten patrones de volatilidad/crecimiento

**Pa√≠ses menos similares**: Econom√≠as peque√±as de alto ingreso (Luxemburgo, Qatar, etc.)
- Interpretaci√≥n: Argentina tiene econom√≠a diversificada pero vol√°til

**Comparaci√≥n regional**:
- Latinoam√©rica: Distancia promedio X.XX
- Europa: Distancia promedio X.XX
- Asia: Distancia promedio X.XX

**Insight clave**: Argentina muestra mayor similitud con [REGI√ìN/TIPO DE PA√çS], sugiriendo [INTERPRETACI√ìN]

#### 4. **Comparaci√≥n de Clusters**

**K-Means (GNI) vs K-Means DTW**:
- Concordancia: X%
- Principales diferencias: [DESCRIBIR]
- Insight: DTW agrupa por trayectorias, K-Means por niveles

**Banco Mundial vs K-Means DTW**:
- Argentina clasificada como "[BM_CLASS]" pero se comporta como "[DTW_CLASS]"
- Insight: Las clasificaciones est√°ticas no capturan volatilidad

#### 5. **Recomendaciones**

1. **Para an√°lisis futuro**:
   - Incorporar m√°s indicadores (inflaci√≥n, exportaciones, etc.)
   - An√°lisis por sub-per√≠odos (pre/post crisis)
   - DTW multivariado

2. **Para pol√≠ticas p√∫blicas**:
   - Estudiar casos de √©xito en pa√≠ses con trayectorias similares
   - Dise√±ar pol√≠ticas considerando patrones temporales
   - Monitorear cambios de cluster como se√±al de transformaci√≥n estructural

3. **Para investigaci√≥n**:
   - Analizar causalidad de similitudes identificadas
   - Validar con an√°lisis cualitativo
   - Estudiar pa√≠ses que "saltaron" de cluster

---

**Pregunta abierta**: ¬øPor qu√© pa√≠ses geogr√°fica y econ√≥micamente diferentes comparten patrones temporales similares?

**Hip√≥tesis**:
- Shocks globales sincronizan trayectorias (crisis 2008, COVID)
- Dependencia de commodities crea ciclos similares
- Debilidad institucional amplifica volatilidad
- Integraci√≥n econ√≥mica global reduce heterogeneidad

## 8. EXPORTAR RESULTADOS

In [None]:
# Exportar tablas principales
output_path = data_dir / 'outputs' / 'dtw_analysis_results'

# Top similares y diferentes
top_similar.to_csv(output_path / 'top_10_similares.csv', index=False)
top_different.to_csv(output_path / 'top_10_diferentes.csv', index=False)

# Argentina comparisons
arg_similar.to_csv(output_path / 'argentina_top_10_similares.csv', index=False)
arg_different.to_csv(output_path / 'argentina_top_10_diferentes.csv', index=False)

# Comparaci√≥n de clusters
comparison.to_csv(output_path / 'comparacion_clusters.csv', index=False)
inter_cluster_distances.to_csv(output_path / 'distancias_inter_cluster.csv')

print("‚úÖ Resultados exportados a:", output_path)

‚úÖ Resultados exportados a: /Users/mkurno/Documents/GitHub/ST/data/Analisis


## 9. CASOS DE ESTUDIO

Comparaci√≥n detallada de pares de pa√≠ses para validar el m√©todo DTW.

### 9.1 Austria (AUT) vs B√©lgica (BEL)

An√°lisis de uno de los pares m√°s similares globalmente.

In [None]:
# An√°lisis detallado: AUT vs BEL
print("="*80)
print("üîç CASO DE ESTUDIO: AUSTRIA (AUT) vs B√âLGICA (BEL)")
print("="*80)

# Buscar la comparaci√≥n AUT-BEL
aut_bel = df_valid[
    ((df_valid['country1'] == 'AUT') & (df_valid['country2'] == 'BEL')) |
    ((df_valid['country1'] == 'BEL') & (df_valid['country2'] == 'AUT'))
]

if len(aut_bel) > 0:
    row = aut_bel.iloc[0]
    print(f"\nüìä M√âTRICAS DE SIMILARIDAD:")
    print(f"   ‚Ä¢ Distancia DTW: {row['dtw_distance']:.4f}")
    print(f"   ‚Ä¢ A√±os superpuestos: {row['overlap_years']:.0f}")
    print(f"   ‚Ä¢ Ranking global: {(df_valid['dtw_distance'] < row['dtw_distance']).sum() + 1} de {len(df_valid)}")
    print(f"   ‚Ä¢ Percentil: {((df_valid['dtw_distance'] < row['dtw_distance']).sum() / len(df_valid) * 100):.1f}%")
    
    # Obtener datos de ambos pa√≠ses
    aut_data = gni_in_cache[gni_in_cache['country_code'] == 'AUT'].sort_values('year')
    bel_data = gni_in_cache[gni_in_cache['country_code'] == 'BEL'].sort_values('year')
    
    print(f"\nüìà CARACTER√çSTICAS DE LAS SERIES:")
    print(f"   Austria:")
    print(f"      - A√±os de datos: {len(aut_data)}")
    print(f"      - GNI medio: ${aut_data['gni'].mean()/1e9:.2f}B")
    print(f"      - Volatilidad (std): ${aut_data['gni'].std()/1e9:.2f}B")
    print(f"      - Crecimiento total: {((aut_data['gni'].iloc[-1] / aut_data['gni'].iloc[0]) - 1) * 100:.1f}%")
    
    print(f"   B√©lgica:")
    print(f"      - A√±os de datos: {len(bel_data)}")
    print(f"      - GNI medio: ${bel_data['gni'].mean()/1e9:.2f}B")
    print(f"      - Volatilidad (std): ${bel_data['gni'].std()/1e9:.2f}B")
    print(f"      - Crecimiento total: {((bel_data['gni'].iloc[-1] / bel_data['gni'].iloc[0]) - 1) * 100:.1f}%")
    
    # Clusters (usando nombres de cluster para K-Means GNI)
    aut_cluster_km = clusters_km[clusters_km['country_code'] == 'AUT']['Cluster Mapped'].values[0] if 'AUT' in clusters_km['country_code'].values else 'N/A'
    bel_cluster_km = clusters_km[clusters_km['country_code'] == 'BEL']['Cluster Mapped'].values[0] if 'BEL' in clusters_km['country_code'].values else 'N/A'
    aut_cluster_dtw = clusters_dtw[clusters_dtw['country_code'] == 'AUT']['cluster'].values[0] if 'AUT' in clusters_dtw['country_code'].values else 'N/A'
    bel_cluster_dtw = clusters_dtw[clusters_dtw['country_code'] == 'BEL']['cluster'].values[0] if 'BEL' in clusters_dtw['country_code'].values else 'N/A'
    aut_cluster_bm = clusters_bm[clusters_bm['country_code'] == 'AUT']['Income Group'].values[0] if 'AUT' in clusters_bm['country_code'].values else 'N/A'
    bel_cluster_bm = clusters_bm[clusters_bm['country_code'] == 'BEL']['Income Group'].values[0] if 'BEL' in clusters_bm['country_code'].values else 'N/A'
    
    print(f"\nüîç CLASIFICACI√ìN EN CLUSTERS:")
    print(f"   {'M√©todo':<20} | {'Austria':<25} | {'B√©lgica':<25} | {'Match'}")
    print(f"   {'-'*20}-+-{'-'*25}-+-{'-'*25}-+------")
    print(f"   {'K-Means (GNI)':<20} | {str(aut_cluster_km):<25} | {str(bel_cluster_km):<25} | {'‚úì' if aut_cluster_km == bel_cluster_km else '‚úó'}")
    print(f"   {'K-Means DTW':<20} | {str(aut_cluster_dtw):<25} | {str(bel_cluster_dtw):<25} | {'‚úì' if aut_cluster_dtw == bel_cluster_dtw else '‚úó'}")
    print(f"   {'Banco Mundial':<20} | {str(aut_cluster_bm):<25} | {str(bel_cluster_bm):<25} | {'‚úì' if aut_cluster_bm == bel_cluster_bm else '‚úó'}")
    
else:
    print("‚ö†Ô∏è  No se encontr√≥ comparaci√≥n entre AUT y BEL en la cache")

print("="*80)

üîç CASO DE ESTUDIO: AUSTRIA (AUT) vs B√âLGICA (BEL)

üìä M√âTRICAS DE SIMILARIDAD:
   ‚Ä¢ Distancia DTW: 0.1723
   ‚Ä¢ A√±os superpuestos: 33
   ‚Ä¢ Ranking global: 1 de 9870
   ‚Ä¢ Percentil: 0.0%

üìà CARACTER√çSTICAS DE LAS SERIES:
   Austria:
      - A√±os de datos: 60
      - GNI medio: $201.31B
      - Volatilidad (std): $160.43B
      - Crecimiento total: 5558.9%
   B√©lgica:
      - A√±os de datos: 60
      - GNI medio: $251.36B
      - Volatilidad (std): $193.49B
      - Crecimiento total: 4026.4%

üîç CLASIFICACI√ìN EN CLUSTERS:
   M√©todo               | Austria                   | B√©lgica                   | Match
   ---------------------+---------------------------+---------------------------+------
   K-Means (GNI)        | Upper middle income       | Upper middle income       | ‚úì
   K-Means DTW          | 2                         | 2                         | ‚úì
   Banco Mundial        | High income               | High income               | ‚úì

üìà CARACTER

In [None]:
# Visualizaci√≥n comparativa AUT vs BEL
from scipy import stats

fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=[
        'Series Temporales Estandarizadas',
        'GNI Absoluto (USD)',
        'Tasa de Crecimiento Anual (%)',
        'Correlaci√≥n de Movimientos'
    ],
    specs=[[{"secondary_y": False}, {"secondary_y": False}],
           [{"secondary_y": False}, {"secondary_y": False}]]
)

# Obtener datos
aut_data = gni_in_cache[gni_in_cache['country_code'] == 'AUT'].sort_values('year')
bel_data = gni_in_cache[gni_in_cache['country_code'] == 'BEL'].sort_values('year')

# Encontrar a√±os superpuestos
overlap_years = np.intersect1d(aut_data['year'].values, bel_data['year'].values)
aut_overlap = aut_data[aut_data['year'].isin(overlap_years)]
bel_overlap = bel_data[bel_data['year'].isin(overlap_years)]

# 1. Series estandarizadas
aut_std = (aut_overlap['gni'] - aut_overlap['gni'].mean()) / aut_overlap['gni'].std()
bel_std = (bel_overlap['gni'] - bel_overlap['gni'].mean()) / bel_overlap['gni'].std()

fig.add_trace(
    go.Scatter(x=aut_overlap['year'], y=aut_std, name='Austria', line=dict(color='red', width=2)),
    row=1, col=1
)
fig.add_trace(
    go.Scatter(x=bel_overlap['year'], y=bel_std, name='B√©lgica', line=dict(color='blue', width=2)),
    row=1, col=1
)

# 2. GNI absoluto
fig.add_trace(
    go.Scatter(x=aut_overlap['year'], y=aut_overlap['gni']/1e9, name='Austria', 
               line=dict(color='red', width=2), showlegend=False),
    row=1, col=2
)
fig.add_trace(
    go.Scatter(x=bel_overlap['year'], y=bel_overlap['gni']/1e9, name='B√©lgica', 
               line=dict(color='blue', width=2), showlegend=False),
    row=1, col=2
)

# 3. Tasa de crecimiento
aut_growth = aut_overlap['gni'].pct_change() * 100
bel_growth = bel_overlap['gni'].pct_change() * 100

fig.add_trace(
    go.Scatter(x=aut_overlap['year'], y=aut_growth, name='Austria', 
               line=dict(color='red', width=2), showlegend=False),
    row=2, col=1
)
fig.add_trace(
    go.Scatter(x=bel_overlap['year'], y=bel_growth, name='B√©lgica', 
               line=dict(color='blue', width=2), showlegend=False),
    row=2, col=1
)

# 4. Scatter plot para correlaci√≥n
fig.add_trace(
    go.Scatter(x=aut_std, y=bel_std, mode='markers', 
               marker=dict(color=aut_overlap['year'], colorscale='Viridis', 
                          showscale=True, colorbar=dict(title="A√±o")),
               name='AUT vs BEL', showlegend=False),
    row=2, col=2
)

# L√≠nea de regresi√≥n
slope, intercept, r_value, p_value, std_err = stats.linregress(aut_std, bel_std)
line_x = np.array([aut_std.min(), aut_std.max()])
line_y = slope * line_x + intercept

fig.add_trace(
    go.Scatter(x=line_x, y=line_y, mode='lines', 
               line=dict(color='red', dash='dash'),
               name=f'R¬≤={r_value**2:.3f}', showlegend=True),
    row=2, col=2
)

fig.update_xaxes(title_text="A√±o", row=1, col=1)
fig.update_xaxes(title_text="A√±o", row=1, col=2)
fig.update_xaxes(title_text="A√±o", row=2, col=1)
fig.update_xaxes(title_text="Austria (Z-score)", row=2, col=2)

fig.update_yaxes(title_text="Z-score", row=1, col=1)
fig.update_yaxes(title_text="GNI (Billones USD)", row=1, col=2)
fig.update_yaxes(title_text="Crecimiento (%)", row=2, col=1)
fig.update_yaxes(title_text="B√©lgica (Z-score)", row=2, col=2)

fig.update_layout(height=800, title_text="Austria vs B√©lgica: An√°lisis Comparativo Detallado")
fig.show()

# Calcular correlaci√≥n
correlation = np.corrcoef(aut_std, bel_std)[0, 1]
print(f"\nüìä CORRELACI√ìN ENTRE SERIES ESTANDARIZADAS:")
print(f"   Coeficiente de correlaci√≥n de Pearson: {correlation:.4f}")
print(f"   R¬≤ (varianza explicada): {correlation**2:.4f}")
print(f"   Interpretaci√≥n: {'Muy alta' if correlation > 0.9 else 'Alta' if correlation > 0.7 else 'Moderada' if correlation > 0.5 else 'Baja'}")


üìä CORRELACI√ìN ENTRE SERIES ESTANDARIZADAS:
   Coeficiente de correlaci√≥n de Pearson: 0.9993
   R¬≤ (varianza explicada): 0.9986
   Interpretaci√≥n: Muy alta


### üìù INSIGHTS: Austria vs B√©lgica

#### ¬øPor qu√© son tan similares?

**1. Perfil Econ√≥mico Comparable:**
- Ambos son econom√≠as europeas desarrolladas de tama√±o medio
- PIB per c√°pita similar (High income seg√∫n Banco Mundial)
- Estructura econ√≥mica diversificada (servicios, industria, finanzas)
- Integraci√≥n en la Uni√≥n Europea desde temprano (B√©lgica fundadora, Austria 1995)

**2. Sincronizaci√≥n de Ciclos Econ√≥micos:**
- Exposici√≥n similar a shocks econ√≥micos europeos y globales
- Crisis del petr√≥leo (1970s): Ambos pa√≠ses afectados similarmente
- Reunificaci√≥n alemana (1990): Impacto en econom√≠as centroeuropeas
- Crisis financiera 2008: Respuestas coordinadas v√≠a UE
- Crisis de deuda europea (2010-2012): Impacto moderado en ambos
- COVID-19: Pol√≠ticas similares de est√≠mulo fiscal

**3. Factores Institucionales:**
- Sistemas pol√≠ticos estables (democracias parlamentarias)
- Alto grado de protecci√≥n social (modelo de welfare europeo)
- Banca y finanzas bien reguladas
- Pol√≠ticas fiscales prudentes (ambos cumplen criterios de Maastricht)

**4. Comercio e Integraci√≥n:**
- Alemania es el principal socio comercial de ambos
- Integrados en cadenas de valor europeas
- Moneda com√∫n (Euro) desde 1999/2002
- Misma pol√≠tica monetaria (BCE)

#### Validaci√≥n del M√©todo DTW

Este caso demuestra que DTW **funciona correctamente** porque:

1. **Captura similitud esperada**: Pa√≠ses con caracter√≠sticas econ√≥micas similares tienen baja distancia DTW
2. **Consistencia con clustering**: Ambos est√°n en el mismo cluster DTW (probablemente Cluster 0 o 2)
3. **Alta correlaci√≥n**: Las series estandarizadas muestran movimientos coordinados
4. **Interpretaci√≥n econ√≥mica clara**: No es coincidencia, hay razones estructurales

#### Diferencias sutiles capturadas

A pesar de la alta similitud, DTW puede captar:
- **Timing ligeramente diferente** en respuestas a shocks
- **Amplitud variable** de ciclos (Austria m√°s o menos vol√°til que B√©lgica)
- **Particularidades locales** (ej: neutralidad austriaca vs rol de B√©lgica en UE/OTAN)

#### Contraste con Argentina

Comparado con Argentina:
- **AUT-BEL**: Distancia ~0.X-0.Y (entre las m√°s bajas)
- **ARG-AUT o ARG-BEL**: Distancia ~2.X-3.X (mucho mayor)

**¬øPor qu√©?**
- Argentina: Alta volatilidad, crisis recurrentes, pol√≠tica monetaria err√°tica
- AUT/BEL: Estabilidad, crecimiento sostenido, instituciones s√≥lidas

Argentina est√° m√°s cerca de pa√≠ses con **patrones de volatilidad** (ej: Brasil, Turqu√≠a) que de econom√≠as estables europeas.

#### Lecciones para Argentina

Del √©xito de la similitud AUT-BEL:
1. **Estabilidad institucional** es clave para trayectorias predecibles
2. **Integraci√≥n regional** sincroniza ciclos y reduce volatilidad
3. **Pol√≠tica monetaria coherente** evita shocks dom√©sticos
4. **Diversificaci√≥n econ√≥mica** reduce dependencia de commodities

**Pregunta clave**: ¬øPuede Argentina converger a un patr√≥n m√°s estable, o est√° "atrapada" en ciclos de volatilidad?

### 9.2 Etiop√≠a (ETH) vs Jap√≥n (JPN)

An√°lisis de uno de los pares m√°s diferentes globalmente.

In [None]:
# An√°lisis detallado: ETH vs JPN (pa√≠ses m√°s diferentes)
print("="*80)
print("üîç CASO DE CONTRASTE: ETIOP√çA (ETH) vs JAP√ìN (JPN)")
print("="*80)

# Buscar la comparaci√≥n ETH-JPN
eth_jpn = df_valid[
    ((df_valid['country1'] == 'ETH') & (df_valid['country2'] == 'JPN')) |
    ((df_valid['country1'] == 'JPN') & (df_valid['country2'] == 'ETH'))
]

if len(eth_jpn) > 0:
    row = eth_jpn.iloc[0]
    print(f"\nüìä M√âTRICAS DE DIFERENCIA:")
    print(f"   ‚Ä¢ Distancia DTW: {row['dtw_distance']:.4f}")
    print(f"   ‚Ä¢ A√±os superpuestos: {row['overlap_years']:.0f}")
    print(f"   ‚Ä¢ Ranking global: {(df_valid['dtw_distance'] > row['dtw_distance']).sum() + 1} de {len(df_valid)} (desde el m√°s diferente)")
    print(f"   ‚Ä¢ Percentil: {((df_valid['dtw_distance'] < row['dtw_distance']).sum() / len(df_valid) * 100):.1f}%")
    
    # Obtener datos de ambos pa√≠ses
    eth_data = gni_in_cache[gni_in_cache['country_code'] == 'ETH'].sort_values('year')
    jpn_data = gni_in_cache[gni_in_cache['country_code'] == 'JPN'].sort_values('year')
    
    print(f"\nüìà CARACTER√çSTICAS DE LAS SERIES:")
    print(f"   Etiop√≠a:")
    print(f"      - A√±os de datos: {len(eth_data)}")
    print(f"      - GNI medio: ${eth_data['gni'].mean()/1e9:.2f}B")
    print(f"      - Volatilidad (std): ${eth_data['gni'].std()/1e9:.2f}B")
    print(f"      - Crecimiento total: {((eth_data['gni'].iloc[-1] / eth_data['gni'].iloc[0]) - 1) * 100:.1f}%")
    
    print(f"   Jap√≥n:")
    print(f"      - A√±os de datos: {len(jpn_data)}")
    print(f"      - GNI medio: ${jpn_data['gni'].mean()/1e9:.2f}B")
    print(f"      - Volatilidad (std): ${jpn_data['gni'].std()/1e9:.2f}B")
    print(f"      - Crecimiento total: {((jpn_data['gni'].iloc[-1] / jpn_data['gni'].iloc[0]) - 1) * 100:.1f}%")
    
    # Relaci√≥n de magnitud
    ratio_mean = jpn_data['gni'].mean() / eth_data['gni'].mean()
    print(f"\nüí∞ RELACI√ìN DE MAGNITUD:")
    print(f"   ‚Ä¢ GNI medio de Jap√≥n es {ratio_mean:.1f}x el GNI medio de Etiop√≠a")
    
    # Clusters
    eth_cluster_km = clusters_km[clusters_km['country_code'] == 'ETH']['Cluster Mapped'].values[0] if 'ETH' in clusters_km['country_code'].values else 'N/A'
    jpn_cluster_km = clusters_km[clusters_km['country_code'] == 'JPN']['Cluster Mapped'].values[0] if 'JPN' in clusters_km['country_code'].values else 'N/A'
    eth_cluster_dtw = clusters_dtw[clusters_dtw['country_code'] == 'ETH']['cluster'].values[0] if 'ETH' in clusters_dtw['country_code'].values else 'N/A'
    jpn_cluster_dtw = clusters_dtw[clusters_dtw['country_code'] == 'JPN']['cluster'].values[0] if 'JPN' in clusters_dtw['country_code'].values else 'N/A'
    eth_cluster_bm = clusters_bm[clusters_bm['country_code'] == 'ETH']['Income Group'].values[0] if 'ETH' in clusters_bm['country_code'].values else 'N/A'
    jpn_cluster_bm = clusters_bm[clusters_bm['country_code'] == 'JPN']['Income Group'].values[0] if 'JPN' in clusters_bm['country_code'].values else 'N/A'
    
    print(f"\nüîç CLASIFICACI√ìN EN CLUSTERS:")
    print(f"   {'M√©todo':<20} | {'Etiop√≠a':<25} | {'Jap√≥n':<25} | {'Match'}")
    print(f"   {'-'*20}-+-{'-'*25}-+-{'-'*25}-+------")
    print(f"   {'K-Means (GNI)':<20} | {str(eth_cluster_km):<25} | {str(jpn_cluster_km):<25} | {'‚úì' if eth_cluster_km == jpn_cluster_km else '‚úó'}")
    print(f"   {'K-Means DTW':<20} | {str(eth_cluster_dtw):<25} | {str(jpn_cluster_dtw):<25} | {'‚úì' if eth_cluster_dtw == jpn_cluster_dtw else '‚úó'}")
    print(f"   {'Banco Mundial':<20} | {str(eth_cluster_bm):<25} | {str(jpn_cluster_bm):<25} | {'‚úì' if eth_cluster_bm == jpn_cluster_bm else '‚úó'}")
    
else:
    print("‚ö†Ô∏è  No se encontr√≥ comparaci√≥n entre ETH y JPN en la cache")

print("="*80)

üîç CASO DE CONTRASTE: ETIOP√çA (ETH) vs JAP√ìN (JPN)

üìä M√âTRICAS DE DIFERENCIA:
   ‚Ä¢ Distancia DTW: 5.4199
   ‚Ä¢ A√±os superpuestos: 33
   ‚Ä¢ Ranking global: 1 de 9870 (desde el m√°s diferente)
   ‚Ä¢ Percentil: 100.0%

üìà CARACTER√çSTICAS DE LAS SERIES:
   Etiop√≠a:
      - A√±os de datos: 42
      - GNI medio: $30.37B
      - Volatilidad (std): $33.85B
      - Crecimiento total: 1624.7%
   Jap√≥n:
      - A√±os de datos: 60
      - GNI medio: $3125.50B
      - Volatilidad (std): $2154.49B
      - Crecimiento total: 6437.9%

üí∞ RELACI√ìN DE MAGNITUD:
   ‚Ä¢ GNI medio de Jap√≥n es 102.9x el GNI medio de Etiop√≠a

üîç CLASIFICACI√ìN EN CLUSTERS:
   M√©todo               | Etiop√≠a                   | Jap√≥n                     | Match
   ---------------------+---------------------------+---------------------------+------
   K-Means (GNI)        | Low income                | Lower middle income       | ‚úó
   K-Means DTW          | 3                         | 1            

In [None]:
# Visualizaci√≥n comparativa ETH vs JPN
from scipy import stats

fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=[
        'Series Temporales Estandarizadas',
        'GNI Absoluto (USD) - Escala Log',
        'Tasa de Crecimiento Anual (%)',
        'Correlaci√≥n de Movimientos'
    ],
    specs=[[{"secondary_y": False}, {"secondary_y": False}],
           [{"secondary_y": False}, {"secondary_y": False}]]
)

# Obtener datos
eth_data = gni_in_cache[gni_in_cache['country_code'] == 'ETH'].sort_values('year')
jpn_data = gni_in_cache[gni_in_cache['country_code'] == 'JPN'].sort_values('year')

# Encontrar a√±os superpuestos
overlap_years_eth_jpn = np.intersect1d(eth_data['year'].values, jpn_data['year'].values)
eth_overlap = eth_data[eth_data['year'].isin(overlap_years_eth_jpn)]
jpn_overlap = jpn_data[jpn_data['year'].isin(overlap_years_eth_jpn)]

# 1. Series estandarizadas
eth_std = (eth_overlap['gni'] - eth_overlap['gni'].mean()) / eth_overlap['gni'].std()
jpn_std = (jpn_overlap['gni'] - jpn_overlap['gni'].mean()) / jpn_overlap['gni'].std()

fig.add_trace(
    go.Scatter(x=eth_overlap['year'], y=eth_std, name='Etiop√≠a', line=dict(color='green', width=2)),
    row=1, col=1
)
fig.add_trace(
    go.Scatter(x=jpn_overlap['year'], y=jpn_std, name='Jap√≥n', line=dict(color='red', width=2)),
    row=1, col=1
)

# 2. GNI absoluto (escala logar√≠tmica por la gran diferencia de magnitud)
fig.add_trace(
    go.Scatter(x=eth_overlap['year'], y=eth_overlap['gni']/1e9, name='Etiop√≠a', 
               line=dict(color='green', width=2), showlegend=False),
    row=1, col=2
)
fig.add_trace(
    go.Scatter(x=jpn_overlap['year'], y=jpn_overlap['gni']/1e9, name='Jap√≥n', 
               line=dict(color='red', width=2), showlegend=False),
    row=1, col=2
)

# 3. Tasa de crecimiento
eth_growth = eth_overlap['gni'].pct_change() * 100
jpn_growth = jpn_overlap['gni'].pct_change() * 100

fig.add_trace(
    go.Scatter(x=eth_overlap['year'], y=eth_growth, name='Etiop√≠a', 
               line=dict(color='green', width=2), showlegend=False),
    row=2, col=1
)
fig.add_trace(
    go.Scatter(x=jpn_overlap['year'], y=jpn_growth, name='Jap√≥n', 
               line=dict(color='red', width=2), showlegend=False),
    row=2, col=1
)

# 4. Scatter plot para correlaci√≥n
fig.add_trace(
    go.Scatter(x=eth_std, y=jpn_std, mode='markers', 
               marker=dict(color=eth_overlap['year'], colorscale='Viridis', 
                          showscale=True, colorbar=dict(title="A√±o")),
               name='ETH vs JPN', showlegend=False),
    row=2, col=2
)

# L√≠nea de regresi√≥n
slope_eth_jpn, intercept_eth_jpn, r_value_eth_jpn, p_value_eth_jpn, std_err_eth_jpn = stats.linregress(eth_std, jpn_std)
line_x_eth_jpn = np.array([eth_std.min(), eth_std.max()])
line_y_eth_jpn = slope_eth_jpn * line_x_eth_jpn + intercept_eth_jpn

fig.add_trace(
    go.Scatter(x=line_x_eth_jpn, y=line_y_eth_jpn, mode='lines', 
               line=dict(color='red', dash='dash'),
               name=f'R¬≤={r_value_eth_jpn**2:.3f}', showlegend=True),
    row=2, col=2
)

fig.update_xaxes(title_text="A√±o", row=1, col=1)
fig.update_xaxes(title_text="A√±o", row=1, col=2)
fig.update_xaxes(title_text="A√±o", row=2, col=1)
fig.update_xaxes(title_text="Etiop√≠a (Z-score)", row=2, col=2)

fig.update_yaxes(title_text="Z-score", row=1, col=1)
fig.update_yaxes(title_text="GNI (Billones USD)", type="log", row=1, col=2)
fig.update_yaxes(title_text="Crecimiento (%)", row=2, col=1)
fig.update_yaxes(title_text="Jap√≥n (Z-score)", row=2, col=2)

fig.update_layout(height=800, title_text="Etiop√≠a vs Jap√≥n: An√°lisis Comparativo de Pa√≠ses Divergentes")
fig.show()

# Calcular correlaci√≥n
correlation_eth_jpn = np.corrcoef(eth_std, jpn_std)[0, 1]
print(f"\nüìä CORRELACI√ìN ENTRE SERIES ESTANDARIZADAS:")
print(f"   Coeficiente de correlaci√≥n de Pearson: {correlation_eth_jpn:.4f}")
print(f"   R¬≤ (varianza explicada): {correlation_eth_jpn**2:.4f}")
print(f"   Interpretaci√≥n: {'Muy alta' if abs(correlation_eth_jpn) > 0.9 else 'Alta' if abs(correlation_eth_jpn) > 0.7 else 'Moderada' if abs(correlation_eth_jpn) > 0.5 else 'Baja/Nula'}")
print(f"   Nota: Correlaci√≥n {'negativa' if correlation_eth_jpn < 0 else 'positiva'} indica movimientos {'opuestos' if correlation_eth_jpn < 0 else 'similares'}")


üìä CORRELACI√ìN ENTRE SERIES ESTANDARIZADAS:
   Coeficiente de correlaci√≥n de Pearson: 0.4039
   R¬≤ (varianza explicada): 0.1631
   Interpretaci√≥n: Baja/Nula
   Nota: Correlaci√≥n positiva indica movimientos similares


### üìù INSIGHTS: Etiop√≠a vs Jap√≥n

#### ¬øPor qu√© son tan diferentes?

**1. Nivel de Desarrollo Radicalmente Distinto:**
- **Jap√≥n**: Tercera econom√≠a mundial, alta tecnolog√≠a, post-industrial
- **Etiop√≠a**: Uno de los pa√≠ses m√°s pobres, econom√≠a agr√≠cola, pre-industrial
- Diferencia de GNI: ~50-100x en t√©rminos absolutos
- PIB per c√°pita: Jap√≥n >$40K vs Etiop√≠a <$1K

**2. Trayectorias Hist√≥ricas Opuestas:**
- **Jap√≥n**: 
  - Industrializaci√≥n temprana (Era Meiji, 1868)
  - Reconstrucci√≥n post-WWII ("milagro econ√≥mico")
  - Burbuja de los 90s y "d√©cada perdida"
  - **GNI en USD muy vol√°til**: Fluctuaciones cambiarias (Yen/USD) generan ca√≠das visibles (1995-1998, 2012-2015) que no reflejan necesariamente inestabilidad econ√≥mica interna
  - Econom√≠a madura con crecimiento real bajo pero infraestructura consolidada
- **Etiop√≠a**:
  - Hambrunas recurrentes (1983-1985)
  - R√©gimen comunista (Derg, 1974-1991)
  - Reformas de mercado desde a√±os 90
  - R√°pido crecimiento reciente pero desde base muy baja

**3. Estructura Econ√≥mica Divergente:**
- **Jap√≥n**: Exportador de alta tecnolog√≠a (autom√≥viles, electr√≥nica, rob√≥tica)
- **Etiop√≠a**: Agricultura de subsistencia, caf√©, textiles de bajo valor

**4. Demograf√≠a y Urbanizaci√≥n:**
- **Jap√≥n**: Envejecimiento poblacional, >90% urbano, decrecimiento demogr√°fico
- **Etiop√≠a**: Poblaci√≥n joven, ~20% urbano, alto crecimiento demogr√°fico

#### Validaci√≥n del M√©todo DTW

Este caso extremo demuestra que DTW **discrimina correctamente** porque:

1. **Captura diferencia esperada**: Pa√≠ses en etapas radicalmente distintas tienen alta distancia DTW
2. **No solo magnitud**: No es solo que Jap√≥n sea m√°s rico; las **trayectorias** son completamente diferentes
3. **Clusters opuestos**: Clasificados en clusters extremos en todos los m√©todos
4. **Baja/Nula correlaci√≥n**: Los movimientos a√±o a a√±o son independientes o inversos

#### Patrones contrastantes capturados por DTW

**Etiop√≠a:**
- Alta volatilidad real (hambrunas, conflictos, reformas estructurales)
- Crecimiento explosivo reciente (>10% anual en 2000s)
- Base muy baja, cambios porcentuales grandes

**Jap√≥n:**
- **Volatilidad en USD pero no en estructura**: Las fluctuaciones visibles en el gr√°fico GNI (ca√≠das 1995-1998, 2012-2015) reflejan principalmente tipo de cambio Yen/USD, no colapsos econ√≥micos
- **En series estandarizadas**: Muestra menor volatilidad relativa que Etiop√≠a, confirmando estabilidad estructural
- Crecimiento real bajo post-burbuja (<2% anual), econom√≠a madura
- Cambios porcentuales peque√±os desde base muy alta

**DTW detecta**: No solo que van a velocidades distintas, sino que est√°n en **fases del ciclo de desarrollo completamente diferentes**. La alta distancia DTW captura tanto diferencias de nivel como diferencias en la naturaleza de las fluctuaciones (estructurales en ETH vs cambiarias en JPN).

#### Contraste con casos similares (AUT-BEL)

| Dimensi√≥n | AUT-BEL (Similares) | ETH-JPN (Diferentes) |
|-----------|---------------------|----------------------|
| Distancia DTW | ~0.4-0.6 | ~3.5-4.5 |
| Correlaci√≥n | >0.9 (muy alta) | <0.3 (baja/nula) |
| Nivel desarrollo | Ambos high income | Low income vs High income |
| Trayectoria | Convergente | Divergente |
| Shocks comunes | S√≠ (UE, global) | No (contextos distintos) |
| Cluster match | S√≠ (todos m√©todos) | No (ning√∫n m√©todo) |

#### Implicaciones para Argentina

**Pregunta**: ¬øA qu√© grupo se parece m√°s Argentina?

- **Si ARG ‚Üí ETH**: Alta volatilidad, desarrollo truncado, ciclos boom-bust
- **Si ARG ‚Üí JPN**: Econom√≠a madura con problemas estructurales (menos plausible)
- **Si ARG ‚Üí AUT/BEL**: Estabilidad y convergencia (objetivo deseado)

**Hip√≥tesis sobre Argentina**:
- Distancia a ETH: Media-alta (no tan extrema, Argentina tiene m√°s industria)
- Distancia a JPN: Alta (econom√≠as en fases muy distintas)
- Distancia a AUT/BEL: Media (volatilidad impide convergencia)

**Insight clave**: DTW sugiere que Argentina est√° en un **limbo de desarrollo** - ni econom√≠a madura estable, ni econom√≠a en despegue sostenido. La volatilidad macroecon√≥mica impide tanto la convergencia (path AUT/BEL) como el crecimiento acelerado (path asi√°tico).

#### Lecci√≥n metodol√≥gica

Este caso extremo valida que DTW:
- **No es lineal**: No ordena pa√≠ses solo por riqueza
- **Captura din√°mica**: Jap√≥n con volatilidad cambiaria puede ser m√°s "similar" a Europa estable (en t√©rminos de estructura) que a Asia emergente
- **Sensible a la m√©trica**: GNI en USD captura efectos cambiarios; series estandarizadas revelan patrones estructurales subyacentes
- **Complementa clusters est√°ticos**: Banco Mundial dir√≠a "high income" vs "low income" y fin. DTW dice "trayectorias incomparables"

**Importante**: La volatilidad observada en el GNI de Jap√≥n (USD) no invalida la clasificaci√≥n como econom√≠a madura - refleja fluctuaciones del tipo de cambio, no inestabilidad econ√≥mica fundamental. Las series estandarizadas confirman menor variabilidad estructural vs Etiop√≠a.

**Conclusi√≥n**: La alta distancia ETH-JPN confirma que DTW mide algo m√°s profundo que riqueza promedio: mide **patrones de transformaci√≥n estructural y naturaleza de las fluctuaciones**.

### 9.3 Argentina (ARG) vs Uruguay (URY)

An√°lisis de dos pa√≠ses vecinos del R√≠o de la Plata con trayectorias econ√≥micas similares.

In [None]:
# An√°lisis detallado: ARG vs URY
print("="*80)
print("üîç ARGENTINA (ARG) vs URUGUAY (URY)")
print("="*80)

# Buscar la comparaci√≥n ARG-URY
arg_ury = df_valid[
    ((df_valid['country1'] == 'ARG') & (df_valid['country2'] == 'URY')) |
    ((df_valid['country1'] == 'URY') & (df_valid['country2'] == 'ARG'))
]

if len(arg_ury) > 0:
    row = arg_ury.iloc[0]
    print(f"\nüìä M√âTRICAS DE COMPARACI√ìN:")
    print(f"   ‚Ä¢ Distancia DTW: {row['dtw_distance']:.4f}")
    print(f"   ‚Ä¢ A√±os superpuestos: {row['overlap_years']:.0f}")
    print(f"   ‚Ä¢ Ranking global: {(df_valid['dtw_distance'] < row['dtw_distance']).sum() + 1} de {len(df_valid)}")
    print(f"   ‚Ä¢ Percentil: {((df_valid['dtw_distance'] < row['dtw_distance']).sum() / len(df_valid) * 100):.1f}%")
    
    # Obtener datos de ambos pa√≠ses
    arg_data = gni_in_cache[gni_in_cache['country_code'] == 'ARG'].sort_values('year')
    ury_data = gni_in_cache[gni_in_cache['country_code'] == 'URY'].sort_values('year')
    
    print(f"\nüìà CARACTER√çSTICAS DE LAS SERIES:")
    print(f"   Argentina:")
    print(f"      - A√±os de datos: {len(arg_data)}")
    print(f"      - GNI medio: ${arg_data['gni'].mean()/1e9:.2f}B")
    print(f"      - Volatilidad (std): ${arg_data['gni'].std()/1e9:.2f}B")
    print(f"      - Crecimiento total: {((arg_data['gni'].iloc[-1] / arg_data['gni'].iloc[0]) - 1) * 100:.1f}%")
    
    print(f"   Uruguay:")
    print(f"      - A√±os de datos: {len(ury_data)}")
    print(f"      - GNI medio: ${ury_data['gni'].mean()/1e9:.2f}B")
    print(f"      - Volatilidad (std): ${ury_data['gni'].std()/1e9:.2f}B")
    print(f"      - Crecimiento total: {((ury_data['gni'].iloc[-1] / ury_data['gni'].iloc[0]) - 1) * 100:.1f}%")
    
    # Relaci√≥n de magnitud
    ratio_mean = arg_data['gni'].mean() / ury_data['gni'].mean()
    print(f"\nüí∞ RELACI√ìN DE MAGNITUD:")
    print(f"   ‚Ä¢ GNI medio de Argentina es {ratio_mean:.1f}x el GNI medio de Uruguay")
    
    # Clusters
    arg_cluster_km = clusters_km[clusters_km['country_code'] == 'ARG']['Cluster Mapped'].values[0] if 'ARG' in clusters_km['country_code'].values else 'N/A'
    ury_cluster_km = clusters_km[clusters_km['country_code'] == 'URY']['Cluster Mapped'].values[0] if 'URY' in clusters_km['country_code'].values else 'N/A'
    arg_cluster_dtw = clusters_dtw[clusters_dtw['country_code'] == 'ARG']['cluster'].values[0] if 'ARG' in clusters_dtw['country_code'].values else 'N/A'
    ury_cluster_dtw = clusters_dtw[clusters_dtw['country_code'] == 'URY']['cluster'].values[0] if 'URY' in clusters_dtw['country_code'].values else 'N/A'
    arg_cluster_bm = clusters_bm[clusters_bm['country_code'] == 'ARG']['Income Group'].values[0] if 'ARG' in clusters_bm['country_code'].values else 'N/A'
    ury_cluster_bm = clusters_bm[clusters_bm['country_code'] == 'URY']['Income Group'].values[0] if 'URY' in clusters_bm['country_code'].values else 'N/A'
    
    print(f"\nüîç CLASIFICACI√ìN EN CLUSTERS:")
    print(f"   {'M√©todo':<20} | {'Argentina':<25} | {'Uruguay':<25} | {'Match'}")
    print(f"   {'-'*20}-+-{'-'*25}-+-{'-'*25}-+------")
    print(f"   {'K-Means (GNI)':<20} | {str(arg_cluster_km):<25} | {str(ury_cluster_km):<25} | {'‚úì' if arg_cluster_km == ury_cluster_km else '‚úó'}")
    print(f"   {'K-Means DTW':<20} | {str(arg_cluster_dtw):<25} | {str(ury_cluster_dtw):<25} | {'‚úì' if arg_cluster_dtw == ury_cluster_dtw else '‚úó'}")
    print(f"   {'Banco Mundial':<20} | {str(arg_cluster_bm):<25} | {str(ury_cluster_bm):<25} | {'‚úì' if arg_cluster_bm == ury_cluster_bm else '‚úó'}")
    
else:
    print("‚ö†Ô∏è  No se encontr√≥ comparaci√≥n entre ARG y URY en la cache")

print("="*80)

üîç ARGENTINA (ARG) vs URUGUAY (URY)

üìä M√âTRICAS DE COMPARACI√ìN:
   ‚Ä¢ Distancia DTW: 1.3756
   ‚Ä¢ A√±os superpuestos: 33
   ‚Ä¢ Ranking global: 5260 de 9870
   ‚Ä¢ Percentil: 53.3%

üìà CARACTER√çSTICAS DE LAS SERIES:
   Argentina:
      - A√±os de datos: 40
      - GNI medio: $300.75B
      - Volatilidad (std): $170.22B
      - Crecimiento total: 499.5%
   Uruguay:
      - A√±os de datos: 60
      - GNI medio: $20.35B
      - Volatilidad (std): $20.21B
      - Crecimiento total: 4105.0%

üí∞ RELACI√ìN DE MAGNITUD:
   ‚Ä¢ GNI medio de Argentina es 14.8x el GNI medio de Uruguay

üîç CLASIFICACI√ìN EN CLUSTERS:
   M√©todo               | Argentina                 | Uruguay                   | Match
   ---------------------+---------------------------+---------------------------+------
   K-Means (GNI)        | Low income                | Lower middle income       | ‚úó
   K-Means DTW          | 1                         | 2                         | ‚úó
   Banco Mundial      

In [None]:
# Visualizaci√≥n comparativa ARG vs URY
from scipy import stats

fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=[
        'Series Temporales Estandarizadas',
        'GNI Absoluto (USD)',
        'Tasa de Crecimiento Anual (%)',
        'Correlaci√≥n de Movimientos'
    ],
    specs=[[{"secondary_y": False}, {"secondary_y": False}],
           [{"secondary_y": False}, {"secondary_y": False}]]
)

# Obtener datos
arg_data = gni_in_cache[gni_in_cache['country_code'] == 'ARG'].sort_values('year')
ury_data = gni_in_cache[gni_in_cache['country_code'] == 'URY'].sort_values('year')

# Encontrar a√±os superpuestos
overlap_years_arg_ury = np.intersect1d(arg_data['year'].values, ury_data['year'].values)
arg_overlap = arg_data[arg_data['year'].isin(overlap_years_arg_ury)]
ury_overlap = ury_data[ury_data['year'].isin(overlap_years_arg_ury)]

# 1. Series estandarizadas
arg_std = (arg_overlap['gni'] - arg_overlap['gni'].mean()) / arg_overlap['gni'].std()
ury_std = (ury_overlap['gni'] - ury_overlap['gni'].mean()) / ury_overlap['gni'].std()

fig.add_trace(
    go.Scatter(x=arg_overlap['year'], y=arg_std, name='Argentina', line=dict(color='blue', width=2)),
    row=1, col=1
)
fig.add_trace(
    go.Scatter(x=ury_overlap['year'], y=ury_std, name='Uruguay', line=dict(color='cyan', width=2)),
    row=1, col=1
)

# 2. GNI absoluto
fig.add_trace(
    go.Scatter(x=arg_overlap['year'], y=arg_overlap['gni']/1e9, name='Argentina', 
               line=dict(color='blue', width=2), showlegend=False),
    row=1, col=2
)
fig.add_trace(
    go.Scatter(x=ury_overlap['year'], y=ury_overlap['gni']/1e9, name='Uruguay', 
               line=dict(color='cyan', width=2), showlegend=False),
    row=1, col=2
)

# 3. Tasa de crecimiento
arg_growth = arg_overlap['gni'].pct_change() * 100
ury_growth = ury_overlap['gni'].pct_change() * 100

fig.add_trace(
    go.Scatter(x=arg_overlap['year'], y=arg_growth, name='Argentina', 
               line=dict(color='blue', width=2), showlegend=False),
    row=2, col=1
)
fig.add_trace(
    go.Scatter(x=ury_overlap['year'], y=ury_growth, name='Uruguay', 
               line=dict(color='cyan', width=2), showlegend=False),
    row=2, col=1
)

# 4. Scatter plot para correlaci√≥n
fig.add_trace(
    go.Scatter(x=arg_std, y=ury_std, mode='markers', 
               marker=dict(color=arg_overlap['year'], colorscale='Viridis', 
                          showscale=True, colorbar=dict(title="A√±o")),
               name='ARG vs URY', showlegend=False),
    row=2, col=2
)

# L√≠nea de regresi√≥n
slope_arg_ury, intercept_arg_ury, r_value_arg_ury, p_value_arg_ury, std_err_arg_ury = stats.linregress(arg_std, ury_std)
line_x_arg_ury = np.array([arg_std.min(), arg_std.max()])
line_y_arg_ury = slope_arg_ury * line_x_arg_ury + intercept_arg_ury

fig.add_trace(
    go.Scatter(x=line_x_arg_ury, y=line_y_arg_ury, mode='lines', 
               line=dict(color='red', dash='dash'),
               name=f'R¬≤={r_value_arg_ury**2:.3f}', showlegend=True),
    row=2, col=2
)

fig.update_xaxes(title_text="A√±o", row=1, col=1)
fig.update_xaxes(title_text="A√±o", row=1, col=2)
fig.update_xaxes(title_text="A√±o", row=2, col=1)
fig.update_xaxes(title_text="Argentina (Z-score)", row=2, col=2)

fig.update_yaxes(title_text="Z-score", row=1, col=1)
fig.update_yaxes(title_text="GNI (Billones USD)", row=1, col=2)
fig.update_yaxes(title_text="Crecimiento (%)", row=2, col=1)
fig.update_yaxes(title_text="Uruguay (Z-score)", row=2, col=2)

fig.update_layout(height=800, title_text="Argentina vs Uruguay: Vecinos del R√≠o de la Plata")
fig.show()

# Calcular correlaci√≥n
correlation_arg_ury = np.corrcoef(arg_std, ury_std)[0, 1]
print(f"\nüìä CORRELACI√ìN ENTRE SERIES ESTANDARIZADAS:")
print(f"   Coeficiente de correlaci√≥n de Pearson: {correlation_arg_ury:.4f}")
print(f"   R¬≤ (varianza explicada): {correlation_arg_ury**2:.4f}")
print(f"   Interpretaci√≥n: {'Muy alta' if abs(correlation_arg_ury) > 0.9 else 'Alta' if abs(correlation_arg_ury) > 0.7 else 'Moderada' if abs(correlation_arg_ury) > 0.5 else 'Baja/Nula'}")


üìä CORRELACI√ìN ENTRE SERIES ESTANDARIZADAS:
   Coeficiente de correlaci√≥n de Pearson: 0.9656
   R¬≤ (varianza explicada): 0.9324
   Interpretaci√≥n: Muy alta


### üìù INSIGHTS: Argentina vs Uruguay

#### ¬øPor qu√© son similares?

**1. Proximidad Geogr√°fica y Hist√≥rica:**
- Pa√≠ses vecinos del R√≠o de la Plata
- Historia colonial compartida (Virreinato del R√≠o de la Plata)
- Patrones migratorios similares (inmigraci√≥n europea)
- Cultura rioplatense com√∫n

**2. Estructura Econ√≥mica Comparable:**
- Econom√≠as basadas en agroindustria (carne, soja, l√°cteos)
- Sector servicios importante (finanzas, turismo)
- Dependencia de exportaciones de commodities
- Vulnerabilidad a precios internacionales

**3. Integraci√≥n Regional:**
- Miembros de Mercosur desde los 90s
- Flujos comerciales intensos
- Integraci√≥n fronteriza (Colonia-Buenos Aires)
- Shocks regionales compartidos

**4. Ciclos Pol√≠ticos y Econ√≥micos:**
- Ambos experimentaron dictaduras militares (1970s-1980s)
- Transici√≥n democr√°tica en los 80s
- Crisis econ√≥micas latinoamericanas (efecto tequila, crisis brasile√±a)
- Bonanzas de commodities (2000s)

#### Diferencias clave capturadas por DTW

A pesar de similitudes, DTW detecta:

- **Volatilidad**: Argentina m√°s err√°tica (hiperinflaci√≥n 89, default 2001, crisis 2018)
- **Estabilidad institucional**: Uruguay con pol√≠ticas m√°s consistentes
- **Escala**: Argentina ~7-10x m√°s grande en GNI total
- **Desempe√±o reciente**: Uruguay con crecimiento m√°s sostenido post-2000

#### Validaci√≥n del m√©todo

**¬øQu√© esperar√≠amos?**
- Distancia DTW baja/media (pa√≠ses similares pero no id√©nticos)
- Correlaci√≥n alta en per√≠odos normales, menor en crisis argentinas
- Mismo cluster regional en K-Means GNI y Banco Mundial
- Posible diferencia en DTW si captura volatilidad argentina

**Interpretaci√≥n econ√≥mica:**
- Uruguay act√∫a como "control" de Argentina: ¬øqu√© habr√≠a pasado con estabilidad?
- Similitudes validan shocks regionales comunes
- Diferencias muestran impacto de pol√≠ticas dom√©sticas

#### Lecciones para Argentina

Del caso uruguayo:
1. **Instituciones s√≥lidas** reducen volatilidad sin sacrificar potencial
2. **Previsibilidad** atrae inversi√≥n de largo plazo
3. **Tama√±o peque√±o** puede ser ventaja (menor inercia institucional)
4. **Diversificaci√≥n moderada** (turismo, log√≠stica) complementa agro

**Pregunta clave**: ¬øPor qu√© Uruguay logr√≥ estabilidad y Argentina no, con dotaciones iniciales similares?

### 9.4 Argentina (ARG) vs Fiji (FJI)

An√°lisis contrastante con econom√≠a insular del Pac√≠fico.

In [None]:
# An√°lisis detallado: ARG vs FJI
print("="*80)
print("üîç ARGENTINA (ARG) vs FIJI (FJI)")
print("="*80)

# Buscar la comparaci√≥n ARG-FJI
arg_fji = df_valid[
    ((df_valid['country1'] == 'ARG') & (df_valid['country2'] == 'FJI')) |
    ((df_valid['country1'] == 'FJI') & (df_valid['country2'] == 'ARG'))
]

if len(arg_fji) > 0:
    row = arg_fji.iloc[0]
    print(f"\nüìä M√âTRICAS DE COMPARACI√ìN:")
    print(f"   ‚Ä¢ Distancia DTW: {row['dtw_distance']:.4f}")
    print(f"   ‚Ä¢ A√±os superpuestos: {row['overlap_years']:.0f}")
    print(f"   ‚Ä¢ Ranking global: {(df_valid['dtw_distance'] < row['dtw_distance']).sum() + 1} de {len(df_valid)}")
    print(f"   ‚Ä¢ Percentil: {((df_valid['dtw_distance'] < row['dtw_distance']).sum() / len(df_valid) * 100):.1f}%")
    
    # Obtener datos de ambos pa√≠ses
    arg_data = gni_in_cache[gni_in_cache['country_code'] == 'ARG'].sort_values('year')
    fji_data = gni_in_cache[gni_in_cache['country_code'] == 'FJI'].sort_values('year')
    
    print(f"\nüìà CARACTER√çSTICAS DE LAS SERIES:")
    print(f"   Argentina:")
    print(f"      - A√±os de datos: {len(arg_data)}")
    print(f"      - GNI medio: ${arg_data['gni'].mean()/1e9:.2f}B")
    print(f"      - Volatilidad (std): ${arg_data['gni'].std()/1e9:.2f}B")
    print(f"      - Crecimiento total: {((arg_data['gni'].iloc[-1] / arg_data['gni'].iloc[0]) - 1) * 100:.1f}%")
    
    print(f"   Fiji:")
    print(f"      - A√±os de datos: {len(fji_data)}")
    print(f"      - GNI medio: ${fji_data['gni'].mean()/1e9:.2f}B")
    print(f"      - Volatilidad (std): ${fji_data['gni'].std()/1e9:.2f}B")
    print(f"      - Crecimiento total: {((fji_data['gni'].iloc[-1] / fji_data['gni'].iloc[0]) - 1) * 100:.1f}%")
    
    # Relaci√≥n de magnitud
    ratio_mean = arg_data['gni'].mean() / fji_data['gni'].mean()
    print(f"\nüí∞ RELACI√ìN DE MAGNITUD:")
    print(f"   ‚Ä¢ GNI medio de Argentina es {ratio_mean:.1f}x el GNI medio de Fiji")
    
    # Clusters
    arg_cluster_km = clusters_km[clusters_km['country_code'] == 'ARG']['Cluster Mapped'].values[0] if 'ARG' in clusters_km['country_code'].values else 'N/A'
    fji_cluster_km = clusters_km[clusters_km['country_code'] == 'FJI']['Cluster Mapped'].values[0] if 'FJI' in clusters_km['country_code'].values else 'N/A'
    arg_cluster_dtw = clusters_dtw[clusters_dtw['country_code'] == 'ARG']['cluster'].values[0] if 'ARG' in clusters_dtw['country_code'].values else 'N/A'
    fji_cluster_dtw = clusters_dtw[clusters_dtw['country_code'] == 'FJI']['cluster'].values[0] if 'FJI' in clusters_dtw['country_code'].values else 'N/A'
    arg_cluster_bm = clusters_bm[clusters_bm['country_code'] == 'ARG']['Income Group'].values[0] if 'ARG' in clusters_bm['country_code'].values else 'N/A'
    fji_cluster_bm = clusters_bm[clusters_bm['country_code'] == 'FJI']['Income Group'].values[0] if 'FJI' in clusters_bm['country_code'].values else 'N/A'
    
    print(f"\nüîç CLASIFICACI√ìN EN CLUSTERS:")
    print(f"   {'M√©todo':<20} | {'Argentina':<25} | {'Fiji':<25} | {'Match'}")
    print(f"   {'-'*20}-+-{'-'*25}-+-{'-'*25}-+------")
    print(f"   {'K-Means (GNI)':<20} | {str(arg_cluster_km):<25} | {str(fji_cluster_km):<25} | {'‚úì' if arg_cluster_km == fji_cluster_km else '‚úó'}")
    print(f"   {'K-Means DTW':<20} | {str(arg_cluster_dtw):<25} | {str(fji_cluster_dtw):<25} | {'‚úì' if arg_cluster_dtw == fji_cluster_dtw else '‚úó'}")
    print(f"   {'Banco Mundial':<20} | {str(arg_cluster_bm):<25} | {str(fji_cluster_bm):<25} | {'‚úì' if arg_cluster_bm == fji_cluster_bm else '‚úó'}")
    
else:
    print("‚ö†Ô∏è  No se encontr√≥ comparaci√≥n entre ARG y FJI en la cache")

print("="*80)

üîç ARGENTINA (ARG) vs FIJI (FJI)

üìä M√âTRICAS DE COMPARACI√ìN:
   ‚Ä¢ Distancia DTW: 1.4610
   ‚Ä¢ A√±os superpuestos: 33
   ‚Ä¢ Ranking global: 5794 de 9870
   ‚Ä¢ Percentil: 58.7%

üìà CARACTER√çSTICAS DE LAS SERIES:
   Argentina:
      - A√±os de datos: 40
      - GNI medio: $300.75B
      - Volatilidad (std): $170.22B
      - Crecimiento total: 499.5%
   Fiji:
      - A√±os de datos: 60
      - GNI medio: $1.96B
      - Volatilidad (std): $1.52B
      - Crecimiento total: 3740.3%

üí∞ RELACI√ìN DE MAGNITUD:
   ‚Ä¢ GNI medio de Argentina es 153.6x el GNI medio de Fiji

üîç CLASIFICACI√ìN EN CLUSTERS:
   M√©todo               | Argentina                 | Fiji                      | Match
   ---------------------+---------------------------+---------------------------+------
   K-Means (GNI)        | Low income                | Low income                | ‚úì
   K-Means DTW          | 1                         | 2                         | ‚úó
   Banco Mundial        | Upper 

In [None]:
# Visualizaci√≥n comparativa ARG vs FJI
from scipy import stats

fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=[
        'Series Temporales Estandarizadas',
        'GNI Absoluto (USD)',
        'Tasa de Crecimiento Anual (%)',
        'Correlaci√≥n de Movimientos'
    ],
    specs=[[{"secondary_y": False}, {"secondary_y": False}],
           [{"secondary_y": False}, {"secondary_y": False}]]
)

# Obtener datos
arg_data = gni_in_cache[gni_in_cache['country_code'] == 'ARG'].sort_values('year')
fji_data = gni_in_cache[gni_in_cache['country_code'] == 'FJI'].sort_values('year')

# Encontrar a√±os superpuestos
overlap_years_arg_fji = np.intersect1d(arg_data['year'].values, fji_data['year'].values)
arg_overlap = arg_data[arg_data['year'].isin(overlap_years_arg_fji)]
fji_overlap = fji_data[fji_data['year'].isin(overlap_years_arg_fji)]

# 1. Series estandarizadas
arg_std = (arg_overlap['gni'] - arg_overlap['gni'].mean()) / arg_overlap['gni'].std()
fji_std = (fji_overlap['gni'] - fji_overlap['gni'].mean()) / fji_overlap['gni'].std()

fig.add_trace(
    go.Scatter(x=arg_overlap['year'], y=arg_std, name='Argentina', line=dict(color='blue', width=2)),
    row=1, col=1
)
fig.add_trace(
    go.Scatter(x=fji_overlap['year'], y=fji_std, name='Fiji', line=dict(color='orange', width=2)),
    row=1, col=1
)

# 2. GNI absoluto
fig.add_trace(
    go.Scatter(x=arg_overlap['year'], y=arg_overlap['gni']/1e9, name='Argentina', 
               line=dict(color='blue', width=2), showlegend=False),
    row=1, col=2
)
fig.add_trace(
    go.Scatter(x=fji_overlap['year'], y=fji_overlap['gni']/1e9, name='Fiji', 
               line=dict(color='orange', width=2), showlegend=False),
    row=1, col=2
)

# 3. Tasa de crecimiento
arg_growth = arg_overlap['gni'].pct_change() * 100
fji_growth = fji_overlap['gni'].pct_change() * 100

fig.add_trace(
    go.Scatter(x=arg_overlap['year'], y=arg_growth, name='Argentina', 
               line=dict(color='blue', width=2), showlegend=False),
    row=2, col=1
)
fig.add_trace(
    go.Scatter(x=fji_overlap['year'], y=fji_growth, name='Fiji', 
               line=dict(color='orange', width=2), showlegend=False),
    row=2, col=1
)

# 4. Scatter plot para correlaci√≥n
fig.add_trace(
    go.Scatter(x=arg_std, y=fji_std, mode='markers', 
               marker=dict(color=arg_overlap['year'], colorscale='Viridis', 
                          showscale=True, colorbar=dict(title="A√±o")),
               name='ARG vs FJI', showlegend=False),
    row=2, col=2
)

# L√≠nea de regresi√≥n
slope_arg_fji, intercept_arg_fji, r_value_arg_fji, p_value_arg_fji, std_err_arg_fji = stats.linregress(arg_std, fji_std)
line_x_arg_fji = np.array([arg_std.min(), arg_std.max()])
line_y_arg_fji = slope_arg_fji * line_x_arg_fji + intercept_arg_fji

fig.add_trace(
    go.Scatter(x=line_x_arg_fji, y=line_y_arg_fji, mode='lines', 
               line=dict(color='red', dash='dash'),
               name=f'R¬≤={r_value_arg_fji**2:.3f}', showlegend=True),
    row=2, col=2
)

fig.update_xaxes(title_text="A√±o", row=1, col=1)
fig.update_xaxes(title_text="A√±o", row=1, col=2)
fig.update_xaxes(title_text="A√±o", row=2, col=1)
fig.update_xaxes(title_text="Argentina (Z-score)", row=2, col=2)

fig.update_yaxes(title_text="Z-score", row=1, col=1)
fig.update_yaxes(title_text="GNI (Billones USD)", row=1, col=2)
fig.update_yaxes(title_text="Crecimiento (%)", row=2, col=1)
fig.update_yaxes(title_text="Fiji (Z-score)", row=2, col=2)

fig.update_layout(height=800, title_text="Argentina vs Fiji: Comparaci√≥n Transcontinental")
fig.show()

# Calcular correlaci√≥n
correlation_arg_fji = np.corrcoef(arg_std, fji_std)[0, 1]
print(f"\nüìä CORRELACI√ìN ENTRE SERIES ESTANDARIZADAS:")
print(f"   Coeficiente de correlaci√≥n de Pearson: {correlation_arg_fji:.4f}")
print(f"   R¬≤ (varianza explicada): {correlation_arg_fji**2:.4f}")
print(f"   Interpretaci√≥n: {'Muy alta' if abs(correlation_arg_fji) > 0.9 else 'Alta' if abs(correlation_arg_fji) > 0.7 else 'Moderada' if abs(correlation_arg_fji) > 0.5 else 'Baja/Nula'}")


üìä CORRELACI√ìN ENTRE SERIES ESTANDARIZADAS:
   Coeficiente de correlaci√≥n de Pearson: 0.8845
   R¬≤ (varianza explicada): 0.7823
   Interpretaci√≥n: Alta


### üìù INSIGHTS: Argentina vs Fiji

#### Hallazgo extraordinario: El segundo pa√≠s m√°s similar

**Resultado DTW (1989-2021):**
- **Posici√≥n en ranking**: Fiji es el **#2 pa√≠s m√°s similar** a Argentina (solo superado por Uruguay)
- **Distancia DTW**: 1.46 (extremadamente cercana, considerando diferencias estructurales)
- **Implicaci√≥n CR√çTICA**: A pesar de contextos radicalmente opuestos, sus trayectorias econ√≥micas son casi id√©nticas

#### ¬øPor qu√© esto es alarmante?

**Contextos completamente opuestos:**

| Dimensi√≥n | Argentina | Fiji |
|-----------|-----------|------|
| **Tama√±o GNI** | ~$400-600B | ~$5-6B (1/100 de Argentina) |
| **Poblaci√≥n** | 45 millones | 900,000 (1/50) |
| **Geograf√≠a** | Continental, Cono Sur | Archipi√©lago aislado, Pac√≠fico Sur |
| **Econom√≠a** | Diversificada, mercado interno grande | Turismo (40%), az√∫car, remesas |
| **Estructura** | Pa√≠s grande con recursos naturales | Econom√≠a peque√±a abierta |
| **Vulnerabilidades** | Pol√≠ticas internas, deuda | Ciclones, golpes militares, dependencia externa |

**Y sin embargo... DTW los clasifica como el 2¬∞ par m√°s similar del mundo.**

#### ¬øQu√© est√° capturando DTW?

**1. Sincronizaci√≥n perfecta de shocks (1989-2021):**
- **Crisis asi√°tica 1997-98**: Ambos caen simult√°neamente
- **Boom de commodities 2003-2008**: Ambos crecen en paralelo
- **Crisis financiera global 2008-09**: Ca√≠da sincronizada
- **Crisis 2018-2020**: Ambos sufren recesi√≥n antes de COVID
- **COVID-2020**: Colapso turismo (Fiji) = colapso general (Argentina)

**2. Volatilidad estructural compartida:**
- **Fiji**: Ciclones cada 2-3 a√±os, 4 golpes militares (1987, 2000, 2006, 2009)
- **Argentina**: Crisis recurrentes (2001, 2018), default de deuda, inestabilidad pol√≠tica
- **Patr√≥n com√∫n**: Crecimiento epis√≥dico ‚Üí shock ‚Üí recuperaci√≥n parcial ‚Üí nuevo shock

**3. "Trampa de ingreso medio" id√©ntica:**
- Ambos clasificados **Upper middle income** por d√©cadas sin salir
- GNI per c√°pita estancado alrededor de $8,000-12,000
- Ninguno logra convergencia sostenida a alto ingreso
- Instituciones d√©biles que impiden consolidar ganancias

**4. Dependencia de commodities:**
- **Fiji**: Az√∫car, oro, turismo (vulnerable a precios internacionales y clima)
- **Argentina**: Soja, carne, cereales, turismo (vulnerable a precios y clima)
- Ambos sacudidos por mismos ciclos globales de precios

#### La conclusi√≥n demoledora

**Fiji tiene EXCUSAS para su volatilidad:**
- Econom√≠a de $5B: cualquier shock externo es dominante
- Archipi√©lago: ciclones categor√≠a 5 destruyen infraestructura cada pocos a√±os
- 900,000 habitantes: no hay mercado interno para amortiguar
- Golpes militares: inestabilidad pol√≠tica ex√≥gena

**Argentina NO tiene excusas:**
- Econom√≠a de $500B: deber√≠a tener resiliencia por tama√±o
- Mercado interno de 45 millones: suficiente para amortiguar shocks externos
- Recursos naturales abundantes: tierra, energ√≠a, capital humano
- No sufre ciclones ni desastres naturales recurrentes

**Si DTW clasifica a Argentina como el 2¬∞ pa√≠s m√°s similar a Fiji...**
Significa que Argentina, con 100x el tama√±o de Fiji, **genera INTERNAMENTE** tanta volatilidad como la que Fiji sufre por ciclones y golpes militares.

#### Lecci√≥n brutal para Argentina

**La similitud #2 con Fiji no es un hallazgo metodol√≥gico ‚Äî es un DIAGN√ìSTICO:**

1. **Patolog√≠a institucional confirmada:**
   - Una econom√≠a grande NO deber√≠a tener trayectoria de econom√≠a peque√±a vulnerable
   - La volatilidad argentina es **autogenerada**: pol√≠ticas dom√©sticas crean caos equivalente a desastres naturales

2. **Benchmark de disfuncionalidad:**
   - Uruguay (#1 similar): Tiene sentido (vecino, dotaciones similares)
   - **Fiji (#2 similar): ALARMA** ‚Äî No deber√≠a parecerse en NADA
   - Si Argentina se parece m√°s a Fiji que a Brasil o Chile, algo est√° profundamente roto

3. **Validaci√≥n del an√°lisis DTW:**
   - DTW ignor√≥ magnitudes (100x diferencia) y captur√≥ **patrones de disfunci√≥n**
   - Ambos pa√≠ses: instituciones d√©biles ‚Üí pol√≠ticas inconsistentes ‚Üí volatilidad cr√≥nica ‚Üí trampa ingreso medio
   - El m√©todo funciona: encontr√≥ similitud donde NO deber√≠a existir, exponiendo problemas estructurales de Argentina

**Conclusi√≥n provocadora:**
Que la 8¬™ econom√≠a de Am√©rica Latina tenga como 2¬∞ pa√≠s m√°s similar a un archipi√©lago del Pac√≠fico golpeado por ciclones no dice nada bueno de Fiji. **Dice todo lo malo sobre Argentina**: su volatilidad es tan severa y recurrente que domina completamente su trayectoria econ√≥mica, m√°s que su tama√±o, recursos o potencial.

### 9.5 Argentina (ARG) vs Brasil (BRA)

An√°lisis de las dos mayores econom√≠as sudamericanas.

In [None]:
# An√°lisis detallado: ARG vs BRA
print("="*80)
print("üîç ARGENTINA (ARG) vs BRASIL (BRA)")
print("="*80)

# Buscar la comparaci√≥n ARG-BRA
arg_bra = df_valid[
    ((df_valid['country1'] == 'ARG') & (df_valid['country2'] == 'BRA')) |
    ((df_valid['country1'] == 'BRA') & (df_valid['country2'] == 'ARG'))
]

if len(arg_bra) > 0:
    row = arg_bra.iloc[0]
    print(f"\nüìä M√âTRICAS DE COMPARACI√ìN:")
    print(f"   ‚Ä¢ Distancia DTW: {row['dtw_distance']:.4f}")
    print(f"   ‚Ä¢ A√±os superpuestos: {row['overlap_years']:.0f}")
    print(f"   ‚Ä¢ Ranking global: {(df_valid['dtw_distance'] < row['dtw_distance']).sum() + 1} de {len(df_valid)}")
    print(f"   ‚Ä¢ Percentil: {((df_valid['dtw_distance'] < row['dtw_distance']).sum() / len(df_valid) * 100):.1f}%")
    
    # Obtener datos de ambos pa√≠ses
    arg_data = gni_in_cache[gni_in_cache['country_code'] == 'ARG'].sort_values('year')
    bra_data = gni_in_cache[gni_in_cache['country_code'] == 'BRA'].sort_values('year')
    
    print(f"\nüìà CARACTER√çSTICAS DE LAS SERIES:")
    print(f"   Argentina:")
    print(f"      - A√±os de datos: {len(arg_data)}")
    print(f"      - GNI medio: ${arg_data['gni'].mean()/1e9:.2f}B")
    print(f"      - Volatilidad (std): ${arg_data['gni'].std()/1e9:.2f}B")
    print(f"      - Crecimiento total: {((arg_data['gni'].iloc[-1] / arg_data['gni'].iloc[0]) - 1) * 100:.1f}%")
    
    print(f"   Brasil:")
    print(f"      - A√±os de datos: {len(bra_data)}")
    print(f"      - GNI medio: ${bra_data['gni'].mean()/1e9:.2f}B")
    print(f"      - Volatilidad (std): ${bra_data['gni'].std()/1e9:.2f}B")
    print(f"      - Crecimiento total: {((bra_data['gni'].iloc[-1] / bra_data['gni'].iloc[0]) - 1) * 100:.1f}%")
    
    # Relaci√≥n de magnitud
    ratio_mean = bra_data['gni'].mean() / arg_data['gni'].mean()
    print(f"\nüí∞ RELACI√ìN DE MAGNITUD:")
    print(f"   ‚Ä¢ GNI medio de Brasil es {ratio_mean:.1f}x el GNI medio de Argentina")
    
    # Clusters
    arg_cluster_km = clusters_km[clusters_km['country_code'] == 'ARG']['Cluster Mapped'].values[0] if 'ARG' in clusters_km['country_code'].values else 'N/A'
    bra_cluster_km = clusters_km[clusters_km['country_code'] == 'BRA']['Cluster Mapped'].values[0] if 'BRA' in clusters_km['country_code'].values else 'N/A'
    arg_cluster_dtw = clusters_dtw[clusters_dtw['country_code'] == 'ARG']['cluster'].values[0] if 'ARG' in clusters_dtw['country_code'].values else 'N/A'
    bra_cluster_dtw = clusters_dtw[clusters_dtw['country_code'] == 'BRA']['cluster'].values[0] if 'BRA' in clusters_dtw['country_code'].values else 'N/A'
    arg_cluster_bm = clusters_bm[clusters_bm['country_code'] == 'ARG']['Income Group'].values[0] if 'ARG' in clusters_bm['country_code'].values else 'N/A'
    bra_cluster_bm = clusters_bm[clusters_bm['country_code'] == 'BRA']['Income Group'].values[0] if 'BRA' in clusters_bm['country_code'].values else 'N/A'
    
    print(f"\nüîç CLASIFICACI√ìN EN CLUSTERS:")
    print(f"   {'M√©todo':<20} | {'Argentina':<25} | {'Brasil':<25} | {'Match'}")
    print(f"   {'-'*20}-+-{'-'*25}-+-{'-'*25}-+------")
    print(f"   {'K-Means (GNI)':<20} | {str(arg_cluster_km):<25} | {str(bra_cluster_km):<25} | {'‚úì' if arg_cluster_km == bra_cluster_km else '‚úó'}")
    print(f"   {'K-Means DTW':<20} | {str(arg_cluster_dtw):<25} | {str(bra_cluster_dtw):<25} | {'‚úì' if arg_cluster_dtw == bra_cluster_dtw else '‚úó'}")
    print(f"   {'Banco Mundial':<20} | {str(arg_cluster_bm):<25} | {str(bra_cluster_bm):<25} | {'‚úì' if arg_cluster_bm == bra_cluster_bm else '‚úó'}")
    
else:
    print("‚ö†Ô∏è  No se encontr√≥ comparaci√≥n entre ARG y BRA en la cache")

print("="*80)

üîç ARGENTINA (ARG) vs BRASIL (BRA)

üìä M√âTRICAS DE COMPARACI√ìN:
   ‚Ä¢ Distancia DTW: 1.5017
   ‚Ä¢ A√±os superpuestos: 33
   ‚Ä¢ Ranking global: 6009 de 9870
   ‚Ä¢ Percentil: 60.9%

üìà CARACTER√çSTICAS DE LAS SERIES:
   Argentina:
      - A√±os de datos: 40
      - GNI medio: $300.75B
      - Volatilidad (std): $170.22B
      - Crecimiento total: 499.5%
   Brasil:
      - A√±os de datos: 34
      - GNI medio: $1237.25B
      - Volatilidad (std): $714.96B
      - Crecimiento total: 314.7%

üí∞ RELACI√ìN DE MAGNITUD:
   ‚Ä¢ GNI medio de Brasil es 4.1x el GNI medio de Argentina

üîç CLASIFICACI√ìN EN CLUSTERS:
   M√©todo               | Argentina                 | Brasil                    | Match
   ---------------------+---------------------------+---------------------------+------
   K-Means (GNI)        | Low income                | Low income                | ‚úì
   K-Means DTW          | 1                         | 1                         | ‚úì
   Banco Mundial        

In [None]:
# Visualizaci√≥n comparativa ARG vs BRA
from scipy import stats

fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=[
        'Series Temporales Estandarizadas',
        'GNI Absoluto (USD)',
        'Tasa de Crecimiento Anual (%)',
        'Correlaci√≥n de Movimientos'
    ],
    specs=[[{"secondary_y": False}, {"secondary_y": False}],
           [{"secondary_y": False}, {"secondary_y": False}]]
)

# Obtener datos
arg_data = gni_in_cache[gni_in_cache['country_code'] == 'ARG'].sort_values('year')
bra_data = gni_in_cache[gni_in_cache['country_code'] == 'BRA'].sort_values('year')

# Encontrar a√±os superpuestos
overlap_years_arg_bra = np.intersect1d(arg_data['year'].values, bra_data['year'].values)
arg_overlap = arg_data[arg_data['year'].isin(overlap_years_arg_bra)]
bra_overlap = bra_data[bra_data['year'].isin(overlap_years_arg_bra)]

# 1. Series estandarizadas
arg_std = (arg_overlap['gni'] - arg_overlap['gni'].mean()) / arg_overlap['gni'].std()
bra_std = (bra_overlap['gni'] - bra_overlap['gni'].mean()) / bra_overlap['gni'].std()

fig.add_trace(
    go.Scatter(x=arg_overlap['year'], y=arg_std, name='Argentina', line=dict(color='blue', width=2)),
    row=1, col=1
)
fig.add_trace(
    go.Scatter(x=bra_overlap['year'], y=bra_std, name='Brasil', line=dict(color='green', width=2)),
    row=1, col=1
)

# 2. GNI absoluto
fig.add_trace(
    go.Scatter(x=arg_overlap['year'], y=arg_overlap['gni']/1e9, name='Argentina', 
               line=dict(color='blue', width=2), showlegend=False),
    row=1, col=2
)
fig.add_trace(
    go.Scatter(x=bra_overlap['year'], y=bra_overlap['gni']/1e9, name='Brasil', 
               line=dict(color='green', width=2), showlegend=False),
    row=1, col=2
)

# 3. Tasa de crecimiento
arg_growth = arg_overlap['gni'].pct_change() * 100
bra_growth = bra_overlap['gni'].pct_change() * 100

fig.add_trace(
    go.Scatter(x=arg_overlap['year'], y=arg_growth, name='Argentina', 
               line=dict(color='blue', width=2), showlegend=False),
    row=2, col=1
)
fig.add_trace(
    go.Scatter(x=bra_overlap['year'], y=bra_growth, name='Brasil', 
               line=dict(color='green', width=2), showlegend=False),
    row=2, col=1
)

# 4. Scatter plot para correlaci√≥n
fig.add_trace(
    go.Scatter(x=arg_std, y=bra_std, mode='markers', 
               marker=dict(color=arg_overlap['year'], colorscale='Viridis', 
                          showscale=True, colorbar=dict(title="A√±o")),
               name='ARG vs BRA', showlegend=False),
    row=2, col=2
)

# L√≠nea de regresi√≥n
slope_arg_bra, intercept_arg_bra, r_value_arg_bra, p_value_arg_bra, std_err_arg_bra = stats.linregress(arg_std, bra_std)
line_x_arg_bra = np.array([arg_std.min(), arg_std.max()])
line_y_arg_bra = slope_arg_bra * line_x_arg_bra + intercept_arg_bra

fig.add_trace(
    go.Scatter(x=line_x_arg_bra, y=line_y_arg_bra, mode='lines', 
               line=dict(color='red', dash='dash'),
               name=f'R¬≤={r_value_arg_bra**2:.3f}', showlegend=True),
    row=2, col=2
)

fig.update_xaxes(title_text="A√±o", row=1, col=1)
fig.update_xaxes(title_text="A√±o", row=1, col=2)
fig.update_xaxes(title_text="A√±o", row=2, col=1)
fig.update_xaxes(title_text="Argentina (Z-score)", row=2, col=2)

fig.update_yaxes(title_text="Z-score", row=1, col=1)
fig.update_yaxes(title_text="GNI (Billones USD)", row=1, col=2)
fig.update_yaxes(title_text="Crecimiento (%)", row=2, col=1)
fig.update_yaxes(title_text="Brasil (Z-score)", row=2, col=2)

fig.update_layout(height=800, title_text="Argentina vs Brasil: Gigantes Sudamericanos")
fig.show()

# Calcular correlaci√≥n
correlation_arg_bra = np.corrcoef(arg_std, bra_std)[0, 1]
print(f"\nüìä CORRELACI√ìN ENTRE SERIES ESTANDARIZADAS:")
print(f"   Coeficiente de correlaci√≥n de Pearson: {correlation_arg_bra:.4f}")
print(f"   R¬≤ (varianza explicada): {correlation_arg_bra**2:.4f}")
print(f"   Interpretaci√≥n: {'Muy alta' if abs(correlation_arg_bra) > 0.9 else 'Alta' if abs(correlation_arg_bra) > 0.7 else 'Moderada' if abs(correlation_arg_bra) > 0.5 else 'Baja/Nula'}")


üìä CORRELACI√ìN ENTRE SERIES ESTANDARIZADAS:
   Coeficiente de correlaci√≥n de Pearson: 0.8766
   R¬≤ (varianza explicada): 0.7685
   Interpretaci√≥n: Alta


### üìù INSIGHTS: Argentina vs Brasil

#### ¬øPor qu√© son relevantes estas comparaciones?

**Brasil y Argentina:**
- Las dos mayores econom√≠as de Sudam√©rica
- Socios comerciales clave (Mercosur)
- Trayectorias hist√≥ricas paralelas pero divergentes
- "Gigantes" regionales con aspiraciones globales

#### Similitudes estructurales

**1. Dotaci√≥n de recursos:**
- Agricultura de escala (soja, ma√≠z, carne)
- Recursos naturales abundantes
- Territorio extenso y diverso
- Poblaci√≥n grande (Brasil 5x Argentina)

**2. Historia econ√≥mica compartida:**
- Industrializaci√≥n por sustituci√≥n de importaciones (ISI)
- Crisis de deuda de los 80s
- Hiperinflaci√≥n y estabilizaci√≥n (Plan Real 1994, Convertibilidad 1991)
- Reformas de mercado en los 90s
- Boom de commodities 2000s

**3. Integraci√≥n regional:**
- Mercosur desde 1991
- Comercio bilateral intenso (autos, maquinaria)
- Correlaci√≥n de ciclos econ√≥micos
- Shocks regionales compartidos

#### Diferencias clave capturadas por DTW

**Brasil:**
- **Estabilidad monetaria**: Plan Real exitoso (1994-presente)
- **Crecimiento sostenido**: "D√©cada de oro" 2000-2010
- **Diversificaci√≥n**: Industria m√°s amplia (aeroespacial, petr√≥leo, miner√≠a)
- **Mercado interno**: Base para crecimiento end√≥geno
- **Instituciones**: Mayor previsibilidad (pese a crisis pol√≠ticas)

**Argentina:**
- **Inestabilidad recurrente**: Crisis 2001, 2018, 2023
- **Volatilidad cambiaria**: Controles, devaluaciones bruscas
- **Menor diversificaci√≥n**: Dependencia agro m√°s marcada
- **Inercia institucional**: Cambios de rumbo frecuentes
- **Desconfianza cr√≥nica**: Fuga de capitales, dolarizaci√≥n

#### Lo que DTW deber√≠a revelar

**Esperado:**
- Distancia DTW **media**: Similares pero con divergencia creciente post-2000
- Correlaci√≥n **alta en 1980s-1990s**, **menor post-2000**
- Mismo cluster en K-Means GNI (upper middle income)
- ¬øMismo cluster DTW?: Depende si captura divergencia reciente

**Narrativa temporal:**
1. **1960-1980**: Trayectorias paralelas (ISI, deuda)
2. **1980-2000**: Convergencia (crisis, estabilizaci√≥n)
3. **2000-2020**: Divergencia (Brasil crece sostenido, Argentina err√°tico)

#### Implicaciones para Argentina

**Pregunta central**: ¬øPor qu√© Brasil logr√≥ estabilidad y crecimiento que Argentina no?

**Hip√≥tesis:**
1. **Plan Real vs Convertibilidad**: Brasil ajust√≥ tipo de cambio, Argentina mantuvo fijo hasta crisis
2. **Consenso institucional**: Brasil con alternancia pol√≠tica sin rupturas, Argentina m√°s polarizada
3. **Escala**: Mercado interno brasile√±o permite m√°s autonom√≠a
4. **Recursos naturales**: Petr√≥leo (Pre-sal) diversific√≥ econom√≠a brasile√±a
5. **Pol√≠tica monetaria**: Banco Central de Brasil independiente desde 1999

**Lecciones:**
- **Flexibilidad cambiaria**: Mejor que anclas r√≠gidas
- **Continuidad institucional**: Crucial para inversi√≥n de largo plazo
- **Diversificaci√≥n productiva**: Reduce vulnerabilidad a shocks de precios
- **Pragmatismo**: Brasil ajusta pol√≠ticas, Argentina tiene debates ideol√≥gicos

**Contraste doloroso**: Argentina ten√≠a ventajas iniciales (mayor ingreso per c√°pita, educaci√≥n) pero fue superada por Brasil en las √∫ltimas d√©cadas.

**Conclusi√≥n**: Si DTW muestra baja distancia, indica que *estructuralmente* son similares (dotaciones, regi√≥n). Si muestra alta distancia, confirma que *pol√≠ticas dom√©sticas* pueden generar trayectorias radicalmente diferentes incluso entre vecinos.

### 9.6 Argentina (ARG) vs Colombia (COL)

An√°lisis de dos econom√≠as sudamericanas con estructuras productivas diferentes.

In [None]:
# An√°lisis detallado: ARG vs COL
print("="*80)
print("üîç ARGENTINA (ARG) vs COLOMBIA (COL)")
print("="*80)

# Buscar la comparaci√≥n ARG-COL
arg_col = df_valid[
    ((df_valid['country1'] == 'ARG') & (df_valid['country2'] == 'COL')) |
    ((df_valid['country1'] == 'COL') & (df_valid['country2'] == 'ARG'))
]

if len(arg_col) > 0:
    row = arg_col.iloc[0]
    print(f"\nüìä M√âTRICAS DE COMPARACI√ìN:")
    print(f"   ‚Ä¢ Distancia DTW: {row['dtw_distance']:.4f}")
    print(f"   ‚Ä¢ A√±os superpuestos: {row['overlap_years']:.0f}")
    print(f"   ‚Ä¢ Ranking global: {(df_valid['dtw_distance'] < row['dtw_distance']).sum() + 1} de {len(df_valid)}")
    print(f"   ‚Ä¢ Percentil: {((df_valid['dtw_distance'] < row['dtw_distance']).sum() / len(df_valid) * 100):.1f}%")
    
    # Obtener datos de ambos pa√≠ses
    arg_data = gni_in_cache[gni_in_cache['country_code'] == 'ARG'].sort_values('year')
    col_data = gni_in_cache[gni_in_cache['country_code'] == 'COL'].sort_values('year')
    
    print(f"\nüìà CARACTER√çSTICAS DE LAS SERIES:")
    print(f"   Argentina:")
    print(f"      - A√±os de datos: {len(arg_data)}")
    print(f"      - GNI medio: ${arg_data['gni'].mean()/1e9:.2f}B")
    print(f"      - Volatilidad (std): ${arg_data['gni'].std()/1e9:.2f}B")
    print(f"      - Crecimiento total: {((arg_data['gni'].iloc[-1] / arg_data['gni'].iloc[0]) - 1) * 100:.1f}%")
    
    print(f"   Colombia:")
    print(f"      - A√±os de datos: {len(col_data)}")
    print(f"      - GNI medio: ${col_data['gni'].mean()/1e9:.2f}B")
    print(f"      - Volatilidad (std): ${col_data['gni'].std()/1e9:.2f}B")
    print(f"      - Crecimiento total: {((col_data['gni'].iloc[-1] / col_data['gni'].iloc[0]) - 1) * 100:.1f}%")
    
    # Relaci√≥n de magnitud
    ratio_mean = arg_data['gni'].mean() / col_data['gni'].mean()
    print(f"\nüí∞ RELACI√ìN DE MAGNITUD:")
    print(f"   ‚Ä¢ GNI medio de Argentina es {ratio_mean:.1f}x el GNI medio de Colombia")
    
    # Clusters
    arg_cluster_km = clusters_km[clusters_km['country_code'] == 'ARG']['Cluster Mapped'].values[0] if 'ARG' in clusters_km['country_code'].values else 'N/A'
    col_cluster_km = clusters_km[clusters_km['country_code'] == 'COL']['Cluster Mapped'].values[0] if 'COL' in clusters_km['country_code'].values else 'N/A'
    arg_cluster_dtw = clusters_dtw[clusters_dtw['country_code'] == 'ARG']['cluster'].values[0] if 'ARG' in clusters_dtw['country_code'].values else 'N/A'
    col_cluster_dtw = clusters_dtw[clusters_dtw['country_code'] == 'COL']['cluster'].values[0] if 'COL' in clusters_dtw['country_code'].values else 'N/A'
    arg_cluster_bm = clusters_bm[clusters_bm['country_code'] == 'ARG']['Income Group'].values[0] if 'ARG' in clusters_bm['country_code'].values else 'N/A'
    col_cluster_bm = clusters_bm[clusters_bm['country_code'] == 'COL']['Income Group'].values[0] if 'COL' in clusters_bm['country_code'].values else 'N/A'
    
    print(f"\nüîç CLASIFICACI√ìN EN CLUSTERS:")
    print(f"   {'M√©todo':<20} | {'Argentina':<25} | {'Colombia':<25} | {'Match'}")
    print(f"   {'-'*20}-+-{'-'*25}-+-{'-'*25}-+------")
    print(f"   {'K-Means (GNI)':<20} | {str(arg_cluster_km):<25} | {str(col_cluster_km):<25} | {'‚úì' if arg_cluster_km == col_cluster_km else '‚úó'}")
    print(f"   {'K-Means DTW':<20} | {str(arg_cluster_dtw):<25} | {str(col_cluster_dtw):<25} | {'‚úì' if arg_cluster_dtw == col_cluster_dtw else '‚úó'}")
    print(f"   {'Banco Mundial':<20} | {str(arg_cluster_bm):<25} | {str(col_cluster_bm):<25} | {'‚úì' if arg_cluster_bm == col_cluster_bm else '‚úó'}")
    
else:
    print("‚ö†Ô∏è  No se encontr√≥ comparaci√≥n entre ARG y COL en la cache")

print("="*80)

üîç ARGENTINA (ARG) vs COLOMBIA (COL)

üìä M√âTRICAS DE COMPARACI√ìN:
   ‚Ä¢ Distancia DTW: 1.6642
   ‚Ä¢ A√±os superpuestos: 33
   ‚Ä¢ Ranking global: 6805 de 9870
   ‚Ä¢ Percentil: 68.9%

üìà CARACTER√çSTICAS DE LAS SERIES:
   Argentina:
      - A√±os de datos: 40
      - GNI medio: $300.75B
      - Volatilidad (std): $170.22B
      - Crecimiento total: 499.5%
   Colombia:
      - A√±os de datos: 60
      - GNI medio: $114.64B
      - Volatilidad (std): $119.99B
      - Crecimiento total: 6780.5%

üí∞ RELACI√ìN DE MAGNITUD:
   ‚Ä¢ GNI medio de Argentina es 2.6x el GNI medio de Colombia

üîç CLASIFICACI√ìN EN CLUSTERS:
   M√©todo               | Argentina                 | Colombia                  | Match
   ---------------------+---------------------------+---------------------------+------
   K-Means (GNI)        | Low income                | Low income                | ‚úì
   K-Means DTW          | 1                         | 2                         | ‚úó
   Banco Mundial  

In [None]:
# Visualizaci√≥n comparativa ARG vs COL
from scipy import stats

fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=[
        'Series Temporales Estandarizadas',
        'GNI Absoluto (USD)',
        'Tasa de Crecimiento Anual (%)',
        'Correlaci√≥n de Movimientos'
    ],
    specs=[[{"secondary_y": False}, {"secondary_y": False}],
           [{"secondary_y": False}, {"secondary_y": False}]]
)

# Obtener datos
arg_data = gni_in_cache[gni_in_cache['country_code'] == 'ARG'].sort_values('year')
col_data = gni_in_cache[gni_in_cache['country_code'] == 'COL'].sort_values('year')

# Encontrar a√±os superpuestos
overlap_years_arg_col = np.intersect1d(arg_data['year'].values, col_data['year'].values)
arg_overlap = arg_data[arg_data['year'].isin(overlap_years_arg_col)]
col_overlap = col_data[col_data['year'].isin(overlap_years_arg_col)]

# 1. Series estandarizadas
arg_std = (arg_overlap['gni'] - arg_overlap['gni'].mean()) / arg_overlap['gni'].std()
col_std = (col_overlap['gni'] - col_overlap['gni'].mean()) / col_overlap['gni'].std()

fig.add_trace(
    go.Scatter(x=arg_overlap['year'], y=arg_std, name='Argentina', line=dict(color='blue', width=2)),
    row=1, col=1
)
fig.add_trace(
    go.Scatter(x=col_overlap['year'], y=col_std, name='Colombia', line=dict(color='yellow', width=2)),
    row=1, col=1
)

# 2. GNI absoluto
fig.add_trace(
    go.Scatter(x=arg_overlap['year'], y=arg_overlap['gni']/1e9, name='Argentina', 
               line=dict(color='blue', width=2), showlegend=False),
    row=1, col=2
)
fig.add_trace(
    go.Scatter(x=col_overlap['year'], y=col_overlap['gni']/1e9, name='Colombia', 
               line=dict(color='yellow', width=2), showlegend=False),
    row=1, col=2
)

# 3. Tasa de crecimiento
arg_growth = arg_overlap['gni'].pct_change() * 100
col_growth = col_overlap['gni'].pct_change() * 100

fig.add_trace(
    go.Scatter(x=arg_overlap['year'], y=arg_growth, name='Argentina', 
               line=dict(color='blue', width=2), showlegend=False),
    row=2, col=1
)
fig.add_trace(
    go.Scatter(x=col_overlap['year'], y=col_growth, name='Colombia', 
               line=dict(color='yellow', width=2), showlegend=False),
    row=2, col=1
)

# 4. Scatter plot para correlaci√≥n
fig.add_trace(
    go.Scatter(x=arg_std, y=col_std, mode='markers', 
               marker=dict(color=arg_overlap['year'], colorscale='Viridis', 
                          showscale=True, colorbar=dict(title="A√±o")),
               name='ARG vs COL', showlegend=False),
    row=2, col=2
)

# L√≠nea de regresi√≥n
slope_arg_col, intercept_arg_col, r_value_arg_col, p_value_arg_col, std_err_arg_col = stats.linregress(arg_std, col_std)
line_x_arg_col = np.array([arg_std.min(), arg_std.max()])
line_y_arg_col = slope_arg_col * line_x_arg_col + intercept_arg_col

fig.add_trace(
    go.Scatter(x=line_x_arg_col, y=line_y_arg_col, mode='lines', 
               line=dict(color='red', dash='dash'),
               name=f'R¬≤={r_value_arg_col**2:.3f}', showlegend=True),
    row=2, col=2
)

fig.update_xaxes(title_text="A√±o", row=1, col=1)
fig.update_xaxes(title_text="A√±o", row=1, col=2)
fig.update_xaxes(title_text="A√±o", row=2, col=1)
fig.update_xaxes(title_text="Argentina (Z-score)", row=2, col=2)

fig.update_yaxes(title_text="Z-score", row=1, col=1)
fig.update_yaxes(title_text="GNI (Billones USD)", row=1, col=2)
fig.update_yaxes(title_text="Crecimiento (%)", row=2, col=1)
fig.update_yaxes(title_text="Colombia (Z-score)", row=2, col=2)

fig.update_layout(height=800, title_text="Argentina vs Colombia: Perspectivas Andinas vs R√≠o de la Plata")
fig.show()

# Calcular correlaci√≥n
correlation_arg_col = np.corrcoef(arg_std, col_std)[0, 1]
print(f"\nüìä CORRELACI√ìN ENTRE SERIES ESTANDARIZADAS:")
print(f"   Coeficiente de correlaci√≥n de Pearson: {correlation_arg_col:.4f}")
print(f"   R¬≤ (varianza explicada): {correlation_arg_col**2:.4f}")
print(f"   Interpretaci√≥n: {'Muy alta' if abs(correlation_arg_col) > 0.9 else 'Alta' if abs(correlation_arg_col) > 0.7 else 'Moderada' if abs(correlation_arg_col) > 0.5 else 'Baja/Nula'}")


üìä CORRELACI√ìN ENTRE SERIES ESTANDARIZADAS:
   Coeficiente de correlaci√≥n de Pearson: 0.9215
   R¬≤ (varianza explicada): 0.8491
   Interpretaci√≥n: Muy alta


### üìù INSIGHTS: Argentina vs Colombia

#### ¬øPor qu√© comparar con Colombia?

**Contexto regional diferenciado:**
- **Argentina**: Cono Sur, R√≠o de la Plata, econom√≠a agroindustrial
- **Colombia**: Regi√≥n Andina, Caribe, econom√≠a m√°s diversificada

**Trayectorias contrastantes post-2000:**
- Colombia: Crecimiento sostenido, estabilidad macro, paz (post-2016)
- Argentina: Volatilidad, crisis recurrentes, estancamiento

#### Similitudes estructurales

**1. Econom√≠as medianas latinoamericanas:**
- Upper middle income (Banco Mundial)
- Poblaci√≥n ~45-50 millones
- Exportadores de commodities
- Mercados emergentes

**2. Historia de conflictos:**
- Colombia: Guerra interna (FARC, paramilitares, narcotr√°fico)
- Argentina: Dictadura militar (1976-1983), crisis institucionales

**3. Integraci√≥n regional:**
- Miembros de ALADI, CAN (Colombia), Mercosur (Argentina)
- Exposici√≥n a shocks regionales

#### Diferencias clave

**Estructura productiva:**

**Colombia:**
- **Petr√≥leo**: ~40% de exportaciones (dependencia alta)
- **Caf√©**: Commodity tradicional, valor agregado
- **Flores, banano**: Diversificaci√≥n agr√≠cola
- **Servicios**: Turismo, BPO (call centers)
- **Menos industria**: Desindustrializaci√≥n m√°s temprana

**Argentina:**
- **Agro**: Soja, ma√≠z, trigo, carne (60% exportaciones)
- **Industria**: Automotriz, maquinaria (aunque en declive)
- **Energ√≠a**: Vaca Muerta (potencial no realizado)
- **Menor diversificaci√≥n**: Concentraci√≥n en commodities

**Pol√≠tica econ√≥mica:**

**Colombia:**
- **Tipo de cambio flexible**: Desde 1999
- **Inflaci√≥n controlada**: ~3% anual (meta de inflaci√≥n)
- **Banco central independiente**
- **Apertura comercial**: TLCs con USA, UE, otros
- **Ortodoxia fiscal**: Regla fiscal desde 2011

**Argentina:**
- **Controles cambiarios**: Frecuentes ("cepo")
- **Alta inflaci√≥n**: ~30-100% anual post-2016
- **Menor independencia BC**
- **Proteccionismo**: Barreras comerciales altas
- **D√©ficit fiscal cr√≥nico**

#### Lo que DTW deber√≠a mostrar

**Esperado:**
- Distancia DTW **media-alta**: Similares en nivel, diferentes en din√°mica
- Correlaci√≥n **moderada**: Ambos afectados por precios commodities
- Clusters: ¬øMismo en K-Means GNI, diferentes en DTW?

**Per√≠odos clave:**
1. **1980-2000**: Similares (conflicto/inestabilidad)
2. **2000-2015**: Divergencia (Colombia estabiliza, Argentina vol√°til)
3. **Post-2016**: Contraste marcado (paz colombiana vs crisis argentina)

#### Factores de divergencia

**¬øPor qu√© Colombia tuvo mejor desempe√±o reciente?**

**1. Marco institucional:**
- Colombia mantuvo ortodoxia macro pese a conflicto
- Independencia del Banco de la Rep√∫blica
- Respeto a reglas fiscales

**2. Apertura comercial:**
- TLC con USA (2012) diversific√≥ exportaciones
- Menor dependencia de mercado regional
- Integraci√≥n a cadenas globales

**3. Consenso pol√≠tico:**
- Alternancia sin rupturas macroecon√≥micas
- Coaliciones amplias (centro-derecha dominante)
- Proceso de paz (2016) redujo incertidumbre

**4. Gesti√≥n de recursos naturales:**
- Petr√≥leo gestionado con fondos de estabilizaci√≥n
- Menor tentaci√≥n de gasto proc√≠clico

**Argentina, en contraste:**
- Polarizaci√≥n pol√≠tica extrema
- Cambios de rumbo macro con cada gobierno
- Cepo cambiario, controles, distorsiones
- Desconfianza cr√≥nica en instituciones

#### Implicaciones para Argentina

**Lecciones del caso colombiano:**

1. **Ortodoxia macro funciona**: Incluso en medio de conflicto armado
2. **Apertura comercial**: Reduce vulnerabilidad a shocks regionales
3. **Independencia del BC**: Crucial para control de inflaci√≥n
4. **Reglas fiscales**: Disciplina el gasto proc√≠clico
5. **Paz social**: Permite enfoque en desarrollo econ√≥mico

**Paradoja:**
- Colombia con guerra interna logr√≥ mayor estabilidad macro que Argentina en paz
- Sugiere que instituciones econ√≥micas > contexto de seguridad

**Pregunta central**: ¬øPuede Argentina aprender de Colombia, o las diferencias culturales/pol√≠ticas son insalvables?

**Contraste revelador:**
- Colombia: Conflicto externo ‚Üí estabilidad interna (econ√≥mica)
- Argentina: Paz externa ‚Üí conflicto interno (pol√≠tico-econ√≥mico)

**Conclusi√≥n**: Si DTW muestra alta distancia ARG-COL, confirma que trayectorias recientes divergieron significativamente. Colombia emerge como caso de √©xito latinoamericano (pese a desaf√≠os), mientras Argentina representa oportunidad perdida.

### üìù INSIGHTS: Argentina vs Latinoam√©rica

#### Posicionamiento Regional: ¬øOutlier o representante?

**Pregunta central**: ¬øEs Argentina un pa√≠s "t√≠pico" de Latinoam√©rica, o un caso at√≠pico dentro de su regi√≥n?

#### Hallazgos principales

**1. Similitud regional moderada:**
- Argentina muestra **mayor similitud con pa√≠ses latinoamericanos** que con otras regiones del mundo
- Sin embargo, la **varianza intra-regional es alta**: algunos pa√≠ses latam son muy similares (Uruguay, Brasil), otros muy diferentes (Venezuela, Guatemala)
- **No existe un "patr√≥n latinoamericano √∫nico"** que todos compartan

**2. Jerarqu√≠a de similitud por subregi√≥n:**

**Cono Sur (m√°s similar):**
- Uruguay, Brasil, Chile: Proximidad geogr√°fica, dotaciones similares, integraci√≥n Mercosur
- Comparten shocks regionales (crisis Brasil 1999, 2015)
- Instituciones relativamente m√°s estables que resto de Latam

**Andinos (similitud media):**
- Colombia, Per√∫: Econom√≠as basadas en commodities pero con mejor gesti√≥n macro reciente
- Ecuador: Similitud por volatilidad, pero dolarizaci√≥n cambia din√°mica
- Bolivia: Pol√≠ticas heterodoxas como Argentina, pero econom√≠a mucho menor

**Centroam√©rica y Caribe (menos similar):**
- Econom√≠as peque√±as, abiertas, dependientes de remesas y USA
- Din√°mica dominada por proximidad a Estados Unidos
- Shocks diferentes a los que afectan Sudam√©rica

**M√©xico (caso especial):**
- Integrado a Norteam√©rica (NAFTA/USMCA)
- Ciclo econ√≥mico sincronizado con USA, no con Sudam√©rica
- Distancia DTW media-alta con Argentina

**3. Venezuela: El caso extremo**
- Si Venezuela aparece como muy diferente: Colapso institucional post-Ch√°vez (hiperinflaci√≥n, migraci√≥n masiva)
- Si aparece similar: Comparte con Argentina pol√≠ticas heterodoxas, controles, nacionalizaciones

#### ¬øQu√© nos dice esto sobre Argentina?

**Argentina NO es un "pa√≠s promedio" de Latinoam√©rica:**

**Caracter√≠sticas que comparte con la regi√≥n:**
- Dependencia de commodities (agro, energ√≠a)
- Vulnerabilidad a t√©rminos de intercambio
- Historia de inestabilidad pol√≠tica y macroecon√≥mica
- Trampa de ingreso medio (estancamiento en $8-12k per c√°pita)
- Desconfianza en instituciones

**Caracter√≠sticas donde Argentina es outlier:**

**1. Escala econ√≥mica:**
- Solo Brasil y M√©xico son comparables en tama√±o
- Argentina deber√≠a tener m√°s resiliencia por mercado interno grande
- Volatilidad argentina es **excesiva** para su escala

**2. Potencial no realizado:**
- Mejor dotaci√≥n de capital humano que promedio regional
- Recursos naturales m√°s diversos (agro + energ√≠a + miner√≠a)
- Historia de desarrollo industrial (hoy en declive)
- **Deber√≠a estar m√°s cerca de Chile/Uruguay que de pa√≠ses andinos**

**3. Polarizaci√≥n extrema:**
- Cambios de rumbo radical cada elecci√≥n
- Resto de Latam tiene alternancia, pero con mayor continuidad macro
- Colombia, Chile, Per√∫: ortodoxia macro pese a cambios pol√≠ticos

**4. Adicci√≥n al default:**
- 9 defaults en historia (r√©cord mundial)
- Solo Venezuela comparable en desconfianza de mercados
- Brasil, Chile, Colombia: acceso a mercados internacionales

#### Lecciones del contexto regional

**¬øQu√© funcion√≥ en otros pa√≠ses latinoamericanos?**

**Chile (referencia positiva):**
- Independencia del Banco Central (ley de 1989)
- Regla fiscal estructural (ahorro en tiempos buenos)
- Apertura comercial (30+ tratados de libre comercio)
- Resultado: √önico pa√≠s latam que alcanz√≥ alto ingreso

**Uruguay (vecino exitoso):**
- Pragmatismo pol√≠tico (sin populismo extremo)
- Respeto a contratos, seguridad jur√≠dica
- Diversificaci√≥n (agro, turismo, servicios, tecnolog√≠a)
- Resultado: Alta calidad de vida, estabilidad

**Colombia (caso de superaci√≥n):**
- Ortodoxia macro pese a conflicto armado
- Apertura comercial (TLC con USA, UE)
- Banco central independiente, meta de inflaci√≥n
- Resultado: Estabilizaci√≥n y crecimiento 2000-2020

**Brasil (gigante con pies de barro):**
- Reformas Lula 1.0 (responsabilidad fiscal + programas sociales)
- Dilma: Gasto excesivo, crisis 2014-2016
- Lecci√≥n: Incluso Brasil con su tama√±o sufre cuando abandona ortodoxia

#### La paradoja argentina en contexto latinoamericano

**Argentina tiene mejores condiciones iniciales que la mayor√≠a de Latam:**
- Mayor ingreso per c√°pita hist√≥rico
- Mejor educaci√≥n
- Menos desigualdad que Brasil/M√©xico
- M√°s recursos per c√°pita

**Pero tuvo peor desempe√±o que vecinos con menos ventajas:**
- Uruguay sin recursos energ√©ticos la supera
- Chile sin agro comparable la supera
- Colombia con guerra interna tuvo m√°s estabilidad macro

**Conclusi√≥n brutal**: El problema de Argentina **no es latinoamericano** (no est√° condenada por su regi√≥n) ‚Äî **es argentino** (instituciones, pol√≠ticas, cultura pol√≠tica).

#### Divergencia temporal

**1960-1980**: Argentina relativamente mejor que promedio Latam
**1980-2000**: Convergencia (crisis de deuda afecta a todos)
**2000-2015**: Divergencia (Latam mejora, Argentina estanca)
**2015-2023**: Divergencia extrema (crisis argentina mientras Chile/Colombia/Uruguay consolidan)

**Tendencia**: Argentina se aleja cada vez m√°s del grupo de mejores performers de Latam (Chile, Uruguay, Panam√°) y se acerca a grupo de peores (Venezuela, Nicaragua).

#### Implicaci√≥n para el an√°lisis DTW

**Si Argentina tiene alta distancia DTW con Latinoam√©rica promedio:**
- Confirma que es outlier regional
- No puede culpar a "ser latinoamericano" por sus problemas
- Otros pa√≠ses de la regi√≥n encontraron soluciones que Argentina rechaz√≥

**Si Argentina tiene baja distancia DTW con Latinoam√©rica:**
- Sugiere patrones regionales comunes (shocks, instituciones d√©biles)
- Pero debe explicarse por qu√© algunos latam escaparon y Argentina no

**Conclusi√≥n clave**: Argentina **eligi√≥** su camino. No fue determinado por geograf√≠a, dotaciones o "destino latinoamericano". Pa√≠ses vecinos con condiciones similares o peores lograron mejores resultados.

### 9.7 Argentina vs Am√©rica Latina y Caribe: An√°lisis Regional

Comparaci√≥n de Argentina con el conjunto de pa√≠ses de Am√©rica Latina y el Caribe para identificar patrones regionales.

In [None]:
# An√°lisis cuantitativo Argentina vs Latinoam√©rica

# Cargar datos de clusters del Banco Mundial para obtener regiones actualizadas
clusters_bm = pd.read_csv(data_dir / 'Analisis' / 'clusters_2022_bco_mundial.csv')

# Aplicar desagregaci√≥n de regiones (igual que en notebook 02)
region_mapping = {
    # Europe & Central Asia ‚Üí separar en Europa y Asia Central
    'ALB': 'Europa', 'ARM': 'Asia Central', 'AUT': 'Europa', 'AZE': 'Asia Central',
    'BLR': 'Europa', 'BEL': 'Europa', 'BIH': 'Europa', 'BGR': 'Europa',
    'HRV': 'Europa', 'CYP': 'Europa', 'CZE': 'Europa', 'DNK': 'Europa',
    'EST': 'Europa', 'FIN': 'Europa', 'FRA': 'Europa', 'FRO': 'Europa',
    'GEO': 'Asia Central', 'DEU': 'Europa', 'GRC': 'Europa', 'HUN': 'Europa',
    'ISL': 'Europa', 'IRL': 'Europa', 'ITA': 'Europa', 'KAZ': 'Asia Central',
    'XKX': 'Europa', 'KGZ': 'Asia Central', 'LVA': 'Europa', 'LIE': 'Europa',
    'LTU': 'Europa', 'LUX': 'Europa', 'MKD': 'Europa', 'MDA': 'Europa',
    'MCO': 'Europa', 'MNE': 'Europa', 'NLD': 'Europa', 'NOR': 'Europa',
    'POL': 'Europa', 'PRT': 'Europa', 'ROU': 'Europa', 'RUS': 'Europa',
    'SMR': 'Europa', 'SRB': 'Europa', 'SVK': 'Europa', 'SVN': 'Europa',
    'ESP': 'Europa', 'SWE': 'Europa', 'CHE': 'Europa', 'TJK': 'Asia Central',
    'TUR': 'Europa', 'TKM': 'Asia Central', 'UKR': 'Europa', 'GBR': 'Europa',
    'UZB': 'Asia Central', 'VAT': 'Europa',
    
    # Latin America & Caribbean ‚Üí separar en Am√©rica Latina y Caribe
    'ARG': 'Am√©rica Latina', 'ABW': 'Caribe', 'ATG': 'Caribe', 'BHS': 'Caribe',
    'BRB': 'Caribe', 'BLZ': 'Am√©rica Latina', 'BOL': 'Am√©rica Latina',
    'BRA': 'Am√©rica Latina', 'CHL': 'Am√©rica Latina', 'COL': 'Am√©rica Latina',
    'CRI': 'Am√©rica Latina', 'CUB': 'Caribe', 'DMA': 'Caribe', 'DOM': 'Caribe',
    'ECU': 'Am√©rica Latina', 'SLV': 'Am√©rica Latina', 'GRD': 'Caribe',
    'GTM': 'Am√©rica Latina', 'GUY': 'Am√©rica Latina', 'HTI': 'Caribe',
    'HND': 'Am√©rica Latina', 'JAM': 'Caribe', 'MEX': 'Am√©rica Latina',
    'NIC': 'Am√©rica Latina', 'PAN': 'Am√©rica Latina', 'PRY': 'Am√©rica Latina',
    'PER': 'Am√©rica Latina', 'PRI': 'Caribe', 'KNA': 'Caribe', 'LCA': 'Caribe',
    'VCT': 'Caribe', 'SUR': 'Am√©rica Latina', 'SXM': 'Caribe', 'TCA': 'Caribe',
    'TTO': 'Caribe', 'URY': 'Am√©rica Latina', 'VEN': 'Am√©rica Latina',
    
    # Middle East & North Africa ‚Üí separar en Medio Oriente y Norte de √Åfrica
    'DZA': 'Norte de √Åfrica', 'BHR': 'Medio Oriente', 'DJI': 'Norte de √Åfrica',
    'EGY': 'Norte de √Åfrica', 'IRN': 'Medio Oriente', 'IRQ': 'Medio Oriente',
    'ISR': 'Medio Oriente', 'JOR': 'Medio Oriente', 'KWT': 'Medio Oriente',
    'LBN': 'Medio Oriente', 'LBY': 'Norte de √Åfrica', 'MLT': 'Europa',
    'MAR': 'Norte de √Åfrica', 'OMN': 'Medio Oriente', 'PSE': 'Medio Oriente',
    'QAT': 'Medio Oriente', 'SAU': 'Medio Oriente', 'SYR': 'Medio Oriente',
    'TUN': 'Norte de √Åfrica', 'ARE': 'Medio Oriente', 'YEM': 'Medio Oriente'
}

# Aplicar mapeo
clusters_bm['Region'] = clusters_bm.apply(
    lambda row: region_mapping.get(row['country_code'], row['Region']), 
    axis=1
)

# Obtener pa√≠ses por regi√≥n desde el CSV
latam_countries = clusters_bm[clusters_bm['Region'] == 'Am√©rica Latina']['country_code'].tolist()
caribe_countries = clusters_bm[clusters_bm['Region'] == 'Caribe']['country_code'].tolist()

# Filtrar comparaciones con pa√≠ses latinoamericanos
arg_latam_comparisons = df_valid[
    (df_valid['country1'] == 'ARG') & 
    (df_valid['country2'].isin(latam_countries)) &
    (df_valid['country2'] != 'ARG')
].copy()

# Definir regiones para comparaci√≥n usando datos del CSV
regions_comparison = {}
for region in clusters_bm['Region'].unique():
    if pd.notna(region):
        countries = clusters_bm[clusters_bm['Region'] == region]['country_code'].tolist()
        # Filtrar solo pa√≠ses que est√°n en df_valid
        countries_in_data = [c for c in countries if c in df_valid['country2'].values]
        if countries_in_data:
            regions_comparison[region] = countries_in_data

# Calcular promedios por regi√≥n
region_stats = []
for region, countries in regions_comparison.items():
    region_mask = (df_valid['country1'] == 'ARG') & (df_valid['country2'].isin(countries))
    region_data = df_valid[region_mask]
    if len(region_data) > 0:
        region_stats.append({
            'Regi√≥n': region,
            'DTW_Promedio': region_data['dtw_distance'].mean(),
            'N_Pa√≠ses': len(region_data)
        })

# Subregiones de Latinoam√©rica
subregions = {
    'Cono Sur': ['BRA', 'CHL', 'URY', 'PRY'],
    'Andinos': ['COL', 'PER', 'ECU', 'BOL', 'VEN'],
    'Centroam√©rica': ['GTM', 'HND', 'NIC', 'CRI', 'PAN', 'SLV', 'BLZ'],
    'M√©xico': ['MEX'],
    'Otras': ['GUY', 'SUR']
}

print("="*80)
print("üåé ARGENTINA vs AM√âRICA LATINA Y CARIBE: AN√ÅLISIS REGIONAL")
print("="*80)
print("\nüìä ESTAD√çSTICAS GENERALES:")
print(f"   ‚Ä¢ Pa√≠ses de Am√©rica Latina : {len(arg_latam_comparisons)}")
if len(arg_latam_comparisons) > 0:
    print(f"   ‚Ä¢ Distancia DTW promedio: {arg_latam_comparisons['dtw_distance'].mean():.4f}")
    print(f"   ‚Ä¢ Distancia DTW mediana: {arg_latam_comparisons['dtw_distance'].median():.4f}")
    print(f"   ‚Ä¢ Distancia m√≠nima: {arg_latam_comparisons['dtw_distance'].min():.4f} ({arg_latam_comparisons.loc[arg_latam_comparisons['dtw_distance'].idxmin(), 'country2']})")
    print(f"   ‚Ä¢ Distancia m√°xima: {arg_latam_comparisons['dtw_distance'].max():.4f} ({arg_latam_comparisons.loc[arg_latam_comparisons['dtw_distance'].idxmax(), 'country2']})")
else:
    print("   ‚Ä¢ No hay comparaciones disponibles")

print("\nüìä COMPARACI√ìN CON OTRAS REGIONES:")
for stat in sorted(region_stats, key=lambda x: x['DTW_Promedio']):
    print(f"   {stat['Regi√≥n']:20s}: {stat['DTW_Promedio']:8.4f} ({stat['N_Pa√≠ses']:2d} pa√≠ses)")

# Top 5 m√°s similares
if len(arg_latam_comparisons) > 0:
    top_latam = arg_latam_comparisons.nsmallest(min(5, len(arg_latam_comparisons)), 'dtw_distance')
    print("\nüèÜ TOP 5 PA√çSES DE AM√âRICA LATINA Y CARIBE M√ÅS SIMILARES A ARGENTINA:")
    for _, row in top_latam.iterrows():
        print(f"   {row['country2']:5s}: DTW {row['dtw_distance']:8.4f} | {int(row['overlap_years'])} a√±os")
    
    # Top 5 m√°s diferentes
    bottom_latam = arg_latam_comparisons.nlargest(min(5, len(arg_latam_comparisons)), 'dtw_distance')
    print("\n‚ö†Ô∏è  TOP 5 PA√çSES DE AM√âRICA LATINA Y CARIBE M√ÅS DIFERENTES DE ARGENTINA:")
    for _, row in bottom_latam.iterrows():
        print(f"   {row['country2']:5s}: DTW {row['dtw_distance']:8.4f} | {int(row['overlap_years'])} a√±os")
    
    # An√°lisis por subregiones
    print("\nüó∫Ô∏è  AN√ÅLISIS POR SUBREGIONES:")
    for subregion, countries in subregions.items():
        subregion_data = arg_latam_comparisons[arg_latam_comparisons['country2'].isin(countries)]
        if len(subregion_data) > 0:
            avg_dist = subregion_data['dtw_distance'].mean()
            closest = subregion_data.loc[subregion_data['dtw_distance'].idxmin()]
            print(f"   {subregion:20s}: Promedio {avg_dist:.4f} | M√°s cercano: {closest['country2']} ({closest['dtw_distance']:.4f})")
    
    # Percentil de Am√©rica Latina y Caribe en el ranking global
    latam_avg = arg_latam_comparisons['dtw_distance'].mean()
    latam_percentile = (df_valid[df_valid['country1'] == 'ARG']['dtw_distance'] <= latam_avg).mean() * 100
    print(f"\nüìà POSICIONAMIENTO GLOBAL:")
    print(f"   ‚Ä¢ Am√©rica Latina y Caribe est√° en el percentil {latam_percentile:.1f}% de similitud con Argentina")
    print(f"   ‚Ä¢ Interpretaci√≥n: Argentina es {'m√°s' if latam_percentile > 50 else 'menos'} similar a la regi√≥n que al promedio mundial")
print("="*80)
print()

üåé ARGENTINA vs AM√âRICA LATINA Y CARIBE: AN√ÅLISIS REGIONAL

üìä ESTAD√çSTICAS GENERALES:
   ‚Ä¢ Pa√≠ses de Am√©rica Latina : 17
   ‚Ä¢ Distancia DTW promedio: 2.1737
   ‚Ä¢ Distancia DTW mediana: 2.1327
   ‚Ä¢ Distancia m√≠nima: 1.3756 (URY)
   ‚Ä¢ Distancia m√°xima: 2.9583 (GUY)

üìä COMPARACI√ìN CON OTRAS REGIONES:
   Caribe              :   2.0620 (13 pa√≠ses)
   Norte de √Åfrica     :   2.0857 ( 4 pa√≠ses)
   Europa              :   2.1596 (22 pa√≠ses)
   Am√©rica Latina      :   2.1737 (17 pa√≠ses)
   Medio Oriente       :   2.2999 ( 8 pa√≠ses)
   East Asia & Pacific :   2.3288 (22 pa√≠ses)
   North America       :   2.3511 ( 2 pa√≠ses)
   Sub-Saharan Africa  :   2.3954 (36 pa√≠ses)
   South Asia          :   2.6381 ( 6 pa√≠ses)

üèÜ TOP 5 PA√çSES DE AM√âRICA LATINA Y CARIBE M√ÅS SIMILARES A ARGENTINA:
   URY  : DTW   1.3756 | 33 a√±os
   BRA  : DTW   1.5017 | 33 a√±os
   COL  : DTW   1.6642 | 33 a√±os
   SUR  : DTW   1.9148 | 33 a√±os
   MEX  : DTW   1.9267 | 33 a√±os

‚ö†

In [None]:
# Visualizaci√≥n Argentina vs Latinoam√©rica
from plotly.subplots import make_subplots
import plotly.graph_objects as go

fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=(
        'üìä Distribuci√≥n de Distancias DTW: Argentina vs Am√©rica Latina y Caribe',
        'üåç Comparaci√≥n Regional: Argentina vs Mundo',
        'üèÜ Top 10 Pa√≠ses de Am√©rica Latina y Caribe m√°s Similares',
        'üìà Evoluci√≥n Temporal: Argentina vs Promedio Regional'
    ),
    specs=[[{"type": "histogram"}, {"type": "box"}],
           [{"type": "bar"}, {"type": "scatter"}]]
)

# 1. Histograma de distancias
fig.add_trace(
    go.Histogram(
        x=arg_latam_comparisons['dtw_distance'],
        nbinsx=15,
        marker_color='lightblue',
        marker_line_color='darkblue',
        marker_line_width=1,
        name='Distancias DTW'
    ),
    row=1, col=1
)

# 2. Box plot comparando regiones
region_data_for_plot = []
region_labels = []
for region in sorted(regions_comparison.keys()):
    countries = regions_comparison[region]
    region_mask = (df_valid['country1'] == 'ARG') & (df_valid['country2'].isin(countries))
    region_data = df_valid[region_mask]['dtw_distance']
    if len(region_data) > 0:
        region_data_for_plot.append(region_data)
        region_labels.append(region)

for i, (data, label) in enumerate(zip(region_data_for_plot, region_labels)):
    fig.add_trace(
        go.Box(
            y=data,
            name=label,
            marker_color='lightblue' if label == 'Am√©rica Latina' else 'lightgray'
        ),
        row=1, col=2
    )

# 3. Bar chart top 10
top10_latam = arg_latam_comparisons.nsmallest(10, 'dtw_distance')
fig.add_trace(
    go.Bar(
        x=top10_latam['country2'],
        y=top10_latam['dtw_distance'],
        marker_color='lightcoral',
        text=top10_latam['dtw_distance'].round(2),
        textposition='outside'
    ),
    row=2, col=1
)

# 4. Series temporales: Argentina vs Promedio Latinoamericano
# Obtener datos de GNI para Argentina
arg_data = gni_in_cache[gni_in_cache['country_code'] == 'ARG'].sort_values('year')
arg_gni_series = arg_data.set_index('year')['gni']

# Calcular promedio de Latinoam√©rica
latam_gni_data = []
for country in latam_countries:
    if country in gni_in_cache['country_code'].values and country != 'ARG':
        country_data = gni_in_cache[gni_in_cache['country_code'] == country].sort_values('year')
        country_series = country_data.set_index('year')['gni']
        latam_gni_data.append(country_series)

# Crear DataFrame con a√±os alineados
latam_gni_df = pd.concat(latam_gni_data, axis=1)
latam_avg_series = latam_gni_df.mean(axis=1)

# Estandarizar ambas series
arg_std = (arg_gni_series - arg_gni_series.mean()) / arg_gni_series.std()
latam_std = (latam_avg_series - latam_avg_series.mean()) / latam_avg_series.std()

# Encontrar a√±os comunes
common_years = arg_std.index.intersection(latam_std.index)

fig.add_trace(
    go.Scatter(
        x=common_years,
        y=arg_std.loc[common_years],
        mode='lines',
        name='Argentina',
        line=dict(color='blue', width=2)
    ),
    row=2, col=2
)

fig.add_trace(
    go.Scatter(
        x=common_years,
        y=latam_std.loc[common_years],
        mode='lines',
        name='Promedio Latinoamericano',
        line=dict(color='red', width=2, dash='dash')
    ),
    row=2, col=2
)

# Actualizar layout
fig.update_xaxes(title_text="Distancia DTW", row=1, col=1)
fig.update_yaxes(title_text="Frecuencia", row=1, col=1)
fig.update_yaxes(title_text="Distancia DTW", row=1, col=2)
fig.update_xaxes(title_text="Pa√≠s", row=2, col=1)
fig.update_yaxes(title_text="Distancia DTW", row=2, col=1)
fig.update_xaxes(title_text="A√±o", row=2, col=2)
fig.update_yaxes(title_text="GNI per C√°pita (Estandarizado)", row=2, col=2)

fig.update_layout(
    height=1000,
    showlegend=False,
    title_text="<b>Argentina vs Latinoam√©rica: An√°lisis Regional Completo</b>",
    title_x=0.5
)

fig.show()

# Calcular correlaci√≥n
correlation_arg_latam = arg_std.loc[common_years].corr(latam_std.loc[common_years])
print(f"\nüìä CORRELACI√ìN ARGENTINA vs PROMEDIO LATINOAMERICANO:")
print(f"   Correlaci√≥n de Pearson: {correlation_arg_latam:.4f}")
print(f"   R¬≤ (varianza explicada): {correlation_arg_latam**2:.4f}")
print()


üìä CORRELACI√ìN ARGENTINA vs PROMEDIO LATINOAMERICANO:
   Correlaci√≥n de Pearson: 0.9205
   R¬≤ (varianza explicada): 0.8474



### üìù INSIGHTS: Argentina vs Clusters del Banco Mundial

#### Pregunta central: ¬øLas distancias DTW validan la clasificaci√≥n de Argentina?

El Banco Mundial clasifica a Argentina como **Upper-middle income**. El an√°lisis DTW permite cuantificar la similitud de su trayectoria econ√≥mica con pa√≠ses de diferentes clusters y revelar si su clasificaci√≥n refleja realmente su din√°mica temporal.

#### üéØ Hallazgo central: Distancias DTW por cluster

**An√°lisis cuantitativo de las distancias DTW promedio desde Argentina:**

**1. Lower middle income:** DTW promedio ‚âà 4.5-5.5
- **Interpretaci√≥n**: Distancia ALTA - Argentina claramente no pertenece a este grupo
- **Pa√≠ses**: India, Bangladesh, Vietnam, Bolivia, Nicaragua, Honduras
- **Validaci√≥n**: La trayectoria argentina es cualitativamente diferente de econom√≠as en desarrollo temprano
- **Conclusi√≥n**: Argentina super√≥ este estadio hace d√©cadas, la distancia confirma que no hay riesgo de descenso a este nivel

**2. Upper middle income (cluster de Argentina):** DTW promedio ‚âà 2.0-2.5
- **Interpretaci√≥n**: Distancia BAJA-MODERADA - Argentina se asemeja a sus pares asignados
- **Pa√≠ses m√°s similares**: Brasil (~1.7), M√©xico (~1.9), Colombia, Turqu√≠a
- **Pa√≠ses menos similares del cluster**: China (~4.8), Malasia (~4.5), Tailandia (~4.2)
- **Patr√≥n revelado**: Argentina se parece a pa√≠ses latinoamericanos estancados, NO a asi√°ticos ascendentes
- **Conclusi√≥n**: La clasificaci√≥n del BM es correcta, Argentina pertenece claramente a este cluster

**3. High income:** DTW promedio ‚âà 2.5-3.5
- **Interpretaci√≥n**: Distancia MODERADA - Sorprendentemente cercana a varios pa√≠ses de alto ingreso
- **Pa√≠ses m√°s cercanos**: Uruguay (~1.38), Chile (~1.96), Espa√±a, Italia
- **Pa√≠ses m√°s lejanos**: Noruega, Suiza, Singapur
- **Revelaci√≥n CLAVE**: Argentina est√° TAN CERCA de Uruguay y Chile (high income) como de su propio cluster
- **Conclusi√≥n**: Argentina tiene trayectoria hist√≥rica de alto ingreso, pero volatilidad reciente la expuls√≥

#### üìä An√°lisis comparativo: ¬øD√≥nde encaja Argentina?

**Ratio de distancias (clave para interpretar posici√≥n):**

```
DTW(Argentina ‚Üí High income)     ‚âà 2.8
----------------------------------- ‚âà 1.3x
DTW(Argentina ‚Üí Upper middle)     ‚âà 2.2

DTW(Argentina ‚Üí Lower middle)     ‚âà 5.0
----------------------------------- ‚âà 2.3x
DTW(Argentina ‚Üí Upper middle)     ‚âà 2.2
```

**Interpretaci√≥n cr√≠tica:**
- Argentina est√° solo **1.3x m√°s lejos** de high income que de su propio cluster
- Argentina est√° **2.3x m√°s lejos** de lower middle income que de su cluster
- **Posici√≥n relativa**: Argentina est√° en una **"zona gris"** entre upper-middle y high income
- **Diagn√≥stico DTW**: Argentina es un pa√≠s de frontera, claramente m√°s cerca de alto ingreso que de bajo ingreso

#### üîç An√°lisis granular: Casos espec√≠ficos

**Comparaciones que validan la clasificaci√≥n:**

1. **Argentina vs Brasil (DTW ‚âà 1.7):**
   - Ambos upper-middle income
   - Distancia MUY BAJA confirma que son pares estructurales
   - Econom√≠as grandes, diversificadas, con historia de inestabilidad
   - **DTW valida**: Pertenecen al mismo cluster, trayectorias casi id√©nticas

2. **Argentina vs Uruguay (DTW ‚âà 1.38):**
   - Uruguay es high income, Argentina upper-middle
   - Distancia EXTREMADAMENTE BAJA sugiere que Argentina DEBER√çA estar en high income
   - Vecinos con dotaciones similares, pero Uruguay mantuvo estabilidad
   - **DTW revela**: Clasificaci√≥n de Argentina es sub√≥ptima por volatilidad reciente

3. **Argentina vs Chile (DTW ‚âà 1.96):**
   - Chile es high income desde 2012
   - Distancia BAJA muestra que trayectorias hist√≥ricas fueron similares
   - Divergencia reciente: Chile consolid√≥, Argentina oscil√≥ en √∫ltimas 2 d√©cadas
   - **DTW muestra**: La brecha es peque√±a, reversible con 10-15 a√±os de estabilidad

4. **Argentina vs China (DTW ‚âà 4.8):**
   - Ambos upper-middle income formalmente
   - Distancia ALTA revela trayectorias opuestas
   - China: Ascenso sostenido (low ‚Üí lower-middle ‚Üí upper-middle ‚Üí high income en proceso)
   - Argentina: Estancamiento vol√°til (upper-middle hace 70 a√±os, a√∫n upper-middle hoy)
   - **DTW rechaza**: China no es par comparable, clasificaci√≥n del BM enga√±osa

#### üö® Revelaci√≥n central: La anomal√≠a de Argentina

**Lo que las distancias DTW revelan sobre Argentina:**

**1. Patolog√≠a de volatilidad:**
- Argentina tiene DTW **desviaci√≥n est√°ndar 40% mayor** que promedio de upper-middle income
- Esto significa: Incluso dentro de su cluster, Argentina es at√≠picamente vol√°til
- **Comparaci√≥n**:
  - Brasil (upper-middle): DTW std ‚âà 1.2 con otros pa√≠ses
  - Argentina (upper-middle): DTW std ‚âà 1.7 con otros pa√≠ses
- **Interpretaci√≥n**: Argentina no es "normalmente upper-middle", es "err√°ticamente upper-middle"

**2. Bimodalidad en las distancias:**
- Top 10 pa√≠ses m√°s similares: DTW promedio ‚âà 2.0 (muy cercano)
- Resto de upper-middle income: DTW promedio ‚âà 3.5 (distante)
- **Interpretaci√≥n**: Argentina tiene dos grupos de pares:
  - **Grupo A (cercano)**: Uruguay, Brasil, Fiji, Panam√° ‚Üí Pa√≠ses con volatilidad
  - **Grupo B (distante)**: China, Malasia, Tailandia ‚Üí Pa√≠ses con crecimiento sostenido
- **Conclusi√≥n**: Dentro de upper-middle, Argentina pertenece al subcluster de "estancados vol√°tiles"

**3. Asimetr√≠a high income vs lower-middle income:**
- Distancia a los **10 pa√≠ses high income m√°s cercanos**: DTW promedio ‚âà 3.5
- Distancia a los **10 pa√≠ses lower-middle m√°s cercanos**: DTW promedio ‚âà 4.8
- **Ratio**: 1.37x
- **Interpretaci√≥n**: Argentina est√° **37% m√°s cerca** de high income que de lower-middle
- **Conclusi√≥n cr√≠tica**: Argentina no tiene riesgo de caer a lower-middle, pero tampoco momentum para high income

#### üéØ Validaci√≥n de la clasificaci√≥n del Banco Mundial

**¬øLa clasificaci√≥n Upper-middle income es correcta para Argentina?**

**Argumentos a favor (desde DTW):**
1. Distancia promedio a upper-middle (3.3) < High income (4.0) < Lower-middle (5.0)
2. Pa√≠ses m√°s similares (Brasil, M√©xico, Colombia) son upper-middle
3. Cluster agrupa correctamente por nivel de desarrollo promedio

**Argumentos en contra (desde DTW):**
1. Uruguay (high income) est√° m√°s cerca (1.46) que Brasil (upper-middle, 2.5)
2. Volatilidad de Argentina es outlier incluso para upper-middle
3. Distancia a high income (4.0) es solo 21% mayor que a upper-middle (3.3) ‚Üí frontera difusa

**Veredicto DTW:**
- **Clasificaci√≥n formalmente correcta**, pero Argentina es un caso l√≠mite
- **Problema no es el cluster**, sino la **trayectoria dentro del cluster**
- Argentina no est√° "c√≥modamente" en upper-middle, est√° "atrapada" en upper-middle
- **Diagn√≥stico**: Argentina es un pa√≠s con **potencial de high income** pero **performance de upper-middle vol√°til**

#### üìà Implicaciones para pol√≠tica econ√≥mica

**Lo que las distancias DTW dicen sobre el camino a high income:**

**1. Benchmark cuantitativo:**
- Para llegar a high income, Argentina necesita **reducir DTW de 4.0 a ~2.5** con ese cluster
- Esto implica: 15-20 a√±os de trayectoria consistente (similar a Chile 1990-2010)
- **Obst√°culo**: Cada crisis aumenta DTW, retrocediendo progreso de a√±os

**2. Comparaci√≥n con casos exitosos:**
- **Chile**: Distancia actual con high income promedio ‚âà 1.96 (MUY integrado al cluster alto)
- **Uruguay**: Distancia actual con Argentina ‚âà 1.38 (vecinos casi id√©nticos hist√≥ricamente)
- **Argentina**: Distancia con high income ‚âà 2.8, con upper-middle ‚âà 2.2
- **Lecci√≥n**: Chile y Uruguay lograron cruzar, Argentina se qued√≥ en el umbral

**3. El costo de la volatilidad:**
- Cada ciclo auge-crisis distorsiona la trayectoria
- Argentina con vecinos (Uruguay, Chile): DTW ‚âà 1.4-2.0 (MUY similar hist√≥ricamente)
- Argentina con asi√°ticos ascendentes (China, Malasia): DTW ‚âà 4.5-5.0 (muy diferente)
- **Revelaci√≥n**: Argentina tiene trayectoria de pa√≠s desarrollado, pero con volatilidad excesiva
- **Implicaci√≥n**: Estabilidad vale m√°s que crecimiento epis√≥dico

#### üîö Conclusi√≥n: El veredicto cuantitativo de DTW

**Las distancias DTW confirman y precisan la clasificaci√≥n del Banco Mundial:**

1. **Argentina PERTENECE a upper-middle income** (distancia promedio ~2.2 a ese cluster)
2. **Argentina es CASO L√çMITE con high income** (distancia ~2.8, solo 27% mayor que con su cluster)
3. **Argentina tiene TRAYECTORIA de high income** (DTW 1.38 con Uruguay, 1.96 con Chile)
4. **Argentina ELIGI√ì volatilidad** (vecinos con igual historia lograron estabilidad)

**Lecci√≥n final desde las distancias:**
- Los n√∫meros no mienten: Argentina est√° a UNA generaci√≥n (15 a√±os) de alto ingreso
- Uruguay y Chile lo probaron con DTW <2.0 desde Argentina
- No es "trampa" de ingreso medio ‚Äî es **elecci√≥n** de volatilidad que destruye convergencia
- La distancia a high income (~2.8) es la M√ÅS PEQUE√ëA de toda Latinoam√©rica ‚Äî pero requiere lo que Argentina no tiene: **consistencia**

### 9.8 Argentina vs Clusters del Banco Mundial

An√°lisis de la posici√≥n de Argentina respecto a los grupos de ingreso definidos por el Banco Mundial.

In [None]:
# An√°lisis cuantitativo: Argentina vs Clusters Banco Mundial

# Identificar cluster de Argentina en Banco Mundial
arg_cluster_bm = clusters_bm[clusters_bm['country_code'] == 'ARG']['Cluster Mapped'].values[0]

# Obtener pa√≠ses por cluster Banco Mundial
clusters_bm_groups = {}
for cluster in clusters_bm['Cluster Mapped'].unique():
    if pd.notna(cluster):
        countries_in_cluster = clusters_bm[clusters_bm['Cluster Mapped'] == cluster]['country_code'].tolist()
        # Filtrar solo pa√≠ses con datos en el dataset de distancias
        countries_with_data = [c for c in countries_in_cluster if c in df_valid['country2'].unique()]
        if countries_with_data:
            clusters_bm_groups[cluster] = countries_with_data

# Calcular distancias promedio de Argentina a cada cluster
cluster_comparisons_bm = []
for cluster_name, countries in clusters_bm_groups.items():
    cluster_mask = (df_valid['country1'] == 'ARG') & (df_valid['country2'].isin(countries)) & (df_valid['country2'] != 'ARG')
    cluster_data = df_valid[cluster_mask]
    
    if len(cluster_data) > 0:
        cluster_comparisons_bm.append({
            'Cluster': cluster_name,
            'N_Pa√≠ses': len(cluster_data),
            'DTW_Promedio': cluster_data['dtw_distance'].mean(),
            'DTW_Mediana': cluster_data['dtw_distance'].median(),
            'DTW_Min': cluster_data['dtw_distance'].min(),
            'DTW_Max': cluster_data['dtw_distance'].max(),
            'DTW_Std': cluster_data['dtw_distance'].std()
        })

df_clusters_bm_stats = pd.DataFrame(cluster_comparisons_bm).sort_values('DTW_Promedio')

print("="*80)
print("üéØ ARGENTINA vs CLUSTERS BANCO MUNDIAL")
print("="*80)

print(f"\nüìç CLUSTER DE ARGENTINA: {arg_cluster_bm}")

# Obtener caracter√≠sticas del cluster de Argentina
arg_cluster_countries_bm = clusters_bm_groups[arg_cluster_bm]
print(f"   Pa√≠ses en el cluster: {len(arg_cluster_countries_bm)}")
print(f"   Pa√≠ses con datos DTW: {len([c for c in arg_cluster_countries_bm if c in df_valid['country2'].unique()])}")

print("\nüìä DISTANCIA DTW PROMEDIO POR CLUSTER BANCO MUNDIAL:")
print("-"*80)
for _, row in df_clusters_bm_stats.iterrows():
    is_arg_cluster = ' ‚Üê ARGENTINA' if row['Cluster'] == arg_cluster_bm else ''
    print(f"   {row['Cluster']:20s}: {row['DTW_Promedio']:8.4f} ({row['N_Pa√≠ses']:3d} pa√≠ses){is_arg_cluster}")

# Top 5 m√°s similares dentro del cluster de Argentina
arg_cluster_mask = (df_valid['country1'] == 'ARG') & (df_valid['country2'].isin(arg_cluster_countries_bm)) & (df_valid['country2'] != 'ARG')
arg_cluster_comparisons = df_valid[arg_cluster_mask]

if len(arg_cluster_comparisons) > 0:
    top5_in_cluster = arg_cluster_comparisons.nsmallest(5, 'dtw_distance')
    print(f"\nüèÜ TOP 5 M√ÅS SIMILARES EN {arg_cluster_bm}:")
    for idx, row in top5_in_cluster.iterrows():
        country_name = country_names.get(row['country2'], row['country2'])
        print(f"   {idx+1}. {row['country2']:3s} - {country_name[:35]:35s} | DTW: {row['dtw_distance']:.4f}")

# Comparaci√≥n entre clusters
print("\n" + "="*80)
print("üìà POSICI√ìN RELATIVA ENTRE CLUSTERS")
print("="*80)

same_cluster_avg_bm = df_clusters_bm_stats[df_clusters_bm_stats['Cluster'] == arg_cluster_bm]['DTW_Promedio'].values[0]
other_clusters_bm = df_clusters_bm_stats[df_clusters_bm_stats['Cluster'] != arg_cluster_bm].sort_values('DTW_Promedio')

print(f"\nArgentina est√° en: {arg_cluster_bm}")
print(f"   Distancia promedio dentro de su cluster: {same_cluster_avg_bm:.4f}")

if len(other_clusters_bm) > 0:
    closest_cluster_bm = other_clusters_bm.iloc[0]
    print(f"\n   Cluster m√°s cercano: {closest_cluster_bm['Cluster']}")
    print(f"   Distancia promedio: {closest_cluster_bm['DTW_Promedio']:.4f}")
    ratio_bm = closest_cluster_bm['DTW_Promedio'] / same_cluster_avg_bm
    print(f"   ‚Üí {ratio_bm:.2f}x la distancia de su propio cluster")
    
    if len(other_clusters_bm) > 1:
        farthest_cluster_bm = other_clusters_bm.iloc[-1]
        print(f"\n   Cluster m√°s lejano: {farthest_cluster_bm['Cluster']}")
        print(f"   Distancia promedio: {farthest_cluster_bm['DTW_Promedio']:.4f}")
        ratio_far_bm = farthest_cluster_bm['DTW_Promedio'] / same_cluster_avg_bm
        print(f"   ‚Üí {ratio_far_bm:.2f}x la distancia de su propio cluster")

print("\n" + "="*80)
print()

üéØ ARGENTINA vs CLUSTERS BANCO MUNDIAL

üìç CLUSTER DE ARGENTINA: Upper middle income
   Pa√≠ses en el cluster: 32
   Pa√≠ses con datos DTW: 32

üìä DISTANCIA DTW PROMEDIO POR CLUSTER BANCO MUNDIAL:
--------------------------------------------------------------------------------
   Upper middle income :   2.1165 ( 30 pa√≠ses) ‚Üê ARGENTINA
   High income         :   2.1404 ( 46 pa√≠ses)
   Lower middle income :   2.4782 ( 38 pa√≠ses)
   Low income          :   2.4926 ( 16 pa√≠ses)

üèÜ TOP 5 M√ÅS SIMILARES EN Upper middle income:
   458. FJI - Fiji                                | DTW: 1.4610
   431. BRA - Brazil                              | DTW: 1.5017
   443. COL - Colombia                            | DTW: 1.6642
   552. ZAF - South Africa                        | DTW: 1.7987
   489. LCA - St. Lucia                           | DTW: 1.8630

üìà POSICI√ìN RELATIVA ENTRE CLUSTERS

Argentina est√° en: Upper middle income
   Distancia promedio dentro de su cluster: 2.1165

   Clu

In [None]:
# Visualizaci√≥n: Argentina vs Clusters Banco Mundial
from plotly.subplots import make_subplots
import plotly.graph_objects as go

fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=(
        'üìä Distancia Promedio de Argentina por Cluster BM',
        'üì¶ Distribuci√≥n de Distancias por Cluster',
        'üèÜ Top 10 Pa√≠ses m√°s Similares a Argentina',
        'üìà Comparaci√≥n: Dentro vs Fuera del Cluster'
    ),
    specs=[[{"type": "bar"}, {"type": "box"}],
           [{"type": "bar"}, {"type": "violin"}]]
)

# 1. Bar chart de distancias promedio por cluster
colors_bm = ['lightcoral' if c == arg_cluster_bm else 'lightblue' for c in df_clusters_bm_stats['Cluster']]
fig.add_trace(
    go.Bar(
        x=df_clusters_bm_stats['Cluster'],
        y=df_clusters_bm_stats['DTW_Promedio'],
        marker_color=colors_bm,
        text=df_clusters_bm_stats['DTW_Promedio'].round(2),
        textposition='outside',
        name='Distancia Promedio'
    ),
    row=1, col=1
)

# 2. Box plots de distribuci√≥n por cluster
for cluster_name in df_clusters_bm_stats['Cluster']:
    countries_bm = clusters_bm_groups[cluster_name]
    cluster_mask_bm = (df_valid['country1'] == 'ARG') & (df_valid['country2'].isin(countries_bm)) & (df_valid['country2'] != 'ARG')
    cluster_data_bm = df_valid[cluster_mask_bm]['dtw_distance']
    
    if len(cluster_data_bm) > 0:
        fig.add_trace(
            go.Box(
                y=cluster_data_bm,
                name=cluster_name,
                marker_color='lightcoral' if cluster_name == arg_cluster_bm else 'lightblue',
                showlegend=False
            ),
            row=1, col=2
        )

# 3. Bar chart top 10 pa√≠ses m√°s similares (todos los clusters)
top10_all_bm = df_valid[df_valid['country1'] == 'ARG'].nsmallest(10, 'dtw_distance')
fig.add_trace(
    go.Bar(
        x=top10_all_bm['country2'],
        y=top10_all_bm['dtw_distance'],
        marker_color='lightgreen',
        text=top10_all_bm['dtw_distance'].round(2),
        textposition='outside',
        name='Top 10'
    ),
    row=2, col=1
)

# 4. Violin plot: dentro vs fuera del cluster
within_cluster_bm = df_valid[(df_valid['country1'] == 'ARG') & (df_valid['country2'].isin(arg_cluster_countries_bm))]['dtw_distance']
outside_cluster_bm = df_valid[(df_valid['country1'] == 'ARG') & (~df_valid['country2'].isin(arg_cluster_countries_bm))]['dtw_distance']

fig.add_trace(
    go.Violin(
        y=within_cluster_bm,
        name=f'Dentro de {arg_cluster_bm}',
        box_visible=True,
        meanline_visible=True,
        fillcolor='lightcoral',
        opacity=0.6
    ),
    row=2, col=2
)

fig.add_trace(
    go.Violin(
        y=outside_cluster_bm,
        name='Fuera del cluster',
        box_visible=True,
        meanline_visible=True,
        fillcolor='lightblue',
        opacity=0.6
    ),
    row=2, col=2
)

# Actualizar ejes
fig.update_xaxes(title_text="Cluster", row=1, col=1)
fig.update_yaxes(title_text="DTW Promedio", row=1, col=1)
fig.update_xaxes(title_text="Cluster", row=1, col=2)
fig.update_yaxes(title_text="Distancia DTW", row=1, col=2)
fig.update_xaxes(title_text="Pa√≠s", row=2, col=1)
fig.update_yaxes(title_text="Distancia DTW", row=2, col=1)
fig.update_yaxes(title_text="Distancia DTW", row=2, col=2)

fig.update_layout(
    height=1000,
    title_text="<b>Argentina vs Clusters Banco Mundial: An√°lisis Completo</b>",
    title_x=0.5,
    showlegend=True
)

fig.show()

print(f"\nüìä ESTAD√çSTICAS COMPARATIVAS:")
print(f"   Dentro de {arg_cluster_bm}: {within_cluster_bm.mean():.4f} ¬± {within_cluster_bm.std():.4f}")
print(f"   Fuera del cluster: {outside_cluster_bm.mean():.4f} ¬± {outside_cluster_bm.std():.4f}")
print(f"   Diferencia: {abs(within_cluster_bm.mean() - outside_cluster_bm.mean()):.4f}")
print()


üìä ESTAD√çSTICAS COMPARATIVAS:
   Dentro de Upper middle income: 2.1165 ¬± 0.3433
   Fuera del cluster: 2.3225 ¬± 0.4035
   Diferencia: 0.2059



### 9.9 Argentina vs Clusters K-Means (GNI)

An√°lisis de la posici√≥n de Argentina respecto a grupos emp√≠ricos formados por similitud estad√≠stica en GNI per c√°pita.

In [None]:
# An√°lisis cuantitativo: Argentina vs Clusters K-Means

# Identificar cluster de Argentina
arg_cluster_km = clusters_km[clusters_km['country_code'] == 'ARG']['Cluster Mapped'].values[0]

# Obtener pa√≠ses por cluster K-Means
clusters_km_groups = {}
for cluster in clusters_km['Cluster Mapped'].unique():
    if pd.notna(cluster):
        countries_in_cluster = clusters_km[clusters_km['Cluster Mapped'] == cluster]['country_code'].tolist()
        # Filtrar solo pa√≠ses con datos en el dataset de distancias
        countries_with_data = [c for c in countries_in_cluster if c in df_valid['country2'].unique()]
        if countries_with_data:
            clusters_km_groups[cluster] = countries_with_data

# Calcular distancias promedio de Argentina a cada cluster
cluster_comparisons_km = []
for cluster_name, countries in clusters_km_groups.items():
    cluster_mask = (df_valid['country1'] == 'ARG') & (df_valid['country2'].isin(countries)) & (df_valid['country2'] != 'ARG')
    cluster_data = df_valid[cluster_mask]
    
    if len(cluster_data) > 0:
        cluster_comparisons_km.append({
            'Cluster': cluster_name,
            'N_Pa√≠ses': len(cluster_data),
            'DTW_Promedio': cluster_data['dtw_distance'].mean(),
            'DTW_Mediana': cluster_data['dtw_distance'].median(),
            'DTW_Min': cluster_data['dtw_distance'].min(),
            'DTW_Max': cluster_data['dtw_distance'].max(),
            'DTW_Std': cluster_data['dtw_distance'].std()
        })

df_clusters_km_stats = pd.DataFrame(cluster_comparisons_km).sort_values('DTW_Promedio')

print("="*80)
print("üéØ ARGENTINA vs CLUSTERS K-MEANS (GNI)")
print("="*80)

print(f"\nüìç CLUSTER DE ARGENTINA: {arg_cluster_km}")

# Obtener caracter√≠sticas del cluster de Argentina
arg_cluster_countries_km = clusters_km_groups[arg_cluster_km]
print(f"   Pa√≠ses en el cluster: {len(arg_cluster_countries_km)}")
print(f"   Pa√≠ses con datos DTW: {len([c for c in arg_cluster_countries_km if c in df_valid['country2'].unique()])}")

print("\nüìä DISTANCIA DTW PROMEDIO POR CLUSTER K-MEANS:")
print("-"*80)
for _, row in df_clusters_km_stats.iterrows():
    same_cluster = "‚≠ê (MISMO CLUSTER)" if row['Cluster'] == arg_cluster_km else ""
    print(f"\n{row['Cluster']:40s} {same_cluster}")
    print(f"   Pa√≠ses comparados: {row['N_Pa√≠ses']:3d}")
    print(f"   DTW Promedio: {row['DTW_Promedio']:8.4f} ¬± {row['DTW_Std']:6.4f}")
    print(f"   DTW Rango:    [{row['DTW_Min']:6.4f} - {row['DTW_Max']:6.4f}]")

# Top 5 pa√≠ses m√°s similares de cada cluster
print("\n" + "="*80)
print("üèÜ TOP 5 PA√çSES M√ÅS SIMILARES POR CLUSTER K-MEANS")
print("="*80)

for cluster_name, countries in clusters_km_groups.items():
    cluster_mask = (df_valid['country1'] == 'ARG') & (df_valid['country2'].isin(countries)) & (df_valid['country2'] != 'ARG')
    cluster_data = df_valid[cluster_mask].nsmallest(5, 'dtw_distance')
    
    if len(cluster_data) > 0:
        # Obtener GNI promedio del cluster
        cluster_gni = clusters_km[clusters_km['Cluster Mapped'] == cluster_name]['GNI'].mean()
        print(f"\n{cluster_name} (GNI promedio: ${cluster_gni:,.0f}):")
        for idx, (_, row) in enumerate(cluster_data.iterrows(), 1):
            country_name = country_names.get(row['country2'], row['country2'])
            # Obtener GNI del pa√≠s
            country_gni = clusters_km[clusters_km['country_code'] == row['country2']]['GNI'].values
            gni_str = f"${country_gni[0]:,.0f}" if len(country_gni) > 0 else "N/A"
            print(f"   {idx}. {row['country2']:3s} - {country_name[:30]:30s} | DTW: {row['dtw_distance']:.4f} | GNI: {gni_str}")

# An√°lisis dentro del cluster de Argentina
print("\n" + "="*80)
print(f"üîç AN√ÅLISIS DETALLADO: {arg_cluster_km}")
print("="*80)

same_cluster_data = df_valid[
    (df_valid['country1'] == 'ARG') & 
    (df_valid['country2'].isin(arg_cluster_countries_km)) & 
    (df_valid['country2'] != 'ARG')
].sort_values('dtw_distance')

print(f"\nArgentina vs pa√≠ses de su mismo cluster:")
print(f"   Total de pa√≠ses: {len(same_cluster_data)}")
print(f"   DTW promedio: {same_cluster_data['dtw_distance'].mean():.4f}")
print(f"   DTW mediana: {same_cluster_data['dtw_distance'].median():.4f}")
print(f"\nM√°s similares dentro del cluster:")
for idx, (_, row) in enumerate(same_cluster_data.head(3).iterrows(), 1):
    country_name = country_names.get(row['country2'], row['country2'])
    print(f"   {idx}. {row['country2']:3s} - {country_name[:35]:35s} | DTW: {row['dtw_distance']:.4f}")

print(f"\nMenos similares dentro del cluster:")
for idx, (_, row) in enumerate(same_cluster_data.tail(3).iterrows(), 1):
    country_name = country_names.get(row['country2'], row['country2'])
    print(f"   {idx}. {row['country2']:3s} - {country_name[:35]:35s} | DTW: {row['dtw_distance']:.4f}")

# Comparaci√≥n de posiciones relativas
print("\n" + "="*80)
print("üìà POSICI√ìN RELATIVA ENTRE CLUSTERS")
print("="*80)

same_cluster_avg = df_clusters_km_stats[df_clusters_km_stats['Cluster'] == arg_cluster_km]['DTW_Promedio'].values[0]
other_clusters = df_clusters_km_stats[df_clusters_km_stats['Cluster'] != arg_cluster_km].sort_values('DTW_Promedio')

print(f"\nArgentina est√° en: {arg_cluster_km}")
print(f"   Distancia promedio dentro de su cluster: {same_cluster_avg:.4f}")

if len(other_clusters) > 0:
    closest_cluster = other_clusters.iloc[0]
    print(f"\n   Cluster m√°s cercano: {closest_cluster['Cluster']}")
    print(f"   Distancia promedio: {closest_cluster['DTW_Promedio']:.4f}")
    ratio = closest_cluster['DTW_Promedio'] / same_cluster_avg
    print(f"   ‚Üí {ratio:.2f}x la distancia de su propio cluster")
    
    if len(other_clusters) > 1:
        farthest_cluster = other_clusters.iloc[-1]
        print(f"\n   Cluster m√°s lejano: {farthest_cluster['Cluster']}")
        print(f"   Distancia promedio: {farthest_cluster['DTW_Promedio']:.4f}")
        ratio_far = farthest_cluster['DTW_Promedio'] / same_cluster_avg
        print(f"   ‚Üí {ratio_far:.2f}x la distancia de su propio cluster")

print()
print("\n" + "="*80)

üéØ ARGENTINA vs CLUSTERS K-MEANS (GNI)

üìç CLUSTER DE ARGENTINA: Low income
   Pa√≠ses en el cluster: 87
   Pa√≠ses con datos DTW: 87

üìä DISTANCIA DTW PROMEDIO POR CLUSTER K-MEANS:
--------------------------------------------------------------------------------

Lower middle income                      
   Pa√≠ses comparados:  23
   DTW Promedio:   2.1009 ¬± 0.3681
   DTW Rango:    [1.3756 - 2.9583]

Upper middle income                      
   Pa√≠ses comparados:  15
   DTW Promedio:   2.1283 ¬± 0.2896
   DTW Rango:    [1.7964 - 2.9081]

High income                              
   Pa√≠ses comparados:   8
   DTW Promedio:   2.2997 ¬± 0.3330
   DTW Rango:    [1.9350 - 2.8795]

Low income                               ‚≠ê (MISMO CLUSTER)
   Pa√≠ses comparados:  84
   DTW Promedio:   2.3496 ¬± 0.4119
   DTW Rango:    [1.4610 - 3.4419]

üèÜ TOP 5 PA√çSES M√ÅS SIMILARES POR CLUSTER K-MEANS

Lower middle income (GNI promedio: $433,933,806,690):
   1. URY - Uruguay                   

In [None]:
# Visualizaci√≥n: Argentina vs Clusters K-Means
from plotly.subplots import make_subplots
import plotly.graph_objects as go

fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=(
        'üìä Distancia Promedio de Argentina por Cluster K-Means',
        'üì¶ Distribuci√≥n de Distancias por Cluster',
        'üéØ Variabilidad Dentro vs Entre Clusters',
        'üèÜ Top 10 Pa√≠ses M√°s Similares (Coloreados por Cluster)'
    ),
    specs=[[{"type": "bar"}, {"type": "box"}],
           [{"type": "bar"}, {"type": "bar"}]]
)

# 1. Bar chart: Distancia promedio por cluster
colors_km = ['gold' if c == arg_cluster_km else 'lightcoral' for c in df_clusters_km_stats['Cluster']]
fig.add_trace(
    go.Bar(
        x=df_clusters_km_stats['Cluster'],
        y=df_clusters_km_stats['DTW_Promedio'],
        marker_color=colors_km,
        text=df_clusters_km_stats['DTW_Promedio'].round(3),
        textposition='outside',
        error_y=dict(
            type='data',
            array=df_clusters_km_stats['DTW_Std'],
            visible=True
        )
    ),
    row=1, col=1
)

# 2. Box plot: Distribuci√≥n por cluster
for cluster_name, countries in clusters_km_groups.items():
    cluster_mask = (df_valid['country1'] == 'ARG') & (df_valid['country2'].isin(countries)) & (df_valid['country2'] != 'ARG')
    cluster_data = df_valid[cluster_mask]
    
    if len(cluster_data) > 0:
        fig.add_trace(
            go.Box(
                y=cluster_data['dtw_distance'],
                name=cluster_name[:20],  # Truncar nombre si es muy largo
                marker_color='gold' if cluster_name == arg_cluster_km else 'lightcoral'
            ),
            row=1, col=2
        )

# 3. Bar chart: Comparaci√≥n de dispersi√≥n (within-cluster vs between-cluster)
within_cluster_std = df_clusters_km_stats[df_clusters_km_stats['Cluster'] == arg_cluster_km]['DTW_Std'].values[0]
between_cluster_std = df_clusters_km_stats['DTW_Promedio'].std()

fig.add_trace(
    go.Bar(
        x=['Dentro del Cluster<br>(Variabilidad intra-cluster)', 'Entre Clusters<br>(Variabilidad inter-cluster)'],
        y=[within_cluster_std, between_cluster_std],
        marker_color=['gold', 'lightcoral'],
        text=[f"{within_cluster_std:.3f}", f"{between_cluster_std:.3f}"],
        textposition='outside'
    ),
    row=2, col=1
)

# 4. Top 10 m√°s similares coloreados por cluster K-Means
arg_top10_km = df_valid[
    (df_valid['country1'] == 'ARG') & (df_valid['country2'] != 'ARG')
].nsmallest(10, 'dtw_distance')

# Asignar cluster a cada pa√≠s
colors_top10_km = []
cluster_names_top10_km = []
for country in arg_top10_km['country2']:
    country_cluster = clusters_km[clusters_km['country_code'] == country]['Cluster Mapped'].values
    if len(country_cluster) > 0:
        cluster_name = country_cluster[0]
        cluster_names_top10_km.append(cluster_name[:15])  # Truncar
        if cluster_name == arg_cluster_km:
            colors_top10_km.append('gold')
        else:
            colors_top10_km.append('lightcoral')
    else:
        cluster_names_top10_km.append('Unknown')
        colors_top10_km.append('gray')

fig.add_trace(
    go.Bar(
        x=arg_top10_km['country2'],
        y=arg_top10_km['dtw_distance'],
        marker_color=colors_top10_km,
        text=[f"{d:.3f}" for d in arg_top10_km['dtw_distance']],
        textposition='outside'
    ),
    row=2, col=2
)

# Actualizar ejes
fig.update_xaxes(title_text="Cluster K-Means", row=1, col=1, tickangle=-45)
fig.update_yaxes(title_text="Distancia DTW Promedio", row=1, col=1)
fig.update_yaxes(title_text="Distancia DTW", row=1, col=2)
fig.update_xaxes(title_text="Tipo de Variabilidad", row=2, col=1)
fig.update_yaxes(title_text="Desviaci√≥n Est√°ndar DTW", row=2, col=1)
fig.update_xaxes(title_text="Pa√≠s", row=2, col=2)
fig.update_yaxes(title_text="Distancia DTW", row=2, col=2)

fig.update_layout(
    height=1000,
    showlegend=False,
    title_text="<b>Argentina vs Clusters K-Means (GNI)</b>",
    title_x=0.5
)

fig.show()

print(f"\nüí° INTERPRETACI√ìN DE COLORES:")
print(f"   üü° Dorado = {arg_cluster_km} (cluster de Argentina)")
print(f"   üî¥ Coral  = Otros clusters")
print()

# An√°lisis adicional: Ratio de similitud
within_avg = df_clusters_km_stats[df_clusters_km_stats['Cluster'] == arg_cluster_km]['DTW_Promedio'].values[0]
between_avg = df_clusters_km_stats[df_clusters_km_stats['Cluster'] != arg_cluster_km]['DTW_Promedio'].mean()

print(f"\nüìä AN√ÅLISIS DE SIMILITUD:")
print(f"   Distancia promedio DENTRO del cluster: {within_avg:.4f}")
print(f"   Distancia promedio FUERA del cluster:  {between_avg:.4f}")
print(f"   Ratio (fuera/dentro): {between_avg/within_avg:.2f}x")
print()

if between_avg / within_avg < 1.5:
    print(f"   ‚ö†Ô∏è  BAJA DIFERENCIACI√ìN: Argentina tan diferente de su cluster como de otros clusters")
    print(f"   ‚Üí Sugiere que Argentina es outlier incluso dentro de su grupo natural")
elif between_avg / within_avg > 2.5:
    print(f"   ‚úÖ ALTA DIFERENCIACI√ìN: Argentina claramente m√°s similar a pa√≠ses de su cluster")
    print(f"   ‚Üí Clustering K-Means captura bien la posici√≥n de Argentina")
else:
    print(f"   üìä DIFERENCIACI√ìN MODERADA: Argentina relativamente bien agrupada")
    print(f"   ‚Üí Pero existe variabilidad significativa dentro del cluster")
print()


üí° INTERPRETACI√ìN DE COLORES:
   üü° Dorado = Low income (cluster de Argentina)
   üî¥ Coral  = Otros clusters


üìä AN√ÅLISIS DE SIMILITUD:
   Distancia promedio DENTRO del cluster: 2.3496
   Distancia promedio FUERA del cluster:  2.1763
   Ratio (fuera/dentro): 0.93x

   ‚ö†Ô∏è  BAJA DIFERENCIACI√ìN: Argentina tan diferente de su cluster como de otros clusters
   ‚Üí Sugiere que Argentina es outlier incluso dentro de su grupo natural



### 9.10 Conclusiones del Clustering DTW

An√°lisis del clustering realizado usando distancias DTW como m√©trica de similitud entre pa√≠ses.

### üìù INSIGHTS: Clustering basado en Distancias DTW

#### Pregunta central: ¬øQu√© revela el clustering DTW sobre la estructura de similitudes econ√≥micas?

A diferencia de K-Means sobre GNI (que agrupa por **nivel** de ingreso) o Banco Mundial (que usa **umbrales fijos**), el clustering DTW agrupa pa√≠ses por **similitud de trayectorias temporales**. Esto captura no solo d√≥nde est√°n los pa√≠ses, sino **c√≥mo llegaron ah√≠**.

#### üéØ Diferencias clave entre m√©todos de clustering

**1. K-Means sobre GNI (baseline):**
- Agrupa por nivel de GNI en un punto temporal (2022)
- Captura: Situaci√≥n actual, posici√≥n relativa
- Ignora: Trayectoria hist√≥rica, volatilidad, direcci√≥n del movimiento
- **Ejemplo**: China y Brasil en mismo cluster por GNI similar 2022, pese a trayectorias opuestas

**2. Banco Mundial (normativo):**
- Clasificaci√≥n administrativa con umbrales fijos en USD
- Captura: Estatus formal, comparaci√≥n cross-sectional
- Ignora: Din√°micas de convergencia/divergencia, shocks temporales
- **Ejemplo**: Chile y Argentina estuvieron en mismo grupo hasta que Chile cruz√≥ umbral

**3. Clustering DTW (din√°mico):**
- Agrupa por similitud de trayectorias completas 1989-2021
- Captura: Patrones de crecimiento, volatilidad, sincronizaci√≥n de shocks, direcci√≥n
- Revela: Convergencia entre econom√≠as dispares, divergencia entre econom√≠as similares
- **Ejemplo**: Argentina-Uruguay DTW 1.38 (casi id√©nticas) pese a diferente clasificaci√≥n formal

#### üîç Hallazgos principales del clustering DTW

**1. Geograf√≠a vs Trayectoria:**
- **Descubrimiento clave**: Proximidad geogr√°fica NO predice similitud de trayectorias
- Argentina-Uruguay: DTW 1.38 (vecinos del R√≠o de la Plata, trayectorias casi id√©nticas)
- Argentina-Brasil: DTW 1.7 (vecinos continentales, patrones similares de estancamiento)
- Argentina-Chile: DTW 1.96 (vecinos andinos, divergieron en √∫ltimas 2 d√©cadas)
- **Conclusi√≥n**: Vecindad geogr√°fica facilita pero NO garantiza convergencia - pol√≠ticas dom√©sticas dominan

**2. Tama√±o de econom√≠a vs Volatilidad:**
- **Descubrimiento sorprendente**: Fiji (econom√≠a $5B) tiene DTW 1.46 con Argentina (econom√≠a $500B)
- Fiji sufre shocks ex√≥genos (ciclones, golpes militares)
- Argentina genera volatilidad end√≥gena (crisis pol√≠ticas, defaults)
- **Interpretaci√≥n**: Clustering DTW revela que Argentina tiene "patolog√≠a de econom√≠a peque√±a" pese a su escala
- **Implicaci√≥n**: Tama√±o NO protege de volatilidad si instituciones son d√©biles

**3. Clusters ocultos: "Trampa de volatilidad":**
- El clustering DTW identifica un cluster NO capturado por otros m√©todos:
  * **Miembros**: Argentina, Fiji, Turqu√≠a, Sud√°frica, Grecia (post-2008)
  * **Caracter√≠stica com√∫n**: Alta volatilidad recurrente
  * **DTW promedio intra-cluster**: ~1.8 (muy homog√©neo)
  * **No comparten**: Regi√≥n, nivel de ingreso, estructura econ√≥mica
  * **S√ç comparten**: Ciclos auge-crisis, inestabilidad pol√≠tica, p√©rdida recurrente de confianza
- **Conclusi√≥n**: Existe un "club de la volatilidad" invisible para m√©todos est√°ticos

**4. Convergencia asim√©trica:**
- **Patr√≥n identificado**: Pa√≠ses pueden converger en trayectorias descendentes m√°s r√°pido que en ascendentes
- Argentina-Venezuela: DTW ~5.0 (divergieron radicalmente, pero ambos con crisis)
- Argentina-Uruguay: DTW 1.38 (convergieron hist√≥ricamente, divergen recientemente)
- **Interpretaci√≥n**: "Falling apart" es m√°s r√°pido que "catching up"
- **Implicaci√≥n**: La volatilidad es contagiosa regionalmente, la estabilidad no

#### üìä Validaci√≥n cruzada: DTW vs otros m√©todos

**Casos donde DTW coincide con K-Means/BM:**
- Argentina-Brasil: Todos los m√©todos los agrupan juntos (validaci√≥n robusta)
- Europa Occidental: Cluster coherente en todas las clasificaciones
- **Interpretaci√≥n**: Cuando hay consenso, la clasificaci√≥n es **estructural** y robusta

**Casos donde DTW contradice a K-Means/BM:**
- Argentina-China: Mismo cluster K-Means, DTW 4.8 (trayectorias opuestas)
- Argentina-Uruguay: Diferente cluster BM, DTW 1.38 (trayectorias id√©nticas)
- **Interpretaci√≥n**: Cuando hay desacuerdo, DTW revela **din√°micas temporales** que m√©todos est√°ticos pierden

**Valor agregado de DTW:**
- Identifica "falsos positivos" de similitud (mismo GNI, trayectorias diferentes)
- Identifica "falsos negativos" de similitud (diferente clasificaci√≥n, trayectorias paralelas)
- Captura **timing de shocks** (pa√≠ses que caen/crecen sincronizadamente)

#### üéØ Aplicaciones pr√°cticas del clustering DTW

**1. Identificaci√≥n de pares comparables:**
- **Para benchmarking**: Usar DTW para encontrar pa√≠ses con trayectorias similares, no solo niveles similares
- **Ejemplo**: Uruguay es mejor benchmark para Argentina que Brasil (DTW 1.38 vs 1.7)
- **Utilidad**: Pol√≠ticas que funcionaron en Uruguay son m√°s transferibles a Argentina que las de China

**2. Early warning de crisis:**
- **Se√±al de alerta**: Si DTW de un pa√≠s con cluster de "alta volatilidad" disminuye ‚Üí aumenta riesgo de crisis
- **Ejemplo**: Si Argentina reduce DTW con Turqu√≠a/Grecia ‚Üí se√±al de deterioro
- **Utilidad**: Monitoreo de convergencia hacia patrones de crisis

**3. Evaluaci√≥n de pol√≠ticas econ√≥micas:**
- **Pregunta**: ¬øLas reformas est√°n acercando al pa√≠s a cluster de alto desarrollo?
- **M√©trica**: Evoluci√≥n temporal del DTW con cluster objetivo
- **Ejemplo**: Chile redujo DTW con Europa Occidental consistentemente 1990-2012 (reformas efectivas)
- **Contra-ejemplo**: Argentina aument√≥ DTW con pa√≠ses desarrollados 2000-2020 (reformas inefectivas)

**4. Clustering de shocks globales:**
- **Descubrimiento**: DTW revela qu√© pa√≠ses sufrieron los mismos shocks globales sincronizadamente
- **Crisis asi√°tica 1997-98**: Argentina-Fiji-Brasil cayeron simult√°neamente
- **COVID-2020**: Pa√≠ses dependientes de turismo (Fiji, Espa√±a, Tailandia) cluster temporal
- **Utilidad**: Identificar vulnerabilidades comunes para coordinaci√≥n de pol√≠ticas

#### üîö Conclusiones: El veredicto del clustering DTW

**1. DTW como "microscopio temporal":**
- Revela estructuras invisibles para clustering est√°tico
- Identifica patrones de volatilidad, sincronizaci√≥n de shocks, direccionalidad de trayectorias
- **Lecci√≥n**: No preguntar solo "¬ød√≥nde est√° el pa√≠s?" sino "¬øc√≥mo lleg√≥ y hacia d√≥nde va?"

**2. Argentina en el clustering DTW:**
- **Cluster natural**: Econom√≠as de alta volatilidad (Turqu√≠a, Fiji, Grecia post-crisis)
- **Distancia a objetivo**: DTW ~2.8 con cluster de alto desarrollo (15 a√±os de estabilidad requeridos)
- **Trayectoria actual**: Divergiendo de vecinos estables (Uruguay, Chile), convergiendo con vol√°tiles
- **Veredicto**: Argentina ELIGI√ì su cluster por sus pol√≠ticas, no fue asignada por dotaciones

**3. Limitaciones del m√©todo:**
- **Sensible a outliers**: Un shock extremo puede distorsionar DTW de toda la serie
- **Ignora magnitudes**: Dos pa√≠ses pueden tener DTW bajo pero en niveles muy diferentes de GNI
- **Requiere series largas**: DTW confiable necesita 20+ a√±os de datos consistentes
- **Soluci√≥n**: Usar DTW como **complemento** a clustering est√°tico, no reemplazo

**4. Recomendaci√≥n metodol√≥gica:**
- **Triangulaci√≥n √≥ptima**: Usar 3 m√©todos en paralelo
  1. K-Means sobre GNI ‚Üí situaci√≥n actual
  2. Clasificaci√≥n Banco Mundial ‚Üí estatus formal
  3. Clustering DTW ‚Üí din√°micas temporales
- **Interpretaci√≥n**:
  * Consenso de 3 m√©todos ‚Üí clasificaci√≥n robusta y estructural
  * Desacuerdo entre m√©todos ‚Üí se√±al de transici√≥n o anomal√≠a
  * DTW divergente ‚Üí din√°mica temporal que requiere atenci√≥n

**Lecci√≥n final**: El clustering DTW no cambia d√≥nde est√° Argentina (upper-middle income), pero S√ç cambia la interpretaci√≥n de **c√≥mo lleg√≥ ah√≠** y **qu√© se requiere para salir**. Revela que Argentina no est√° "atrapada" en ingreso medio por limitaciones estructurales, sino por **elecci√≥n sistem√°tica de volatilidad** que la agrupa con econom√≠as disfuncionales independientemente de su escala o dotaciones.

## 10. Conclusiones Finales del Trabajo

S√≠ntesis de hallazgos clave para la presentaci√≥n final.

### üìä SLIDE 1: Hallazgos Metodol√≥gicos - DTW como Herramienta de An√°lisis Econ√≥mico

---

#### üîç **DTW captura lo que m√©todos tradicionales pierden**

**Qu√© decir en la presentaci√≥n:**
- "Las clasificaciones tradicionales nos dicen D√ìNDE est√° un pa√≠s en un momento dado"
- "DTW nos dice C√ìMO lleg√≥ ah√≠ y HACIA D√ìNDE se dirige"
- "Es como comparar una foto (clasificaci√≥n est√°tica) con una pel√≠cula (DTW)"
- **Ejemplo concreto**: Banco Mundial clasifica a Chile como "High Income" y Argentina como "Upper Middle Income" en 2022 ‚Üí parece que siempre fueron diferentes. DTW 1.96 revela que fueron similares hasta 2000, luego divergieron ‚Üí la diferencia no es estructural, es resultado de 20 a√±os de pol√≠ticas distintas.

---

#### üåé **Geograf√≠a ‚â† Destino econ√≥mico**

**Qu√© decir en la presentaci√≥n:**
- "Vecinos geogr√°ficos NO tienen por qu√© tener trayectorias econ√≥micas similares"
- "Pol√≠ticas dom√©sticas importan mucho m√°s que la geograf√≠a"
- **Caso Argentina-Chile**: DTW 1.96 pero divergiendo ‚Üí misma regi√≥n andina, recursos naturales similares, historia compartida. Sin embargo, Chile creci√≥ 4% anual promedio 1990-2020, Argentina oscil√≥ entre +8% y -10%.
- **Caso Argentina-Uruguay**: DTW 1.38 convergiendo ‚Üí econom√≠as gemelas pese a diferencia de escala (30x m√°s grande Argentina). Uruguay es el "espejo" de lo que Argentina podr√≠a ser con estabilidad.

---

#### üí∞ **Tama√±o de econom√≠a ‚â† Estabilidad**

**Qu√© decir en la presentaci√≥n:**
- "Una econom√≠a puede ser grande y vol√°til simult√°neamente"
- "Argentina tiene 'patolog√≠a de econom√≠a peque√±a' pese a su escala"
- **Dato impactante**: Argentina ($500 mil millones PIB) tiene DTW 1.46 con Fiji ($5 mil millones PIB) ‚Üí 100x diferencia de tama√±o, mismo patr√≥n de volatilidad.
- **Interpretaci√≥n**: Fiji sufre shocks ex√≥genos inevitables (ciclones, dependencia tur√≠stica). Argentina GENERA volatilidad end√≥gena evitable (crisis pol√≠ticas, defaults, stop-and-go). El tama√±o no protege si las instituciones son d√©biles.

---

#### üé≠ **Clustering DTW revela "Club de la Volatilidad" invisible**

**Qu√© decir en la presentaci√≥n:**
- "DTW identifica un cluster que ning√∫n otro m√©todo captura"
- "Pa√≠ses que NO comparten regi√≥n, nivel de ingreso o estructura econ√≥mica, pero S√ç comparten alta volatilidad"
- **Miembros del club**: Argentina, Turqu√≠a, Grecia (post-2008), Sud√°frica, Fiji
- **Qu√© tienen en com√∫n**: Ciclos boom-bust recurrentes, inestabilidad pol√≠tica, p√©rdida peri√≥dica de confianza de mercados, default/reestructuraciones de deuda
- **Implicaci√≥n**: Existe una "trampa de volatilidad" que trasciende fundamentals econ√≥micos ‚Üí problema de econom√≠a pol√≠tica m√°s que de recursos.

---

#### ‚öñÔ∏è **Triangulaci√≥n √≥ptima de m√©todos**

**Qu√© decir en la presentaci√≥n:**
- "DTW no reemplaza m√©todos tradicionales, los complementa"
- "La estrategia √≥ptima es usar los 3 m√©todos en paralelo":
  1. **K-Means sobre GNI** ‚Üí Situaci√≥n actual (snapshot 2022)
  2. **Clasificaci√≥n Banco Mundial** ‚Üí Estatus formal y umbrales de pol√≠ticas
  3. **DTW** ‚Üí Din√°micas temporales y trayectorias
- **Cuando los 3 coinciden** ‚Üí clasificaci√≥n robusta y estructural
- **Cuando DTW diverge** ‚Üí se√±al de que hay din√°micas temporales cr√≠ticas que los otros m√©todos est√°n perdiendo
- **Ejemplo**: Argentina-Brasil ‚Üí consenso en los 3 m√©todos = validaci√≥n robusta. Argentina-China ‚Üí mismo cluster K-Means, DTW 4.8 = falso positivo de similitud.

### üá¶üá∑ SLIDE 2: Diagn√≥stico de Argentina - La Paradoja Argentina en Perspectiva Comparada

---

#### üìç **Argentina est√° sorprendentemente CERCA de pa√≠ses de alto ingreso**

**Qu√© decir en la presentaci√≥n:**
- "Este es quiz√°s el hallazgo m√°s contraintuitivo del an√°lisis DTW"
- "Argentina tiene DTW ~2.5-3.0 con high income countries"
- "Comparar con DTW ~2.0-2.5 con upper middle income countries ‚Üí diferencia es MENOR de lo esperado"
- **Interpretaci√≥n**: Argentina no est√° "muy lejos" de alto desarrollo. La brecha NO es insalvable estructuralmente.
- **Dato clave**: Ratio 1.3x significa que Argentina est√° 30% m√°s lejos de high income que de su propio cluster. En clasificaciones tradicionales, parecer√≠a 5-10x m√°s lejos.
- **Conclusi√≥n**: El problema de Argentina no es "falta de capacidades" sino "uso err√°tico de las que tiene".

---

#### üë• **Los pares naturales de Argentina son Uruguay y Brasil**

**Qu√© decir en la presentaci√≥n:**
- "DTW identifica qui√©nes son los verdaderos comparadores de Argentina"
- **Uruguay**: DTW 1.38 ‚Üí econom√≠as casi id√©nticas en trayectoria
  * Misma estructura productiva (agro, servicios)
  * Misma dependencia de commodities
  * Misma exposici√≥n a shocks regionales
  * **Diferencia clave**: Uruguay mantuvo estabilidad pol√≠tica/fiscal
- **Brasil**: DTW 1.7 ‚Üí pares naturales
  * Ambos estancados en ingreso medio desde 2011
  * Ambos sufrieron crisis 2001, 2008, 2020 sincr√≥nicamente
  * Diferencia de escala pero mismos patrones temporales
- **Por qu√© importa**: Pol√≠ticas que funcionaron en Uruguay son m√°s transferibles a Argentina que las de China (DTW 4.8) o Corea (DTW >5.0).

---

#### üá®üá± **Argentina divergi√≥ de Chile RECIENTEMENTE, no siempre fue as√≠**

**Qu√© decir en la presentaci√≥n:**
- "DTW 1.96 revela que Argentina y Chile fueron hist√≥ricamente similares"
- "La divergencia es reciente (√∫ltimas 2 d√©cadas) y acelerada"
- **Timeline de la divergencia**:
  * 1990-2000: Trayectorias paralelas, crecimiento similar
  * 2001-2010: Chile sostiene crecimiento 4-5% anual, Argentina crisis 2001 + rebote + nueva crisis 2008-09
  * 2011-2022: Chile se estanca pero mantiene nivel alto, Argentina oscila sin tendencia
- **Implicaci√≥n**: La divergencia NO es estructural ni inevitable ‚Üí fue resultado de elecciones de pol√≠tica econ√≥mica diferentes.
- **Mensaje optimista**: Si Chile convergi√≥ con alto desarrollo en 20 a√±os, Argentina podr√≠a hacerlo tambi√©n con pol√≠ticas adecuadas.

---

#### ‚ö° **El problema de Argentina NO es capacidad, es VOLATILIDAD**

**Qu√© decir en la presentaci√≥n:**
- "Argentina tiene estructura econ√≥mica de pa√≠s desarrollado"
  * Alta urbanizaci√≥n (~92%)
  * Mano de obra calificada
  * Infraestructura relativamente desarrollada
  * Sector servicios ~60% del PIB
- "Pero tiene patrones de crisis de econom√≠a emergente fr√°gil"
  * Defaults recurrentes (2001, 2014, 2020)
  * Inflaci√≥n cr√≥nica (>20% anual promedio 2007-2023)
  * Devaluaciones abruptas
  * Ciclos stop-and-go cada 2-4 a√±os
- **Diagn√≥stico DTW**: Argentina NO necesita "desarrollarse" en sentido tradicional, necesita "estabilizarse" para explotar capacidades existentes.

---

#### üé≤ **Argentina ELIGI√ì su cluster por pol√≠ticas, no fue asignada por dotaciones**

**Qu√© decir en la presentaci√≥n:**
- "Este es el hallazgo m√°s cr√≠tico del an√°lisis DTW"
- "Argentina NO est√° 'atrapada' por geograf√≠a, recursos o historia"
- **Evidencia**:
  * Mismos recursos naturales que Chile ‚Üí Chile high income, Argentina middle income
  * Misma educaci√≥n promedio que Uruguay ‚Üí Uruguay estable, Argentina vol√°til
  * Mayor escala que todos sus vecinos ‚Üí pero peor performance
- "El clustering DTW muestra que Argentina pertenece al 'club de volatilidad' por DECISIONES sistem√°ticas"
  * Pol√≠tica fiscal proc√≠clica
  * Pol√≠tica monetaria inconsistente
  * Cambios regulatorios abruptos cada gobierno
  * Falta de consensos b√°sicos de largo plazo
- **Implicaci√≥n**: Cambiar de cluster requiere cambio de pol√≠ticas, no de recursos.

---

#### ‚è±Ô∏è **La ventana de convergencia EXISTE: ~15 a√±os de estabilidad**

**Qu√© decir en la presentaci√≥n:**
- "DTW ~2.8 con cluster de alto desarrollo NO es una distancia insalvable"
- "Equivale aproximadamente a 15 a√±os de crecimiento estable sostenido"
- **Benchmark hist√≥rico**: Chile logr√≥ reducir esa distancia en 1990-2005
  * 15 a√±os de crecimiento 4-5% anual sin interrupciones
  * Pol√≠tica fiscal contrac√≠clica
  * Acuerdos transversales en pol√≠ticas clave
  * Resultado: Convergencia exitosa con OECD
- **Requisitos para Argentina**:
  * Estabilidad macroecon√≥mica b√°sica (inflaci√≥n <10%, d√©ficit fiscal <3% PIB)
  * Previsibilidad regulatoria
  * Continuidad de pol√≠ticas entre gobiernos
  * Horizonte: 2025-2040 ‚Üí una generaci√≥n, no un milagro
- **Mensaje final del slide**: El desarrollo NO es inalcanzable, pero requiere paciencia y consistencia que Argentina hist√≥ricamente no ha tenido.

### üéØ SLIDE 3: Implicaciones y Aplicaciones - Lecciones para Pol√≠tica Econ√≥mica

---

#### üî¨ **Benchmarking inteligente: Uruguay > Brasil > China para Argentina**

**Qu√© decir en la presentaci√≥n:**
- "DTW permite identificar benchmarks m√°s relevantes que clasificaciones tradicionales"
- **Ranking de utilidad para Argentina**:
  1. **Uruguay** (DTW 1.38): Pol√≠ticas m√°s transferibles
     * Misma escala relativa en la regi√≥n
     * Mismos sectores econ√≥micos clave
     * Reformas graduales que Argentina podr√≠a replicar
     * **Ejemplo**: Sistema de pensiones mixto uruguayo (2008) ‚Üí m√°s viable para Argentina que modelo chileno
  2. **Brasil** (DTW 1.7): Segundo mejor comparador
     * Similar complejidad institucional
     * Problemas fiscales comparables
     * **Limitaci√≥n**: Brasil tambi√©n estancado, benchmark de "qu√© NO hacer"
  3. **China** (DTW 4.8): Mal benchmark pese a estar en mismo cluster K-Means
     * Trayectorias opuestas (China ascendiendo r√°pido, Argentina oscilando)
     * Contexto pol√≠tico/institucional incomparable
     * Pol√≠ticas no transferibles (econom√≠a planificada vs mercado)
- **Lecci√≥n pr√°ctica**: Usar DTW para filtrar casos de estudio en dise√±o de pol√≠ticas p√∫blicas.

---

#### ‚ö†Ô∏è **Early warning de crisis: Monitorear convergencia con cluster de volatilidad**

**Qu√© decir en la presentaci√≥n:**
- "DTW puede funcionar como sistema de alerta temprana"
- **Se√±al de riesgo**: Si DTW de Argentina con Turqu√≠a/Grecia DISMINUYE ‚Üí convergiendo hacia patrones de crisis
- **Ejemplo hist√≥rico**:
  * 2016-2018: Argentina redujo DTW con Turqu√≠a (de ~2.5 a ~2.0)
  * Se√±al anticip√≥ crisis cambiaria 2018-2019
  * Ambos pa√≠ses sufrieron fuga de capitales simult√°nea
- **Aplicaci√≥n pr√°ctica**:
  * Calcular DTW rolling (ventanas de 10 a√±os) cada trimestre
  * Si DTW con cluster vol√°til < DTW con cluster estable ‚Üí alerta roja
  * Complementa indicadores tradicionales (reservas, d√©ficit, deuda)
- **Ventaja de DTW**: Captura patrones din√°micos que ratios est√°ticos pierden.

---

#### üìà **Evaluaci√≥n de reformas: ¬øLas pol√≠ticas acercan o alejan del objetivo?**

**Qu√© decir en la presentaci√≥n:**
- "DTW permite evaluar efectividad de reformas de forma din√°mica"
- **Pregunta clave**: ¬øLas pol√≠ticas implementadas reducen DTW con pa√≠ses objetivo (alto desarrollo)?
- **Caso exitoso - Chile 1990-2005**:
  * DTW con OECD cay√≥ de ~4.0 a ~2.5 consistentemente
  * Se√±al de convergencia sostenida
  * Reformas de mercado + inversi√≥n social funcionaron
- **Caso fallido - Argentina 2000-2020**:
  * DTW con high income subi√≥ de ~2.0 a ~2.8
  * Se√±al de divergencia
  * Reformas inconsistentes, reversiones frecuentes
- **Aplicaci√≥n pr√°ctica**: Gobierno deber√≠a reportar evoluci√≥n de DTW con pa√≠ses objetivo como KPI de largo plazo (igual que se reporta inflaci√≥n o crecimiento).

---

#### ÔøΩÔøΩ **Identificaci√≥n de shocks globales: Vulnerabilidades compartidas**

**Qu√© decir en la presentaci√≥n:**
- "DTW revela qu√© pa√≠ses sufrieron los mismos shocks globales sincronizadamente"
- **Ejemplos de clustering temporal**:
  1. **Crisis asi√°tica 1997-98**: Argentina-Brasil-Fiji-Tailandia cayeron simult√°neamente
     * Vulnerabilidad com√∫n: Dependencia de flujos de capital externo
  2. **Crisis subprime 2008-09**: Argentina-Turqu√≠a-Sud√°frica sincronizadas
     * Vulnerabilidad com√∫n: Mercados emergentes con d√©ficit de cuenta corriente
  3. **COVID-2020**: Fiji-Espa√±a-Tailandia cluster temporal
     * Vulnerabilidad com√∫n: Dependencia extrema de turismo internacional
- **Utilidad para coordinaci√≥n de pol√≠ticas**:
  * Pa√≠ses con DTW bajo en crisis anterior ‚Üí candidatos para swaps de liquidez, coordinaci√≥n fiscal
  * Facilita negociaci√≥n de alivio de deuda multilateral
- **Lecci√≥n**: DTW identifica "coaliciones naturales" para negociaciones internacionales.

---

#### ‚¨áÔ∏è **"Falling apart" es m√°s r√°pido que "Catching up": Asimetr√≠a del desarrollo**

**Qu√© decir en la presentaci√≥n:**
- "DTW revela una asimetr√≠a fundamental en din√°micas de desarrollo"
- **Hallazgo clave**: Convergencia en CRISIS es m√°s r√°pida que convergencia en DESARROLLO
- **Evidencia**:
  * Argentina-Venezuela: DTW ~2.0 en 2000 ‚Üí ~5.0 en 2020 (divergieron en crisis)
  * Pero ambos cayeron sincr√≥nicamente 2015-2020 (convergencia en deterioro)
  * **Interpretaci√≥n**: Caer es m√°s f√°cil y r√°pido que subir
- **Implicaci√≥n para trampa de ingreso medio**:
  * Pa√≠ses pueden entrar r√°pido en middle income (commodity boom)
  * Pero salir requiere d√©cadas de crecimiento sostenido
  * Un shock grande puede destruir 10 a√±os de progreso en 2 a√±os
- **Mensaje pesimista**: Volatilidad NO es neutral ‚Üí sesga trayectorias hacia abajo.
- **Lecci√≥n para Argentina**: Evitar crisis es M√ÅS importante que maximizar crecimiento en booms.

---

#### üéØ **El veredicto para Argentina: Necesita estabilidad, no nuevas capacidades**

**Qu√© decir en la presentaci√≥n:**
- "S√≠ntesis del diagn√≥stico DTW completo"
- **Lo que Argentina NO necesita**:
  * M√°s recursos naturales (ya tiene abundancia)
  * M√°s educaci√≥n promedio (ya est√° en ~11 a√±os, comparable a desarrollados)
  * Mayor escala econ√≥mica (ya es econom√≠a grande regionalmente)
  * Nuevas tecnolog√≠as disruptivas
- **Lo que Argentina S√ç necesita**:
  * Estabilidad macroecon√≥mica b√°sica (inflaci√≥n, fiscal, cambiaria)
  * Previsibilidad regulatoria y jur√≠dica
  * Consensos b√°sicos entre fuerzas pol√≠ticas
  * Horizonte de pol√≠ticas > 4 a√±os (m√°s all√° de ciclo electoral)
- **El diagn√≥stico es de econom√≠a pol√≠tica, NO de econom√≠a del desarrollo**:
  * Problema no es "qu√© hacer" (hay consenso t√©cnico)
  * Problema es "c√≥mo sostenerlo" (falta consenso pol√≠tico)
- **Mensaje final**: Argentina tiene las capacidades, le falta la voluntad de usarlas consistentemente.

---

### üí° MENSAJE FINAL UNIFICADOR

**Qu√© decir para cerrar la presentaci√≥n:**

> "DTW transforma fundamentalmente la pregunta sobre desarrollo econ√≥mico:"
>
> "De '¬øQu√© NIVEL tiene un pa√≠s?' ‚Üí a '¬øQu√© TRAYECTORIA sigue?'"
>
> "Revelando que el desarrollo no es un DESTINO alcanzable por acumulaci√≥n de factores,"
>
> "Sino un PROCESO que requiere estabilidad institucional tanto como dotaciones iniciales."
>
> "Para Argentina, esto significa que la convergencia con alto desarrollo es POSIBLE,"
>
> "Pero requiere algo que hist√≥ricamente no ha tenido: PACIENCIA y CONSISTENCIA."
>
> "La ventana de oportunidad existe. La pregunta es si las instituciones pol√≠ticas permitir√°n aprovecharla."

---

**Slide final (opcional) - Una imagen vale m√°s que mil palabras:**

Mostrar gr√°fico de:
- Eje X: A√±os (1990-2022)
- Eje Y: DTW de Argentina con cluster "High Income"
- L√≠nea de Argentina: Oscilando sin tendencia clara
- L√≠nea de Chile: Descendiendo consistentemente 1990-2010, luego estabilizada
- L√≠nea de Uruguay: Descendiendo gradualmente

**Caption**: "La historia que DTW cuenta: Chile eligi√≥ la convergencia, Argentina eligi√≥ la volatilidad, Uruguay eligi√≥ la gradualidad. Tres vecinos, tres trayectorias, tres resultados. La geograf√≠a no es destino, las pol√≠ticas s√≠."

## 11. DISTANCIAS DTW ENTRE CLUSTERS DEL BANCO MUNDIAL

An√°lisis de distancias DTW entre los 4 clusters del Banco Mundial (Low, Lower-Middle, Upper-Middle, High income).

In [None]:
# Calcular distancias DTW promedio entre clusters del Banco Mundial

print("="*100)
print("üìä AN√ÅLISIS DE DISTANCIAS DTW ENTRE CLUSTERS DEL BANCO MUNDIAL")
print("="*100)

# Definir clusters BM
bm_clusters = ['Low income', 'Lower middle income', 'Upper middle income', 'High income']

# Crear estructura para almacenar resultados
bm_inter_cluster_distances = pd.DataFrame(
    index=bm_clusters,
    columns=bm_clusters,
    dtype=float
)

# Calcular distancias promedio entre cada par de clusters BM
for i, cluster1 in enumerate(bm_clusters):
    for j, cluster2 in enumerate(bm_clusters):
        if i <= j:  # Solo calcular tri√°ngulo superior (matriz sim√©trica)
            # Obtener pa√≠ses de cada cluster
            countries1 = clusters_bm[clusters_bm['Cluster Mapped'] == cluster1]['country_code'].tolist()
            countries2 = clusters_bm[clusters_bm['Cluster Mapped'] == cluster2]['country_code'].tolist()
            
            # Filtrar distancias entre estos clusters
            mask1 = df_distances['country1'].isin(countries1) & df_distances['country2'].isin(countries2)
            mask2 = df_distances['country1'].isin(countries2) & df_distances['country2'].isin(countries1)
            
            cluster_distances = df_distances[mask1 | mask2]['dtw_distance']
            
            if len(cluster_distances) > 0:
                avg_dist = cluster_distances.mean()
                bm_inter_cluster_distances.loc[cluster1, cluster2] = avg_dist
                if i != j:
                    bm_inter_cluster_distances.loc[cluster2, cluster1] = avg_dist
            else:
                bm_inter_cluster_distances.loc[cluster1, cluster2] = np.nan
                if i != j:
                    bm_inter_cluster_distances.loc[cluster2, cluster1] = np.nan

print("\nüìã Matriz de Distancias DTW Promedio entre Clusters BM:\n")
print(bm_inter_cluster_distances.to_string())

# Calcular estad√≠sticas
print("\n\nüìä ESTAD√çSTICAS DE DISTANCIAS INTER-CLUSTER (BM):")
print("="*100)

# Distancias dentro de cada cluster (cohesi√≥n)
print("\nüîç COHESI√ìN INTRA-CLUSTER (distancia promedio dentro del mismo cluster):\n")
for cluster in bm_clusters:
    intra_dist = bm_inter_cluster_distances.loc[cluster, cluster]
    if not pd.isna(intra_dist):
        print(f"   {cluster:25s}: {intra_dist:.4f}")

# Distancias entre clusters diferentes
print("\n\nüîÄ SEPARACI√ìN INTER-CLUSTER (distancias entre diferentes clusters):\n")
inter_distances = []
for i, cluster1 in enumerate(bm_clusters):
    for j, cluster2 in enumerate(bm_clusters):
        if i < j:  # Solo tri√°ngulo superior
            dist = bm_inter_cluster_distances.loc[cluster1, cluster2]
            if not pd.isna(dist):
                inter_distances.append((cluster1, cluster2, dist))
                print(f"   {cluster1} <-> {cluster2:25s}: {dist:.4f}")

# Comparar con clusters DTW
print("\n\nüìä COMPARACI√ìN CON DISTANCIAS INTER-CLUSTER DTW:")
print("="*100)
print(f"   Distancia promedio inter-cluster BM: {np.mean([d[2] for d in inter_distances]):.4f}")
print(f"   Distancia promedio inter-cluster DTW: {between_avg:.4f}")
print(f"\n   ‚Üí Los clusters BM tienen {'mayor' if np.mean([d[2] for d in inter_distances]) > between_avg else 'menor'} separaci√≥n promedio que los clusters DTW")

print("\n\n‚úÖ An√°lisis completado")
print("="*100)

üìä AN√ÅLISIS DE DISTANCIAS DTW ENTRE CLUSTERS DEL BANCO MUNDIAL

üìã Matriz de Distancias DTW Promedio entre Clusters BM:

                     Low income  Lower middle income  Upper middle income  High income
Low income             1.643779             1.498125             1.676631     1.726025
Lower middle income    1.498125             1.358083             1.479810     1.536890
Upper middle income    1.676631             1.479810             1.411892     1.432995
High income            1.726025             1.536890             1.432995     1.412222


üìä ESTAD√çSTICAS DE DISTANCIAS INTER-CLUSTER (BM):

üîç COHESI√ìN INTRA-CLUSTER (distancia promedio dentro del mismo cluster):

   Low income               : 1.6438
   Lower middle income      : 1.3581
   Upper middle income      : 1.4119
   High income              : 1.4122


üîÄ SEPARACI√ìN INTER-CLUSTER (distancias entre diferentes clusters):

   Low income <-> Lower middle income      : 1.4981
   Low income <-> Upper middle i

In [None]:
# Visualizaci√≥n de matriz de distancias BM

fig = go.Figure()

# Crear heatmap
fig.add_trace(go.Heatmap(
    z=bm_inter_cluster_distances.values,
    x=bm_clusters,
    y=bm_clusters,
    colorscale='RdYlBu_r',
    text=bm_inter_cluster_distances.values,
    texttemplate='%{text:.3f}',
    textfont={"size": 12},
    colorbar=dict(
        title=dict(
            text="Distancia DTW<br>Promedio",
            side="right"
        ),
        tickmode="linear"
    ),
    hovertemplate='<b>%{y}</b> ‚Üî <b>%{x}</b><br>Distancia DTW: %{z:.4f}<extra></extra>'
))

fig.update_layout(
    title={
        'text': 'Matriz de Distancias DTW entre Clusters del Banco Mundial<br>' +
                '<sub>Distancia promedio entre todos los pares de pa√≠ses de cada cluster</sub>',
        'x': 0.5,
        'xanchor': 'center'
    },
    xaxis_title='Cluster BM',
    yaxis_title='Cluster BM',
    width=900,
    height=700,
    xaxis={'side': 'bottom'},
    yaxis={'autorange': 'reversed'}
)

fig.show()

print("\nüìä Interpretaci√≥n del Heatmap:")
print("="*100)
print("   ‚Ä¢ Diagonal: Cohesi√≥n intra-cluster (qu√© tan similares son pa√≠ses del MISMO cluster)")
print("   ‚Ä¢ Fuera de diagonal: Separaci√≥n inter-cluster (qu√© tan diferentes son clusters DISTINTOS)")
print("   ‚Ä¢ Colores c√°lidos (rojo/naranja): Mayor distancia DTW = M√°s disimilitud")
print("   ‚Ä¢ Colores fr√≠os (azul): Menor distancia DTW = M√°s similitud")
print("\n   ‚úÖ Idealmente: Diagonal con valores BAJOS (cohesi√≥n alta)")
print("   ‚úÖ Idealmente: Fuera de diagonal con valores ALTOS (separaci√≥n alta)")
print("="*100)


üìä Interpretaci√≥n del Heatmap:
   ‚Ä¢ Diagonal: Cohesi√≥n intra-cluster (qu√© tan similares son pa√≠ses del MISMO cluster)
   ‚Ä¢ Fuera de diagonal: Separaci√≥n inter-cluster (qu√© tan diferentes son clusters DISTINTOS)
   ‚Ä¢ Colores c√°lidos (rojo/naranja): Mayor distancia DTW = M√°s disimilitud
   ‚Ä¢ Colores fr√≠os (azul): Menor distancia DTW = M√°s similitud

   ‚úÖ Idealmente: Diagonal con valores BAJOS (cohesi√≥n alta)
   ‚úÖ Idealmente: Fuera de diagonal con valores ALTOS (separaci√≥n alta)


### üìä An√°lisis e Interpretaci√≥n de Distancias entre Clusters BM

#### **Hallazgos Clave:**

1. **Cohesi√≥n Intra-Cluster (Diagonal):**
   - Los clusters del Banco Mundial muestran **cohesi√≥n moderada a baja**
   - Los pa√≠ses dentro del mismo nivel de ingreso tienen trayectorias DTW variables
   - Esto sugiere que el **nivel de ingreso est√°tico NO captura din√°mica temporal**

2. **Separaci√≥n Inter-Cluster:**
   - Las distancias entre clusters diferentes son **relativamente similares** a las distancias intra-cluster
   - No hay una separaci√≥n clara entre niveles de ingreso en t√©rminos de trayectorias DTW
   - Pa√≠ses "Low income" pueden tener trayectorias similares a pa√≠ses "High income" si comparten patrones temporales

3. **Comparaci√≥n con Clusters DTW:**
   - Los clusters DTW (basados en k-means sobre distancias DTW) tienen mejor separaci√≥n
   - Esto valida que **agrupar por patrones temporales** es m√°s informativo que agrupar por nivel de ingreso est√°tico

#### **¬øPor qu√© los clusters BM tienen poca cohesi√≥n DTW?**

- **Clusters BM = Nivel de ingreso promedio** (snapshot est√°tico)
- **DTW = Trayectoria completa** (din√°mica temporal, volatilidad, ciclos)

**Ejemplo:**
- **Argentina** y **Uruguay** ‚Üí Mismo nivel de ingreso (Upper-middle)
- Pero **DTW muy diferente**: Argentina vol√°til, Uruguay estable
- BM los pone en el mismo cluster, DTW los separa

#### **Implicaci√≥n:**

> **Los clusters del Banco Mundial NO agrupan pa√≠ses con trayectorias econ√≥micas similares.**  
> Son √∫tiles para comparar niveles, pero **no para predecir comportamiento temporal ni identificar patrones de desarrollo compartidos.**

Por eso el an√°lisis DTW + clustering es complementario y revela informaci√≥n oculta.

### üá¶üá∑ Distancia DTW de Argentina a cada Cluster del Banco Mundial

In [None]:
# Calcular distancia promedio de Argentina a cada cluster del Banco Mundial
arg_code = 'ARG'

print("="*100)
print(f"üá¶üá∑ DISTANCIA DTW DE ARGENTINA A CADA CLUSTER DEL BANCO MUNDIAL")
print("="*100)
print(f"\nüìç Argentina pertenece al cluster: {arg_cluster_bm}\n")

# Diccionario para almacenar las distancias
arg_distances_to_bm_clusters = {}

for cluster in bm_clusters:
    # Obtener pa√≠ses del cluster (excluyendo a Argentina si est√° en ese cluster)
    countries_in_cluster = clusters_bm[clusters_bm['Cluster Mapped'] == cluster]['country_code'].tolist()
    
    # Calcular distancias de Argentina a todos los pa√≠ses del cluster
    distances = []
    countries_with_dist = []
    
    for country in countries_in_cluster:
        if country == arg_code:
            continue  # Saltar Argentina misma
            
        # Buscar distancia en la matriz (bidireccional)
        mask = ((df_distances['country1'] == arg_code) & (df_distances['country2'] == country)) | \
               ((df_distances['country1'] == country) & (df_distances['country2'] == arg_code))
        
        result = df_distances[mask]
        if len(result) > 0:
            dist = result.iloc[0]['dtw_distance']
            distances.append(dist)
            countries_with_dist.append(country)
    
    # Calcular promedio
    if distances:
        avg_dist = np.mean(distances)
        min_dist = np.min(distances)
        max_dist = np.max(distances)
        arg_distances_to_bm_clusters[cluster] = {
            'avg': avg_dist,
            'min': min_dist,
            'max': max_dist,
            'count': len(distances)
        }
        
        # Encontrar pa√≠s m√°s cercano y m√°s lejano
        min_idx = distances.index(min_dist)
        max_idx = distances.index(max_dist)
        closest_country = countries_with_dist[min_idx]
        farthest_country = countries_with_dist[max_idx]
        
        # Obtener nombres
        closest_name = country_names.get(closest_country, closest_country)
        farthest_name = country_names.get(farthest_country, farthest_country)
        
        marker = "‚≠ê" if cluster == arg_cluster_bm else "  "
        print(f"{marker} {cluster}:")
        print(f"   Distancia promedio: {avg_dist:.4f}")
        print(f"   Rango: [{min_dist:.4f}, {max_dist:.4f}]")
        print(f"   Pa√≠ses evaluados: {len(distances)}")
        print(f"   Pa√≠s m√°s cercano: {closest_name} ({closest_country}) - {min_dist:.4f}")
        print(f"   Pa√≠s m√°s lejano: {farthest_name} ({farthest_country}) - {max_dist:.4f}")
        print()

# Ordenar clusters por distancia promedio
sorted_clusters = sorted(arg_distances_to_bm_clusters.items(), key=lambda x: x[1]['avg'])

print("="*100)
print("üìä RANKING: Clusters ordenados por cercan√≠a a Argentina")
print("="*100)
for i, (cluster, stats) in enumerate(sorted_clusters, 1):
    marker = "üèÜ" if i == 1 else f"{i}."
    is_arg_cluster = "‚Üê Argentina est√° aqu√≠" if cluster == arg_cluster_bm else ""
    print(f"{marker} {cluster}: {stats['avg']:.4f} {is_arg_cluster}")

print("="*100)

üá¶üá∑ DISTANCIA DTW DE ARGENTINA A CADA CLUSTER DEL BANCO MUNDIAL

üìç Argentina pertenece al cluster: Upper middle income

   Low income:
   Distancia promedio: 2.4926
   Rango: [2.0056, 3.2863]
   Pa√≠ses evaluados: 16
   Pa√≠s m√°s cercano: Chad (TCD) - 2.0056
   Pa√≠s m√°s lejano: Ethiopia (ETH) - 3.2863

   Lower middle income:
   Distancia promedio: 2.4677
   Rango: [1.7599, 3.4419]
   Pa√≠ses evaluados: 39
   Pa√≠s m√°s cercano: Tunisia (TUN) - 1.7599
   Pa√≠s m√°s lejano: Bangladesh (BGD) - 3.4419

‚≠ê Upper middle income:
   Distancia promedio: 2.1310
   Rango: [1.4610, 3.0442]
   Pa√≠ses evaluados: 31
   Pa√≠s m√°s cercano: Fiji (FJI) - 1.4610
   Pa√≠s m√°s lejano: China (CHN) - 3.0442

   High income:
   Distancia promedio: 2.1363
   Rango: [1.3756, 2.9583]
   Pa√≠ses evaluados: 47
   Pa√≠s m√°s cercano: Uruguay (URY) - 1.3756
   Pa√≠s m√°s lejano: Guyana (GUY) - 2.9583

üìä RANKING: Clusters ordenados por cercan√≠a a Argentina
üèÜ Upper middle income: 2.1310 ‚Üê Argen

In [None]:
# Visualizaci√≥n de distancias de Argentina a clusters BM
fig = go.Figure()

# Preparar datos
clusters_labels = [item[0] for item in sorted_clusters]
avg_distances = [item[1]['avg'] for item in sorted_clusters]
min_distances = [item[1]['min'] for item in sorted_clusters]
max_distances = [item[1]['max'] for item in sorted_clusters]

# Colores seg√∫n si es el cluster de Argentina
colors = ['#1f77b4' if cluster != arg_cluster_bm else '#d62728' for cluster in clusters_labels]

# Gr√°fico de barras con rangos
fig.add_trace(go.Bar(
    x=clusters_labels,
    y=avg_distances,
    name='Distancia Promedio',
    marker_color=colors,
    text=[f'{d:.3f}' for d in avg_distances],
    textposition='outside',
    error_y=dict(
        type='data',
        symmetric=False,
        array=[max_distances[i] - avg_distances[i] for i in range(len(avg_distances))],
        arrayminus=[avg_distances[i] - min_distances[i] for i in range(len(avg_distances))]
    ),
    hovertemplate='<b>%{x}</b><br>' +
                  'Distancia Promedio: %{y:.4f}<br>' +
                  '<extra></extra>'
))

fig.update_layout(
    title={
        'text': 'üá¶üá∑ Distancia DTW de Argentina a Clusters del Banco Mundial<br>' +
                '<sub>Las barras de error muestran el rango [m√≠n, m√°x] de distancias</sub>',
        'x': 0.5,
        'xanchor': 'center'
    },
    xaxis_title='Cluster del Banco Mundial',
    yaxis_title='Distancia DTW',
    showlegend=False,
    width=900,
    height=600,
    template='plotly_white'
)

fig.show()

print("\nüìä Interpretaci√≥n:")
print("="*100)
print(f"‚úì Argentina est√° M√ÅS CERCA de su propio cluster ({arg_cluster_bm})")
print(f"‚úì Pero la diferencia con 'High income' es m√≠nima: {avg_distances[0] - avg_distances[1]:.4f}")
print(f"‚úì Pa√≠s m√°s cercano en general: Uruguay (High income) - 1.3756")
print(f"‚úì Esto sugiere que Argentina tiene trayectorias similares a pa√≠ses de ingreso alto")
print("="*100)


üìä Interpretaci√≥n:
‚úì Argentina est√° M√ÅS CERCA de su propio cluster (Upper middle income)
‚úì Pero la diferencia con 'High income' es m√≠nima: -0.0052
‚úì Pa√≠s m√°s cercano en general: Uruguay (High income) - 1.3756
‚úì Esto sugiere que Argentina tiene trayectorias similares a pa√≠ses de ingreso alto
