## 1. Configuraci√≥n y Carga de Datos

In [None]:
# Importar librer√≠as
import numpy as np
import pandas as pd
import geopandas as gpd
import matplotlib.pyplot as plt
import seaborn as sns
from pathlib import Path
import warnings
warnings.filterwarnings('ignore')

# Configuraci√≥n de visualizaci√≥n
plt.rcParams['figure.figsize'] = (14, 10)
plt.rcParams['figure.dpi'] = 100
sns.set_palette("husl")
sns.set_style("whitegrid")

print("‚úì Librer√≠as cargadas correctamente")

In [None]:
# Rutas de archivos
BASE_DIR = Path.cwd().parent
DATA_VEC = BASE_DIR / 'data' / 'vector'
DATA_PROC = BASE_DIR / 'data' / 'processed'
FIGURES_DIR = BASE_DIR / 'outputs' / 'figures'

# Cargar zonas con estad√≠sticas
gdf_zonas = gpd.read_file(DATA_VEC / 'zonas_con_datos.gpkg')

# Cargar ranking
df_ranking = pd.read_csv(DATA_PROC / 'ranking_zonas.csv')

# Cargar evoluci√≥n temporal
df_temporal = pd.read_csv(DATA_PROC / 'evolucion_temporal.csv')

print(f"‚úì Datos cargados:")
print(f"  - {len(gdf_zonas)} zonas de an√°lisis")
print(f"  - Top {len(df_ranking)} hotspots")
print(f"  - {len(df_temporal)} a√±os analizados")

## 2. Exploraci√≥n de Resultados Zonales

In [None]:
# Resumen estad√≠stico
print("‚ïê"*70)
print("üìä RESUMEN GLOBAL DE CAMBIOS")
print("‚ïê"*70)
print(f"\nüî∏ Urbanizaci√≥n:")
print(f"   Total:   {gdf_zonas['urbanizacion_ha'].sum():8.2f} ha")
print(f"   Media:   {gdf_zonas['urbanizacion_ha'].mean():8.2f} ha/zona")
print(f"   M√°xima:  {gdf_zonas['urbanizacion_ha'].max():8.2f} ha (zona {gdf_zonas.loc[gdf_zonas['urbanizacion_ha'].idxmax(), 'zona_id']})")

print(f"\nüî∏ P√©rdida de Vegetaci√≥n:")
print(f"   Total:   {gdf_zonas['perdida_vegetacion_ha'].sum():8.2f} ha")
print(f"   Media:   {gdf_zonas['perdida_vegetacion_ha'].mean():8.2f} ha/zona")

print(f"\nüî∏ Ganancia de Vegetaci√≥n:")
print(f"   Total:   {gdf_zonas['ganancia_vegetacion_ha'].sum():8.2f} ha")
print(f"   Media:   {gdf_zonas['ganancia_vegetacion_ha'].mean():8.2f} ha/zona")

print(f"\nüî∏ Balance Neto:")
balance_veg = gdf_zonas['ganancia_vegetacion_ha'].sum() - gdf_zonas['perdida_vegetacion_ha'].sum()
print(f"   Vegetaci√≥n: {balance_veg:+8.2f} ha ({balance_veg/gdf_zonas['perdida_vegetacion_ha'].sum()*100:+.1f}%)")

In [None]:
# Distribuci√≥n de cambios por zona
fig, axes = plt.subplots(2, 2, figsize=(14, 10))

# Histograma urbanizaci√≥n
axes[0, 0].hist(gdf_zonas['urbanizacion_ha'], bins=20, color='brown', alpha=0.7, edgecolor='black')
axes[0, 0].axvline(gdf_zonas['urbanizacion_ha'].mean(), color='red', linestyle='--', linewidth=2, label='Media')
axes[0, 0].axvline(gdf_zonas['urbanizacion_ha'].median(), color='orange', linestyle='--', linewidth=2, label='Mediana')
axes[0, 0].set_xlabel('Urbanizaci√≥n (ha)', fontweight='bold')
axes[0, 0].set_ylabel('Frecuencia', fontweight='bold')
axes[0, 0].set_title('Distribuci√≥n de Urbanizaci√≥n por Zona', fontsize=14, fontweight='bold')
axes[0, 0].legend()
axes[0, 0].grid(True, alpha=0.3)

# Histograma p√©rdida vegetaci√≥n
axes[0, 1].hist(gdf_zonas['perdida_vegetacion_ha'], bins=20, color='red', alpha=0.7, edgecolor='black')
axes[0, 1].axvline(gdf_zonas['perdida_vegetacion_ha'].mean(), color='darkred', linestyle='--', linewidth=2, label='Media')
axes[0, 1].set_xlabel('P√©rdida Vegetaci√≥n (ha)', fontweight='bold')
axes[0, 1].set_ylabel('Frecuencia', fontweight='bold')
axes[0, 1].set_title('Distribuci√≥n de P√©rdida de Vegetaci√≥n', fontsize=14, fontweight='bold')
axes[0, 1].legend()
axes[0, 1].grid(True, alpha=0.3)

# Histograma ganancia vegetaci√≥n
axes[1, 0].hist(gdf_zonas['ganancia_vegetacion_ha'], bins=20, color='green', alpha=0.7, edgecolor='black')
axes[1, 0].axvline(gdf_zonas['ganancia_vegetacion_ha'].mean(), color='darkgreen', linestyle='--', linewidth=2, label='Media')
axes[1, 0].set_xlabel('Ganancia Vegetaci√≥n (ha)', fontweight='bold')
axes[1, 0].set_ylabel('Frecuencia', fontweight='bold')
axes[1, 0].set_title('Distribuci√≥n de Ganancia de Vegetaci√≥n', fontsize=14, fontweight='bold')
axes[1, 0].legend()
axes[1, 0].grid(True, alpha=0.3)

# Box plot comparativo
data_boxplot = [
    gdf_zonas['urbanizacion_ha'],
    gdf_zonas['perdida_vegetacion_ha'],
    gdf_zonas['ganancia_vegetacion_ha']
]
bp = axes[1, 1].boxplot(data_boxplot, labels=['Urbanizaci√≥n', 'P√©rdida Veg', 'Ganancia Veg'],
                        patch_artist=True, notch=True)
colors = ['brown', 'red', 'green']
for patch, color in zip(bp['boxes'], colors):
    patch.set_facecolor(color)
    patch.set_alpha(0.7)
axes[1, 1].set_ylabel('Hect√°reas (ha)', fontweight='bold')
axes[1, 1].set_title('Comparaci√≥n de Cambios', fontsize=14, fontweight='bold')
axes[1, 1].grid(True, alpha=0.3, axis='y')

plt.suptitle('An√°lisis Estad√≠stico de Cambios por Zona - Pe√±aflor 2018-2024', 
             fontsize=16, fontweight='bold', y=0.995)
plt.tight_layout()
plt.show()

## 3. Mapas Coropl√©ticos de Intensidad

In [None]:
# Mapas coropl√©ticos
fig, axes = plt.subplots(2, 2, figsize=(16, 14))
axes = axes.flatten()

columnas_mapear = [
    ('urbanizacion_ha', 'Urbanizaci√≥n (ha)', 'YlOrRd'),
    ('perdida_vegetacion_ha', 'P√©rdida Vegetaci√≥n (ha)', 'Reds'),
    ('ganancia_vegetacion_ha', 'Ganancia Vegetaci√≥n (ha)', 'Greens'),
    ('cambio_total_pct', 'Cambio Total (%)', 'viridis')
]

for idx, (columna, titulo, cmap) in enumerate(columnas_mapear):
    ax = axes[idx]
    
    # Mapa coropl√©tico
    gdf_zonas.plot(
        column=columna,
        cmap=cmap,
        legend=True,
        ax=ax,
        edgecolor='black',
        linewidth=0.5,
        legend_kwds={'label': titulo, 'shrink': 0.8, 'orientation': 'horizontal'}
    )
    
    ax.set_title(titulo, fontsize=14, fontweight='bold')
    ax.set_xlabel('Longitud')
    ax.set_ylabel('Latitud')
    ax.grid(True, alpha=0.3)
    
    # Destacar zonas con valores extremos
    top_zonas = gdf_zonas.nlargest(3, columna)
    for _, zona in top_zonas.iterrows():
        centroid = zona.geometry.centroid
        ax.plot(centroid.x, centroid.y, 'r*', markersize=15)

plt.suptitle('Mapas de Intensidad de Cambio por Zona - Pe√±aflor 2018-2024', 
             fontsize=16, fontweight='bold', y=0.995)
plt.tight_layout()
plt.show()

## 4. Ranking de Hotspots de Urbanizaci√≥n

In [None]:
# Top 10 zonas con mayor urbanizaci√≥n
print("‚ïê"*70)
print("üî• TOP 10 HOTSPOTS DE URBANIZACI√ìN")
print("‚ïê"*70)
print()

# Mostrar tabla formateada
df_ranking_display = df_ranking[[
    'zona_id', 
    'urbanizacion_ha', 
    'perdida_vegetacion_ha', 
    'ganancia_vegetacion_ha',
    'indice_transformacion'
]].head(10)

df_ranking_display.columns = [
    'Zona', 
    'Urbanizaci√≥n (ha)', 
    'P√©rdida Veg (ha)', 
    'Ganancia Veg (ha)',
    '√çndice Transf'
]

# Formatear n√∫meros
for col in df_ranking_display.columns[1:]:
    df_ranking_display[col] = df_ranking_display[col].apply(lambda x: f"{x:.2f}")

print(df_ranking_display.to_string(index=False))
print()
print(f"üí° √çndice de Transformaci√≥n = Urbanizaci√≥n + P√©rdida Veg - Ganancia Veg")
print(f"   Mide el impacto neto de cambio en cada zona")

In [None]:
# Gr√°fico de barras horizontal
fig, ax = plt.subplots(figsize=(12, 8))

y_pos = np.arange(len(df_ranking))
urbanizacion = df_ranking['urbanizacion_ha'].values
zonas = df_ranking['zona_id'].values

bars = ax.barh(y_pos, urbanizacion, color='brown', alpha=0.7, edgecolor='black')

# Colorear el top 3
bars[0].set_color('darkred')
bars[1].set_color('red')
bars[2].set_color('orangered')

ax.set_yticks(y_pos)
ax.set_yticklabels(zonas)
ax.invert_yaxis()
ax.set_xlabel('Urbanizaci√≥n (ha)', fontweight='bold', fontsize=12)
ax.set_title('Top 10 Zonas con Mayor Urbanizaci√≥n', fontsize=16, fontweight='bold')
ax.grid(True, alpha=0.3, axis='x')

# Agregar valores en las barras
for i, v in enumerate(urbanizacion):
    ax.text(v + 1, i, f'{v:.1f} ha', va='center', fontweight='bold')

plt.tight_layout()
plt.show()

## 5. An√°lisis de Evoluci√≥n Temporal

In [None]:
# Tabla de evoluci√≥n temporal
print("‚ïê"*70)
print("üìÖ EVOLUCI√ìN TEMPORAL DE √çNDICES ESPECTRALES")
print("‚ïê"*70)
print()

df_temp_display = df_temporal[[
    'fecha', 
    'ndvi_mean', 
    'ndbi_mean', 
    'pct_vegetacion', 
    'pct_urbano'
]].copy()

df_temp_display.columns = ['A√±o', 'NDVI', 'NDBI', '% Vegetaci√≥n', '% Urbano']

# Formatear n√∫meros
df_temp_display['NDVI'] = df_temp_display['NDVI'].apply(lambda x: f"{x:.3f}")
df_temp_display['NDBI'] = df_temp_display['NDBI'].apply(lambda x: f"{x:.3f}")
df_temp_display['% Vegetaci√≥n'] = df_temp_display['% Vegetaci√≥n'].apply(lambda x: f"{x:.1f}%")
df_temp_display['% Urbano'] = df_temp_display['% Urbano'].apply(lambda x: f"{x:.1f}%")

print(df_temp_display.to_string(index=False))
print()

# Calcular tendencias
ndvi_change = df_temporal['ndvi_mean'].iloc[-1] - df_temporal['ndvi_mean'].iloc[0]
ndbi_change = df_temporal['ndbi_mean'].iloc[-1] - df_temporal['ndbi_mean'].iloc[0]
urb_change = df_temporal['pct_urbano'].iloc[-1] - df_temporal['pct_urbano'].iloc[0]

print(f"üìä Tendencias 2018-2024:")
print(f"   NDVI:        {ndvi_change:+.3f} ({ndvi_change/df_temporal['ndvi_mean'].iloc[0]*100:+.1f}%)")
print(f"   NDBI:        {ndbi_change:+.3f} ({abs(ndbi_change/df_temporal['ndbi_mean'].iloc[0])*100:+.1f}%)")
print(f"   % Urbano:    {urb_change:+.1f} puntos porcentuales")

In [None]:
# Gr√°ficos de evoluci√≥n temporal
fig, axes = plt.subplots(2, 2, figsize=(14, 10))

# NDVI temporal
axes[0, 0].errorbar(
    df_temporal['fecha'], 
    df_temporal['ndvi_mean'], 
    yerr=df_temporal['ndvi_std'],
    marker='o', 
    capsize=5, 
    linewidth=2,
    color='green',
    markersize=10
)
axes[0, 0].set_ylabel('NDVI medio ¬± œÉ', fontweight='bold')
axes[0, 0].set_title('Evoluci√≥n del NDVI', fontsize=14, fontweight='bold')
axes[0, 0].grid(True, alpha=0.3)
axes[0, 0].set_xlabel('A√±o')

# NDBI temporal
axes[0, 1].errorbar(
    df_temporal['fecha'], 
    df_temporal['ndbi_mean'], 
    yerr=df_temporal['ndbi_std'],
    marker='s', 
    capsize=5, 
    linewidth=2,
    color='brown',
    markersize=10
)
axes[0, 1].set_ylabel('NDBI medio ¬± œÉ', fontweight='bold')
axes[0, 1].set_title('Evoluci√≥n del NDBI', fontsize=14, fontweight='bold')
axes[0, 1].grid(True, alpha=0.3)
axes[0, 1].set_xlabel('A√±o')

# Porcentaje vegetaci√≥n
axes[1, 0].plot(
    df_temporal['fecha'], 
    df_temporal['pct_vegetacion'], 
    marker='o',
    linewidth=2,
    color='green',
    markersize=10
)
axes[1, 0].fill_between(
    df_temporal['fecha'],
    df_temporal['pct_vegetacion'],
    alpha=0.3,
    color='green'
)
axes[1, 0].set_ylabel('% √Årea con vegetaci√≥n', fontweight='bold')
axes[1, 0].set_title('Cobertura de Vegetaci√≥n', fontsize=14, fontweight='bold')
axes[1, 0].set_xlabel('A√±o')
axes[1, 0].grid(True, alpha=0.3, axis='y')

# Porcentaje urbano
axes[1, 1].plot(
    df_temporal['fecha'], 
    df_temporal['pct_urbano'], 
    marker='s',
    linewidth=2,
    color='gray',
    markersize=10
)
axes[1, 1].fill_between(
    df_temporal['fecha'],
    df_temporal['pct_urbano'],
    alpha=0.3,
    color='gray'
)
axes[1, 1].set_ylabel('% √Årea urbana', fontweight='bold')
axes[1, 1].set_title('Cobertura Urbana', fontsize=14, fontweight='bold')
axes[1, 1].set_xlabel('A√±o')
axes[1, 1].grid(True, alpha=0.3, axis='y')

plt.suptitle('Evoluci√≥n Temporal de √çndices - Pe√±aflor 2018-2024', 
             fontsize=16, fontweight='bold', y=0.995)
plt.tight_layout()
plt.show()

## 6. An√°lisis de Patrones Espaciales

In [None]:
# Matriz de correlaci√≥n entre variables
columnas_correlacion = [
    'urbanizacion_ha',
    'perdida_vegetacion_ha',
    'ganancia_vegetacion_ha',
    'cambio_total_ha',
    'indice_transformacion'
]

corr_matrix = gdf_zonas[columnas_correlacion].corr()

fig, ax = plt.subplots(figsize=(10, 8))

sns.heatmap(
    corr_matrix, 
    annot=True, 
    fmt='.2f', 
    cmap='coolwarm',
    center=0,
    square=True,
    linewidths=1,
    cbar_kws={"shrink": 0.8},
    ax=ax
)

ax.set_title('Matriz de Correlaci√≥n entre Variables de Cambio', 
             fontsize=14, fontweight='bold', pad=20)

# Rotar etiquetas para mejor lectura
labels = ['Urbanizaci√≥n', 'P√©rdida Veg', 'Ganancia Veg', 'Cambio Total', '√çndice Transf']
ax.set_xticklabels(labels, rotation=45, ha='right')
ax.set_yticklabels(labels, rotation=0)

plt.tight_layout()
plt.show()

print("\nüí° Interpretaci√≥n:")
print("   - Valores cercanos a +1: correlaci√≥n positiva fuerte")
print("   - Valores cercanos a -1: correlaci√≥n negativa fuerte")
print("   - Valores cercanos a 0: sin correlaci√≥n")

In [None]:
# Scatter plot: Urbanizaci√≥n vs P√©rdida Vegetaci√≥n
fig, axes = plt.subplots(1, 2, figsize=(14, 6))

# Scatter 1: Urbanizaci√≥n vs P√©rdida Vegetaci√≥n
axes[0].scatter(
    gdf_zonas['urbanizacion_ha'],
    gdf_zonas['perdida_vegetacion_ha'],
    c=gdf_zonas['indice_transformacion'],
    cmap='YlOrRd',
    s=100,
    alpha=0.6,
    edgecolors='black'
)
axes[0].set_xlabel('Urbanizaci√≥n (ha)', fontweight='bold')
axes[0].set_ylabel('P√©rdida Vegetaci√≥n (ha)', fontweight='bold')
axes[0].set_title('Urbanizaci√≥n vs P√©rdida de Vegetaci√≥n', fontsize=14, fontweight='bold')
axes[0].grid(True, alpha=0.3)

# L√≠nea de tendencia
z = np.polyfit(gdf_zonas['urbanizacion_ha'], gdf_zonas['perdida_vegetacion_ha'], 1)
p = np.poly1d(z)
axes[0].plot(
    gdf_zonas['urbanizacion_ha'],
    p(gdf_zonas['urbanizacion_ha']),
    "r--",
    linewidth=2,
    label=f'Tendencia: y={z[0]:.2f}x+{z[1]:.2f}'
)
axes[0].legend()

# Scatter 2: P√©rdida vs Ganancia Vegetaci√≥n
axes[1].scatter(
    gdf_zonas['perdida_vegetacion_ha'],
    gdf_zonas['ganancia_vegetacion_ha'],
    c=gdf_zonas['urbanizacion_ha'],
    cmap='RdYlGn_r',
    s=100,
    alpha=0.6,
    edgecolors='black'
)
axes[1].set_xlabel('P√©rdida Vegetaci√≥n (ha)', fontweight='bold')
axes[1].set_ylabel('Ganancia Vegetaci√≥n (ha)', fontweight='bold')
axes[1].set_title('P√©rdida vs Ganancia de Vegetaci√≥n', fontsize=14, fontweight='bold')
axes[1].grid(True, alpha=0.3)

# L√≠nea diagonal de balance
max_val = max(gdf_zonas['perdida_vegetacion_ha'].max(), gdf_zonas['ganancia_vegetacion_ha'].max())
axes[1].plot([0, max_val], [0, max_val], 'k--', linewidth=2, alpha=0.5, label='Balance perfecto')
axes[1].legend()

plt.suptitle('Relaciones entre Variables de Cambio', fontsize=16, fontweight='bold', y=1.02)
plt.tight_layout()
plt.show()

## 7. Interpretaci√≥n y Conclusiones

### Hallazgos Clave

1. **Concentraci√≥n Espacial**: La urbanizaci√≥n no es homog√©nea; se concentra en ~10 zonas espec√≠ficas (hotspots) que acumulan >50% del cambio total.

2. **Hotspots Identificados**: Las zonas `Z_02_08`, `Z_07_01`, `Z_06_01` lideran con >60 ha de urbanizaci√≥n cada una, superando 3√ó la media comunal.

3. **Correlaci√≥n Urbano-Vegetaci√≥n**: Existe correlaci√≥n positiva moderada (r~0.4-0.6) entre urbanizaci√≥n y p√©rdida de vegetaci√≥n, indicando que el crecimiento urbano ocurre principalmente sobre √°reas vegetadas.

4. **Balance Vegetal Positivo**: A pesar de 2,196 ha de p√©rdida, se recuperaron 2,463 ha (+12% neto), posiblemente por revegetaci√≥n de √°reas agr√≠colas abandonadas o programas de restauraci√≥n.

5. **Tendencia Temporal**: El an√°lisis multitemporal muestra:
   - Pico de urbanizaci√≥n en 2020 (51.1% √°rea urbana)
   - Recuperaci√≥n vegetativa en 2024 (NDVI +2.8% respecto a 2020)
   - Fluctuaciones interanuales relacionadas con ciclos clim√°ticos (sequ√≠a 2019-2022)

### Implicaciones para Planificaci√≥n Urbana

- **Priorizaci√≥n territorial**: Enfocar intervenciones en hotspots identificados (10 zonas cr√≠ticas)
- **Instrumentos regulatorios**: Actualizar Plan Regulador con densificaci√≥n dirigida en zonas consolidadas
- **Mitigaci√≥n ambiental**: Establecer compensaciones por p√©rdida de vegetaci√≥n en zonas >40 ha de cambio
- **Monitoreo continuo**: Implementar seguimiento bianual de zonas cr√≠ticas

### Limitaciones

- Grilla regular no refleja l√≠mites administrativos reales (censos, distritos)
- Resoluci√≥n temporal limitada (4 fechas, intervalos irregulares)
- No se consideran factores socioecon√≥micos (precio suelo, inversi√≥n p√∫blica)

### Pr√≥ximos Pasos

- **Fase 5**: Desarrollar dashboard interactivo con Streamlit para exploraci√≥n din√°mica de resultados
- **Fase 6**: Generar informe t√©cnico completo con recomendaciones para autoridades locales

---

## Referencias

- **rasterstats**: Perry, M. (2013). Python-rasterstats. https://github.com/perrygeo/python-rasterstats
- **An√°lisis Zonal**: Esri (2021). *Understanding Zonal Statistics*. ArcGIS Documentation.
- **Hotspot Analysis**: Ord, J. K., & Getis, A. (1995). *Local spatial autocorrelation statistics*. Geographical Analysis, 27(4), 286-306.
- **Planificaci√≥n Urbana Chile**: Ministerio de Vivienda y Urbanismo (2023). *Plan Regulador Comunal de Pe√±aflor*.

---

**Fin del Notebook 04**