# üìì 05 S√≠ntesis de Resultados y Conclusiones

Este notebook consolida los hallazgos de los an√°lisis anteriores (Acquisici√≥n, ESDA, Geoestad√≠stica y ML) para generar una visi√≥n integral de la distribuci√≥n de servicios en **San Bernardo**.

---

In [1]:
import geopandas as gpd
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sqlalchemy import create_engine
import os
from dotenv import load_dotenv

# --- CONFIGURACI√ìN DE ENTORNO ---
load_dotenv("../.env")
db_url = f"postgresql://{os.getenv('POSTGRES_USER')}:{os.getenv('POSTGRES_PASSWORD')}@{os.getenv('POSTGRES_HOST', 'localhost')}:5432/{os.getenv('POSTGRES_DB')}"
engine = create_engine(db_url)

plt.style.use('ggplot')
print("Herramientas de s√≠ntesis preparadas.")

## 1. Consolidaci√≥n de M√©tricas

Extraemos las estad√≠sticas clave comparando los datos reales vs las predicciones del modelo.

In [2]:
# --- CARGA DE PREDICCIONES FINALES ---
df = gpd.read_postgis("SELECT * FROM raw_data.ml_predictions", engine, geom_col='geometry')

# --- C√ÅLCULO DE M√âTRICAS DE S√çNTESIS ---
summary_stats = {
    "Total Celdas Analizadas": len(df),
    "Total Amenidades Reales (OSM)": int(df['count'].sum()),
    "Total Amenidades Predichas": round(float(df['prediction'].sum()), 2),
    "Error Absoluto Medio (MAE)": round(float((df['prediction'] - df['count']).abs().mean()), 4),
    "M√°xima Densidad Detectada": int(df['count'].max())
}

display(pd.DataFrame([summary_stats]).T.rename(columns={0: 'Valor'}))

## 2. Comparativa Visual: Realidad vs Patrones

Visualizamos la densidad de servicios frente a los clusters detectados por LISA.

In [3]:
fig, axes = plt.subplots(1, 2, figsize=(18, 8))

# --- MAPA 1: DENSIDAD REAL ---
df.plot(column='count', ax=axes[0], cmap='YlOrRd', legend=True, 
        legend_kwds={'label': "N√∫mero de Amenidades"})
axes[0].set_title("Distribuci√≥n Real de Servicios (Densidad)")
axes[0].axis('off')

# --- MAPA 2: CLUSTERS ESPACIALES (LISA) ---
# Cargamos los tipos de cluster desde la tabla de clusters directamente si est√° disponible
df.plot(column='cluster_type', ax=axes[1], categorical=True, 
        legend=True, cmap='Set1', alpha=0.8)
axes[1].set_title("Zonas de Inter√©s Espacial (Hot Spots / LISA)")
axes[1].axis('off')

plt.tight_layout()
plt.show()