# 游늽 05 S칤ntesis de Resultados y Conclusiones

Este notebook consolida los hallazgos de los an치lisis anteriores para generar un informe final coherente sobre el Laboratorio Integrador de la comuna de **San Bernardo**.

---

In [None]:
import geopandas as gpd
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sqlalchemy import create_engine
import os
from dotenv import load_dotenv
from pathlib import Path

load_dotenv("../.env")
db_url = f"postgresql://{os.getenv('POSTGRES_USER')}:{os.getenv('POSTGRES_PASSWORD')}@{os.getenv('POSTGRES_HOST', 'localhost')}:5432/{os.getenv('POSTGRES_DB')}"
engine = create_engine(db_url)

# Configuraci칩n de visualizaci칩n
plt.style.use('ggplot')
print("Herramientas de s칤ntesis preparadas.")

## 1. Consolidaci칩n de Resultados Metab칩licos

Extraemos las m칠tricas clave obtenidas en las etapas de **An치lisis Espacial** y **Machine Learning**.

In [None]:
# Cargar predicciones finales
df = gpd.read_postgis("SELECT * FROM raw_data.ml_predictions", engine, geom_col='geometry')

summary_stats = {
    "Total Celdas": len(df),
    "Amenidades Reales": int(df['count'].sum()),
    "Amenidades Predichas": round(float(df['prediction'].sum()), 2),
    "Error Medio (MAE)": round(float((df['prediction'] - df['count']).abs().mean()), 4),
    "M치xima Densidad Real": int(df['count'].max()),
    "M치xima Densidad Predicha": round(float(df['prediction'].max()), 2)
}

pd.DataFrame([summary_stats]).T.rename(columns={0: 'Valor'})

## 2. Distribuci칩n de Amenidades y Clusters

Comparemos visualmente la densidad observada frente a los clusters identificados por el an치lisis LISA.

In [None]:
fig, axes = plt.subplots(1, 2, figsize=(18, 8))

# Mapa 1: Densidad Real
df.plot(column='count', ax=axes[0], cmap='YlOrRd', legend=True, 
        legend_kwds={'label': "N칰mero de Amenidades"})
axes[0].set_title("Distribuci칩n Real de Servicios")
axes[0].axis('off')

# Mapa 2: Clusters LISA
df.plot(column='cluster_type', ax=axes[1], categorical=True, 
        legend=True, cmap='Set1', alpha=0.8)
axes[1].set_title("Hot Spots y Cold Spots (LISA)")
axes[1].axis('off')

plt.tight_layout()
plt.show()

## 3. An치lisis de Desempe침o del Modelo

El siguiente gr치fico muestra el ajuste del modelo de Random Forest. Las celdas sobre la l칤nea diagonal indican predicciones perfectas.

In [None]:
plt.figure(figsize=(10, 6))
sns.regplot(x=df['count'], y=df['prediction'], scatter_kws={'alpha':0.3}, line_kws={'color':'red'})
plt.xlabel("Observado (Real)")
plt.ylabel("Predicho (Modelo)")
plt.title("Ajuste del Modelo de Machine Learning")
plt.show()

## 4. Hallazgos Principales

### 游늸 Patrones Espaciales
- Se confirma la existencia de un **nucleo central robusto** en San Bernardo (HH) donde los servicios se retroalimentan entre s칤.
- Existe una periferia con servicios limitados (LL), indicando una oportunidad para la expansi칩n de infraestructura urbana.

### 游뱄 Capacidad Predictiva
- El factor determinante para la ubicaci칩n de servicios es la **densidad de edificios**, seguido por la **red vial**.
- El modelo es altamente eficaz para predecir zonas de baja densidad, pero tiende a subestimar el conteo en los puntos de alt칤sima concentraci칩n del centro c칤vico.

## 5. Recomendaciones Finales

1. **Focalizaci칩n:** Priorizar inversiones en las zonas identificadas como *Low-Low* (Cold Spots) que presenten una densidad habitacional creciente.
2. **Escalabilidad:** El modelo puede aplicarse a comunas similares de la Regi칩n Metropolitana para comparar el nivel de equidad territorial.
3. **Pr칩ximos Pasos:** Integrar capas de **Sentinel-2** (NDVI) para analizar la relaci칩n entre 치reas verdes y la oferta de servicios urbanos.