# üìä Market Cockpit Analytics

## An√°lisis Avanzado del Mercado Inmobiliario de Barcelona

Este notebook demuestra c√≥mo utilizar las **9 vistas anal√≠ticas** creadas para el dashboard Market Cockpit.

### Vistas Disponibles:
| Vista | Registros | Descripci√≥n |
|-------|-----------|-------------|
| `v_barrio_scorecard` | 73 | M√©tricas consolidadas por barrio |
| `v_riesgo_gentrificacion` | 15,428 | Indicadores de riesgo de gentrificaci√≥n |
| `v_correlaciones_cruzadas` | 1,011 | Datos para an√°lisis de correlaciones |
| `v_affordability_detallado` | 1,011 | M√©tricas de asequibilidad |
| `v_tendencias_consolidadas` | 1,014 | Evoluci√≥n temporal de m√©tricas |
| `v_affordability_quarterly` | 2,431 | Asequibilidad trimestral |
| `v_precios_evolucion_anual` | 1,014 | Evoluci√≥n de precios |
| `v_demografia_resumen` | 657 | Resumen demogr√°fico |
| `v_gentrificacion_tendencias` | 2,780 | Tendencias de gentrificaci√≥n |


In [1]:
# Importar librer√≠as
import sqlite3
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import numpy as np
from pathlib import Path

# Configurar pandas para mostrar m√°s columnas
pd.set_option('display.max_columns', 50)
pd.set_option('display.width', 200)

# Ruta a la base de datos
DB_PATH = Path("../data/processed/database.db")

def get_connection():
    """Obtiene conexi√≥n a la base de datos."""
    return sqlite3.connect(DB_PATH)

print(f"‚úÖ Conectado a: {DB_PATH}")


‚úÖ Conectado a: ../data/processed/database.db


---
## 1Ô∏è‚É£ KPI Cr√≠ticos - v_barrio_scorecard

Esta vista consolida **todas las m√©tricas** para cada barrio, permitiendo una visi√≥n hol√≠stica.


In [2]:
# Cargar scorecard completo de barrios
query = """
SELECT 
    barrio_id,
    barrio_nombre,
    distrito_nombre,
    ultimo_anio_datos,
    precio_m2_venta_promedio,
    precio_mes_alquiler_promedio,
    poblacion_total_promedio,
    renta_mediana_promedio,
    tasa_criminalidad_1000hab_promedio,
    pct_poblacion_expuesta_65db_promedio as pct_ruido_alto,
    zona_tensionada,
    nivel_tension
FROM v_barrio_scorecard
ORDER BY precio_m2_venta_promedio DESC
"""

with get_connection() as conn:
    df_scorecard = pd.read_sql_query(query, conn)

print(f"üìä Scorecard de {len(df_scorecard)} barrios")
df_scorecard.head(10)


üìä Scorecard de 73 barrios


Unnamed: 0,barrio_id,barrio_nombre,distrito_nombre,ultimo_anio_datos,precio_m2_venta_promedio,precio_mes_alquiler_promedio,poblacion_total_promedio,renta_mediana_promedio,tasa_criminalidad_1000hab_promedio,pct_ruido_alto,zona_tensionada,nivel_tension
0,23,Sarri√†,Sarri√†-Sant Gervasi,2025,6874.114898,1666.034916,24858.0,76691.0,3.99,6.7,1.0,alta
1,21,Pedralbes,Les Corts,2025,6584.854029,1505.552059,12130.0,104774.0,7.21,13.93,1.0,alta
2,24,les Tres Torres,Sarri√†-Sant Gervasi,2025,6548.975095,2058.816964,16276.0,104774.0,3.99,20.09,1.0,alta
3,26,Sant Gervasi - Galvany,Sarri√†-Sant Gervasi,2025,6394.175071,1702.425106,47674.0,78455.0,3.99,25.7,1.0,alta
4,7,la Dreta de l'Eixample,Eixample,2025,6187.173629,1520.108127,44105.0,62584.0,13.92,34.96,1.0,alta
5,8,l'Antiga Esquerra de l'Eixample,Eixample,2025,5956.133806,1347.458555,42751.0,56867.5,13.92,41.72,1.0,alta
6,69,Diagonal Mar i el Front Mar√≠tim del Poblenou,Sant Mart√≠,2025,5789.848883,1626.464792,13453.0,53668.0,6.81,14.71,1.0,alta
7,25,Sant Gervasi - la Bonanova,Sarri√†-Sant Gervasi,2025,5701.054667,1635.478199,26135.0,91726.5,3.99,23.1,1.0,alta
8,67,la Vila Ol√≠mpica del Poblenou,Sant Mart√≠,2025,5474.638281,1633.195974,9338.0,72356.0,6.81,14.79,1.0,alta
9,19,les Corts,Les Corts,2025,5403.6427,1263.418771,45965.0,55539.0,7.21,20.09,1.0,alta


In [3]:
# Visualizaci√≥n: Top 10 barrios m√°s caros
fig = px.bar(
    df_scorecard.head(10),
    x='barrio_nombre',
    y='precio_m2_venta_promedio',
    color='distrito_nombre',
    title='üè† Top 10 Barrios M√°s Caros de Barcelona (‚Ç¨/m¬≤)',
    labels={
        'precio_m2_venta_promedio': 'Precio ‚Ç¨/m¬≤',
        'barrio_nombre': 'Barrio',
        'distrito_nombre': 'Distrito'
    },
    template='plotly_white'
)
fig.update_layout(xaxis_tickangle=-45)
fig.show()


---
## 2Ô∏è‚É£ An√°lisis de Riesgo de Gentrificaci√≥n - v_riesgo_gentrificacion

Identifica barrios con alto riesgo de gentrificaci√≥n bas√°ndose en m√∫ltiples indicadores.


In [4]:
# Cargar datos de riesgo de gentrificaci√≥n
query = """
SELECT 
    barrio_id,
    barrio_nombre,
    precio_actual,
    pct_cambio_precio_5_anios,
    renta_actual,
    pct_cambio_renta_5_anios,
    tasa_criminalidad_actual,
    score_riesgo_gentrificacion,
    categoria_riesgo
FROM v_riesgo_gentrificacion
WHERE precio_actual IS NOT NULL
ORDER BY score_riesgo_gentrificacion DESC
LIMIT 20
"""

with get_connection() as conn:
    df_riesgo = pd.read_sql_query(query, conn)

print("üö® Top 20 barrios con mayor riesgo de gentrificaci√≥n:")
df_riesgo


üö® Top 20 barrios con mayor riesgo de gentrificaci√≥n:


Unnamed: 0,barrio_id,barrio_nombre,precio_actual,pct_cambio_precio_5_anios,renta_actual,pct_cambio_renta_5_anios,tasa_criminalidad_actual,score_riesgo_gentrificacion,categoria_riesgo
0,1,el Raval,3632.05,,31729.0,,27.36,,Muy Bajo
1,1,el Raval,3632.05,,31729.0,,27.36,,Muy Bajo
2,1,el Raval,3632.05,,31729.0,,27.36,,Muy Bajo
3,1,el Raval,3632.05,,31729.0,,27.36,,Muy Bajo
4,1,el Raval,3632.05,,31729.0,,27.36,,Muy Bajo
5,1,el Raval,3632.05,,31729.0,,27.36,,Muy Bajo
6,1,el Raval,3632.05,,31729.0,,27.36,,Muy Bajo
7,1,el Raval,3632.05,,31729.0,,27.36,,Bajo
8,1,el Raval,3632.05,,31729.0,,27.36,,Bajo
9,1,el Raval,3632.05,1.255924,31729.0,,27.36,,Muy Bajo


In [5]:
# Distribuci√≥n de categor√≠as de riesgo
query = """
SELECT 
    categoria_riesgo,
    COUNT(DISTINCT barrio_id) as num_barrios
FROM v_riesgo_gentrificacion
WHERE categoria_riesgo IS NOT NULL
GROUP BY categoria_riesgo
"""

with get_connection() as conn:
    df_categorias = pd.read_sql_query(query, conn)

# Definir colores y orden
color_map = {'Alto': '#dc3545', 'Medio': '#ffc107', 'Bajo': '#17a2b8', 'Muy Bajo': '#28a745'}

fig = px.pie(
    df_categorias,
    values='num_barrios',
    names='categoria_riesgo',
    title='üéØ Distribuci√≥n de Riesgo de Gentrificaci√≥n por Categor√≠a',
    color='categoria_riesgo',
    color_discrete_map=color_map
)
fig.show()


---
## 3Ô∏è‚É£ Tendencias Temporales - v_tendencias_consolidadas

Analiza la evoluci√≥n temporal de todas las m√©tricas.


In [6]:
# Evoluci√≥n de precios promedio en Barcelona
query = """
SELECT 
    anio,
    AVG(precio_m2_venta) as precio_m2_venta_avg,
    AVG(precio_mes_alquiler) as alquiler_avg,
    AVG(renta_mediana) as renta_avg,
    AVG(tasa_criminalidad_1000hab_anual) as criminalidad_avg
FROM v_tendencias_consolidadas
WHERE anio >= 2015
GROUP BY anio
ORDER BY anio
"""

with get_connection() as conn:
    df_tendencias = pd.read_sql_query(query, conn)

print(f"üìÖ Tendencias desde 2015 hasta {df_tendencias['anio'].max()}")
df_tendencias


üìÖ Tendencias desde 2015 hasta 2025


Unnamed: 0,anio,precio_m2_venta_avg,alquiler_avg,renta_avg,criminalidad_avg
0,2015,2488.560713,664.953371,,14.164521
1,2016,2606.41201,715.135413,,14.194384
2,2017,3045.4519,799.49631,,13.833562
3,2018,3285.935151,845.60556,,16.367945
4,2019,3381.50922,881.219723,,17.664932
5,2020,3371.741446,896.415056,,17.139589
6,2021,3362.614805,846.045165,,9.236712
7,2022,3461.4584,931.557172,,13.204932
8,2023,3513.265005,1032.54126,45632.856164,16.018219
9,2024,3775.276126,1073.132995,,15.897945


In [7]:
# Gr√°fico de evoluci√≥n de precios
fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=('Precio Venta ‚Ç¨/m¬≤', 'Alquiler ‚Ç¨/mes', 'Renta Mediana ‚Ç¨', 'Criminalidad (‚Ä∞)')
)

fig.add_trace(
    go.Scatter(x=df_tendencias['anio'], y=df_tendencias['precio_m2_venta_avg'], 
               name='Precio Venta', line=dict(color='#1f77b4', width=3)),
    row=1, col=1
)

fig.add_trace(
    go.Scatter(x=df_tendencias['anio'], y=df_tendencias['alquiler_avg'], 
               name='Alquiler', line=dict(color='#ff7f0e', width=3)),
    row=1, col=2
)

fig.add_trace(
    go.Scatter(x=df_tendencias['anio'], y=df_tendencias['renta_avg'], 
               name='Renta', line=dict(color='#2ca02c', width=3)),
    row=2, col=1
)

fig.add_trace(
    go.Scatter(x=df_tendencias['anio'], y=df_tendencias['criminalidad_avg'], 
               name='Criminalidad', line=dict(color='#d62728', width=3)),
    row=2, col=2
)

fig.update_layout(
    height=600, 
    title_text='üìà Evoluci√≥n de Indicadores Clave (2015-2024)',
    showlegend=False,
    template='plotly_white'
)
fig.show()


---
## 4Ô∏è‚É£ Correlaciones Cruzadas - v_correlaciones_cruzadas

Analiza las relaciones entre diferentes variables.


In [8]:
# Cargar datos para correlaciones
query = """
SELECT 
    precio_m2_venta,
    renta_mediana,
    poblacion_total,
    edad_media,
    densidad_hab_km2,
    tasa_criminalidad_1000hab,
    nivel_lden_medio as ruido_lden,
    num_listings_airbnb
FROM v_correlaciones_cruzadas
WHERE anio >= 2020
"""

with get_connection() as conn:
    df_corr = pd.read_sql_query(query, conn)

# Calcular matriz de correlaci√≥n
correlation_matrix = df_corr.corr()

# Visualizar
fig = px.imshow(
    correlation_matrix,
    labels=dict(color="Correlaci√≥n"),
    title='üîó Matriz de Correlaciones entre Variables',
    color_continuous_scale='RdBu_r',
    zmin=-1, zmax=1,
    text_auto='.2f'
)
fig.update_layout(height=600)
fig.show()


---
## 5Ô∏è‚É£ Datos de Seguridad y Ruido

An√°lisis de criminalidad y contaminaci√≥n ac√∫stica por distrito.


In [9]:
# Criminalidad por distrito (2024)
query = """
SELECT 
    b.distrito_nombre,
    SUM(s.delitos_patrimonio) as delitos_patrimonio,
    SUM(s.delitos_seguridad_personal) as delitos_seguridad,
    AVG(s.tasa_criminalidad_1000hab) as tasa_promedio
FROM fact_seguridad s
JOIN dim_barrios b ON s.barrio_id = b.barrio_id
WHERE s.anio = 2024
GROUP BY b.distrito_nombre
ORDER BY tasa_promedio DESC
"""

with get_connection() as conn:
    df_crimen = pd.read_sql_query(query, conn)

fig = px.bar(
    df_crimen,
    x='distrito_nombre',
    y='tasa_promedio',
    color='tasa_promedio',
    title='üöî Tasa de Criminalidad por Distrito (2024)',
    labels={
        'tasa_promedio': 'Tasa por 1000 hab.',
        'distrito_nombre': 'Distrito'
    },
    color_continuous_scale='Reds',
    template='plotly_white'
)
fig.update_layout(xaxis_tickangle=-45)
fig.show()


In [10]:
# Ruido por distrito
query = """
SELECT 
    b.distrito_nombre,
    AVG(r.nivel_lden_medio) as nivel_lden_promedio,
    AVG(r.pct_poblacion_expuesta_65db) as pct_expuesta_65db
FROM fact_ruido r
JOIN dim_barrios b ON r.barrio_id = b.barrio_id
GROUP BY b.distrito_nombre
ORDER BY pct_expuesta_65db DESC
"""

with get_connection() as conn:
    df_ruido = pd.read_sql_query(query, conn)

fig = px.bar(
    df_ruido,
    x='distrito_nombre',
    y='pct_expuesta_65db',
    color='nivel_lden_promedio',
    title='üîä Exposici√≥n al Ruido por Distrito (% poblaci√≥n >65dB)',
    labels={
        'pct_expuesta_65db': '% Poblaci√≥n expuesta >65dB',
        'distrito_nombre': 'Distrito',
        'nivel_lden_promedio': 'Nivel Lden (dB)'
    },
    color_continuous_scale='YlOrRd',
    template='plotly_white'
)
fig.update_layout(xaxis_tickangle=-45)
fig.show()


---
## 6Ô∏è‚É£ Dashboard Resumen - KPIs Principales

Visi√≥n consolidada de los principales indicadores.


In [11]:
# Obtener KPIs principales
queries = {
    'precio_medio': "SELECT AVG(precio_m2_venta_promedio) FROM v_barrio_scorecard",
    'alquiler_medio': "SELECT AVG(precio_mes_alquiler_promedio) FROM v_barrio_scorecard",
    'criminalidad_media': "SELECT AVG(tasa_criminalidad_1000hab_promedio) FROM v_barrio_scorecard",
    'ruido_medio': "SELECT AVG(pct_poblacion_expuesta_65db_promedio) FROM v_barrio_scorecard",
    'barrios_alto_riesgo': "SELECT COUNT(DISTINCT barrio_id) FROM v_riesgo_gentrificacion WHERE categoria_riesgo = 'Alto'"
}

kpis = {}
with get_connection() as conn:
    for key, query in queries.items():
        result = pd.read_sql_query(query, conn).iloc[0, 0]
        kpis[key] = result if result else 0

# Mostrar KPIs
print("\n" + "="*60)
print("üìä MARKET COCKPIT - KPIs PRINCIPALES")
print("="*60)
print(f"\nüè† Precio medio de venta:     {kpis['precio_medio']:,.0f} ‚Ç¨/m¬≤")
print(f"üîë Alquiler medio:            {kpis['alquiler_medio']:,.0f} ‚Ç¨/mes")
print(f"üöî Tasa criminalidad media:   {kpis['criminalidad_media']:.1f} ‚Ä∞")
print(f"üîä Exposici√≥n ruido >65dB:    {kpis['ruido_medio']:.1f} %")
print(f"‚ö†Ô∏è  Barrios alto riesgo:       {int(kpis['barrios_alto_riesgo'])} barrios")
print("\n" + "="*60)



üìä MARKET COCKPIT - KPIs PRINCIPALES

üè† Precio medio de venta:     4,042 ‚Ç¨/m¬≤
üîë Alquiler medio:            1,020 ‚Ç¨/mes
üöî Tasa criminalidad media:   7.4 ‚Ä∞
üîä Exposici√≥n ruido >65dB:    13.8 %
‚ö†Ô∏è  Barrios alto riesgo:       0 barrios



---
## üìã Resumen de Vistas Anal√≠ticas

| Vista | Uso Principal | M√©tricas Clave |
|-------|---------------|----------------|
| `v_barrio_scorecard` | Dashboard principal | Todas consolidadas por barrio |
| `v_riesgo_gentrificacion` | Alertas de riesgo | Score y categor√≠a de riesgo |
| `v_correlaciones_cruzadas` | An√°lisis estad√≠stico | Variables para ML/correlaci√≥n |
| `v_affordability_detallado` | Asequibilidad | Price-to-income, rent burden |
| `v_tendencias_consolidadas` | Evoluci√≥n temporal | Series temporales |
| `v_affordability_quarterly` | Asequibilidad trimestral | Categor√≠as de affordability |
| `v_precios_evolucion_anual` | Precios hist√≥ricos | Venta y alquiler por a√±o |
| `v_demografia_resumen` | Demograf√≠a | Poblaci√≥n, edad, densidad |
| `v_gentrificacion_tendencias` | Cambios 2015-2024 | % cambio precio/renta |

### Fuentes de Datos:
- **Ruido**: Open Data BCN - Mapa Estrat√©gico de Ruido (2022)
- **Seguridad**: Mossos d'Esquadra v√≠a Portal de Dades (2011-2025)
- **Precios**: Portal de Dades Barcelona + Idealista
- **Demograf√≠a**: IDESCAT + Open Data BCN
