# üìä Dataset `listings_unificado.csv` - Documentaci√≥n de Columnas

## üéØ Descripci√≥n General

Dataset unificado de Airbnb para an√°lisis de turismo urbano, conteniendo **61,289 registros** de Barcelona, Madrid y Mallorca. Este archivo representa la versi√≥n consolidada de datos b√°sicos utilizados por la aplicaci√≥n Streamlit.

---

## üìã Estructura del Dataset

**Dimensiones**: 61,289 filas √ó 10 columnas  
**Ciudades**: Barcelona, Madrid, Mallorca  
**Prop√≥sito**: Dataset operativo para app Streamlit  
**Caracter√≠sticas**: Versi√≥n simplificada y optimizada para visualizaciones

---

## üî¢ Columnas del Dataset

| # | Columna | Tipo | Descripci√≥n |
|---|---------|------|-------------|
| 1 | `id` | **int64** | **Identificador √∫nico** - ID principal del listing en Airbnb |
| 2 | `ciudad` | **object** | **Ciudad** - Barcelona, Madrid o Mallorca |
| 3 | `name` | **object** | **Nombre del listing** - T√≠tulo de la propiedad en Airbnb |
| 4 | `neighbourhood_cleansed` | **object** | **Barrio normalizado** - Nombre del barrio/zona geogr√°fica |
| 5 | `distrito` | **object** | **Distrito administrativo** - Agrupaci√≥n de barrios por distrito |
| 6 | `latitude` | **float64** | **Latitud** - Coordenada geogr√°fica (precisi√≥n ~100m) |
| 7 | `longitude` | **float64** | **Longitud** - Coordenada geogr√°fica (precisi√≥n ~100m) |
| 8 | `room_type` | **object** | **Tipo de habitaci√≥n** - Entire home/apt, Private room, Shared room |
| 9 | `minimum_nights` | **int64** | **Estancia m√≠nima** - N√∫mero m√≠nimo de noches requeridas |
| 10 | `availability_365` | **int64** | **Disponibilidad anual** - D√≠as disponibles en los pr√≥ximos 365 d√≠as |

---

## üìà Caracter√≠sticas T√©cnicas

### **Rangos de Valores Esperados**
- **`id`**: N√∫meros √∫nicos de 6-8 d√≠gitos
- **`ciudad`**: 3 valores √∫nicos (Barcelona, Madrid, Mallorca)  
- **`latitude`**: ~39.5-42.0 (rango geogr√°fico Espa√±a)
- **`longitude`**: ~1.4-4.4 (rango geogr√°fico Espa√±a)
- **`room_type`**: 3 categor√≠as principales
- **`minimum_nights`**: 1-1250 d√≠as (casos extremos para alquiler largo plazo)
- **`availability_365`**: 0-365 d√≠as

### **Calidad de Datos**
- ‚úÖ **Sin valores nulos** en columnas cr√≠ticas (id, ciudad, coordenadas)
- ‚úÖ **Coordenadas validadas** dentro de rangos geogr√°ficos
- ‚úÖ **Consistencia territorial** entre barrio y distrito
- ‚ö†Ô∏è **Algunos nulos** posibles en name y neighbourhood_cleansed

---

## üéØ Uso en la Aplicaci√≥n

### **M√©tricas Calculadas**
1. **Ocupaci√≥n**: `(365 - availability_365) / 365 * 100`
2. **Densidad por barrio**: Conteo de listings por neighbourhood_cleansed
3. **Distribuci√≥n geogr√°fica**: Basada en latitude/longitude
4. **Tipos de alojamiento**: An√°lisis de room_type

### **Visualizaciones Generadas**
- üó∫Ô∏è **Mapas interactivos** usando coordenadas
- üìä **Gr√°ficos por distrito** y barrio  
- üìà **An√°lisis de disponibilidad** temporal
- üè† **Segmentaci√≥n por tipo** de habitaci√≥n

---

**üí° Nota**: Este dataset es la versi√≥n operativa utilizada por `app_nuevo.py`. Para an√°lisis m√°s detallados con precios y m√©tricas avanzadas, usar `listings_nuevo.csv`.

In [1]:
import pandas as pd


In [2]:
df = pd.read_csv('listings_unificado.csv')


In [7]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 61114 entries, 0 to 61113
Data columns (total 10 columns):
 #   Column                  Non-Null Count  Dtype  
---  ------                  --------------  -----  
 0   id                      61114 non-null  int64  
 1   ciudad                  61114 non-null  object 
 2   name                    61114 non-null  object 
 3   neighbourhood_cleansed  61114 non-null  object 
 4   distrito                61114 non-null  object 
 5   latitude                61114 non-null  float64
 6   longitude               61114 non-null  float64
 7   room_type               61114 non-null  object 
 8   minimum_nights          61114 non-null  int64  
 9   availability_365        61114 non-null  int64  
dtypes: float64(2), int64(3), object(5)
memory usage: 4.7+ MB


In [None]:
# muestra 10 filas aleatorias de neighbourhood_cleansed
df['neighbourhood_cleansed'].sample(10, random_state=42)

## üí∞ **S√ç, app_nuevo.py muestra datos de precios y costes**

### **1. M√©tricas de Precios en Dashboard Principal** üìä
- **üí∞ Precio Medio**: `{precio_medio:.0f}‚Ç¨` por noche
- **üíº Impacto Econ√≥mico**: `{impacto_economico:.0f}M‚Ç¨` anual estimado

### **2. Fuentes de Datos de Precios** üìÇ
La app intenta cargar precios desde m√∫ltiples fuentes:
```python
# Archivos que busca para precios:
- "precios_inmobiliarios.csv"
- "listings_precios" (dataset principal con precios)
- "pre_airbnb" (datos con precios reales)
```

### **3. D√≥nde Aparecen los Precios** üó∫Ô∏è
1. **Mapas interactivos**: 
   - `precio_medio_euros` en tooltips/hover
   - Informaci√≥n de precios por barrio

2. **Cards de barrios**:
   - `üí∞ Precio Medio: ‚Ç¨{precio_medio}/noche`

3. **KPIs principales**:
   - Precio medio ponderado por ciudad
   - Impacto econ√≥mico calculado

### **4. C√°lculo de M√©tricas Econ√≥micas** üßÆ
```python
# F√≥rmula del impacto econ√≥mico:
pib_airbnb_diario = total_listings * precio_medio * ocupacion_media
impacto_anual = (pib_airbnb_diario * dias_operativos) / 1_000_000  # En millones
```

### **5. Valores por Defecto** ‚öôÔ∏è
Cuando no hay datos reales disponibles:
- **Precio medio**: 85‚Ç¨/noche (promedio Espa√±a)
- **Impacto econ√≥mico**: 750M‚Ç¨ (estimaci√≥n sectorial)

### **üö® PROBLEMA IDENTIFICADO**
**`listings_unificado.csv` NO tiene columnas de precios**, por lo que la app:
- ‚úÖ **Carga la estructura** correctamente
- ‚ùå **No puede mostrar precios reales** de este dataset
- üîÑ **Usa valores por defecto** o datos de otros archivos si existen

### **üí° Recomendaci√≥n**
Para que los precios funcionen completamente, la app necesita:
1. `listings_nuevo.csv` (que S√ç tiene columna `price`)
2. O archivos complementarios como `precios_inmobiliarios.csv`
3. O datos en `pre_airbnb` con precios reales

21841               Trafalgar
16869         Palos de Moguer
3075                Trafalgar
40789    el Putxet i el Farr√≥
15325              Guindalera
18200           Valdeacederas
31745             Sant Antoni
23186                 Legazpi
47713                Pollen√ßa
3181              Embajadores
Name: neighbourhood_cleansed, dtype: object