[![Open in Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/rpasquini/econometria-iae/blob/main/consigna_airbnb_examen.ipynb)

# Consigna 

Su objetivo es analizar los efectos que tiene la oferta de propiedades en alquiler a traves de la plataforma Airbnb en los valores de alquiler de las propiedades cercanas.

Para el análisis usted cuenta con una base datos de ofertas de propiedades en alquiler en la Ciudad de Buenos Aires durante el primer trimestre de 2023. Estas ofertas no incluyen las propiedades que se alquilan a traves de Airbnb, sino que se corresponden con las ofertas de alquiler permanente (típicamente de plazos mayores a 1 año de duración). Los valores de alquiler son mensuales. La base de datos puede considerarse un corte trasversal, donde la unidad de análisis es la propiedad.

Usted debe proponer una estrategia para identificar el efecto causal. Como parte de su respuesta, enuncie los supuestos que se deben cumplir para que la estrategia funcione.

Las siguientes variables están disponibles para su análisis:

1. `PESOS`: El precio de alquiler de la propiedad en pesos.
2. `airbnb_n`: El número de propiedades en alquiler a traves de Airbnb en el area cercana a la propiedad.
3. `AMB`: Número de ambientes de la propiedad.
4. `DORMIS`: Número de dormitorios de la propiedad.
5. `ANTIG`: Antiguedad de la propiedad en años.
6. `LUMINOSO`: Si la propiedad tiene ventanas al exterior.
7. `EDIF`: Edad del edificio en el que se encuentra la propiedad.
8. `BAUL`: Si la propiedad tiene bodega.
9. `COCH`: Si la propiedad tiene estacionamiento.
10. `BAÑOS`: Número de baños de la propiedad.
11. `TERRA_BAL_`: Si la propiedad tiene terraza o balcon.
12. `AMENITIES`: Si la propiedad tiene amenities.
13. `BARRIO`: Barrio de la propiedad. (hay 45 barrios en la muestra)
14. `COMUNA`: Nro de Comuna en la que esta ubicada la propiedad (nota: las comunas son una division administrativa de la ciudad, son 15 comunas)
15. `ZONA`: Zona de la propiedad.




Al respecto de estas variables es importante que usted tenga en cuenta que:
1. **No es necesario que utilice todas las variables**. Es importante justificar por qué agregaría una variable y por qué no en relación al objetivo del análisis.
2. Notar que **las variables podrían necesitar ser transformadas** para que sean utiles en el análisis. Tenga particular cuidado de que algunas de estas variables, al ser tomadas de las ofertas de alquiler, podrían no estar disponibles para todas las propiedades.


# Como entregar este ejercicio para evaluación

1. Para responder la consigna, agregue las celdas de codigo o texto que sean necesarias.
2. Guarden una copia en su Drive, y compartanla el link en el formulario del examen.
3. Importante: Recuerden otorgar permisos de edición para que el profesor pueda ver las respuestas e ingresar comentarios.
4. Importante: Cambien el título al notebook ingresando su nombre y apellido.
5. Preguntas sobre el enunciado? Escriban a rpasquini@gmail.com



# Carga de datos

In [None]:
# install geopandas
!pip install geopandas

In [1]:
# import geopandas
import geopandas as gpd

In [4]:
# download and load the data
import requests
import zipfile
import io

# Download the zip file
url = "https://github.com/rpasquini/econometria-iae/blob/main/datos/prices_with_airbnb_exam.zip?raw=true"
response = requests.get(url)
z = zipfile.ZipFile(io.BytesIO(response.content))
z.extractall()

# Then read with geopandas
gdf = gpd.read_file('prices_with_airbnb_exam.shp')  # Adjust filename as needed
gdf.head()

Unnamed: 0,PESOS,M2,airbnb_n,AMB,DORMIS,ANTIG,LUMINOSO,EDIF,BAUL,COCH,BAÑOS,TERRA_BAL_,AMENITIES,BARRIO_1,COMUNA,Zona_1,geometry
0,140000.0,57.0,18,3.0,2.0,35.0,,,,,1.0,BALCON,,ALMAGRO,5.0,CENTRO-ESTE,POINT (-58.42991 -34.60101)
1,90000.0,35.0,4,2.0,1.0,50.0,,,,,1.0,,,ALMAGRO,5.0,CENTRO-ESTE,POINT (-58.4253 -34.61257)
2,170000.0,75.0,32,4.0,3.0,50.0,,,,,1.0,,,ALMAGRO,5.0,CENTRO-ESTE,POINT (-58.42435 -34.60454)
3,70000.0,40.0,11,2.0,1.0,40.0,SI,,,,1.0,,,ALMAGRO,5.0,CENTRO-ESTE,POINT (-58.41621 -34.60659)
4,120000.0,65.0,3,3.0,2.0,,SI,,,,1.0,BALCON,,ALMAGRO,5.0,CENTRO-ESTE,POINT (-58.41863 -34.60989)


## Pregunta 1

Elija una estrategia de identificación de causalidad (entre las que se presentaron en el curso). 
Explique por qué la estrategia es adecuada para el caso. Identifique por qué los supuestos de la estrategia permiten identificar el efecto causal.

Nota: Esta pregunta es teórica y no requiere estimar un modelo.




## Pregunta 2

Estime el modelo y explique sus resultados.


## Pregunta 3

Realice un análisis de los supuestos del modelo que garantizan la validez de los tests de hipótesis.
Explique si están dadas las condiciones para que los tests sean validos.

## Pregunta 4

Cómo se podría mejorar la estrategia de identificación de causalidad? ¿Cuáles son las limitaciones de la estrategia propuesta? Qué tipo de datos adicionales usaría para hacerlo?
