<a href="https://colab.research.google.com/github/rpasquini/metodos_cuantitativos/blob/main/notebooks/R/OLS4_Regresion_Multiple.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


_author: Ricardo Pasquini (rpasquini@gmail.com)

In [None]:
%load_ext rpy2.ipython


In [None]:
%%R

# Instalamos y cargamos las librerías necesarias
if (!require("sf")) install.packages("sf")
if (!require("dplyr")) install.packages("dplyr")
if (!require("ggplot2")) install.packages("ggplot2")
if (!require("car")) install.packages("car")  # Para diagnósticos de regresión

# Cargamos las librerías
library(sf)
library(dplyr)
library(ggplot2)
library(car)


In [None]:
%%R

# Descargamos y cargamos los datos
download.file("https://github.com/rpasquini/urban-econometrics/blob/master/data/departamentos2019amba.zip?raw=true",
              destfile = "departamentos2019amba.zip", mode = "wb")
unzip("departamentos2019amba.zip", exdir = ".")
departamentos <- st_read("departamentos2019amba.shp")


In [None]:
%%R

# Ver las columnas disponibles
colnames(departamentos)


In [None]:
%%R

# Ajustamos el modelo simple
modelo <- lm(price ~ bedrooms, data = departamentos)
summary(modelo)


# Estimacion del Modelo Multivariado

Modelo propuesto:

$price_i=\beta_0+\beta_1*bedrooms_i+\beta_2*surface+\epsilon_i$


In [None]:
%%R

# Ajustamos el modelo multivariado
modelo_multi <- lm(price ~ bedrooms + surface_to, data = departamentos)
summary(modelo_multi)


In [None]:
%%R

# Modelo con solo superficie
modelo_surface <- lm(price ~ surface_to, data = departamentos)
summary(modelo_surface)


# Ejemplo OVB


In [None]:
%%R

# Cargamos los datos de educación
datosedu <- read.csv('https://raw.githubusercontent.com/rpasquini/urban-econometrics/master/data/estadistica-educativa.csv')

# Creamos las variables dummy para tipo_gestion
datosedu$Privada <- as.factor(datosedu$tipo_gestion == "Privada")


In [None]:
%%R

# Modelo con variable Privada
modelo_edu <- lm(iecep ~ Privada, data = datosedu)
summary(modelo_edu)


# Ejemplos Colinealidad


In [None]:
%%R

# Creamos la variable bedrooms al cuadrado
departamentos$bedrooms2 <- departamentos$bedrooms^2

# Ajustamos el modelo con el término cuadrático
modelo_cuad <- lm(price ~ bedrooms + bedrooms2, data = departamentos)
summary(modelo_cuad)


In [None]:
%%R

# Modelos con variables de rendimiento académico
modelo_mat <- lm(tasa_repeticion_2012 ~ one_alto_mat, data = datosedu)
summary(modelo_mat)


In [None]:
%%R

# Modelo con ciencias naturales
modelo_cs_nat <- lm(tasa_repeticion_2012 ~ one_alto_cs_nat, data = datosedu)
summary(modelo_cs_nat)


In [None]:
%%R

# Modelo con ciencias sociales
modelo_cs_soc <- lm(tasa_repeticion_2012 ~ one_alto_cs_soc, data = datosedu)
summary(modelo_cs_soc)


In [None]:
%%R

# Modelo con todas las variables de rendimiento
modelo_completo <- lm(tasa_repeticion_2012 ~ one_alto_mat + one_alto_cs_nat + one_alto_cs_soc, 
                     data = datosedu)
summary(modelo_completo)


# Investigando el premio por formalidad
### Extracto de Datos de Goytia, Heikkila, Pasquini (2020)
https://www.sciencedirect.com/science/article/abs/pii/S0264837722005117


## Descripción de variables
* bformal es una dummy que señala con 1 a las areas "formales" y 0 a las areas "informales". Este es un criterio de delimitación espacial.  "Informal" se utiliza para el área que constituye un barrio popular  
* dconurb1, dconurb2, dconurb3 son dummies que señalan a los agrupamientos de partidos del AMBA "Conurbano 1", "Conurbano 2" y "Conurbano 3" respectivamente, según la categorización del INDEC.  Vease https://www.indec.gob.ar/dbindec/folleto_gba.pdf
* dprop_soloviv', 'dprop_ocupant', 'dinquilinos' son dummies que señalan a los que son propietarios solo de la vivienda, ocupantes e inquilinos respectivamente.
* dedu_secincomp', 'dedu_seccomp', 'dedu_ter_o_mas' son dummies que señalan la educación del jefe de hogar
* 'dconexionagua1', 'delectricidad_med', 'dconexiongas'  son dummies que señalan la presencia de conexión al agua de red, la presencia de un medidor de electricidad y la conexión al gas de red respectivamente.


In [None]:
%%R

# Cargamos los datos
datosghp <- read.csv('https://raw.githubusercontent.com/rpasquini/urban-econometrics/master/data/formal%20premia%20data%20extract.csv')

# Vemos las columnas disponibles
colnames(datosghp)


In [None]:
%%R

# Modelo de premio por formalidad
modelo_formal <- lm(alquiler2 ~ bformal + dconurb1 + dconurb2 + dconurb3 + 
                   dconexionagua1 + delectricidad_med + dconexiongas + hora_c, 
                   data = datosghp)
summary(modelo_formal)
