# Instalación de Paquetes 

In [1]:
knitr::opts_chunk$set(echo = TRUE)

Los paquetes que se van a utilizar son:

In [2]:
#install.packages("plm")         #Panel linear models 
#install.packages("gplots")      #Tools for plotting data 
#install.packages("stargazer")   #Tablas más estéticas 
#install.packages("foreing")     #Importar datos 
#install.packages("sandwich")    #Estimador de errores robustos 
#install.packages("lmtest")      #Inferencia estadística para modelos lineales 
#install.packages("tseries")
#install.packages("wooldridge")  #Bases de datos que se encuentran en Wooldridge
#install.packages("AER")         #AER contiene estimadores como tobit y variables instrumentales (IV)
                                   
#install.packages("dplyr")

library(plm);library(gplots);library(stargazer)
library(foreign);library(sandwich);library(lmtest)
library(tseries);library(wooldridge);library(AER);library(dplyr)



Attaching package: ‘gplots’


The following object is masked from ‘package:stats’:

    lowess



Please cite as: 


 Hlavac, Marek (2018). stargazer: Well-Formatted Regression and Summary Statistics Tables.

 R package version 5.2.2. https://CRAN.R-project.org/package=stargazer 


Loading required package: zoo


Attaching package: ‘zoo’


The following objects are masked from ‘package:base’:

    as.Date, as.Date.numeric


Registered S3 method overwritten by 'quantmod':
  method            from
  as.zoo.data.frame zoo 

Loading required package: car

Loading required package: carData

Loading required package: survival


Attaching package: ‘dplyr’


The following object is masked from ‘package:car’:

    recode


The following objects are masked from ‘package:plm’:

    between, lag, lead


The following objects are masked from ‘package:stats’:

    filter, lag


The following objects are masked from ‘package:base’:

    intersect, setdiff, setequal, union




# Importación de base de datos 

Para este ejercicio trabajaremos una base de datos que se encuentra en la memoria de Rstudio. En este caso, se empleará un ejemplo adaptado de **Introduction to Econometrics with R**  de *Christoph Hanck, Martin Arnold, Alexander Gerber and Martin Schmelze* 

Para quien quiera profundizar más en dicho libro, se adjunta el enlace: 
+ https://www.econometrics-with-r.org/index.html

## Cargamos la base de datos 

In [3]:
data("Fatalities")  # Base de datos importada desde la libreria AER
help("Fatalities") 

0,1
Fatalities {AER},R Documentation


Para usar la función glimpse es necesario cargar el paquete dplyr.

In [4]:
# class(Fatalities) # Se importa la base de datos como un data frame
# dim(Fatalities) # Da las dimensiones del data frame (336 obs y 34 variables)


Se indeca la base de datos "Fatalities" en formato panel: 

In [5]:
Panel= pdata.frame(Fatalities, index = c("state","year"))

attach(Panel)
class(Panel)   # el objeto ahora es un tipo especial de data frame llamado pdata.frame
#help("pdata.frame")

Hay que tener en cuenta la estructura del código para indexar como panel la base: 

+ *Nombre <- pdata.frame(Base_datos, index=c("Variable del individuo","Variable de tiempo"))*

Primero va la variable indicativa del individuo y luego la variable indicativa del tiempo. 

La base de datos a emplear tiene la siguiente descripción: 

+ US traffic fatalities panel data for the "lower 48" US states (i.e., excluding Alaska and Hawaii), annually for 1982 through 1988 state and year are the individual and time index respectively

Se define la tasa de mortalidad como:

In [6]:
Panel$fatal_rate <- Fatalities$fatal / Fatalities$pop * 100

In [7]:
#Para extraer una variable del panel (e.g. pop de Panel)
#Panel$pop    #La extracción de una variable es igual que para un data frame normal 
#La extracción incluye los dos indices del panel para cada observación              

# Para extraer solo los indices de cada observación del panel 
#index(Panel)  # Retorna un df cuyas dos variables son los dos índices


Para conocer las dimensiones del panel y determinar si un panel está balanceado, se emplea el comando pdim

In [8]:
pdim(Panel)

Balanced Panel: n = 48, T = 7, N = 336

Con la siguiente función se identifica a aquellas variables que cambian a lo largo del tiempo (pero que son constantes para todos los individuos) y aquellas variables que cambian entre individuos (pero que son constantes a lo largo del tiempo)

In [9]:
pvar(Panel)

no time variation:       state 
no individual variation: year unempus emppopus 

# Estimación de modelos para datos panel 

Para estimar los distintos modelos de datos panel se utiliza el comando ***plm***. La estructura del codigo es bastante sencilla: 

+ *plm(Var_explicada~ Var_explicativas, data="---", model="---", index=c("Var_individuo","Var_tiempo"))

Para *model* se puede elegir entre Efectos fijos(**within**), Efectos Aleatorios (**random**) y Mínimos Cuadrados Combinados(**pooling**)
    
Directamente en el código también se puede indexar la base de datos, en caso de que no se le haya indicado antes a RStudioque la base de datos es un panel. 
    
## Minimos Cuadrados Combinados 
Para estimar un modelo de Mínimos Cuadrados Combinados el tipo de modelo es *"pooling*

In [10]:
fatalities_pooled <- plm(fatal_rate~ beertax +drinkage + unemp + log(income), 
                         index = c("state", "year"),
                         model = "pooling",
                         data = Panel)



## Efectos fijos 
Para estimar un modelo de Efectos fijos el tipo de modelo es *"within"*

In [11]:
fatalities_FE <- plm(fatal_rate ~ beertax +drinkage + unemp + log(income), 
                     index = c("state", "year"),
                     model = "within",
                     data = Panel)


## Efectos aleatorios
Para estimar un modelo de Efectos aleatorios el tipo de modelo es *"Random"* 

In [12]:
fatalities_EA <- plm(fatal_rate ~ beertax +drinkage + unemp + log(income), 
                     index = c("state", "year"),
                     model = "random",
                     data = Panel)


El $\theta$ se puede calcular despejando de la formula teórica de la transformación que se realiza con Efectos Aleatorios. 

$$ \hat{\theta_{it}}= \frac{y_{it}-\hat{y_{it}}-\hat{u_{it}}}{\overline{y}}  $$
Luego, el $\theta$ para este ejemplo es: 

In [13]:
fitted.values(fatalities_EA)[1:7] #valores ajustados de Y para el primer individuo
attach(Panel)
fatal_rate[1:7]#valores observados de Y para el primer individuo
mean(fatal_rate[1:7]) #valor promedio de Y para el primer individuo
residuals(fatalities_EA)[1:7] #Residuales para el primer individuo
theta = (fatal_rate[1:7]-fitted.values(fatalities_EA)[1:7]-residuals(fatalities_EA)[1:7])/mean(fatal_rate[1:7])
theta


The following objects are masked from Panel (pos = 3):

    afatal, baptist, beertax, breath, drinkage, dry, emppop, emppopus,
    fatal, fatal1517, fatal1820, fatal2124, gsp, income, jail, miles,
    milestot, mormon, nfatal, nfatal1517, nfatal1820, nfatal2124, pop,
    pop1517, pop1820, pop2124, service, sfatal, spirits, state, unemp,
    unempus, year, youngdrivers




## Primeras diferencias
Para estimar un modelo de Primeras diferencias el tipo de modelo es *"fd"* 

In [14]:
fatalities_FD <- plm(fatal_rate ~ beertax +drinkage + unemp + log(income), 
                     index = c("state", "year"),
                     model = "fd",
                     data = Panel)

Para presentar los resultados se hace uso de la función Stargazer

In [15]:
stargazer(fatalities_pooled,fatalities_FE, fatalities_EA, fatalities_FD, digits = 3,
          header = F, type = "text", 
          title = "Modelo de catástrofes de tránsito por conducir en estado de ebriedad", 
          column.labels = c("Pooled","EF","RE","PD"))



Modelo de catástrofes de tránsito por conducir en estado de ebriedad
                                            Dependent variable:                               
             ---------------------------------------------------------------------------------
                                                fatal_rate                                    
                     Pooled                    EF                RE               PD          
                       (1)                     (2)              (3)              (4)          
----------------------------------------------------------------------------------------------
beertax              0.001*                  -0.004*           0.001            0.001         
                     (0.001)                 (0.002)          (0.001)          (0.003)        
                                                                                              
drinkage             -0.0001                -0.0004*          -0.0002      

Llegados a este punto, los elementos abordados fueron: i) identificar la forma como se indexa una base de datos en formato panel;ii) estimar los modelos de datos panel de EF, EA, PD y Pooling utilizando el comando ***plm***;y, iii) presentar los resultados por medio de la función stargazer.

 