In [9]:
import numpy as np
import pandas as pd
import statsmodels.formula.api as smf
from statsmodels.iolib.summary2 import summary_col
from linearmodels.iv import IV2SLS
import linearmodels.system as iv3

## Ejemplo 16.1 Índice de homicidios y tamaño de la fuerza de pollcía (crime4.dta)

Las ciudades suelen precisar cuánta más fuerza policiaca necesitan para disminuir sus índices de homicidios.

Un modelo simple de corte transversal para abordar esta cuestión es

$    \tag{16.6}$

Donde murdpc son los homicidios, polpc es el número de oficiales de policía e incpc es el ingreso, todos ellos per cápita. (Por tanto, no se incluye un subíndice i.) El ingreso per cápita se considera exógeno en esta ecuación. En la práctica, se incluirían otros factores, como distribuciones de edad y sexo, niveles educativos, quizá variables geográficas y otras variables que midieran la severidad del castigo. Para esclarecer este punto, considere la ecuación (16. 6).

La pregunta que se desea contestar es: si una ciudad incrementa, de manera exógena, su fuerza policiaca, ¿ese incremento hará descender el promedio del índice de homicidios? Si se pudiera elegir de manera exógena la cantidad de fuerza policiaca para una muestra aleatoria de ciudades, se estimaría (16.16) mediante MCO. Por supuesto, tal experimento no se puede realizar. Pero, de cualquier forma, ¿es posible pensar que la cantidad de fuerza policiaca se determina de manera exógena? Probablemente no. El gasto de una ciudad en las fuerzas del orden está determinado, al menos parcialmente, por su índice de homicidios esperado. Para reflejar esto, se postula una segunda relación:

$    \tag{16.7}$

Se espera que 2  0: manteniendo los otros factores constantes, las ciudades con índices de homicidios (esperados) más altos tengan más policías per cápita. Una vez que se especifican los demás factores en (16.7), se tiene un modelo de dos ecuaciones simultáneas. En realidad sólo interesa la ecuación (16.6) pero, como se verá en la sección 16.3, ``es necesario saber con precisión cómo se especifica la segunda ecuación con el fin de estimar la primera``.

Un punto importante es que (16.7) describe el comportamiento de los policías, mientras que (16.6) describe las acciones de los potenciales homicidas. Esto da a cada ecuación una interpretación ceteris paribus clara, lo cual hace que las ecuaciones (16.6) y (16.7) sean un modelo de ecuaciones simultáneas apropiado.

## Ejemplo 16.2 Gastos en vivienda y ahorro

Suponga que una familia aleatoria en la población tiene gastos y ahorros en vivienda anuales que están determinados de manera conjunta por

$   \tag{16.8}$

$   \tag{16.9}$

donde inc es el ingreso anual y educ y age se miden en años. En un principio puede parecer que estas ecuaciones son una forma sensible de ver cómo se determinan los gastos y ahorros en vivienda. Pero es necesario preguntar, ¿qué valor tendría una de estas ecuaciones sin el otro? Ninguna tiene una interpretación ceteris paribus debido a que housing (vivienda) y saving (ahorro) se eligieron para la misma familia. Por ejemplo, no tiene sentido preguntar: si el ingreso anual aumenta en $10,000, ¿cómo cambiarían los gastos de la vivienda, si saving se mantuviera fijo? Si el ingreso familiar aumenta, una familia, por lo general,
cambiará la mezcla óptima de gastos y ahorro en vivienda. Pero la ecuación (16.8) hace parecer como si se quisiera conocer el efecto de un cambio en inc, educ o age mientras se mantiene fijo saving. Este difícil experimento no es interesante. Cualquier modelo basado en principios económicos, en particular, la maximización de utilidades, haría que las familias eligieran de manera óptima housing y saving como funciones de inc y los precios relativos de la vivienda y el ahorro. Las variables educ y age afectarían las preferencias de consumo, ahorro y riesgo. Por tanto, housing y saving serían cada una funciones del ingreso,
educación, edad y otras variables que afectan al problema de maximización de utilidades (como tasas de rendimiento diferentes sobre vivienda y otros ahorros).

Incluso si se decidiera que MES en (16.8) y (16.9) tienen sentido, no hay forma de estimar los parámetros. (Se analizará este problema más ampliamente en la sección 16.3.) Las dos ecuaciones son indistintas, a menos que se suponga que el ingreso, la educación o la edad aparecen en una ecuación pero no en la otra, lo cual no tendría sentido.

Aunque este es un ejemplo pobre del MES, lo que podría resultar interesante es probar si, en otros factores fijos, existe una compensación entre los gastos de vivienda y ahorro. Pero entonces sólo se estaría estimando (16.8) mediante MCO, a menos que existiera una variable omitida o problema de error de medición.

## Ejemplo 16.3 Oferta de trabajo de las mujeres casadas trabajadoras

Para ilustrar la cuestión de la identificación, considere la oferta de mano de obra de trabajadoras casadas
que ya forman parte del mercado laboral. En lugar de la función de la demanda, se escribe la oferta salarial
en función de las horas y las variables de productividad acostumbradas. Con la condición de equilibrio
impuesta, las dos ecuaciones estructurales son

$    \tag{16.19}$

$    \tag{16.19}$

La variable age es la edad de la mujer, kidslt6 es el número de niños que tienen menos de seis años de edad,
nwifeinc es el ingreso no salarial de la mujer (que incluye los ingresos de su cónyuge) y educ (educación) y
exper (experiencia) son los años de educación y experiencia previa, respectivamente. Se supone que todas
las variables, salvo hours y log(wage) son exógenas. (Este es un supuesto débil, puesto que educ podría
estar correlacionado con la capacidad omitida en su ecuación. Pero con fines de ilustración, se ignora el
problema de capacidad omitida.) La forma funcional en este sistema, donde hours aparece en forma nivelada
pero wage (salario) está en forma logarítmica, es común en economía laboral. Se puede escribir este
sistema como en las ecuaciones (16.17) y (16.18) al definir y1  hours y y2  log(wage).

La primera ecuación es la función de la oferta y satisface la condición de orden, pues las dos variables
exógenas, exper y exper2, se omitieron en la ecuación de oferta de mano de obra. Estas restricciones
de exclusión son supuestos cruciales: se supone que, una vez que se controlan el salario, la educación, la
edad, el número de niños pequeños y otros ingresos, la experiencia pasada no tiene efecto sobre la oferta
actual de mano de obra. Desde luego, este supuesto es muy cuestionable, pero se utiliza aquí a modo de
ilustración.

Dadas las ecuaciones (16.19) y (16.20), la condición de rango para identificar la primera ecuación es
que al menos exper o exper2 tiene un coeficiente diferente de cero en la ecuación (16.20). Si 22  0 y
23  0, no existen variables exógenas que aparezcan en la segunda ecuación y que tampoco aparezcan
en la primera (educ aparece en ambas). Se puede decir que la condición de rango para la identificación de
(16.19) es equivalente en términos en la forma reducida de log(wage), que es

$   \tag{16.21}$

Para la identificación, se necesita que 25 
 0 o 26 
 0, algo que se puede probar mediante un estadístico
F estándar, como se analizó en el capítulo 15.

La ecuación de la oferta salarial, (16.20), se identifica si al menos una de las variables age, kidslt6, o
nwifeinc tiene un coeficiente diferente de cero en (16.19). Esto es idéntico a suponer que la forma reducida
de hours, que tiene la misma forma que el lado derecho de (16.21), depende de al menos una de las variables
age, kidslt6 o nwifeinc. Cuando se especifica la ecuación de la oferta salarial, se supone que ni age,
kidslt6 o nwifeinc tienen efecto alguno en el salario ofrecido, una vez que se ha dado cuenta de las horas, la
educación y la experiencia. Éstos serían supuestos pobres si las variables tienen, de alguna manera, efectos
directos en la productividad, o si las mujeres padecieran discriminación basada en su edad o en el número
de hijos pequeños.

## Ejemplo 16.4 Inflación y grado de apertura

Romer (1993) propone modelos teóricos sobre la inflación que sugieren que los países más “abiertos” deberían
tener tasas de inflación más bajas. Su análisis empírico explica las tasas de inflación anuales promedio
(desde 1973) en términos de la participación promedio de las importaciones en el producto interno bruto
(o nacional) desde 1973, la cual es su medida de apertura. Además de estimar la ecuación clave mediante
MCO, utiliza variables instrumentales. Si bien Romer no especifica ambas ecuaciones en un sistema simultáneo,
tiene en mente un sistema de dos ecuaciones:

$    \tag{16.22}$

$    \tag{16.23}$

donde pcinc es el ingreso per cápita (en dólares de 1980 y se supone exógena) y land es la extensión territorial
del país, en millas cuadradas (también supuestamente exógena). La ecuación (16.22) es de interés,
por su hipótesis de que 1  0. (Las economías
más abiertas tienen tasas de inflación menores.) La segunda ecuación refleja el hecho de que el grado de apertura puede depender de la tasa de inflación promedio, así como de otros factores. La variable log(pcinc) aparece en ambas ecuaciones, pero se
supone que log(land ) aparece sólo en la segunda ecuación. La idea es que, ceteris paribus, un país más pequeño tiende a ser más abierto (así que 22  0).

Mediante la regla de identificación que se mencionó antes, se identifica la ecuación (16.22), siempre
y cuando 22   0. La ecuación (16.23) no se identifica pues contiene dos variables exógenas. Pero lo que
interesa es (16.22).

## Ejemplo 16.5 Oferta de trabajo de las mujeres casadas trabajadoras (mroz.dta)

Se utilizan los datos de las mujeres trabajadoras casadas en MROZ.RAW para estimar la ecuación de oferta
de mano de obra (16.19) mediante MC2E. El conjunto completo de variables instrumentales incluye a educ,
age, kidslt6, nwifeinc, exper y exper2. La curva estimada de oferta de mano de obra es

$    \tag{16.24}$

la cual muestra que la curva de oferta de mano de obra tiene pendiente positiva. El coeficiente estimado
en log(wage) tiene la siguiente interpretación, todos los factores constantes, hours  16.4(%wage). Las
elasticidades de la oferta de mano de obra se pueden calcular si se multiplican ambos lados de esta última
ecuación por 100/hours:

lo cual implica que la elasticidad de la oferta de mano de obra (respecto al salario) simplemente es de
1,640/hours. [La elasticidad no es constante en este modelo, pues la variable dependiente en (16.24) es
hours y no log(hours).] Al promedio de horas trabajadas, 1,303, la elasticidad estimada es 1,640/1,303 
1.26, lo cual implica un incremento mayor que 1% en las horas trabajadas dado un incremento de 1% en
el salario. Esta es una elasticidad estimada grande. A más horas, la elasticidad será menor; a menos horas,
como con hours  800, la elasticidad será superior a dos.

Para fines comparativos, cuando (16.19) se estima mediante MCO, el coeficiente de log(wage)
es 2.05 (ee  54.88), lo cual implica que no hay efecto en las horas trabajadas. Para confirmar que
log(wage) en realidad es endógena en (16.19), se puede realizar la prueba de la sección 15.5. Cuando se
agregan los residuales de la forma reducida vˆ2 a la ecuación y se estima mediante MCO, el estadístico t en
vˆ2 es 6.61, lo cual es muy significativo y por tanto log(wage) parece ser endógeno.

La ecuación de oferta salarial (16.20) también se puede estimar mediante MC2E. El resultado es

$   \tag{16.25}$

La ecuación de oferta salarial (16.20) también se puede estimar mediante MC2E. El resultado es

In [11]:
df1 = pd.read_stata('mroz.dta')
df1.head(3)

Unnamed: 0,inlf,hours,kidslt6,kidsge6,age,educ,wage,repwage,hushrs,husage,...,faminc,mtr,motheduc,fatheduc,unem,city,exper,nwifeinc,lwage,expersq
0,1,1610,1,0,32,12,3.354,2.65,2708,34,...,16310.0,0.7215,12,7,5.0,0,14,10.91006,1.210154,196
1,1,1656,0,2,30,12,1.3889,2.65,2310,30,...,21800.0,0.6615,7,7,11.0,1,5,19.499981,0.328512,25
2,1,1980,1,3,35,12,4.5455,4.04,3072,40,...,21040.0,0.6915,12,7,5.0,0,15,12.03991,1.514138,225


In [11]:
df1['c']= np.ones(len(df1))

In [12]:
df1.head(3)

Unnamed: 0,inlf,hours,kidslt6,kidsge6,age,educ,wage,repwage,hushrs,husage,...,mtr,motheduc,fatheduc,unem,city,exper,nwifeinc,lwage,expersq,c
0,1,1610,1,0,32,12,3.354,2.65,2708,34,...,0.7215,12,7,5.0,0,14,10.91006,1.210154,196,1.0
1,1,1656,0,2,30,12,1.3889,2.65,2310,30,...,0.6615,7,7,11.0,1,5,19.499981,0.328512,25,1.0
2,1,1980,1,3,35,12,4.5455,4.04,3072,40,...,0.6915,12,7,5.0,0,15,12.03991,1.514138,225,1.0


In [1]:
from linearmodels import IV2SLS, IV3SLS, SUR, IVSystemGMM

reg1 = IV2SLS (dependiente, exógenas, end´pgena, instrumentos)

In [13]:
reg1 = IV2SLS(df1.hours, df1[['c','educ','age','kidslt6','nwifeinc']],df1[['lwage']],df1[['exper','expersq']]).fit(cov_type='unadjusted')
print(reg1)

                          IV-2SLS Estimation Summary                          
Dep. Variable:                  hours   R-squared:                     -2.0076
Estimator:                    IV-2SLS   Adj. R-squared:                -2.0433
No. Observations:                 428   F-statistic:                    17.450
Date:                Fri, Oct 18 2019   P-value (F-stat)                0.0037
Time:                        10:43:44   Distribution:                  chi2(5)
Cov. Estimator:            unadjusted                                         
                                                                              
                             Parameter Estimates                              
            Parameter  Std. Err.     T-stat    P-value    Lower CI    Upper CI
------------------------------------------------------------------------------
c              2225.7     570.52     3.9011     0.0001      1107.5      3343.9
educ          -183.75     58.684    -3.1312     0.00

Inputs contain missing values. Dropping rows with missing observations.


reg1 = IV2SLS (dependiente, exógenas, end´pgena, instrumentos)

In [16]:
reg1 = IV2SLS(df1.lwage, df1[['c','educ','exper','expersq']],df1[['hours']],df1[['age','kidslt6','nwifeinc']]).fit(cov_type='unadjusted')
print(reg1)

                          IV-2SLS Estimation Summary                          
Dep. Variable:                  lwage   R-squared:                      0.1257
Estimator:                    IV-2SLS   Adj. R-squared:                 0.1174
No. Observations:                 428   F-statistic:                    77.012
Date:                Fri, Oct 18 2019   P-value (F-stat)                0.0000
Time:                        10:49:33   Distribution:                  chi2(4)
Cov. Estimator:            unadjusted                                         
                                                                              
                             Parameter Estimates                              
            Parameter  Std. Err.     T-stat    P-value    Lower CI    Upper CI
------------------------------------------------------------------------------
c             -0.6557     0.3358    -1.9527     0.0509     -1.3139      0.0024
educ           0.1103     0.0154     7.1488     0.00

Inputs contain missing values. Dropping rows with missing observations.


In [12]:
# 3SLS regressions:
formula = {'eq1': 'hours ~ 1 + educ + age + kidslt6 + nwifeinc +'
                  '[np.log(wage) ~ exper+I(exper**2)]',
           'eq2': 'np.log(wage) ~ 1 + educ + exper + I(exper**2) +'
                  '[hours ~ age + kidslt6 + nwifeinc]'}

reg_3sls = iv3.IV3SLS.from_formula(formula, data=df1)

results_3sls = reg_3sls.fit(cov_type='unadjusted', debiased=True)
print(f'results_3sls: \n{results_3sls}\n')

  if is_categorical(s):
Inputs contain missing values. Dropping rows with missing observations.


results_3sls: 
                           System GLS Estimation Summary                           
Estimator:                        GLS   Overall R-squared:                  -3.0751
No. Equations.:                     2   McElroy's R-squared:                 0.8638
No. Observations:                 428   Judge's (OLS) R-squared:            -3.0751
Date:                Mon, Oct 16 2023   Berndt's R-squared:                  0.6857
Time:                        14:24:02   Dhrymes's R-squared:                -3.0751
                                        Cov. Estimator:                  unadjusted
                                        Num. Constraints:                      None
                    Equation: eq1, Dependent Variable: hours                    
              Parameter  Std. Err.     T-stat    P-value    Lower CI    Upper CI
--------------------------------------------------------------------------------
Intercept        2388.5     554.05     4.3109     0.0000      1299.4  

  ci = self.params[:, None] + self.std_errors[:, None] * q


## Ejemplo 16.6 Inflación y grado de apertura (openness.dta)

Antes de estimar (16.22) mediante los datos en OPENNESS.RAW, se revisa para ver si open (apertura)
tiene una correlación parcial suficiente con la VI propuesta, log(land). La regresión en la forma reducida es

El estadístico t sobre log(land) es superior a nueve en valor absoluto, lo cual verifica la aseveración de
Romer de que los países más pequeños son más abiertos. El hecho de que log(pcinc) sea tan insignificante
en esta regresión es irrelevante.
Estimar (16.22) mediante log(land ) como una VI para open da

$    \tag{16.26}$

El coeficiente en open es estadísticamente significativo al nivel aproximadamente de 1% en comparación con la alternativa (1  0). El efecto también es económicamente importante: para cada incremento de punto porcentual en la participación de importaciones en el producto interno bruto, la inflación anual será menor aproximadamente en una tercera parte de un punto porcentual. A modo de comparación, la estimación de MCO es de .215 (ee  .095).

In [6]:
dfej16_6['c']= np.ones(len(dfej16_6))

In [2]:
dfej16_6 = pd.read_stata('openness.dta')
dfej16_6.head()

Unnamed: 0,open,inf,pcinc,land,oil,good,lpcinc,lland,lopen,linf,opendec,linfdec
0,31.4,9.9,1998,919595.0,0,0,7.599902,13.731688,3.446808,2.292535,0.314,-2.312635
1,9.4,117.0,4342,1072067.0,0,1,8.37609,13.885099,2.24071,4.762174,0.094,0.157004
2,16.700001,9.5,8349,2966150.0,0,1,9.029897,14.902776,2.815409,2.251292,0.167,-2.353878
3,35.599998,5.0,8230,32375.0,0,1,9.015541,10.385141,3.572345,1.609438,0.356,-2.995732
4,91.0,4.8,9185,240.0,1,0,9.125327,5.480639,4.510859,1.568616,0.91,-3.036554


In [3]:
print(smf.ols('open ~ lpcinc + lland', data = dfej16_6).fit().summary())

                            OLS Regression Results                            
Dep. Variable:                   open   R-squared:                       0.449
Model:                            OLS   Adj. R-squared:                  0.439
Method:                 Least Squares   F-statistic:                     45.17
Date:                Mon, 16 Oct 2023   Prob (F-statistic):           4.45e-15
Time:                        14:00:43   Log-Likelihood:                -488.44
No. Observations:                 114   AIC:                             982.9
Df Residuals:                     111   BIC:                             991.1
Df Model:                           2                                         
Covariance Type:            nonrobust                                         
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
Intercept    117.0845     15.848      7.388      0.0

In [7]:
reg166 = IV2SLS(dfej16_6.inf, dfej16_6[['c','lpcinc']],dfej16_6.open,dfej16_6.lland).fit(cov_type='unadjusted')
print(reg166)

                          IV-2SLS Estimation Summary                          
Dep. Variable:                    inf   R-squared:                      0.0309
Estimator:                    IV-2SLS   Adj. R-squared:                 0.0134
No. Observations:                 114   F-statistic:                    5.7307
Date:                Mon, Oct 16 2023   P-value (F-stat)                0.0570
Time:                        14:09:04   Distribution:                  chi2(2)
Cov. Estimator:            unadjusted                                         
                                                                              
                             Parameter Estimates                              
            Parameter  Std. Err.     T-stat    P-value    Lower CI    Upper CI
------------------------------------------------------------------------------
c              26.899     15.197     1.7700     0.0767     -2.8866      56.685
lpcinc         0.3758     1.9884     0.1890     0.85

## Ejemplo 16.7 Contraste de la hipótesis de la renta permanente (consump.dta )

Campbell y Mankiw (1990) emplearon métodos de variables instrumentales para probar varias versiones
de hipótesis de ingreso permanente. Se usarán los datos anuales de 1959 a 1995 en CONSUMP.RAW
para imitar uno de sus análisis. Campbell y Mankiw emplearon datos trimestrales hasta 1985.
Una ecuación que Campbell y Mankiw estimaron (escrita con nuestra notación) es

$   \tag{16.35}$

donde
gct  log(ct)  crecimiento anual en consumo real per cápita (excluyendo a los no perecederos).
gyt  crecimiento en el ingreso real disponible.

r3t  la tasa de interés real (ex post) medida por el rendimiento en las tasas trimestrales de los
bonos del Tesoro: r3t  i3t  inft, donde la tasa de inflación está basada en el Índice de
precios al consumidor.

Las tasas de crecimiento de consumo e ingreso disponible no poseen tendencia y son débilmente
dependientes; se supondrá que este también es el caso para r3t así que se puede aplicar la teoría estándar
asintótica.

La característica clave de la ecuación (16.35) es que la HIP implica que el término de error ut tiene una
media condicional de cero en toda la información observada en el tiempo t  1 o antes: E(utIt1)  0. Sin
embargo, no es necesario que ut no esté correlacionado con gyt o r3t; una forma tradicional de pensar esto
es que dichas variables están determinadas en forma conjunta, pero no se escribirá un sistema completo
de tres ecuaciones.

Debido a que ut no está correlacionado con todas las variables de fecha t  1 o anterior, los instrumentos
válidos para estimar (16.35) son los valores rezagados de gc, gy y r3 (y los rezagos de las otras
variables, pero no se usarán aquí). ¿Cuáles son las hipótesis de interés? La forma pura de HIP tiene 1 
2  0. Campbell y Mankiw argumentan que 1 es positiva si alguna fracción de la población consume su
ingreso actual, más que su ingreso permanente. La HIP con una tasa de interés real y no constante implica
que 2  0.

Cuando se estima (16.35) mediante MC2E, usando los instrumentos gc1, gy1 y r31 como variables
endógenas gyt y r3t, se obtiene

$   \tag{16.36}$

Por tanto, la forma pura de HIP se rechaza fuertemente debido a que el coeficiente en gy es económicamente
grande (un incremento de 1% en el ingreso disponible aumenta el consumo en más de .5%) y es
estadísticamente significativo (t  4.34). En contraste, el coeficiente de interés real es muy pequeño y estadísticamente
insignificante. Estos hallazgos son cualitativamente iguales que los de Campbell y Mankiw.

La HIP también implica que los errores {ut} no están correlacionados serialmente. Después de la estimación
de MC2E, se obtienen los residuales, uˆ t, y se incluye u ˆ t1 como una variable explicativa adicional en
(16.36); aún se emplearán los instrumentos gct1, gyt1, r3t1, y u ˆ t1 actúa como su propio instrumento (vea
la sección 15.7). El coeficiente en uˆ t1 es  ˆ  .187 (ee  .133), así que existe cierta evidencia de correlación
serial positiva, aunque no al nivel de significancia de 5%. Campbell y Mankiw analizan el por qué, con
los datos trimestrales disponibles, la correlación serial positiva puede encontrarse en errores aun cuando la
HIP fuera válida; algunas de estas cuestiones también se relacionan con los datos anuales.

In [5]:
dfej16_7 = pd.read_stata('consump.dta')
dfej16_7.head()

Unnamed: 0,year,i3,inf,rdisp,rnondc,rserv,pop,y,rcons,c,...,gy,gc_1,gy_1,r3_1,lc_ly,lc_ly_1,gc_2,gy_2,r3_2,lc_ly_2
0,1959,3.41,0.7,1530.099976,606.299988,687.400024,177830.0,8604.285156,1293.699951,7274.925293,...,,,,,-0.167827,,,,,
1,1960,2.93,1.7,1565.400024,615.400024,717.400024,180671.0,8664.368164,1332.800049,7376.945312,...,0.006959,,,2.71,-0.16086,-0.167827,,,,
2,1961,2.38,1.0,1615.800049,626.700012,746.5,183691.0,8796.293945,1373.199951,7475.597168,...,0.015111,0.013926,0.006959,1.23,-0.162686,-0.16086,,,2.71,-0.167827
3,1962,2.78,1.0,1693.699951,646.5,783.400024,186538.0,9079.651367,1429.900024,7665.462402,...,0.031706,0.013285,0.015111,1.38,-0.169312,-0.162686,0.013926,0.006959,1.23,-0.16086
4,1963,3.16,1.3,1755.5,660.0,818.700012,189242.0,9276.482422,1478.699951,7813.804199,...,0.021446,0.025081,0.031706,1.78,-0.171591,-0.169312,0.013285,0.015111,1.38,-0.162686


In [6]:
pi_reg = IV2SLS.from_formula('gc ~ 1 + [gy + r3 ~ gy_1 + gc_1 + r3_1]', data = dfej16_7).fit()
print(pi_reg)

                          IV-2SLS Estimation Summary                          
Dep. Variable:                     gc   R-squared:                      0.6779
Estimator:                    IV-2SLS   Adj. R-squared:                 0.6578
No. Observations:                  35   F-statistic:                    18.305
Date:                Fri, Jul 17 2020   P-value (F-stat)                0.0001
Time:                        13:31:28   Distribution:                  chi2(2)
Cov. Estimator:                robust                                         
                                                                              
                             Parameter Estimates                              
            Parameter  Std. Err.     T-stat    P-value    Lower CI    Upper CI
------------------------------------------------------------------------------
Intercept      0.0081     0.0034     2.3694     0.0178      0.0014      0.0147
gy             0.5862     0.1371     4.2761     0.00

Inputs contain missing values. Dropping rows with missing observations.


## Ejemplo 16.8 Efecto de la población carcelaria sobre las tasas de delincuencia con violencia (prison.dta)

Con el fin de estimar el efecto causal del incremento de la población carcelaria en el índice delictivo a nivel
estatal, Levitt (1996) utilizó casos de pleitos en prisiones sobrepobladas como instrumentos del crecimiento
en la población de la prisión. La ecuación que Levitt estimó es en primeras diferencias; se puede escribir
un modelo subyacente de efectos fijos como

$   \tag{16.40}$

donde t denota diferentes interceptos de tiempo, y crime (delitos) y prison (población carcelaria) se miden
por cada 100,000 personas. (La variable de la población de la prisión se mide sobre el último día del año
anterior.) El vector zit1 contiene el logaritmo de policías per cápita, el logaritmo de ingreso per cápita, la
tasa de desempleo, las proporciones de negros y personas que viven en áreas metropolitanas y las proporciones
de distribución por edades.

Al diferenciar (16.40) se obtiene la ecuación estimada por Levitt:

$   \tag{16.41}$

La simultaneidad entre los índices delictivos y la población carcelaria, o de manera más precisa en las tasas
de crecimiento, hace que la estimación de MCO de (16.41) sea por lo general, más inconsistente. Mediante
el índice de delitos violentos y un subconjunto de datos de Levitt (en PRISON.RAW, para los años
de 1980 a 1993, para 5114  714 observaciones totales), se obtiene la estimación combinada de MCO de
1, que es .181 (ee  .048). También se estima (16.41) por MC2E combinados, donde los instrumentos
para log(prison) son dos variables binarias, cada una para si se llegó a la decisión final sobre las peleas
por sobrepoblación en el año presente o en los pasados dos años. La estimación combinada de MC2E de
1 es 1.032 (ee  .370). Por tanto, el efecto estimado de MC2E es mucho mayor; no es de sorprender que
sea mucho menos preciso también. Levitt encontró resultados similares cuando usó un periodo de tiempo
mayor (pero sin las primeras observaciones para algunos estados) y más instrumentos

In [3]:
dfej16_8 = pd.read_stata('prison.dta')
dfej16_8.head()

Unnamed: 0,state,year,govelec,black,metro,unem,criv,crip,lcriv,lcrip,...,cag18_24,cag25_34,cunem,cblack,cmetro,pris,lpris,gpris,final1,final2
0,1,80,0,0.256,0.632,0.08775,4.447868,44.476376,1.492425,3.794958,...,7.7e-05,0.00199,0.01675,-0.059999,0.0002,141.334717,4.951131,-0.020659,0,0
1,1,81,0,0.2557,0.6362,0.10667,4.700944,44.248787,1.547763,3.789828,...,0.000177,0.004632,0.01892,-0.030001,0.0042,163.533646,5.097019,0.145888,0,0
2,1,82,1,0.2554,0.6404,0.14367,4.49758,42.050446,1.503539,3.73887,...,-0.000712,1.3e-05,0.037,-0.029999,0.0042,183.694809,5.213276,0.116257,0,0
3,1,83,0,0.2551,0.6446,0.13667,4.186833,37.084393,1.431945,3.613196,...,-0.001318,0.001163,-0.007,-0.030001,0.0042,218.624207,5.387354,0.174078,0,0
4,1,84,0,0.2548,0.6488,0.11167,4.353239,35.042255,1.47092,3.556555,...,-0.002618,0.001297,-0.025,-0.030001,0.0042,245.068619,5.501538,0.114184,0,0


In [4]:
print(IV2SLS.from_formula('gcriv ~ 1 + [gpris ~ final1 + final2] + gpolpc + gincpc + cunem + cblack + cmetro + cag0_14 + cag15_17 + cag18_24 + cag25_34', data=dfej16_8).fit(cov_type='unadjusted'))
print(smf.ols('gcriv ~ gpris + gpolpc + gincpc + cunem + cblack + cmetro + cag0_14 + cag15_17 + cag18_24 + cag25_34', data=dfej16_8).fit().summary())

                          IV-2SLS Estimation Summary                          
Dep. Variable:                  gcriv   R-squared:                     -0.2447
Estimator:                    IV-2SLS   Adj. R-squared:                -0.2624
No. Observations:                 714   F-statistic:                    59.380
Date:                Fri, Jul 17 2020   P-value (F-stat)                0.0000
Time:                        13:30:16   Distribution:                 chi2(10)
Cov. Estimator:            unadjusted                                         
                                                                              
                             Parameter Estimates                              
            Parameter  Std. Err.     T-stat    P-value    Lower CI    Upper CI
------------------------------------------------------------------------------
Intercept      0.0363     0.0242     1.5039     0.1326     -0.0110      0.0837
gpolpc         0.0735     0.0690     1.0650     0.28

  data_klasses = (pandas.Series, pandas.DataFrame, pandas.Panel)
