# Ejemplo de Sistemas de Ecuaciones

## Planteamiento:

Asumimos que tenemos observaciones de corte transversal independienntes e idénticamente distribuidas:
\begin{equation*}
    \{ \mathbf{X}_i , \mathbf{Y}_i ; i = 1, 2, \ldots, N \}
\end{equation*}

Donde $\mathbf{X}_i$ es una matriz $G \times K$ y $\mathbf{Y}_i$ es un vector $G \times 1$. Así, la matriz $\mathbf{X}_i$ continene todas las variables explicativas que aparecen en el sistema, para cada uno de los individuos indexados $i$:
\begin{equation}
    \mathbf{Y}_i = \mathbf{Y}_i \boldsymbol{\beta} + \boldsymbol{\varepsilon}_i
    \label{Sist_Eqn_G}
\end{equation}

Donde $\boldsymbol{\beta}$ es un vector $K \times 1$ y $\boldsymbol{\varepsilon}_i$ es un vector $G \times 1$. De esta forma en general tendríamos:
\begin{equation*}
    \mathbf{Y}_i = 
    \begin{bmatrix}
    y_{i1} \\
    y_{i2} \\
    \vdots \\
    y_{iG}
    \end{bmatrix}
\end{equation*}

\begin{equation*}
    \boldsymbol{\varepsilon}_i = 
    \begin{bmatrix}
    \varepsilon_{i1} \\
    \varepsilon_{i2} \\
    \vdots \\
    \varepsilon_{iG}
    \end{bmatrix}
\end{equation*}

Donde $i = 1, 2, \ldots, N$. 
\begin{equation*}
    \boldsymbol{\beta} = 
    \begin{bmatrix}
    \boldsymbol{\beta}_{1} \\
    \boldsymbol{\beta}_{2} \\
    \vdots \\
    \boldsymbol{\beta}_{G}
    \end{bmatrix}
\end{equation*}

Par el caso particular de un modelo de ecuaciones simúltneas aparentemente no relacionadas que no compartan variables explicativas:
\begin{equation*}
    \mathbf{x}_{ig} = [x_{i1}, x_{i2}, \ldots, x_{iK_g}]
\end{equation*}

Así, podemos proponer que la matriz $\mathbf{X}_i$ con dimensión $G \times (K_1 + K_2 + \ldots + K_G)$es de la forma:
\begin{equation*}
    \mathbf{X}_i = 
    \begin{bmatrix}
    \mathbf{x}_{i1} \\
    \mathbf{x}_{i2} \\
    \vdots \\
    \mathbf{x}_{iG}
    \end{bmatrix} \\
\end{equation*}


## Estimadores:

El estimador de Mínimos Cuadrados Ordinarios estará dado por:
\begin{eqnarray*}
    \hat{\boldsymbol{\beta}}_{OLS} & = & (\mathbf{X}' \mathbf{X})^{-1} \mathbf{X}' \mathbf{Y}
\end{eqnarray*}

El estimador de Mínimos Cuadrados Generalizados estará dado por:
\begin{eqnarray*}
    \hat{\boldsymbol{\beta}}_{GLS} & = & (\mathbf{X}' \Sigma^{-1} \mathbf{X})^{-1} \mathbf{X}' \Sigma^{-1} \mathbf{Y}
\end{eqnarray*}

El estimador de Mínimos Cuadros Generalizados Factibles al siguiente:
\begin{equation*}
    \hat{\hat{\boldsymbol{\beta}}} = (\mathbf{X}' \hat{\Sigma}^{-1} \mathbf{X})^{-1} \mathbf{X}' \hat{\Sigma}^{-1} \mathbf{Y}
\end{equation*}

El estimador GMM:
\begin{equation}
    \hat{\boldsymbol{\beta}} = \left( \mathbf{X}' \mathbf{Z} \hat{\mathbf{W}} \mathbf{Z}' \mathbf{X} \right)^{-1} \left( \mathbf{X}' \mathbf{Z} \hat{\mathbf{W}} \mathbf{Z}' \mathbf{Y} \right)
    \label{GMM_System_Beta}
\end{equation}

El estimador 2SLS:
\begin{eqnarray}
    \hat{\boldsymbol{\beta}} & = & \left( \mathbf{X}' \mathbf{Z} \left( \frac{ \mathbf{Z}'\mathbf{Z} }{N} \right)^{-1} \mathbf{Z}' \mathbf{X} \right)^{-1} \left( \mathbf{X}' \mathbf{Z} \left( \frac{ \mathbf{Z}'\mathbf{Z} }{N} \right)^{-1} \mathbf{Z}' \mathbf{Y} \right) \nonumber \\ 
    & = & \left( \mathbf{X}' \mathbf{Z} \left( \mathbf{Z}'\mathbf{Z} \right)^{-1} \mathbf{Z}' \mathbf{X} \right)^{-1} \left( \mathbf{X}' \mathbf{Z} \left( \mathbf{Z}'\mathbf{Z} \right)^{-1} \mathbf{Z}' \mathbf{Y} \right) \nonumber \\
    & = & \left( \mathbf{X}' \mathbf{Z} \left( \mathbf{Z}'\mathbf{Z} \right)^{-1} \left( \mathbf{Z}'\mathbf{Z} \right) \left( \mathbf{Z}'\mathbf{Z} \right)^{-1} \mathbf{Z}' \mathbf{X} \right)^{-1} \left( \mathbf{X}' \mathbf{Z} \left( \mathbf{Z}'\mathbf{Z} \right)^{-1} \mathbf{Z}' \mathbf{Y} \right) \nonumber \\
    & = & \left( \hat{\mathbf{X}}' \hat{\mathbf{X}} \right)^{-1} \hat{\mathbf{X}}' \mathbf{Y} 
    \label{GMM_System_Beta_2SLS}
\end{eqnarray}

El estimador 3SLS:
\begin{eqnarray}
    \hat{\boldsymbol{\beta}} & = & \left( \mathbf{X}' \mathbf{Z} \left( \frac{ \mathbf{Z}' ( \mathbf{I}_N \otimes \hat{\boldsymbol{\Sigma}} ) \mathbf{Z} }{N} \right)^{-1} \mathbf{Z}' \mathbf{X} \right)^{-1} \left( \mathbf{X}' \mathbf{Z} \left( \frac{ \mathbf{Z}' ( \mathbf{I}_N \otimes \hat{\boldsymbol{\Sigma}} ) \mathbf{Z} }{N} \right)^{-1} \mathbf{Z}' \mathbf{Y} \right) \nonumber \\ 
    & = & \left( \mathbf{X}' \mathbf{Z} \left( \mathbf{Z}' ( \mathbf{I}_N \otimes \hat{\boldsymbol{\Sigma}} ) \mathbf{Z} \right)^{-1} \mathbf{Z}' \mathbf{X} \right)^{-1} \left( \mathbf{X}' \mathbf{Z} \left( \mathbf{Z}' ( \mathbf{I}_N \otimes \hat{\boldsymbol{\Sigma}} ) \mathbf{Z} \right)^{-1} \mathbf{Z}' \mathbf{Y} \right) 
    \label{GMM_System_Beta_3SLS}
\end{eqnarray}


## 1. Importación de bibliotecas

In [None]:
#!pip install linearmodels==4.17
#!pip install linearmodels==4.27
#!pip install linearmodels==4.5
#!pip install linearmodels

In [None]:
# Common libraries
#%matplotlib inline
import numpy as np
import pandas as pd
import statsmodels.api as sm
from linearmodels.system import SUR
from linearmodels import IV2SLS, IV3SLS, SUR, IVSystemGMM

#
import warnings
warnings.filterwarnings('ignore')

Vamos a utilizar un data set que está en la biblioteca: linearmodels

In [None]:
from linearmodels.datasets import mroz # Para el Data Set

print(mroz.DESCR)

Este ejemplo demuestra cómo se puede estimar conjuntamente un sistema de ecuaciones simultáneas utilizando mínimos cuadrados de tres etapas (3SLS). 

Las ecuaciones simultáneas modelan el salario y el número de horas trabajadas. Las dos ecuaciones son

\begin{equation}
    hours = \beta_0 + \beta_1 ln(wage) + \beta_2 educ + \beta_3 age + \beta_4 kidsslt6 + \beta_5 nwifeinc + \varepsilon_i^h
\end{equation}

\begin{equation}
    ln(wage) = \gamma_0 + \gamma_1 hours + \gamma_2 educ + \gamma_3 educ^2 + \gamma_4 exper + \varepsilon_i^w
\end{equation}

Este ejemplo está basado en la discusión que hace Wooldridge (2002).

In [None]:
# Show data

data = mroz.load()
data

In [None]:
# Selecting Data and Dropping NAs values:

data = data[ ["hours", "educ", "age", "kidslt6", "nwifeinc", "lwage", "exper", "expersq"] ]

data = data.dropna()

data

Estos ejemplos utilizan la interfaz de fórmula. 

Esto suele ser más sencillo cuando los modelos tienen regresores exógenos, regresores endógenos e instrumentos.

Acá algunos ejemplos con el procedimiento de 2SLS:

In [None]:
# Estimating hours equation:

hours = "hours ~ educ + age + kidslt6 + nwifeinc + [lwage ~ exper + expersq]" # Equation

hours_res = IV2SLS.from_formula(hours, data).fit(cov_type = "unadjusted")
# Note: cov_type can take values in 
# HC0: White's (1980) heteroskedasticity robust standard errors.
# HC1: MacKinnon and White's (1985) heteroskedasticity robust standard errors.
# HC2: MacKinnon and White's (1985) heteroskedasticity robust standard errors.
# HC3: MacKinnon and White's (1985) heteroskedasticity robust standard errors.

In [None]:
# First Stage
print(hours_res.first_stage)

In [None]:
# Second Stage
print(hours_res)

In [None]:
# Estimating wage equation:

lwage = "lwage ~ educ + exper + expersq + [hours ~ age + kidslt6 + nwifeinc]"

lwage_res = IV2SLS.from_formula(lwage, data).fit(cov_type = "unadjusted")

In [None]:
# First Stage
print(lwage_res.first_stage)

In [None]:
# Second Stage
print(lwage_res)

Un sistema se puede especificar utilizando un diccionario de fórmulas. 

Las términos del diccionario se utilizan como etiquetas de ecuación. Aparte de este simple cambio, la sintaxis es idéntica.

Aquí, el modelo se estima usando MCO que estimará simultáneamente las dos ecuaciones pero producirá estimaciones que son idénticas a las ecuaciones separadas.

In [None]:
#

hours = "hours ~ educ + age + kidslt6 + nwifeinc + [lwage ~ exper + expersq]" # Equation

lwage = "lwage ~ educ + exper + expersq + [hours ~ age + kidslt6 + nwifeinc]"

In [None]:
# Estimating System:

equations = dict(hours = hours, lwage = lwage)

system_2sls_res = IV3SLS.from_formula(equations, data).fit(method="ols", cov_type = "unadjusted")

In [None]:
# 
print(system_2sls_res)

El uso estimaciones GLS que pueden ser más eficientes que las estimaciones habituales. Aquí sólo cambia la primera ecuación. Esto se debe a la estructura del problema.

In [None]:
# Estimating System:

equations = dict(hours = hours, lwage = lwage)

system_3sls_res = IV3SLS.from_formula(equations, data).fit(method = "gls", cov_type = "unadjusted")

In [None]:
#

print(system_3sls_res)

### Especificación directa del modelo

El modelo se puede especificar directamente usando un diccionario de diccionarios donde los diccionarios internos contienen los 4 componentes del modelo:

* dependent - La variable dependiente
* exog - regresores exógenos
* endog - regresores endógenos
* instruments - Variables instrumentales

Las estimaciones son las mismas. Esta interfaz es más útil para generar y estimar modelos mediante programación.

In [None]:
hours = {
    "dependent": data[["hours"]],
    "exog": data[["educ", "age", "kidslt6", "nwifeinc"]],
    "endog": data[["lwage"]],
    "instruments": data[["exper", "expersq"]],
}

lwage = {
    "dependent": data[["lwage"]],
    "exog": data[["educ", "exper", "expersq"]],
    "endog": data[["hours"]],
    "instruments": data[["age", "kidslt6", "nwifeinc"]],
}

equations = dict(hours = hours, lwage = lwage)

system_3sls_res = IV3SLS(equations).fit(cov_type="unadjusted")

print(system_3sls_res)