# Logit Multinomial: Decisiones escolares y laborales para hombres jóvenes

## Dataset y objetivo del ejemplo:
* Los datos (un subconjunto del trabajo de Keane y Wolpin, 1997, "The Career Decisions of Young Men", Journal of Political Economy, Vol. 105, No. 3, pp. 473-522) contienen historial de empleo y escolaridad para una muestra de hombres para los años 1981 a 1987. 

* Utilizamos los datos para 1987. Los tres resultados posibles se inscribieron en la escuela (estado = 0), no en la escuela y no trabajando (estado = 1), y trabajando (estado = 2). 

* Las variables explicativas son educación, experiencia de trabajo cuadrática y un indicador binario de si el individuo es de raza negra. 

## 1. Importación de Bibliotecas:

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import statsmodels.api as sm

# Omiting WARNINGS
import warnings
warnings.filterwarnings('ignore')

### Descripción de variables:
* id: identifier
* numyrs: number of years in sample
* year: 81 to 87
* choice: sch=1,home=2,wc=3,bc=4,serv=5
* wage: annual wage, 1987 \$
* educ: years of schooling
* expwc: experience in white collar
* expbc: experience in blue collar
* expser: experience in services
* manuf: =1 if in manufacturing
* black: =1 if black
* lwage: log(wage)
* y81: =1 if year == 81
* ... y87
* enroll: =1 if choice == 1
* employ: =1 if choice == 3, 4, or 5
* attrit: =1 if attrit in next year
* exper: expwc + expbc + expser
* expersq: exper^2
* status: sch=1,home=2,work=3

In [None]:
#
keane_df = pd.read_stata('keane.dta')
keane_df.head()

In [None]:
# 
keane_df.shape

In [None]:
# Selección de datos (sólo información de 1987):

keane_df2 = keane_df.loc[keane_df.y87 == 1]

In [None]:
#
keane_df2["estado"] = 0
keane_df2.loc[keane_df2.status == 2.0, "estado"] = 1
keane_df2.loc[keane_df2.status == 3.0, "estado"] = 2

In [None]:
#
keane_df2.head()

In [None]:
# 
keane_df2.shape

In [None]:
#
keane_df2 = keane_df2[['estado', 'educ', 'exper', 'expersq', 'black']]

keane_df2.head()

In [None]:
#
pd.crosstab(keane_df2["estado"], keane_df2["educ"], margins = True)

## 2. Estimación 

In [None]:
# Definición de variables:
y = keane_df2["estado"]

X = keane_df2[['educ', 'exper', 'expersq', 'black']]

X = sm.add_constant(X)

In [None]:
# Estimación:
mdl = sm.MNLogit(y, X)
 
mdl_fit = mdl.fit()

In [None]:
# Imprimiendo Resultados:
print(mdl_fit.summary())

In [None]:
# Efectos Marginnales:
mdl_margeff = mdl_fit.get_margeff()

print(mdl_margeff.summary())