# Haciendo Economía: Retornos a la educación

## Modelo 

$$
y= f(X) + u
$$

$$
log(w)= \beta_0 + Educ \beta_1 + u
$$


## Datos

La NLSY97 (National Longitudinal Survey of Youth, 1997) es un proyecto longitudinal que sigue las vidas de una muestra de jóvenes estadounidenses nacidos entre 1980 y 1984. Se entrevistó por primera vez a 8,984 encuestados cuando tenían entre 12 y 17 años en 1997. Esta cohorte en curso ha sido encuestada 19 veces hasta la fecha y ahora se entrevista bienalmente. Los datos están disponibles desde la Ronda 1 (1997-98) hasta la Ronda 19 (2019-2020), junto con un suplemento COVID-19 realizado en 2021.
La sección de "Educación, Capacitación y Puntajes de Logro" del NLSY97 proporciona información sobre las actividades educativas, actitudes y estado educativo de los encuestados. A continuación, te proporciono un resumen de las áreas relevantes que podrían contener información sobre las variables que mencionaste:

   
Entre otras cosas Se recopilan datos sobre las actividades, actitudes y estado educativo de los encuestados del NLSY97 a través de preguntas sobre escolaridad. Estas preguntas se adaptan al nivel de grado del encuestado y abordan experiencias educativas antes de la secundaria, en la secundaria y en la universidad.
       
En la primera ronda, la mayoría de los encuestados del NLSY97 participaron en la administración de una prueba nacional, la versión informatizada del Armed Services Vocational Aptitude Battery (ASVAB).


Además, algunos encuestados del NLSY97 realizaron el Peabody Individual Achievement Test (PIAT) Math Assessment como parte de la entrevista. También se recopiló información sobre otros tests estandarizados (como ACT y SAT) que los encuestados podrían haber tomado en la secundaria.

In [None]:
# install.packages("pacman") #Correr esta linea en Google Colab

In [2]:
# Cargamos los paquetes

require("pacman")

p_load("tidyverse","stargazer")


Loading required package: pacman



In [3]:
nlsy = read_csv('https://raw.githubusercontent.com/ignaciomsarmiento/datasets/main/nlsy97.csv')


[1mRows: [22m[34m1266[39m [1mColumns: [22m[34m994[39m
[36m──[39m [1mColumn specification[22m [36m──────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────[39m
[1mDelimiter:[22m ","
[32mdbl[39m (994): lnw_2016, educ, black, hispanic, other, exp, afqt, mom_educ, dad_...

[36mℹ[39m Use `spec()` to retrieve the full column specification for this data.
[36mℹ[39m Specify the column types or set `show_col_types = FALSE` to quiet this message.


In [4]:
head(nlsy)

lnw_2016,educ,black,hispanic,other,exp,afqt,mom_educ,dad_educ,yhea_100_1997,⋯,_XPexp_13,_XPexp_14,_XPexp_16,_XPexp_17,_XPexp_18,_XPexp_19,_XPexp_20,_XPexp_21,_XPexp_22,_XPexp_23
<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,⋯,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>
4.076898,16,0,0,0,11,7.0724,12,12,3,⋯,0,0,0,0,0,0,0,0,0,0
3.294138,9,0,0,0,19,4.7481,9,10,2,⋯,0,0,0,0,0,1,0,0,0,0
2.830896,9,0,1,0,22,1.1987,12,9,3,⋯,0,0,0,0,0,0,0,0,1,0
4.306459,16,0,0,0,13,8.9321,16,18,2,⋯,1,0,0,0,0,0,0,0,0,0
5.991465,16,0,1,0,15,2.2618,16,16,1,⋯,0,0,0,0,0,0,0,0,0,0
4.711924,16,0,0,0,14,8.9502,18,20,1,⋯,0,1,0,0,0,0,0,0,0,0


### Estadísticas descriptivas y limpieza de datos

In [16]:
summary(nlsy  %>% select(lnw_2016, educ))

    lnw_2016           educ      
 Min.   :-1.955   Min.   : 8.00  
 1st Qu.: 2.642   1st Qu.:12.00  
 Median : 3.077   Median :14.00  
 Mean   : 3.110   Mean   :14.31  
 3rd Qu.: 3.525   3rd Qu.:16.00  
 Max.   : 7.393   Max.   :20.00  

In [None]:
#Housekeeping
nlsy = nlsy  %>%   drop_na(educ) #dropea los valores faltantes (NA)

In [5]:
#Polinomios de educación

nlsy <- nlsy  %>% mutate(educ2=educ^2)

## Regresión Lineal: log(salario) en polinomios de educación

In [6]:
head(nlsy)

lnw_2016,educ,black,hispanic,other,exp,afqt,mom_educ,dad_educ,yhea_100_1997,⋯,_XPexp_23,educ2,educ3,educ4,educ5,educ6,educ7,educ8,educ9,educ10
<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,⋯,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>
4.076898,16,0,0,0,11,7.0724,12,12,3,⋯,0,256,4096,65536,1048576,16777216,268435456,4294967296,68719476736,1099512000000.0
3.294138,9,0,0,0,19,4.7481,9,10,2,⋯,0,81,729,6561,59049,531441,4782969,43046721,387420489,3486784000.0
2.830896,9,0,1,0,22,1.1987,12,9,3,⋯,0,81,729,6561,59049,531441,4782969,43046721,387420489,3486784000.0
4.306459,16,0,0,0,13,8.9321,16,18,2,⋯,0,256,4096,65536,1048576,16777216,268435456,4294967296,68719476736,1099512000000.0
5.991465,16,0,1,0,15,2.2618,16,16,1,⋯,0,256,4096,65536,1048576,16777216,268435456,4294967296,68719476736,1099512000000.0
4.711924,16,0,0,0,14,8.9502,18,20,1,⋯,0,256,4096,65536,1048576,16777216,268435456,4294967296,68719476736,1099512000000.0


### Corremos la regresión

In [9]:
reg<- lm(lnw_2016~educ,  data = nlsy)


In [10]:
stargazer(reg,type="text") #Similar en stata: outreg2 


                        Dependent variable:    
                    ---------------------------
                             lnw_2016          
-----------------------------------------------
educ                         0.077***          
                              (0.008)          
                                               
Constant                     2.003***          
                              (0.119)          
                                               
-----------------------------------------------
Observations                   1,266           
R2                             0.067           
Adjusted R2                    0.066           
Residual Std. Error      0.840 (df = 1264)     
F Statistic          90.128*** (df = 1; 1264)  
Note:               *p<0.1; **p<0.05; ***p<0.01


## Habilidad

El AFQT (Armed Forces Qualification Test) es una puntuación derivada de cuatro de las nueve subpruebas del ASVAB (Armed Services Vocational Aptitude Battery). Estas subpruebas son:

   - Arithmetic Reasoning (AR): Evalúa la capacidad para resolver problemas matemáticos básicos.
   - Word Knowledge (WK): Mide la capacidad para entender el significado de las palabras a través de sinónimos.
   - Paragraph Comprehension (PC): Evalúa la capacidad para obtener información de un texto escrito.
   - Mathematics Knowledge (MK): Mide el conocimiento de conceptos matemáticos y aplicaciones.
   
Muchos argumentan que el AFQT es comparable a otras pruebas populares de cociente intelectual (CI) en el hecho de que evalúa el nivel básico de inteligencia de un individuo.

Otros dicen que mo es una medida de inteligencia general, sino más bien una evaluación de habilidades y conocimientos en áreas específicas que son consideradas esenciales para el entrenamiento y desempeño en el servicio militar.

La puntuación del AFQT se calcula combinando las puntuaciones de las subpruebas mencionadas y luego se convierte en un percentil que varía de 0 a 10. Esta puntuación indica cómo se compara un individuo con una muestra representativa de la población de 18 a 23 años en términos de habilidades y conocimientos evaluados por el ASVAB.

Por ejemplo, una puntuación del AFQT en el percentil .60 significa que el individuo obtuvo una puntuación igual o superior al 60% de la población de referencia.


In [11]:
reg2 <- lm(lnw_2016~educ + afqt,  data = nlsy)

In [12]:
stargazer(reg,reg2,type="text") #Similar en stata: outreg2 


                                   Dependent variable:               
                    -------------------------------------------------
                                        lnw_2016                     
                              (1)                      (2)           
---------------------------------------------------------------------
educ                        0.077***                 0.048***        
                            (0.008)                  (0.010)         
                                                                     
afqt                                                 0.050***        
                                                     (0.010)         
                                                                     
Constant                    2.003***                 2.148***        
                            (0.119)                  (0.121)         
                                                                     
-------------------