In [None]:
import pandas as pd
import numpy as np
import matplotlib
from matplotlib import pyplot as plt #librería para graficar
import statsmodels.api as sm

# Omiting WARNINGS
import warnings
warnings.filterwarnings('ignore')


# Variables

## Educativas 
- desercion : desercion
- inst_pub : Institucion publica (p9_11==priv)
- rezago  : Ingreso a la EMS con mas de 17 años 
- escuela_asig : Le asignaron escuela
- turno : Turno diferente al que quería
- prob_ent_m : Problemas para entenderle a los maestros
- acoso_esc : Lo molestaban compañeros
- discriminacion : Se sentía discriminado(a)
- no_cambio :  Se quiso cambiar de escuela, no le revalidaron los cursos 
- beca : Tenía beca 
- confianza_maes : Confianza en Director/Maestro/Orientador
- expulcion : Expulsado por indisciplina
- cambio : Cambio de escuela
- prom_sec: Promedio de secundaria
- Promedio en EMS
    - prom_ems_a : Alto o de los más altos
    - prom_ems_nab : Ni alto ni bajo
    - prom_ems_b : Bajo
    - prom_ems_mb : De los mas bajos
- Reprobación 
    - repr_n : Nunca o alguna vez
    - repr_vm : Varias materias
    - repr_mp : Más de las permitidas
- Asistencia 
    - asis_s : Siempre o regularmente 
    - asis_f : Asistencia a clases: Faltaba con frecuencia
    - asis_fm : Asistencia a clases: Faltaba mucho
        
## Individuales
- sexo: Sexo (Mujer)
- casado : Se casó
- embarazo:  Embarazo o hijos
- baja_autoestima: Tenía baja autoestima
- disguto_est : Le disgustaba estudiar
- cambio_casa : Cambio de casa
- confianza_fam: Confianza en Familia
- problemas_padres : Problemas personales con padres
- preferian_hermanos: La familia prefería que estudiaran otros hermanos
- vivia_padres : Vivía con ambos padres
- num_hnos : Número de hermanos
- hnos_des : Hermanos desertores de EMS
- Educacion padres
    - educ_pad_sp : Sin Primaria completa
    - educ_pad_ss : Primaria completa / Secundaria incompleta
    - educ_pad_cs : Secundaria completa
    - educ_pad_cems : EMS incompleta o completa
    - educ_pad_ces : Educación Superior incompleta o completa

## Sociales
- ingreso : Ingreso familia
- falta_din ; Faltaba dinero en el hogar para útiles, pasajes o inscripción
- tiempo_aesc : Tiempo a la escuela (más de 30 min)
- trabajo_mas_imp : Consideraba trabajar más importante que estudiar 
- tiempo_trabajo : Trabajó> 20 hrs/semana
- estudio_poca_uti: Consideraba que estudiar es de poca utilidad
- drogas: Consumía drogas

In [None]:
df = pd.read_stata('Base_de_datos/ENDEMS_STATA.dta',convert_categoricals=False)
df

In [None]:
def llenar_df( v_desertor, v_no_desertor  ):
    res = []
    for desertor, x, y in df[['f21',v_desertor, v_no_desertor]].values:
        if desertor == 1 :
            res.append(x)
        else :
            res.append(y)
    return res

In [None]:
# Datos

## Filtro de alumnos desertores y no desertores
df = df[ (df['f21']== 1) | (df['f21']== 2)]

## Variales
columns = ['desercion','inst_pub','rezago','escuela_asig','turno_dif','prob_ent_m','acoso_esc', 'discriminacion', 'no_cambio', 
          'beca', 'confianza_maes' , 'expulcion', 'cambio', 'prom_sec' , 'prom_ems_a', 'prom_ems_nab' , 'prom_ems_b', 'prom_ems_mb',
          'repr_n', 'repr_vm' , 'repr_mp', 'asis_s', 'asis_f', 'asis_fm', 'sexo', 'casado', 'embarazo', 'baja_autoestima',
          'disguto_est', 'cambio_casa', 'confianza_fam' , 'problemas_padres', 'preferian_hermanos', 'vivia_padres', 
          'num_hnos', 'hnos_des' , 'educ_pad_sp' , 'educ_pad_ss' , 'educ_pad_cs' , 'educ_pad_cems' , 'educ_pad_ces', 
          'ingreso', 'falta_din', 'tiempo_aesc' , 'trabajo_mas_imp' , 'tiempo_trabajo', 'estudio_poca_uti', 'drogas'
         ]

ems = pd.DataFrame()
#ems = pd.DataFrame(index=range(8235), columns=columns)


df

#ems['desercion'] = [0]*8236

# desercion = 1 deserto

ems['desercion'] = [1 if x == 1 else 0 for x in df['f21']  ]

# institucion publica: desercion: p9_11 no desercion : p49_11  
ems['inst_pub'] = llenar_df('p9_11','p49_11')
# cast valor
ems.loc[ems.inst_pub == 1, "inst_pub"] = 0
ems.loc[ems.inst_pub == 2, "inst_pub"] = 1

# turno_dif p24_2 p63_2 
ems['turno_dif'] = llenar_df('p24_2','p63_2')
ems.loc[ems.turno_dif == 2, "turno_dif"] = 0

#prob_ent_m
ems['prob_ent_m'] = llenar_df('p24_7','p63_7')
ems.loc[ems.prob_ent_m == 2, "turno_dif"] = 0


#acoso_esc
ems['acoso_esc'] = llenar_df('p24_10','p63_10')
ems.loc[ems.acoso_esc == 2, "acoso_esc"] = 0


#discriminacion
ems['discriminacion'] = llenar_df('p24_12','p63_12')
ems.loc[ems.discriminacion == 2, "discriminacion"] = 0


#no_cambio
ems['no_cambio'] = llenar_df('p24_20','p63_20')
ems.loc[ems.no_cambio == 2, "no_cambio"] = 0


#beca
ems['beca'] = llenar_df('p18','p60')
ems.loc[ems.beca == 2, "beca"] = 0


#expulcion
ems['expulcion'] = llenar_df('p24_5','p63_5')
ems.loc[ems.expulcion == 2, "expulcion"] = 0


#cambio
ems['cambio'] = llenar_df('p7','p47')
ems.loc[ems.cambio == 2, "cambio"] = 0


#prom_sec
ems['prom_sec'] = llenar_df('p5','p45')
ems.loc[ems.prom_sec == 2, "prom_sec"] = 0


#sexo 1 Mujer 
ems['sexo'] = llenar_df('s1','s1')
ems.loc[ems.sexo == 1, "sexo"] = 0
ems.loc[ems.sexo == 2, "sexo"] = 1


#casado
ems['casado'] = llenar_df('p24_14','p63_14')
ems.loc[ems.casado == 2, "casado"] = 0


#embarazo
ems['embarazo'] = llenar_df('p24_18','p63_18')
ems.loc[ems.embarazo == 2, "embarazo"] = 0


#baja_autoestima
ems['baja_autoestima'] = llenar_df('p24_22','p63_22')
ems.loc[ems.baja_autoestima == 2, "baja_autoestima"] = 0


#disguto_est
ems['disguto_est'] = llenar_df('p24_4','p63_4')
ems.loc[ems.disguto_est == 2, "disguto_est"] = 0


#cambio_casa
ems['cambio_casa'] = llenar_df('p24_9','p63_9')
ems.loc[ems.cambio_casa == 2, "cambio_casa"] = 0


#problemas_padres
ems['problemas_padres'] = llenar_df('p24_13','p63_13')
ems.loc[ems.problemas_padres == 2, "problemas_padres"] = 0


#preferian_hermanos
ems['preferian_hermanos'] = llenar_df('p24_15','p63_15')
ems.loc[ems.preferian_hermanos == 2, "preferian_hermanos"] = 0


#num_hnos
#ems['num_hnos'] = llenar_df('p12_5cts','p52_5cts')
#ems.loc[ems.num_hnos == 2, "num_hnos"] = 0


#hnos_des
#ems['hnos_des'] = llenar_df('p23_2cts','p62_2cts')
#ems.loc[ems.hnos_des == 2, "hnos_des"] = 0





#ems.loc[df.f21 == 1,'desercion'] = 1

#ems['ins_pub']

In [None]:
ems.info()
ems

# Estimacion

In [None]:
Y = ems['desercion']
X = list(ems)
X.remove('desercion')
X = ems[X]
X = sm.add_constant(X)


In [None]:
mdl = sm.Logit(Y, X)
 
mdl_fit = mdl.fit()

In [None]:
# Imprimiendo Resultados:
print(mdl_fit.summary())

In [None]:

# Efectos Marginnales:
mdl_margeff = mdl_fit.get_margeff()
print(mdl_margeff.summary())

In [None]:
list(ems)

In [None]:
df['prom_sec'].unique()

In [None]:
ems['prom_sec'].unique()

In [None]:
df['f21']