In [2]:
%load_ext autoreload
%autoreload 2

In [3]:
import sys
import importlib

import itertools as it
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
import numpy as np
import statsmodels.api as sm

from itertools import product

from criteriaetl.utils.expansion_func import (get_value_counts_with_expansion_factor,
    get_percentage_table_with_expansion_factor)
from criteriaetl.utils.display_func import cdisplay, percentage_count_plot
from criteriaetl.utils.common_func import (get_weighted_complete_randomization_series_on_subset, 
    proportional_cut, weighted_qcut, get_partition_bool_columns_dict)
from criteriaetl.transformers.columns_base import (NameTransformer, 
    ReplaceTransformer, SelectTransformer, AssignTransformer)
from criteriaetl.transformers.rows_base import AggregateTransformer
from criteriaetl.transformers.fusion_base import MergeTransformer

from projectetl.utils.dataload import (load_survey_data_do, save_survey_with_pickle,
                                       load_survey_from_pickle)
from projectetl.utils.config import ENHOGAR_DIR

In [5]:
survey_household_member_raw = load_survey_data_do(ENHOGAR_DIR / 'Hogar_Personas ENHOGAR 2016.sav',
                                                  load_func=lambda path: pd.read_spss(str(path)))
survey_member_raw = load_survey_data_do(ENHOGAR_DIR / 'Personas ENHOGAR 2016.sav',
                                        load_func=lambda path: pd.read_spss(str(path)))
survey_house_raw = load_survey_data_do(ENHOGAR_DIR / 'Viviendas ENHOGAR 2016.sav',
                                       load_func=lambda path: pd.read_spss(str(path)))

In [12]:
survey_household_member_raw.head()

Unnamed: 0,hhupm,hhviv,hhogar,hlinea,hnumlin,hnumero,hoviv,zona,hprovi,hmunic,hdistrit,hsecc,hbarrio,hpolig,harea,hsegm,hintd,hintm,hinty,hvisitas,hresul,hmiembro,helegido,hentrev,hsuperv,hcritico,hdigitad,hirevd,hirevm,hirevy,h402,h403,h403a,h404d,h404m,h404y,h405,h406,h406a,h407,...,h204b,h204c,h204d,h205,h206,h207,h208,h209a,h209b,h209c,h209d,h209e,h209f,h209g,h209h,h209i,h210,h211,h212,h213,h214,h215,h216,h217,h218,h301,h302,h303,h304,h305,h306,h307,h308,grupsec,edad_quinq,hestrat,region,fexpansion,fponderacion,filter_$
0,1.0,1.0,1.0,1.0,1.0,5473.0,2.0,Urbano,Distrito Nacional,1.0,1.0,1.0,1.0,1.0,3.0,3.0,1.0,11.0,2016.0,1.0,Entrevista completa,6.0,Entrevista completa,Sandra Osoria Pérez,Ana María Moran Duran,Natividad Valverde Martínez,HENRY,1.0,11.0,2016.0,Hombre,41.0,1.0,13.0,12.0,1974.0,El (la) Jefe(a),Si tiene,1.0,Unido(a),...,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Muy poco protegidos,Poco satisfecho,Mala,No,,,,,,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Medio bajo,40-44,Ciudad de Santo Domingo,Metropolitana,143.43477,1.080379,Not Selected
1,1.0,1.0,1.0,2.0,1.0,5473.0,2.0,Urbano,Distrito Nacional,1.0,1.0,1.0,1.0,1.0,3.0,3.0,1.0,11.0,2016.0,1.0,Entrevista completa,6.0,Entrevista completa,Sandra Osoria Pérez,Ana María Moran Duran,Natividad Valverde Martínez,HENRY,1.0,11.0,2016.0,Mujer,33.0,2.0,29.0,9.0,1983.0,Esposo(a) o compañero(a),Si tiene,2.0,Unido(a),...,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Muy poco protegidos,Poco satisfecho,Mala,No,,,,,,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Medio bajo,30-34,Ciudad de Santo Domingo,Metropolitana,143.43477,1.080379,Not Selected
2,1.0,1.0,1.0,3.0,1.0,5473.0,2.0,Urbano,Distrito Nacional,1.0,1.0,1.0,1.0,1.0,3.0,3.0,1.0,11.0,2016.0,1.0,Entrevista completa,6.0,Entrevista completa,Sandra Osoria Pérez,Ana María Moran Duran,Natividad Valverde Martínez,HENRY,1.0,11.0,2016.0,Mujer,18.0,3.0,11.0,3.0,1998.0,Adoptado/ hijo de crianza,Si tiene,3.0,Separado(a) de unión libre,...,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Muy poco protegidos,Poco satisfecho,Mala,No,,,,,,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Medio bajo,15-19,Ciudad de Santo Domingo,Metropolitana,143.43477,1.080379,Not Selected
3,1.0,1.0,1.0,4.0,1.0,5473.0,2.0,Urbano,Distrito Nacional,1.0,1.0,1.0,1.0,1.0,3.0,3.0,1.0,11.0,2016.0,1.0,Entrevista completa,6.0,Entrevista completa,Sandra Osoria Pérez,Ana María Moran Duran,Natividad Valverde Martínez,HENRY,1.0,11.0,2016.0,Hombre,14.0,4.0,23.0,12.0,2001.0,Adoptado/ hijo de crianza,Si tiene,4.0,Soltero(a),...,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Muy poco protegidos,Poco satisfecho,Mala,No,,,,,,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Medio bajo,10-14,Ciudad de Santo Domingo,Metropolitana,143.43477,1.080379,Not Selected
4,1.0,1.0,1.0,5.0,1.0,5473.0,2.0,Urbano,Distrito Nacional,1.0,1.0,1.0,1.0,1.0,3.0,3.0,1.0,11.0,2016.0,1.0,Entrevista completa,6.0,Entrevista completa,Sandra Osoria Pérez,Ana María Moran Duran,Natividad Valverde Martínez,HENRY,1.0,11.0,2016.0,Hombre,11.0,5.0,13.0,9.0,2005.0,Adoptado/ hijo de crianza,Si tiene,0.0,,...,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Muy poco protegidos,Poco satisfecho,Mala,No,,,,,,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Medio bajo,10-14,Ciudad de Santo Domingo,Metropolitana,143.43477,1.080379,Not Selected


In [13]:
survey_member_raw.head()

Unnamed: 0,hhupm,hhviv,hhogar,hlinea,hnumlin,hnumero,hoviv,zona,hprovi,hmunic,hdistrit,hsecc,hbarrio,hpolig,harea,hsegm,hintd,hintm,hinty,hvisitas,hresul,hmiembro,helegido,hnumli,hentrev,hsuperv,hcritico,hdigitad,hirevd,hirevm,hirevy,estratos,hzona,h402,h403,h403a,h404d,h404m,h404y,h405,...,h601,h601a,h602,h603,h604,h605,h606,h607,h608,h609,h610,h611,h612,h613,h614,h615,h616,h617,h618,h618f,h619,h620,h621,h622,h623,h624,h625,h626,h627,h628,h629,h630,h631,h632,nmiembro,hestrat,region,grupsec,fexpansion,fponderacion
0,1.0,1.0,1.0,1.0,1.0,5473.0,2.0,Urbano,Distrito Nacional,1.0,1.0,1.0,1.0,1.0,3.0,3.0,1.0,11.0,2016.0,1.0,Entrevista completa,6.0,Entrevista completa,1.0,Sandra Osoria Pérez,Ana María Moran Duran,Natividad Valverde Martínez,HENRY,1.0,11.0,2016.0,Distrito Nacional,Urbano,Hombre,41.0,1.0,13.0,12.0,1974.0,El (la) Jefe(a),...,No,Porque el seguro está en tramite,,,,,,,,,,,,,,,,,,,,,,,,,,,,,Si,Otro problema de salud,Algunas veces,No,6-7,Ciudad de Santo Domingo,Metropolitana,Medio bajo,143.43477,1.080379
1,1.0,1.0,1.0,2.0,1.0,5473.0,2.0,Urbano,Distrito Nacional,1.0,1.0,1.0,1.0,1.0,3.0,3.0,1.0,11.0,2016.0,1.0,Entrevista completa,6.0,Entrevista completa,1.0,Sandra Osoria Pérez,Ana María Moran Duran,Natividad Valverde Martínez,HENRY,1.0,11.0,2016.0,Distrito Nacional,Urbano,Mujer,33.0,2.0,29.0,9.0,1983.0,Esposo(a) o compañero(a),...,Si,,Si,Es sin pago y está afiliado al SeNaSa según Le...,No,,,,Titular,2.0,2.0,2.0,No,Si,No,No,No,,,,1.0,Si,"Si, siempre",Si,"Si, siempre",No,,Si,No,Si,Si,Otro problema de salud,"Si, siempre",No,6-7,Ciudad de Santo Domingo,Metropolitana,Medio bajo,143.43477,1.080379
2,1.0,1.0,1.0,3.0,1.0,5473.0,2.0,Urbano,Distrito Nacional,1.0,1.0,1.0,1.0,1.0,3.0,3.0,1.0,11.0,2016.0,1.0,Entrevista completa,6.0,Entrevista completa,1.0,Sandra Osoria Pérez,Ana María Moran Duran,Natividad Valverde Martínez,HENRY,1.0,11.0,2016.0,Distrito Nacional,Urbano,Mujer,18.0,3.0,11.0,3.0,1998.0,Adoptado/ hijo de crianza,...,Si,,Si,Es sin pago y está afiliado al SeNaSa según Le...,No,,,,Titular,0.0,0.0,,No,No tiene hijos,No tiene hijos,No,No,,,,1.0,Si,"Si, siempre",Si,"Si, siempre",No,,Si,No,Si,Si,Otro problema de salud,Algunas veces,No,6-7,Ciudad de Santo Domingo,Metropolitana,Medio bajo,143.43477,1.080379
3,1.0,1.0,1.0,4.0,1.0,5473.0,2.0,Urbano,Distrito Nacional,1.0,1.0,1.0,1.0,1.0,3.0,3.0,1.0,11.0,2016.0,1.0,Entrevista completa,6.0,Entrevista completa,1.0,Sandra Osoria Pérez,Ana María Moran Duran,Natividad Valverde Martínez,HENRY,1.0,11.0,2016.0,Distrito Nacional,Urbano,Hombre,14.0,4.0,23.0,12.0,2001.0,Adoptado/ hijo de crianza,...,Si,,Si,Es sin pago y está afiliado al SeNaSa según Le...,No,,,,Dependiente,,,,,,,,,Del padre o madre,Si,2.0,1.0,Si,"Si, siempre",Si,"Si, siempre",No,,Si,No,,Si,Otro problema de salud,Algunas veces,No,6-7,Ciudad de Santo Domingo,Metropolitana,Medio bajo,143.43477,1.080379
4,1.0,1.0,1.0,5.0,1.0,5473.0,2.0,Urbano,Distrito Nacional,1.0,1.0,1.0,1.0,1.0,3.0,3.0,1.0,11.0,2016.0,1.0,Entrevista completa,6.0,Entrevista completa,1.0,Sandra Osoria Pérez,Ana María Moran Duran,Natividad Valverde Martínez,HENRY,1.0,11.0,2016.0,Distrito Nacional,Urbano,Hombre,11.0,5.0,13.0,9.0,2005.0,Adoptado/ hijo de crianza,...,Si,,Si,Es sin pago y está afiliado al SeNaSa según Le...,No,,,,Dependiente,,,,,,,,,Del padre o madre,Si,2.0,1.0,Si,"Si, siempre",Si,"Si, siempre",No,,Si,No,,Si,Otro problema de salud,Algunas veces,No,6-7,Ciudad de Santo Domingo,Metropolitana,Medio bajo,143.43477,1.080379


In [14]:
survey_house_raw.head()

Unnamed: 0,hhupm,hhviv,hhogar,hnumero,hoviv,hzona,hprovin,hmunic,hresul,hmiembro,h001,h101,h102,h103,h104,h105,h106,h107,h108,h109,h110,h111,h112,h113,h114a,h114b,h114c,h114d,h114e,h114f,h114g,h114h,h114i,h114j,h114k,h114l,h114m,h114n,h114o,h114p,...,h204b,h204c,h204d,h205,h206,h207,h208,h209a,h209b,h209c,h209d,h209e,h209f,h209g,h209h,h209i,h210,h211,h212,h213,h214,h215,h216,h217,h218,h301,h302,h303,h304,h305,h306,h307,h308,estratos,region,grupsec,fexpansion,fponderacion,fexpansion_tic,fponderacion_tic
0,1.0,1.0,1.0,5473.0,2.0,Urbano,Distrito Nacional,1.0,Entrevista completa,6.0,1.0,Vivienda independiente,Block o concreto,Concreto,Cerámica,3.0,2.0,Gas propano,Agua de botellón (procesada),Del acueducto en el patio de la vivienda,Inodoro,Lo usan solo las personas del hogar,Energía eléctrica del tendido público,La recoge el ayunrtamiento,Sí,Sí,Sí,Sí,Sí,Sí,No,No,Sí,No,Sí,No,No,No,No,No,...,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Muy poco protegidos,Poco satisfecho,Mala,No,,,,,,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Ciudad de Santo Domingo,Metropolitana,Medio bajo,143.43477,1.080379,346.88577,0.965224
1,1.0,2.0,1.0,5474.0,5.0,Urbano,Distrito Nacional,1.0,Entrevista completa,3.0,1.0,Vivienda independiente,Madera,Zinc,Cemento,2.0,1.0,Gas propano,Agua de botellón (procesada),Del acueducto en el patio de la vivienda,Inodoro,Lo usan solo las personas del hogar,Energía eléctrica del tendido público,La recoge el ayunrtamiento,No,Sí,No,No,Sí,No,No,No,Sí,No,Sí,No,No,No,No,No,...,Sí,Sí,Sí,No,No,No,Sí,Sí,Sí,No,Sí,Sí,Sí,No,No,Sí,Poco protegidos,Satisfecho,Buena,Si,Si,,,,,Sí,No,No,Sí,No,Sí,Sí,Sí,Ciudad de Santo Domingo,Metropolitana,Muy bajo,143.43477,1.080379,346.88577,0.965224
2,1.0,3.0,1.0,5475.0,8.0,Urbano,Distrito Nacional,1.0,Entrevista completa,4.0,1.0,Vivienda independiente,Block o concreto,Concreto,Mosaico,4.0,3.0,Gas propano,Agua de botellón (procesada),Del acueducto dentro de la vivienda,Inodoro,Lo usan solo las personas del hogar,Energía eléctrica del tendido público,La recoge el ayunrtamiento,Sí,Sí,Sí,No,Sí,Sí,No,No,Sí,No,Sí,No,No,No,No,Sí,...,No,Sí,No,Sí,Sí,Sí,Sí,Sí,No,Sí,No,Sí,Sí,No,Sí,Sí,Poco protegidos,Satisfecho,Buena,Si,Si,Satisfecho,Satisfecho,Poco satisfecho,Satisfecho,Sí,No,No,No,No,No,No,Sí,Ciudad de Santo Domingo,Metropolitana,Medio y Medio alto,143.43477,1.080379,346.88577,0.965224
3,1.0,4.0,1.0,5476.0,12.0,Urbano,Distrito Nacional,1.0,Entrevista completa,3.0,1.0,Vivienda independiente,Block o concreto,Concreto,Cerámica,3.0,2.0,Gas propano,Agua de botellón (procesada),Del acueducto en el patio de la vivienda,Inodoro,Lo usan solo las personas del hogar,Energía eléctrica del tendido público,La recoge el ayunrtamiento,Sí,Sí,Sí,No,Sí,Sí,No,No,Sí,No,Sí,Sí,No,No,No,Sí,...,Sí,Sí,Sí,No,Sí,Sí,Sí,Sí,No,Sí,Sí,Sí,No,Sí,Sí,Sí,Poco protegidos,Poco satisfecho,Mala,No,,,,,,Sí,No,No,No,No,No,No,No,Ciudad de Santo Domingo,Metropolitana,Medio y Medio alto,143.43477,1.080379,346.88577,0.965224
4,1.0,5.0,1.0,5477.0,15.0,Urbano,Distrito Nacional,1.0,Entrevista completa,5.0,1.0,Vivienda independiente,Block o concreto,Concreto,Cerámica,3.0,2.0,Gas propano,De camioncito procesada,Del acueducto en el patio de la vivienda,Inodoro,Lo usan solo las personas del hogar,Energía eléctrica del tendido público,La recoge el ayunrtamiento,No,Sí,Sí,No,Sí,Sí,No,No,Sí,No,Sí,No,No,No,No,Sí,...,Sí,No,No,No,No,Sí,Sí,Sí,No,Sí,No,Sí,Sí,No,Sí,No,Poco protegidos,Poco satisfecho,Buena,Si,Si,Satisfecho,Satisfecho,No solicitó servicio,Satisfecho,Sí,Sí,Sí,Sí,Sí,Sí,Sí,No,Ciudad de Santo Domingo,Metropolitana,Medio bajo,143.43477,1.080379,346.88577,0.965224
