# Encuesta continua de hogares 2020

### Cuánto afecta el nivel eductativo y la cantidad de hijos a las posibilidades de inserción laboral de una mujer

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()


In [2]:
df = pd.read_spss('HyP_2020_Terceros.sav')

df = df.rename(columns={
    'numero': 'id_hogar',
    'e26': 'sexo',
    'e563': 'genero',
    'e29_6': 'ascendencia',
    'e30': 'parentesco',
    'pobpcoac': 'estado_laboral',
    })

df = df[['id_hogar', 'sexo', 'genero', 'ascendencia', 'parentesco', 'estado_laboral', 'nper']]

In [3]:
df.sample(5)

Unnamed: 0,id_hogar,sexo,genero,ascendencia,parentesco,estado_laboral,nper
69411,38601,2.0,Mujer,Blanca,Jefe/a de hogar,Desocupados propiamente dichos,1.0
29010,22488,2.0,Mujer,Blanca,Esposo/a o compañero/a,Ocupados,2.0
30505,23201,1.0,Varón,Blanca,Jefe/a de hogar,"Inactivo, jubilado",1.0
142707,54648,2.0,Mujer,Asiática o amarilla,Jefe/a de hogar,Ocupados,1.0
126025,8537,1.0,0.0,Asiática o amarilla,Hijo/a de ambos,Menor 14 años,3.0


In [4]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 145166 entries, 0 to 145165
Data columns (total 7 columns):
 #   Column          Non-Null Count   Dtype   
---  ------          --------------   -----   
 0   id_hogar        145166 non-null  object  
 1   sexo            145166 non-null  float64 
 2   genero          145166 non-null  category
 3   ascendencia     145166 non-null  category
 4   parentesco      145166 non-null  category
 5   estado_laboral  145166 non-null  category
 6   nper            145166 non-null  float64 
dtypes: category(4), float64(2), object(1)
memory usage: 3.9+ MB


In [5]:
df['estado_laboral'].value_counts() / len(df['estado_laboral']) * 100

Ocupados                                      43.915242
Inactivo, jubilado                            16.902029
Menor 14 años                                 15.480898
Inactivo, estudiante                           8.152735
Inactivo, realiza los quehaceres del hogar     5.433779
Inactivo, pensionista                          3.998870
Desocupados propiamente dichos                 3.600705
Inactivo, otro                                 1.193806
Desocupados BT1V                               0.688867
Inactivo, rentista                             0.340989
Desocupados en seguro de desempleo             0.292079
Name: estado_laboral, dtype: float64

## Género

In [6]:
df['genero'].value_counts()

Mujer                    69037
Varón                    57429
0.0                      18571
Sin dato                    78
Mujer trans                 29
Varón trans                 14
Otra                         6
No sabe / No contesta        2
Name: genero, dtype: int64

## Ascendencia

In [7]:
asc_princ_porcentage = df['ascendencia'].value_counts() / len(df['ascendencia']) * 100

asc_princ_porcentage

Blanca                 69.510767
Asiática o amarilla    23.261645
Afro o negra            3.583484
Sin dato                2.384856
Indígena                1.244782
Otra                    0.014466
Name: ascendencia, dtype: float64

## Composición del hogar

In [8]:
df['parentesco'].value_counts() 

Jefe/a de hogar                            58021
Esposo/a o compañero/a                     31354
Hijo/a de ambos                            27083
Hijo/a solo del jefe/a                     15987
Nieto/a                                     4233
Hijo/a solo del esposo/a compañero/a        2288
Padre/madre                                 1601
Hermano/a                                   1070
Otro pariente                                888
Yerno/nuera                                  875
Otro no pariente                             865
Suegro/a                                     412
Sin dato                                     316
Cuñado/a                                     149
Servicio doméstico o familiar del mismo       24
Name: parentesco, dtype: int64

## Habitantes del hogar

In [9]:
familia = pd.pivot_table(df, index='id_hogar', columns='parentesco',values=['nper'], aggfunc='count')

familia['totales'] = familia.apply(lambda x:x.sum(), axis=1)

familia = familia.copy().sort_values(by='totales', ascending=False)

familia

Unnamed: 0_level_0,nper,nper,nper,nper,nper,nper,nper,nper,nper,nper,nper,nper,nper,nper,nper,totales
parentesco,Cuñado/a,Esposo/a o compañero/a,Hermano/a,Hijo/a de ambos,Hijo/a solo del esposo/a compañero/a,Hijo/a solo del jefe/a,Jefe/a de hogar,Nieto/a,Otro no pariente,Otro pariente,Padre/madre,Servicio doméstico o familiar del mismo,Sin dato,Suegro/a,Yerno/nuera,Unnamed: 16_level_1
id_hogar,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2,Unnamed: 12_level_2,Unnamed: 13_level_2,Unnamed: 14_level_2,Unnamed: 15_level_2,Unnamed: 16_level_2
56535,0,1,0,10,0,0,1,4,0,0,0,0,0,0,0,16
14619,0,0,0,0,0,4,1,4,2,0,0,0,0,0,2,13
9287,0,0,0,0,0,5,1,6,0,0,0,0,0,0,1,13
23586,0,0,0,0,0,6,1,3,1,0,0,0,2,0,0,13
52853,0,1,0,3,0,0,1,5,0,0,0,0,0,0,2,12
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
37352,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1
37338,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1
37337,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1
37336,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1


In [10]:
familia['totales'].value_counts().sort_index()

1     15749
2     18429
3     11547
4      8634
5      2870
6       887
7       267
8       134
9        44
10       11
11        8
12       10
13        3
16        1
Name: totales, dtype: int64

In [11]:
df['parentesco_num'] = df['parentesco'].cat.codes

In [12]:
df[['parentesco_num','parentesco']].value_counts().sort_index()

parentesco_num  parentesco                             
0               Cuñado/a                                     149
1               Esposo/a o compañero/a                     31354
2               Hermano/a                                   1070
3               Hijo/a de ambos                            27083
4               Hijo/a solo del esposo/a compañero/a        2288
5               Hijo/a solo del jefe/a                     15987
6               Jefe/a de hogar                            58021
7               Nieto/a                                     4233
8               Otro no pariente                             865
9               Otro pariente                                888
10              Padre/madre                                 1601
11              Servicio doméstico o familiar del mismo       24
12              Sin dato                                     316
13              Suegro/a                                     412
14              Yerno/nuera       

## Hijos

In [13]:
mask = df['parentesco_num'].isin([3,5,6])

df = df[mask]

df['es_madre'] = np.NaN
df['es_madre'] = df['es_madre'].apply(lambda x:'madre').where(df['parentesco_num'] == 6).where(df['sexo'] == 2)

In [14]:
df

Unnamed: 0,id_hogar,sexo,genero,ascendencia,parentesco,estado_laboral,nper,parentesco_num,es_madre
0,100,2.0,Mujer,Blanca,Jefe/a de hogar,Ocupados,1.0,6,madre
2,100,1.0,0.0,Blanca,Hijo/a de ambos,Menor 14 años,3.0,3,
3,1000,1.0,Varón,Blanca,Jefe/a de hogar,"Inactivo, jubilado",1.0,6,
4,1000,2.0,Mujer,Blanca,Hijo/a solo del jefe/a,"Inactivo, pensionista",2.0,5,
5,10000,1.0,Varón,Blanca,Jefe/a de hogar,"Inactivo, jubilado",1.0,6,
...,...,...,...,...,...,...,...,...,...
145161,9992,2.0,Mujer,Blanca,Jefe/a de hogar,Ocupados,1.0,6,madre
145162,9993,1.0,Varón,Blanca,Jefe/a de hogar,Ocupados,1.0,6,
145163,9994,1.0,Varón,Blanca,Jefe/a de hogar,Ocupados,1.0,6,
145164,9996,2.0,Mujer,Blanca,Jefe/a de hogar,"Inactivo, pensionista",1.0,6,madre


In [15]:
df_madres = df.copy().drop(labels=list(df.loc[(df['sexo'] == 1) & (df['parentesco_num'] == 6)].index))

df_madres

Unnamed: 0,id_hogar,sexo,genero,ascendencia,parentesco,estado_laboral,nper,parentesco_num,es_madre
0,100,2.0,Mujer,Blanca,Jefe/a de hogar,Ocupados,1.0,6,madre
2,100,1.0,0.0,Blanca,Hijo/a de ambos,Menor 14 años,3.0,3,
4,1000,2.0,Mujer,Blanca,Hijo/a solo del jefe/a,"Inactivo, pensionista",2.0,5,
11,10001,2.0,0.0,Blanca,Hijo/a de ambos,Menor 14 años,4.0,3,
12,10006,2.0,Mujer,Asiática o amarilla,Jefe/a de hogar,Ocupados,1.0,6,madre
...,...,...,...,...,...,...,...,...,...
145157,9989,2.0,Mujer,Blanca,Jefe/a de hogar,Ocupados,1.0,6,madre
145160,9991,2.0,Mujer,Blanca,Jefe/a de hogar,Ocupados,1.0,6,madre
145161,9992,2.0,Mujer,Blanca,Jefe/a de hogar,Ocupados,1.0,6,madre
145164,9996,2.0,Mujer,Blanca,Jefe/a de hogar,"Inactivo, pensionista",1.0,6,madre


In [20]:
df_familia_madre = df_madres[['id_hogar', 'es_madre', 'parentesco']].groupby(by='id_hogar').count().sort_values(by=['parentesco'], ascending=False)

df_familia_madre[df_familia_madre['es_madre'] != 0]

Unnamed: 0_level_0,es_madre,parentesco
id_hogar,Unnamed: 1_level_1,Unnamed: 2_level_1
27477,1,8
13695,1,8
13689,1,8
13700,1,8
13704,1,8
...,...,...
21823,1,1
41045,1,1
41043,1,1
41042,1,1


In [17]:
df_madres_work = df_madres[df_madres['es_madre'].notnull()]

df_madres_work

Unnamed: 0,id_hogar,sexo,genero,ascendencia,parentesco,estado_laboral,nper,parentesco_num,es_madre
0,100,2.0,Mujer,Blanca,Jefe/a de hogar,Ocupados,1.0,6,madre
12,10006,2.0,Mujer,Asiática o amarilla,Jefe/a de hogar,Ocupados,1.0,6,madre
22,1001,2.0,Mujer,Blanca,Jefe/a de hogar,Ocupados,1.0,6,madre
32,10012,2.0,Mujer,Asiática o amarilla,Jefe/a de hogar,Ocupados,1.0,6,madre
48,10017,2.0,Mujer,Asiática o amarilla,Jefe/a de hogar,Ocupados,1.0,6,madre
...,...,...,...,...,...,...,...,...,...
145157,9989,2.0,Mujer,Blanca,Jefe/a de hogar,Ocupados,1.0,6,madre
145160,9991,2.0,Mujer,Blanca,Jefe/a de hogar,Ocupados,1.0,6,madre
145161,9992,2.0,Mujer,Blanca,Jefe/a de hogar,Ocupados,1.0,6,madre
145164,9996,2.0,Mujer,Blanca,Jefe/a de hogar,"Inactivo, pensionista",1.0,6,madre


In [18]:
df_madres['hijos'] = df_madres.groupby('id_hogar')['id_hogar'].transform('count')

df_madres['hijos'].value_counts()

2     25056
1     22307
3     15876
4      6068
5      1995
6       738
7       273
8        72
10       10
Name: hijos, dtype: int64