In [2]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# Comment this if the data visualisations doesn't work on your side
%matplotlib inline

plt.style.use('bmh')

In [8]:
dfSueldos = pd.read_csv('./Dataset/EPA_2020T1.csv', delimiter="\t")
dfSueldos.head()

Unnamed: 0,CICLO,CCAA,PROV,NVIVI,NIVEL,NPERS,EDAD5,RELPP1,SEXO1,NCONY,...,SIDI3,SIDAC1,SIDAC2,MUN1,PRORE1,REPAIRE1,TRAANT,AOI,CSE,FACTOREL
0,190,16,1,1,1,1,40,1,1,2,...,,1.0,1.0,1,,,1.0,4.0,16.0,244.99
1,190,16,1,1,1,2,35,2,6,1,...,,,,1,,,6.0,9.0,,244.99
2,190,16,1,1,2,3,0,3,6,0,...,,,,1,,,,,,235.1
3,190,16,1,2,1,1,45,1,6,0,...,,1.0,2.0,1,,,1.0,3.0,13.0,206.08
4,190,16,1,2,1,2,20,3,1,0,...,,2.0,2.0,1,,,1.0,6.0,13.0,206.08


In [12]:
dfSueldos.shape

(158290, 93)


Mostramos a continuación el detalle de todas las caracteríticas incluidas enel dataset. Acompañamos la documentación con el archivo "dr_EPA_2005.xlsx" descargado de la página del INE junto al dataset original y que contiene la explicación detallada de cada una de ellas y a que se corresponden los valores categóricos almacenados.

| Variable | Descripción                                                                                                                                                                                                                                                                                                                                                                                |
|----------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| CICLO    | Período de referencia. Todas las personas / viviendas. Valores: 130 (T1-2005), 131(T2-2005) ...   183 (T2-2018)…..                  .                                                                                                                                                                                                                                                      |
| CCAA     | Comunidad autónoma                                                                                                                                                                                                                                                                                                                                                                         |
| PROV     | Provincia donde se ubica la vivienda. Todas las personas / viviendas                                                                                                                                                                                                                                                                                                                       |
| NVIVI    | Número de orden de la vivienda.                                                                                                                                                                                                                                                                                                                                                            |
| NIVEL    | Variable que indica el nivel del registro en el fichero. Tipo de registro: Mayor de 15, menor de 16, vivienda. Todas las personas / viviendas                                                                                                                                                                                                                                              |
| NPERS    | Número de orden de la persona en el hogar. Todas las personas. 01-19                                                                                                                                                                                                                                                                                                                       |
| EDAD5    | Edad, grupos quinquenales de años cumplidos. Todas las personas                                                                                                                                                                                                                                                                                                                            |
| RELPP1   | Relación con la persona de referencia. Todas las personas                                                                                                                                                                                                                                                                                                                                  |
| SEXO1    | Sexo. Todas las personas                                                                                                                                                                                                                                                                                                                                                                   |
| NCONY    | Número de orden del cónyuge o pareja en el hogar. Todas las personas (sólo se pregunta a aquellas personas de 16 y más años). 01-19. 00 No tiene o no reside en la vivienda                                                                                                                                                                                                                |
| NPADRE   | Número de orden del padre en el hogar. Todas las personas. 01-19. 00 No tiene o no reside en la vivienda                                                                                                                                                                                                                                                                                   |
| NMADRE   | Número de orden de la madre en el hogar. Todas las personas. 01-19. 00 No tiene o no reside en la vivienda                                                                                                                                                                                                                                                                                 |
| RELLMILI | Relleno antigua variable MILI (Si está realizando o no el servicio militar o civil sustitutorio -EPA1999_2004-)                                                                                                                                                                                                                                                                            |
| ECIV1    | Estado civil legal. Todas las personas (sólo se pregunta a aquellas personas de 16 o más años)                                                                                                                                                                                                                                                                                             |
| PRONA1   | Si es en España, indicar provincia. Personas nacidas en España                                                                                                                                                                                                                                                                                                                             |
| REGNA1   | Región del país extranjero de nacimiento. Personas nacidas en el extranjero.                                                                                                                                                                                                                                                                                                               |
| NAC1     | Nacionalidad. Todas las personas                                                                                                                                                                                                                                                                                                                                                           |
| EXREGNA1 | Región del país de la nacionalidad extranjera. Todas las personas con nacionalidad extranjera o doble nacionalidad.                                                                                                                                                                                                                                                                        |
| ANORE1   | Años de residencia en España. Todas las personas con nacionalidad extranjera (0-99). 0 para menos de un año en España                                                                                                                                                                                                                                                                      |
| NFORMA   | Nivel de estudios (3). Todas las personas de 16 y más años. CNED 2014 (01-81) CNED 2000 (11-80)                                                                                                                                                                                                                                                                                            |
| RELLB1   | Relleno en apartado de formación                                                                                                                                                                                                                                                                                                                                                           |
| EDADEST  | Edad en la que alcanzó el máximo nivel de estudios. Todas las personas de 16 y más años no analfabetas (7-110). 0 - No sabe fecha en la que alcanzó el máximo nivel de estudios.                                                                                                                                                                                                           |
| CURSR    | Ha cursado estudios reglados (enseñanza regular) durante las cuatro últimas semanas. Todas las personas de 16 y más años                                                                                                                                                                                                                                                                   |
| NCURSR   | Nivel de los estudios reglados que cursa (2, 3). Todas las personas de 16 y más años que han cursado estudios reglados durante las 4 últimas semanas. CNED 2014 (11-81) CNED 2000 (11-61)                                                                                                                                                                                                  |
| CURSNR   | Ha realizado algún curso de formación no reglada, durante las cuatro últimas semanas. Todas las personas de 16 y más años. CNED 2014 (91-94) CNED 2000 (21-93)                                                                                                                                                                                                                             |
| NCURNR   | Nivel de estudios de la formación no reglada (2). Todas las personas de 16 y más años que han realizado algún curso de formación no reglada en las 4 últimas semanas                                                                                                                                                                                                                       |
| HCURNR   | Total de horas de estudios no reglados en las últimas cuatro semanas . Todas las personas de 16 y más años que han realizado algún curso de formación no reglada en las 4 últimas semanas (0-400). 999 No sabe                                                                                                                                                                             |
| RELLB2   | Relleno en apartado de formación                                                                                                                                                                                                                                                                                                                                                           |
| TRAREM   | Si ha realizado un trabajo remunerado durante la semana pasada. Todas las personas de 16 y más años                                                                                                                                                                                                                                                                                        |
| AYUDFA   | Ayuda familiar. Realización de trabajo no remunerado empresa familiar. Todas las personas de 16 y más años que no trabajaron en la semana de referencia a cambio de remuneración                                                                                                                                                                                                           |
| AUSENT   | A pesar de no haber trabajado ¿tenía un empleo o negocio?. Todas las personas de 16 y más años que no trabajaron en la semana de referencia a cambio de remuneración                                                                                                                                                                                                                       |
| RZNOTB   | Razones por las que no trabajó, teniendo empleo. Todas las personas de 16 y más años que no trabajaron la semana de referencia, ni ayudan en el negocio familiar, y tenían empleo                                                                                                                                                                                                          |
| VINCUL   | Vinculación con el empleo de personas con empleo ausentes en la semana de referencia. Personas que tenían un empleo del cual estaban ausentes la semana de referencia                                                                                                                                                                                                                      |
| NUEVEM   | Ha encontrado empleo . Personas de 16 a 74 años sin empleo que no han trabajado en la semana de referencia                                                                                                                                                                                                                                                                                 |
| OCUP1    | Ocupación principal. Todas las personas de 16 y más años que trabajaron o tenían empleo la semana de referencia. Categorías generadas a partir de T1-2011 con códigos según CNO 2011                                                                                                                                                                                                       |
| ACT1     | Actividad principal (1). Todas las personas de 16 y más años que trabajaron o tenían empleo la semana de referencia. Categorías generadas a partir de T1-2008 con Códigos según CNAE 2009. Hasta T4-2007 se obtuvieron con la clasificación de actividades CNAE-93 rev-1. (véase Anexo códigos CNAE 2009 y 1993 para más información sobre la correspondencia entre ambas clasificaciones) |
| SITU     | ¿Cuál es su situación profesional (actividad principal)?                                                                                             Todas las personas de 16 y más años que trabajaron o tenían empleo la semana de referencia                                                                                                                                            |
| SP       | Tipo de administración en la que trabaja. Todos los asalariados del sector público                                                                                                                                                                                                                                                                                                         |
| DUCON1   | Tiene contrato indefinido o temporal. Todos los asalariados                                                                                                                                                                                                                                                                                                                                |
| DUCON2   | Relación laboral de carácter permanente o discontinuo. Asalariados con contrato o relación laboral indefinidos                                                                                                                                                                                                                                                                             |
| DUCON3   | Tipo de contrato o relación laboral de carácter temporal. Asalariados con contrato temporal                                                                                                                                                                                                                                                                                                |
| TCONTM   | Duración en meses del contrato o relación laboral temporal  (si ha trabajado un mes o más). Asalariados con contrato temporal cuya duración mínima de contrato es un mes. Valores: 00-96                                                                                                                                                                                                   |
| TCONTD   | Duración en días del contrato o relación laboral temporal (si ha trabajado menos de un mes). Asalariados con contrato temporal cuya duración máxima de contrato es menos de un mes. Valores: 00-30; 99                                                                                                                                                                                     |
| DREN     | Tiempo en meses desde la renovación del contrato. Asalariados. Valores: 0-720                                                                                                                                                                                                                                                                                                              |
| DCOM     | Tiempo en meses en la empresa. Ocupados. Valores: 0-720                                                                                                                                                                                                                                                                                                                                    |
| PROEST   | Provincia donde está ubicado. Todas las personas de 16 y más años que trabajaron o tenían empleo la semana de referencia                                                                                                                                                                                                                                                                   |
| REGEST   | Territorio donde está ubicado el establecimiento, si es fuera de España. Todas las personas de 16 y más años que trabajaron o tenían empleo la semana de referencia.                                                                                                                                                                                                                       |
| PARCO1   | Tipo de jornada, completa o parcial. Todas las personas de 16 y más años que trabajaron o tenían empleo la semana de referencia                                                                                                                                                                                                                                                            |
| PARCO2   | Motivo de tener jornada parcial. Ocupados a tiempo parcial                                                                                                                                                                                                                                                                                                                                 |
| HORASP   | Horas pactadas en contrato o acuerdo de trabajo (hhmm). Todos los asalariados. Valores: hhmm. hh=00-98. mm=00-59. (9999= No puede precisar / no sabe) .                                                                                                                                                                                                                                    |
| HORASH   | Número de horas semanales que dedica a este trabajo habitualmente (hhmm). Todas las personas de 16 y más años que trabajaron o tenían empleo la semana de referencia. Valores: hhmm. hh=01-98. (9999= No puede precisar / no sabe). mm=00-59; 99  (99= No puede precisar / no sabe).                                                                                                       |
| HORASE   | Número de horas efectivas que dedicó a este trab. la semana pasada (hhmm). Todas las personas de 16 y más años que trabajaron o tenían empleo la semana de referencia. Valores: hhmm. hh=00-98. mm=00-59. (0000 = No trabajó durante la semana de referencia; 9999 = No puede precisar / no sabe)                                                                                          |
| EXTRA    | Realizó horas extraordinarias en la semana de referencia. Asalariados                                                                                                                                                                                                                                                                                                                      |
| EXTPAG   | Número de horas extraordinarias pagadas realizadas en la semana de referencia (hhmm). Valores: hhmm. hh=00-98. mm=00-59. (0000 = No hizo horas extra durante la semana de referencia; 9999 = No puede precisar / no sabe)                                                                                                                                                                  |
| EXTNPG   | Número de horas extraordinarias no pagadas realizadas en la semana de referencia (hhmm). Valores: hhmm. hh=00-98; 99     . mm=00-59; 99  . (0000 = No hizo horas extra durante la semana de referencia; 9999 = No puede precisar / no sabe)                                                                                                                                                |
| RZDIFH   | Razón principal de la diferencia de horas efectivas y habituales. Todas las personas de 16 y más años que trabajaron o tenían empleo la semana de referencia con horas efectivas distintas de las habituales u horas efectivas iguales a cero                                                                                                                                              |
| TRAPLU   | Si tiene otro u otros empleos. Todas las personas de 16 y más años que trabajaron o tenían empleo la semana de referencia                                                                                                                                                                                                                                                                  |
| OCUPLU1  | ¿Cuál es la ocupación u oficio en el segundo empleo?. Todas las personas de 16 y más años que trabajaron o tenían segundo empleo la semana de referencia                                                                                                                                                                                                                                   |
| ACTPLU1  | Actividad del establecimiento donde tiene el segundo empleo. Todas las personas de 16 y más años que tenían segundo empleo la semana de referencia                                                                                                                                                                                                                                         |
| SITPLU   | Situación profesional en el segundo empleo. Todas las personas de 16 y más años que tenían segundo empleo la semana de referencia                                                                                                                                                                                                                                                          |
| HORPLU   | Nº de horas efectivas trabaj. la semana pasada en el segundo empleo (hhmm). Todas las personas de 16 y más años que tenían segundo empleo la semana de referencia. Valores: hhmm. hh=00-98; 99. mm=00-59; 99. (0000 = No trabajó durante la semana de referencia; 9999 = No puede precisar / no sabe)                                                                                      |
| MASHOR   | Si desearía trabajar más horas. Todas las personas de 16 y más años que trabajaron o tenían empleo la semana de referencia                                                                                                                                                                                                                                                                 |
| DISMAS   | Estaría disponible para trabajar más horas antes de 15 días desde la semana de referencia. Todas las personas de 16 y más años que trabajaron o tenían empleo la semana de referencia y desean trabajar más horas                                                                                                                                                                          |
| RZNDISH  | Razones por las que no podría trabajar más horas. Personas de 16 y más años que trabajaron o tenían empleo la semana de referencia, que desean trabajar más horas pero no están disponibles para hacerlo antes de 15 días                                                                                                                                                                  |
| HORDES   | Número de horas que desearía trabajar habitualmente. Todas las personas de 16 y más años que trabajaron o tenían empleo la semana de referencia y desean trabajar más o menos horas. Valores: hh. hh=00-98. (99= No puede precisar / no sabe) .                                                                                                                                            |
| BUSOTR   | Busca otro empleo o está haciendo gestiones para establecerse por su cuenta. Todas las personas de 16 y más años que trabajaron o tenían empleo la semana de referencia                                                                                                                                                                                                                    |
| BUSCA    | Ha buscado empleo en las últimas cuatro semanas. Personas de 16 a 74 años sin empleo que no han trabajado en la semana de referencia                                                                                                                                                                                                                                                       |
| DESEA    | Desearía tener un empleo. Personas de 16 a 74 años sin empleo que no han trabajado en la semana de referencia, no han encontrado empleo y no han buscado empleo en las últimas 4 semanas                                                                                                                                                                                                   |
| FOBACT   | Búsqueda de empleo activa. Todas las personas que buscan empleo                                                                                                                                                                                                                                                                                                                            |
| NBUSCA   | Razones por las que no busca empleo. Personas sin empleo que no buscan empleo (ni han encontrado uno al que aún no se han incorporado)                                                                                                                                                                                                                                                     |
| ASALA    | El empleo que busca o ha encontrado es asalariado. Personas que buscan empleo o que han encontrado un empleo al que se van a incorporar                                                                                                                                                                                                                                                    |
| EMBUS    | Tipo de jornada en el empleo buscado / ha encontrado. Personas que buscan empleo o que han encontrado un empleo al que se van a incorporar                                                                                                                                                                                                                                                 |
| ITBU     | Tiempo que lleva buscando empleo / estuvo buscando empleo. Personas que buscan empleo o que han encontrado un empleo al que se van a incorporar .                                                                                                                                                                                                                                          |
| DISP     | Disponible para trabajar en un plazo de 15 días. Todas las personas de 16 y más excepto mayores de 74 años sin empleo u ocupados que no buscan otro empleo                                                                                                                                                                                                                                 |
| RZNDIS   | Razones para no poder empezar a trabajar en un plazo de 15 días. Todas las personas de 16 y más excepto mayores de 74 años sin empleo u ocupados que no buscan otro empleo y que no estarían disponibles para trabajar en el plazo de dos semanas                                                                                                                                          |
| EMPANT   | Si ha realizado antes algún trabajo. Todas las personas de 16 y más años que no trabajaron la semana de referencia y no tienen empleo                                                                                                                                                                                                                                                      |
| DTANT    | Número de meses transcurridos desde que dejó su último empleo. No ocupados que trabajaron antes. Valores: 0-999                                                                                                                                                                                                                                                                            |
| OCUPA    | Ocupación u oficio que desempeñaba en su último empleo, si hace menos de un año que lo dejó (*). Personas de 16 y más que no tienen empleo ni trabajaron la semana de referencia, pero trabajaron antes y que dejaron su empleo hace 1 año o menos. Si dejaron su empleo hace más de un año es una variable anual                                                                          |
| ACTA     | Actividad del establecimiento  donde trabajaba, si hace menos de un año que lo dejó (1, *). Personas de 16 y más que no tienen empleo ni trabajaron la semana de referencia, pero trabajaron antes y que dejaron su empleo hace 1 año o menos. Si dejaron su empleo hace más de un año es una variable anual                                                                               |
| SITUA    | Situación profesional que tenía en su anterior trabajo, si hace menos de un año que lo dejó (*). Personas de 16 y más que no tienen empleo ni trabajaron la semana de referencia, pero trabajaron antes y que dejaron su empleo hace 1 año o menos. Si dejaron su empleo hace más de un año es una variable anual                                                                          |
| OFEMP    | Situación el domingo pasado, en relación con las of. Empleo de la admon.. Todas las personas de 16 a 74 años                                                                                                                                                                                                                                                                               |
| SIDI1    | Situación inactividad autopercibida en la que estaba la semana pasada. Todas las personas de 16 y más años                                                                                                                                                                                                                                                                                 |
| SIDI2    | Situación inactividad autopercibida en la que estaba la semana pasada. Todas las personas de 16 y más años                                                                                                                                                                                                                                                                                 |
| SIDI3    | Situación inactividad autopercibida en la que estaba la semana pasada. Todas las personas de 16 y más años                                                                                                                                                                                                                                                                                 |
| SIDAC1   | Situación de actividad autopercibida en la que estaba la semana pasada. Todas las personas de 16 y más años                                                                                                                                                                                                                                                                                |
| SIDAC2   | Situación de actividad autopercibida en la que estaba la semana pasada. Todas las personas de 16 y más años                                                                                                                                                                                                                                                                                |
| MUN1     | Lugar de residencia hace un año. Todas las personas .                                                                                                                                                                                                                                                                                                                                      |
| PRORE1   | Si es España: provincia. Todas las personas que residían en un municipio de España distinto del actual hace un año                                                                                                                                                                                                                                                                         |
| REPAIRE1 | Región del país extranjero de residencia anterior. Todas las personas que hace un año residían en el extranjero                                                                                                                                                                                                                                                                            |
| TRAANT   | Si trabajó en algún momento el año pasado. Todas las personas de 16 y más años, sólo en el primer trimestre . Esta variable se preimputa si hace un año estaba trabajando (RACPAS=1)                                                                                                                                                                                                       |
| AOI      | Clasificación de los entrevistados por relación con la actividad económica según criterios OIT. Todas las personas de 16 y más años                                                                                                                                                                                                                                                        |
| CSE      | Asignación de la condición socioeconómica. Ocupados o parados que han trabajado antes                                                                                                                                                                                                                                                                                                      |
| FACTOREL | Factor de elevación . Todos los registros. Valores: XXXXX.XX                                                                                            Para reproducir los datos publicados en INEbase (presentados en miles de personas) hay que dividir por mil                                                                                                                         |

In [9]:
dfSueldos.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 158290 entries, 0 to 158289
Data columns (total 93 columns):
 #   Column    Non-Null Count   Dtype  
---  ------    --------------   -----  
 0   CICLO     158290 non-null  int64  
 1   CCAA      158290 non-null  int64  
 2   PROV      158290 non-null  int64  
 3   NVIVI     158290 non-null  int64  
 4   NIVEL     158290 non-null  int64  
 5   NPERS     158290 non-null  int64  
 6   EDAD5     158290 non-null  int64  
 7   RELPP1    158290 non-null  int64  
 8   SEXO1     158290 non-null  int64  
 9   NCONY     158290 non-null  int64  
 10  NPADRE    158290 non-null  int64  
 11  NMADRE    158290 non-null  int64  
 12  RELLMILI  158290 non-null  object 
 13  ECIV1     158290 non-null  object 
 14  PRONA1    158290 non-null  object 
 15  REGNA1    158290 non-null  object 
 16  NAC1      158290 non-null  int64  
 17  EXREGNA1  158290 non-null  object 
 18  ANORE1    15166 non-null   float64
 19  NFORMA    158290 non-null  object 
 20  RELL