# Librerías

In [1]:
import pandas as pd
import numpy as np 
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)

# Funciones para lectura y concatenado

In [2]:
# Función para generar strings con nombres de los ficheros cambiando el identificador del año 
def filelist(st1,st2,n1,n2):
    filelist = []
    for n in range(n1,n2):
        if n < 10:
            filename = st1 + '0' + str(n) + st2
            filelist.append(filename)
        else: 
            filename = st1 + str(n) + st2
            filelist.append(filename)
    return filelist

In [3]:
# Función para concatenar los ficheros de los distintos años en un sólo fichero
def concatenated_df(df_list):
    df_temp = pd.DataFrame()
    for file in df_list:
        df = pd.read_csv(file)
        if df_temp.shape == (0,0):
            df_temp = df
        else: 
            df_temp = pd.concat([df_temp,df])
    return df_temp

In [4]:
# Listas con los ficheros de cada tipo que contienen datos de todos los años
d_filelist = filelist('Files/esudb','d.csv',4,19) # Ficheros información geográfica año 2004 - 2018
h_filelist = filelist('Files/esudb','h.csv',4,19) # Ficheros información del hogar año 2004 - 2018
p_filelist = filelist('Files/esudb','p.csv',4,19) # Ficheros información de la persona año 2004 - 2018

In [5]:
%%time
df_D = concatenated_df(d_filelist)

CPU times: user 266 ms, sys: 109 ms, total: 375 ms
Wall time: 420 ms


In [6]:
%%time
df_H = concatenated_df(h_filelist)

  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)


CPU times: user 20.7 s, sys: 4.91 s, total: 25.6 s
Wall time: 25.7 s


In [7]:
%%time
df_P = concatenated_df(p_filelist)

  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)
  call = lambda f, *a, **k: f(*a, **k)


CPU times: user 1min 3s, sys: 14.6 s, total: 1min 17s
Wall time: 1min 17s


# Limpieza y selección de variables fichero D / Sociodemográficos


### Diccionario de variables seleccionadas y códigos asociados:

| Variable    | Descripción  |  Categoría   | Código  |
| ----------- | -------------| -------------| --------|
| **DB010**    | **Año** | - |-|
| **DB030**    | **Identificación del hogar** | - |-|
| **DB040**    | **Región** | Galicia |ES11|
| | |Principado de Asturias | ES12 |
| | |Cantabria   | ES13 |
| | |País Vasco  | ES21 |
| | |Comunidad Foral de Navarra | ES22 |
| | |La Rioja    | ES23 |
| | |Aragón      | ES24 |
| | |Comunidad de Madrid    | ES30 |
| | |Castilla y León      | ES24 |
| | |Comunidad de Madrid | 	ES30 |
| | |Castilla y León | ES41 |
| | |Castilla-La Mancha	| ES42 |
| | |Extremadura | ES43 |
| | |Cataluña | ES51 |
| | |Comunidad Valenciana | ES52 |
| | |Illes Balears | ES53 |
| | |Andalucía | ES61 |
| | |Región de Murcia | ES62 |
| | |Ciudad Autónoma de Ceuta | ES63 |
| | |Ciudad Autónoma de Melilla | ES64 |
| | |Canarias | ES70 |
| | |Extra-Regio | ESZZ |
| **DB100** | **Habitat** | Grande | 1	|
| | |Mediano| 2 |
| | |Pequeño| 3 |

In [8]:
print(df_D.shape)
df_D.head()

(196498, 11)


Unnamed: 0,DB010,DB020,DB030,DB040,DB040_F,DB060,DB060_F,DB090,DB090_F,DB100,DB100_F
0,2004,ES,1,ES21,1,1,1,997.96215,1,3,1
1,2004,ES,2,ES21,1,1,1,1001.89779,1,3,1
2,2004,ES,3,ES21,1,1,1,1105.30224,1,3,1
3,2004,ES,4,ES21,1,1,1,319.5525,1,3,1
4,2004,ES,5,ES21,1,1,1,2817.80555,1,3,1


In [9]:
# Selección de variables
dfD_varlist = ['DB010','DB030','DB040','DB100']

# Filtrado de columnas 
df_D1 = df_D[dfD_varlist]

# Cambio de nombre de las variables
df_D1.rename(columns = {'DB030':'HHId','DB010': 'Year','DB040': 'Region',\
                             'DB100': 'Habitat'}, inplace = True)

# Creación de un ID año + ID del hogar para evitar duplicaciones entre los ids de distintos años
df_D1['Year_HHid'] = df_D1['Year'].astype(str) + '_' + df_D1['HHId'].astype(str)

# Cambio de códigos de CCAA por definición de la categoría

df_D1['Region'] = df_D1['Region'].map({'ES11':'Galicia','ES12':'Principado de Asturias','ES13':'Cantabria','ES21':'País Vasco',
                     'ES22':'Comunidad Foral de Navarra','ES23':'La Rioja','ES24':'Aragón','ES30':'Comunidad de Madrid',
                     'ES24':'Castilla y León','ES30':'Comunidad de Madrid','ES41':'Castilla y León','ES42':'Castilla-La Mancha',
                     'ES43':'Extremadura','ES51':'Cataluña','ES52':'Comunidad Valenciana','ES53':'Illes Balears',
                     'ES61':'Andalucía','ES62':'Región de Murcia','ES63':'Ciudad Autónoma de Ceuta',
                     'ES64':'Ciudad Autónoma de Melilla','ES70':'Canarias','ESZZ':'Extra-Regio'})


# Cambio de códigos para el tamaño del hábitat por definición de la categoría
df_D1['Habitat']= df_D1['Habitat'].map({1: 'Big', 2 : 'Medium', 3 : 'Small' }) 

# Tamaño del dataframe una vez aplicados los cambios
print(df_D1.shape)
df_D1.head()

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  errors=errors,


(196498, 5)


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  if sys.path[0] == '':
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy


Unnamed: 0,Year,HHId,Region,Habitat,Year_HHid
0,2004,1,País Vasco,Small,2004_1
1,2004,2,País Vasco,Small,2004_2
2,2004,3,País Vasco,Small,2004_3
3,2004,4,País Vasco,Small,2004_4
4,2004,5,País Vasco,Small,2004_5


# Limpieza y selección de variables fichero H / Datos del hogar


### Diccionario de variables seleccionadas y códigos asociados:

| Variable    | Descripción  |  Categoría   | Código  |
| ----------- | -------------| -------------| --------|
| **HB010**    | **Año** | - |-|
| **HB030**    | **Identificación del hogar** | - | - |
| **HB040**    | **Posibilidad de irse de vacaciones anualmente** |Sí | 1 |
| | |No | 2 |
| **HS050**    | **Posibilidad de comer alimentos cárnicos dos veces por semana** |Sí | 1 |
| | |No | 2 |
| **HS060**    | **Fondo de reserva económico** |Sí | 1 |
| | |No | 2 |
| **HS070**    | **Disponibilidad de teléfono en el hogar** |Sí | 1 |
| | |No | 2 |
| **HS080**    | **Disponibilidad de televisión en el hogar** |Sí | 1 |
| | |No | 2 |
| **HS090**    | **Disponibilidad de ordenador en el hogar** |Sí | 1 |
| | |No | 2 |
| **HS100**    | **Disponibilidad de lavadora en el hogar** |Sí | 1 |
| | |No | 2 |
| **HS110**    | **Disponibilidad de coche en el hogar** |Sí | 1 |
| | |No | 2 |
| **HS120**    | **Capacidad para llegar a fin de mes** |Sí | 1 |
| | |No | 2 |
| **HS140**    | **Impacto de los gastos del hogar** |Sí | 1 |
| | |No | 2 |
| **HH050**    | **Capacidad de poner / calentar la casa en invierno** |Sí | 1 |
| | |No | 2 |
| **HX040**    | **Número de miembros del hogar** | - |-|
| **HX240**    | **Número de unidades de consumo** | - |-|
| **vhRentaa**    | **Renta** | - |-|
| **vhRentaAIa**    | **Renta** | - |-|
| **vhPobreza**    | **Hogar bajo el umbral de la pobreza** | - |-|
| **vhMATDEP**    | **Hogar en carencia material severa** | - |-|


In [132]:
# Selección de variables
dfH_varlist = ['HB010','HB030','HS040','HS050','HS060','HS070','HS080','HS090','HS100','HS110',
               'HS120', 'HS140','HH050','HX040','HX240','vhRentaa','vhRentaAIa','vhPobreza','vhMATDEP']

# Filtrado de columnas 
df_H1  = df_H[dfH_varlist]

# Cambio de nombre de las variables
df_H1.rename(columns = {'HB010':'Year','HB030': 'HHId', 'HS040':'HHHolidays','HS050':'HHFood', 
                             'HS060':'HHReserves','HS070':'HHPhone', 'HS080':'HHTV','HS090':'HHComputer', 
                             'HS100':'HHWashMachine', 'HS110': 'HHCar','HS120':'AREMonth', 'HS140':'HousingCost',
                             'HH050':'HHHeath', 'HX040':'HHnMembers','HX060':'HHType', 'HX240' : 'HHConsUnits'}, inplace = True)

# Creación de un ID año + ID del hogar para evitar duplicaciones entre los ids de distintos años
df_H1['Year_HHid'] = df_H1['Year'].astype(str) + '_' + df_H1['HHId'].astype(str)

# Función para convertir a float las variable de renta y y otras que deberían ser numéricas
def to_numeric(x):
    if type(x) is str:
        x = x.lstrip()
        if not x:
            return np.NaN
        else:
            return float(x)
    else: 
        return x

# Aplicación de la función to_numeric a renta y dificultad para llegar a fin de mes
df_H1['vhRentaa'] = df_H1['vhRentaa'].apply(to_numeric)
df_H1['vhRentaAIa'] = df_H1['vhRentaAIa'].apply(to_numeric)
df_H1['AREMonth'] = df_H1['AREMonth'].apply(to_numeric)

df_H1['HousingCost'] = df_H1['HousingCost'].apply(lambda x: 'HighImpactHH' if x == '1' \
                                                            else 'MediumImpactHH' if x == '2' \
                                                            else 'LowImpactHH' if x == '3' else 'Unknown / Not Declared')

# Función para sustituir los valores de privación marterial
def HHDepriv(x):
    if x == '1':
        return 'Yes'
    elif x == '2':
        return 'No '
    else:
        return 'Unknown / Not Declared'

# Lista de variables de privación material   

list_depriv = ['HHFood','HHHolidays','HHReserves','HHPhone','HHTV','HHComputer',
              'HHWashMachine','HHCar','HHHeath']
    
df_H1[list_depriv] = df_H1[list_depriv].applymap(lambda s: HHDepriv(s)).head()    
    

df_H1.head()

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  errors=errors,
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  from ipykernel import kernelapp as app
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/use

Unnamed: 0,Year,HHId,HHHolidays,HHFood,HHReserves,HHPhone,HHTV,HHComputer,HHWashMachine,HHCar,AREMonth,HousingCost,HHHeath,HHnMembers,HHConsUnits,vhRentaa,vhRentaAIa,vhPobreza,vhMATDEP,Year_HHid
0,2004,1,Yes,Yes,Yes,Yes,Yes,Yes,Yes,Yes,4.0,MediumImpactHH,Yes,3,1.8,40821.0,44829.02,0,0,2004_1
1,2004,2,No,Yes,Yes,Yes,Yes,Unknown / Not Declared,Yes,Unknown / Not Declared,2.0,HighImpactHH,Yes,1,1.0,5068.0,7665.9,1,0,2004_2
2,2004,3,Yes,Yes,Yes,Yes,Yes,Unknown / Not Declared,Yes,Yes,4.0,MediumImpactHH,Yes,2,1.3,23040.0,25637.9,0,0,2004_3
3,2004,4,Yes,Yes,Yes,Yes,Yes,Unknown / Not Declared,Yes,Yes,4.0,MediumImpactHH,Yes,2,1.5,20020.0,23545.62,0,0,2004_4
4,2004,5,Yes,Yes,Yes,Unknown / Not Declared,Yes,Unknown / Not Declared,Yes,Unknown / Not Declared,5.0,MediumImpactHH,Yes,1,1.0,7510.0,10938.46,0,0,2004_5


# Fusión de las variables de dfH y dfD

In [94]:
dfHH = df_H1.merge(df_D1, left_on = ['Year_HHid','Year','HHId'], right_on = ['Year_HHid','Year','HHId'], how = 'outer')
print(dfHH.shape)
dfHH.head()

(196498, 22)


Unnamed: 0,Year,HHId,HHHolidays,HHFood,HHReserves,HHPhone,HHTV,HHComputer,HHWashMachine,HHCar,AREMonth,HousingCost,HHHeath,HHnMembers,HHConsUnits,vhRentaa,vhRentaAIa,vhPobreza,vhMATDEP,Year_HHid,Region,Habitat
0,2004,1,Yes,Yes,Yes,Yes,Yes,Yes,Yes,Yes,4.0,MediumImpactHH,Yes,3,1.8,40821.0,44829.02,0,0,2004_1,País Vasco,Small
1,2004,2,No,Yes,Yes,Yes,Yes,Unknown / Not Declared,Yes,Unknown / Not Declared,2.0,HighImpactHH,Yes,1,1.0,5068.0,7665.9,1,0,2004_2,País Vasco,Small
2,2004,3,Yes,Yes,Yes,Yes,Yes,Unknown / Not Declared,Yes,Yes,4.0,MediumImpactHH,Yes,2,1.3,23040.0,25637.9,0,0,2004_3,País Vasco,Small
3,2004,4,Yes,Yes,Yes,Yes,Yes,Unknown / Not Declared,Yes,Yes,4.0,MediumImpactHH,Yes,2,1.5,20020.0,23545.62,0,0,2004_4,País Vasco,Small
4,2004,5,Yes,Yes,Yes,Unknown / Not Declared,Yes,Unknown / Not Declared,Yes,Unknown / Not Declared,5.0,MediumImpactHH,Yes,1,1.0,7510.0,10938.46,0,0,2004_5,País Vasco,Small


# Limpieza y selección de variables fichero P / Datos de la persona


### Diccionario de variables seleccionadas y códigos asociados:


| Variable    | Descripción  |  Categoría   | Código  |
| ----------- | -------------| -------------| --------|
| **PB010**   | **Año** | - |-|
| **PB030**   | **ID del Individuo** | - |-|
| **PPB150**  | **Sexo** |Hombre | 1 |
|  |  | Mujer | 2 |
| **PPB140**  | **Año de nacimiento** | - |-|
| **PB190**  | **Estado Civil** | Soltero/a |1|
|  |  | Casado/a | 2 |
|  |  | Separado/a | 3 |
|  |  | Viudo/a | 4 |
|  |  | Divorciado/a | 5 |
| **PL031**  | **Estado Laboral** | Asalariado a tiempo completo | 1 |
|  |  | Asalariado a tiempo parcial | 2 |
|  |  | Trabajador por cuenta propia a tiempo completo | 3 |
|  |  | Trabajador por cuenta propia a tiempo parcial | 4 |
|  |  | Parado | 5 |
|  |  | Estudiante, escolar o en formación | 6 |
|  |  | Jubilado, retirado, jubilado anticipado o ha cerrado un negocio | 7 |
|  |  | Incapacitado permanente para trabaja | 8 |
|  |  | Servicio militar obligatorio o prestación social sustitutoria | 9 |
|  |  | Dedicado a las labores del hogar, al cuidado de niños u otras personas | 10 |
|  |  | Otra clase de inactividad económica | 11 |
| **PE040**  | **Nivel máximo de estudios finalizados** | Menos que primaria |000|
|  |  | Educación primaria | 100 |
|  |  | Primera etapa de Educación Secundaria | 200 |
|  |  | Segunda etapa de Educación Secundaria | 300 |
|  |  | Orientación general 	344 | 344 |
|  |  | Orientación profesional (sin acceso directo a educación superior) | 353 |
|  |  | Orientación profesional (con acceso directo a educación superior) | 354 |
|  |  | Educación postsecundaria no superior | 400 |
|  |  | Orientación profesional | 450 |
|  |  | Educación superior | 500 |
| **PH010**  | **Valoración estado de salud** | Muy buena  | 1 |
|  |  | Buena | 2 |
|  |  | Normal | 3 |
|  |  | Mala | 4 |
|  |  | Muy mala | 4 |
| **PH020**  | **Enfermedades crónicas** | Sí | 1 |
|  |  | No | 2 |
| **PH030**  | **Limitaciones en la vida díaria últimos 6 meses** | Seriamente limitado | 1 |
|  |  | Limitado, pero no seriamente | 2 |
|  |  | No limitado | 3 |
| **PD020**  | **Posibilidad de comprar ropa** | Sí |1|
|  |  | No, porque no me lo puedo permitir | 2 |
|  |  | No, por otras razones | 3 |
| **PD030**  | **Posibilidad de comprar zapatos** | Sí |1|
|  |  | No, porque no me lo puedo permitir | 2 |
|  |  | No, por otras razones | 3 |
| **PD050**  | **Posibilidad de salir y reunirse con amigos** | Sí |1|
|  |  | No, porque no me lo puedo permitir | 2 |
|  |  | No, por otras razones | 3 |
| **PD060**  | **Posibilidad de realizar actividades de ocio** | Sí |1|
|  |  | No, porque no me lo puedo permitir | 2 |
|  |  | No, por otras razones | 3 |
| **PD070**  | **Posibilidad de gastar dinero en lo que a uno le gusta** | Sí |1|
|  |  | No, porque no me lo puedo permitir | 2 |
|  |  | No, por otras razones | 3 |
| **PD080**  | **Posibilidad de tener conexión a internet** | Sí |1|
|  |  | No, porque no me lo puedo permitir | 2 |
|  |  | No, por otras razones | 3 |
| **PW050T** | **Frecuencia se ha sentido tenso** | Siempre |1|  
|  |  | Frecuentemente | 2 |
|  |  | Algunas veces | 3 |
|  |  | C | 3 |
|  |  | Algunas veces | 3 |


#### Happiness variables

- PW050T: Frequency she / he has been tense

		- Always	1
		- Frequently	2
		- Sometimes	3
		- Unfrequently	4
		- Never	5
        
- PW060T: Frequency she / he has felt down

		- Always	1
		- Frequently	2
		- Sometimes	3
		- Unfrequently	4
		- Never	5
              
- PW070T: Frequency she / he has felt calm

		- Always	1
		- Frequently	2
		- Sometimes	3
		- Unfrequently	4
		- Never	5

- PW080T: Frequency she / he has felt depressed

		- Always	1
		- Frequently	2
		- Sometimes	3
		- Unfrequently	4
		- Never	5
        
- PW90T: Frequency she / he has felt happy

		- Always	1
		- Frequently	2
		- Sometimes	3
		- Unfrequently	4
		- Never	5





| **PW050T** | **Frecuencia se ha sentido tenso** | - |-|  
| **PW060T** | **Frecuencia se ha sentido bajo de moral** | - |-|  
| **PW070T** | **Frecuencia se ha sentido calmado** | - |-|
| **PW080T** | **Frecuencia se ha sentido deprimido** | - |-|  
| **PW090T** | **Frecuencia se ha sentido feliz** | - |-|  
| **PW010T** | **Satisfacción con la vida** | - |-| 
| **PW030** | **Satisfacción con las relaciones personales** | - |-|
| **PW120T** | **Satisfacción con el tiempo que dedica a sí mismo** | - |-|
| **PW160T** | **Satisfacción con su economía** | - |-|  
       

In [116]:
df_P.head()

Unnamed: 0,PB010,PB020,PB030,PB040,PB040_F,PB100,PB100_F,PB110,PB110_F,PB120,PB120_F,PB130,PB130_F,PB140,PB140_F,PB150,PB150_F,PB160,PB160_F,PB170,PB170_F,PB180,PB180_F,PB190,PB190_F,PB200,PB200_F,PB210,PB210_F,PB220A,PB220A_F,PE010,PE010_F,PE020,PE020_F,PE030,PE030_F,PE040,PE040_F,PL030,PL030_F,PL035,PL035_F,PL035COMP,PL035COMP_F,PL015,PL015_F,PL020,PL020_F,PL025,PL025_F,PL040,PL040_F,PL050,PL050_F,PL060,PL060_F,PL070,PL070_F,PL072,PL072_F,PL080,PL080_F,PL085,PL085_F,PL087,PL087_F,PL090,PL090_F,PL100,PL100_F,PL110A,PL110A_F,PL120,PL120_F,PL130,PL130_F,PL140,PL140_F,PL150,PL150_F,PL160,PL160_F,PL170,PL170_F,PL180,PL180_F,PL190,PL190_F,PL200,PL200_F,PL210A,PL210A_F,PL210B,PL210B_F,PL210C,PL210C_F,PL210D,PL210D_F,PL210E,PL210E_F,PL210F,PL210F_F,PL210G,PL210G_F,PL210H,PL210H_F,PL210I,PL210I_F,PL210J,PL210J_F,PL210K,PL210K_F,PL210L,PL210L_F,PH010,PH010_F,PH020,PH020_F,PH030,PH030_F,PH040,PH040_F,PH050,PH050_F,PH060,PH060_F,PH070,PH070_F,PY010N,PY010N_F,PY020N,PY020N_F,PY035N,PY035N_F,PY050N,PY050N_F,PY080N,PY080N_F,PY090N,PY090N_F,PY100N,PY100N_F,PY110N,PY110N_F,PY120N,PY120N_F,PY130N,PY130N_F,PY140N,PY140N_F,PY200G,PY200G_F,PM010,PM010_F,PM020,PM020_F,PM030,PM030_F,PM035,PM035_F,PM040,PM040_F,PM050,PM050_F,PM060,PM060_F,PM070,PM070_F,PM080,PM080_F,PM090,PM090_F,PM100,PM100_F,PY200N,PY200N_F,PY010G,PY010G_F,PY020G,PY020G_F,PY035G,PY035G_F,PY050G,PY050G_F,PY080G,PY080G_F,PY090G,PY090G_F,PY100G,PY100G_F,PY110G,PY110G_F,PY120G,PY120G_F,PY130G,PY130G_F,PY140G,PY140G_F,PS005,PS010,PS010_F,PS020,PS020_F,PS030,PS030_F,PS040,PS040_F,PS050,PS050_F,PS060,PS060_F,PS070,PS070_F,PS080,PS080_F,PS090,PS090_F,PS100,PS100_F,PS110,PS110_F,PS120,PS120_F,PS130,PS130_F,PS140,PS140_F,PS150,PS150_F,PS160,PS160_F,PY021N,PY021N_F,PY070N,PY070N_F,PY021G,PY021G_F,PY030G,PY030G_F,PY070G,PY070G_F,PL031,PL031_F,PL073,PL073_F,PL074,PL074_F,PL075,PL075_F,PL076,PL076_F,PL086,PL086_F,PL089,PL089_F,PL111A,PL111A_F,PL211A,PL211A_F,PL211B,PL211B_F,PL211C,PL211C_F,PL211D,PL211D_F,PL211E,PL211E_F,PL211F,PL211F_F,PL211G,PL211G_F,PL211H,PL211H_F,PL211I,PL211I_F,PL211J,PL211J_F,PL211K,PL211K_F,PL211L,PL211L_F,PD010,PD010_F,PD020,PD020_F,PD030,PD030_F,PD040,PD040_F,PD050,PD050_F,PD060,PD060_F,PD070,PD070_F,PA010,PA010_F,PA020,PA020_F,PA030,PA030_F,PA040,PA040_F,PA050,PA050_F,PA060,PA060_F,PA070,PA070_F,PA080,PA080_F,PA090,PA090_F,PA100,PA100_F,PA110,PA110_F,PL051,PL051_F,PT005,PT010,PT010_F,PT020,PT020_F,PT030,PT030_F,PT040,PT040_F,PT050,PT050_F,PT060,PT060_F,PT070,PT070_F,PT080,PT080_F,PT090,PT090_F,PT100,PT100_F,PT110,PT110_F,PT120,PT120_F,PT130,PT130_F,PT140,PT140_F,PT150,PT150_F,PT160,PT160_F,PT170,PT170_F,PT180,PT180_F,PT190,PT190_F,PT200,PT200_F,PT210,PT210_F,PC170,PC170_F,PC180,PC180_F,PW010,PW010_F,PW020,PW020_F,PW030,PW030_F,PW040,PW040_F,PW050,PW050_F,PW060,PW060_F,PW070,PW070_F,PW080,PW080_F,PW090,PW090_F,PW100,PW100_F,PW110,PW110_F,PW120,PW120_F,PW130,PW130_F,PW140,PW140_F,PW150,PW150_F,PW160,PW160_F,PW170,PW170_F,PW180,PW180_F,PW190,PW190_F,PW200,PW200_F,PW210,PW210_F,PW220,PW220_F,PD080,PD080_F,PD090,PD090_F,PS041,PS041_F,PS081,PS081_F,PS091,PS091_F,PS101,PS101_F,PS102,PS102_F,P104_U,PC110,PC110_F,PC120,PC120_F,PC130,PC130_F,PC140,PC140_F,PC150,PC150_F,PC260,PC260_F,PC270,PC270_F,P78a_U,PH080,PH080_F,PH090,PH090_F,PH100,PH100_F,PH110,PH110_F,PH120,PH120_F,PH130,PH130_F,PH140,PH140_F,PH150,PH150_F,PL111T2,PL111T2_F,PL211AT2,PL211AT2_F,PL211BT2,PL211BT2_F,PL211CT2,PL211CT2_F,PL211DT2,PL211DT2_F,PL211ET2,PL211ET2_F,PL211FT2,PL211FT2_F,PL211GT2,PL211GT2_F,PL211HT2,PL211HT2_F,PL211IT2,PL211IT2_F,PL211JT2,PL211JT2_F,PL211KT2,PL211KT2_F,PL211LT2,PL211LT2_F,PL230T2,PL230T2_F,PL240T2,PL240T2_F,PL250T2,PL250T2_F,PL260T2,PL260T2_F,PL270T2,PL270T2_F,PW010T,PW010T_F,PW030T,PW030T_F,PW040T,PW040T_F,PW050T,PW050T_F,PW060T,PW060T_F,PW070T,PW070T_F,PW080T,PW080T_F,PW090T,PW090T_F,PW100T,PW100T_F,PW110T,PW110T_F,PW120T,PW120T_F,PW160T,PW160T_F,PW190T,PW190T_F,PW230T,PW230T_F,PW240T,PW240T_F,PHD01T,PHD01T_F,PHD02T,PHD02T_F,PHD03T,PHD03T_F,PHD04T,PHD04T_F,PHD05T,PHD05T_F
0,2004,ES,101,1202.11116,1,5,1,2004,1,13,1,2,1,1964,1,1,1,,-2,,-2,102.0,1,2,1,1,1,1,1,1,1,2,1,,-2,1990,1,5,1,1,1.0,1,1.0,1,1,,-2,,-2,,-2,3,1,24,1.0,40.0,1,12,1.0,0,1.0,0,1,0,1,0,1,0,1,,-2,l,1.0,,-2,13.0,1,1.0,1,2.0,1,2.0,1,,-2,,-2,28,1,12,1,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,2,1,2,1,3,1,2,1,,-2,2,1,,-2,20300.0,11001,0.0,0.0,1200.0,1001,0.0,0.0,0.0,0,0.0,0.0,0.0,0.0,0.0,0,0.0,0,0.0,0,0.0,0,1696.0,4001.0,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
1,2004,ES,102,1162.90101,1,5,1,2004,1,12,1,7,1,1967,1,2,1,,-2,,-2,101.0,1,2,1,1,1,1,1,1,1,2,1,,-2,1990,1,5,1,1,1.0,2,1.0,2,1,,-2,,-2,,-2,3,1,24,1.0,40.0,1,12,1.0,0,1.0,0,1,0,1,0,1,0,1,,-2,l,1.0,,-2,13.0,1,,-1,,-1,2.0,1,,-2,,-2,26,1,10,1,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,2,1,2,1,3,1,2,1,,-2,2,1,,-2,20300.0,11001,0.0,0.0,600.0,1001,0.0,0.0,0.0,0,0.0,0.0,0.0,0.0,0.0,0,0.0,0,0.0,0,0.0,0,,-2.0,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
2,2004,ES,201,1017.43755,1,5,1,2004,1,11,1,1,1,1941,1,2,1,,-2,,-2,,-2,4,1,3,1,1,1,1,1,2,1,,-2,1953,1,1,1,6,1.0,2,1.0,2,1,1.0,1,2.0,1,,-2,3,1,91,1.0,,-2,0,1.0,0,1.0,0,1,0,1,0,1,12,1,,-2,,-2.0,,-2,,-2,2.0,1,2.0,1,,-2,,-2,,-2,13,1,20,1,8,1.0,8,1.0,8,1.0,8,1.0,8,1.0,8,1.0,8,1.0,8,1.0,8,1.0,8,1.0,8,1.0,8,1.0,4,1,1,1,3,1,1,1,,-1,2,1,,-2,0.0,0,0.0,0.0,0.0,0,0.0,0.0,0.0,0,0.0,0.0,0.0,0.0,5068.0,11001,0.0,0,0.0,0,0.0,0,,-2.0,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
3,2004,ES,301,1287.9818,1,5,1,2004,1,12,1,4,1,1964,1,2,1,,-2,,-2,,-2,5,1,3,1,1,1,1,1,2,1,,-2,1985,1,5,1,1,1.0,1,1.0,1,1,,-2,,-2,,-2,3,1,24,1.0,35.0,1,12,1.0,0,1.0,0,1,0,1,0,1,0,1,,-2,l,1.0,,-2,11.0,1,1.0,1,2.0,1,2.0,1,,-2,,-2,25,1,14,1,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,1,1.0,2,1,2,1,2,1,2,1,,-2,2,1,,-2,19320.0,11001,0.0,0.0,420.0,1001,0.0,0.0,0.0,0,0.0,0.0,0.0,0.0,0.0,0,0.0,0,0.0,0,0.0,0,1546.0,4001.0,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
4,2004,ES,401,435.79649,1,5,1,2004,1,12,1,5,1,1944,1,1,1,,-2,,-2,402.0,1,2,1,1,1,1,1,1,1,2,1,,-2,1963,1,3,1,5,1.0,2,1.0,2,1,1.0,1,2.0,1,,-2,3,1,91,1.0,,-2,0,1.0,0,1.0,0,1,0,1,0,1,12,1,,-2,,-2.0,,-2,,-2,1.0,1,2.0,1,,-2,,-2,,-2,13,1,35,1,8,1.0,8,1.0,8,1.0,8,1.0,8,1.0,8,1.0,8,1.0,8,1.0,8,1.0,8,1.0,8,1.0,8,1.0,3,1,1,1,3,1,2,1,,-2,2,1,,-2,0.0,0,0.0,0.0,0.0,0,0.0,0.0,0.0,0,0.0,0.0,0.0,0.0,0.0,0,0.0,0,11900.0,11001,0.0,0,,-2.0,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,


In [139]:
# Las variables de "Felicidad" o "Satisfacción con la vida" tienen distinto nombre en 2013 por lo que sustituímos los valores
cods_2018 = ['PW010T','PW030T','PW050T','PW060T','PW070T','PW080T','PW090T','PW100T','PW120T','PW160T','PW190T']# Códigos asisgnados a las variables en 2018
cods_2013 = ['PW010','PW030','PW050','PW060','PW070','PW080','PW090','PW100','PW120','PW160','PW190'] # Códigos asisgnados a las variables en 2013

# Sustituimos los valores NaN de 2013 por los correspondientes a los códigos de preguntas de ese años
df_P[df_P['PB010']== 2013][cods_2018]= df_P[df_P['PB010']== 2013][cods_2013]

dfP_varlist = ['PB010', 'PB030','PB150','PB140','PB190','PL031','PE040','PH010','PH020','PH030', 
               'PD020','PD030','PD050','PD060','PD070','PD080', 'PW050T','PW060T','PW070T','PW080T','PW090T',
               'PW010T','PW030T','PW120T','PW160T']

df_P1 = df_P[dfP_varlist]

df_P1.rename(columns = {'PB010':'Year','PB030':'IndID','PB150':'Sex','PB140':'YBirht','PB190':'MarStatus',
                       'PL031': 'WorStatus', 'PE040':'FStudies','PH010':'CHealth',
                       'PH020':'CrConditions','PH030':'HLimitations', 'PD020':'MDClothes','PD030':'MDShoes', 'PD050':'MDFriends',
                       'PD060':'MDLeisure', 'PD070':'MDSelf','PD080':'MDInternet',                  
                       'PW050T':'FFTense','PW060T':'FFDown','PW070T':'FFCalm','PW080T':'FFDepressed','PW090T':'FFHappy',
                       'PW010T':'WSOovsat','PW030T':'WBSrelations','PW120T':'WBSowntime','PW160T':'WSBeconomy'}, 
                        inplace = True)

# Household Id
# El identificador del individuo lleva asociado el código del hogar. El identificador del individuo son los dos últimos dígitos
# de el Id del individuo y el resto es el Id de su hogar
df_P1['HHId'] = df_P1['IndID'].apply(lambda x: str(x)[:-2]).astype(int)

# Generamos un código único por individuo y año y repetimos la operación por hogar, aunque en el caso del hogar los IDs estarán
# repetidos para las personas que conformen la misma unidad
df_P1['Year_HHid'] = df_P1['Year'].astype(str) + '_'+ df_P1['HHId'].astype(str)
df_P1['Year_IndID'] = df_P1['Year'].astype(str) + '_'+ df_P1['IndID'].astype(str)

# Conversión variable género
df_P1['Sex'] = df_P1['Sex'].apply(lambda x: 'Hombre' if x == 1 else 'Mujer')

# Conversión año de nacimiento en edad
df_P1['AgeNumeric'] = df_P1['Year'] - df_P1['YBirht']

# Convertimos la variable de condiciones de salud en numérica, que si bien es categórica es ordinal 
df_P1['CHealth'] = df_P1['CHealth'].apply(to_numeric)

# Convertimos la variable de condiciones de salud en numérica, que si bien es categórica es ordinal 
df_P1['CHealth'] = df_P1['CHealth'].apply(to_numeric)

# Conversión variable género
df_P1['CrConditions'] = df_P1['CrConditions'].apply(lambda x: 'NChronic' if x == '2'\
                                                              else 'YChronic' if x == '1' else 'Unknown / Not Declared')

# Conversión variable género
df_P1['HLimitations'] = df_P1['HLimitations'].apply(lambda x: 'SerLimited' if x == '1'\
                                                              else 'NoSerLimitedG_limitado' if x == '2' \
                                                              else 'NoLimited' if x == '3' else 'Unknown / Not declared')

# Marital status
def civilstate(x):
    if x == '1': 
        return 'Soltero'
    elif x == '2':
        return 'Casado'
    elif x == '3': 
        return 'Separado'
    elif x == '4': 
        return 'Viudo'
    elif x == '5':
        return 'Divorciado'
    else:
        return 'Uknown / Prefer not to say'

# Conversión variable estado civil
df_P1['MarStatus'] = df_P1['MarStatus'].apply(civilstate)    
    
# Studies
def studiesF(x):
    if x == '000': 
        return '<Primaria'
    elif x == '100':
        return 'Primaria'
    elif x == '200': 
        return 'Secundaria1'
    elif x == '300': 
        return 'Secundaria2'
    elif x == '344':
        return 'OrGeneral'
    elif x == '353' or x == '354':
        return 'OrProfesional'
    elif x == '400':
        return 'SecundariaNoOb'
    elif x == '450':
        return 'OrProfesional'
    elif x == '500':
        return 'EdSuperior'
    else:
        return 'Uknown'
    
# Conversión variable estudios
df_P1['FStudies'] = df_P1['FStudies'].apply(studiesF)    
    
# Workign Status
def workingStatus(x):
    if x == '1': 
        return 'EmployeeFT'
    elif x == '2':
        return 'EmployeePT'
    elif x == '3': 
        return 'SEmployedFT'
    elif x == '4': 
        return 'SEmployedPT'
    elif x == '5':
        return 'Unemployed'
    elif x == '6':
        return 'Student'
    elif x == '7':
        return 'Retired'
    elif x == '9':
        return 'NotAble'
    elif x == '10':
        return 'HHoldKeeper'
    elif x == '11':
        return 'OtherNonWorking'
    else:
        return 'Uknown / Not declared'    

# Conversión estatus del laboral
df_P1['WorStatus'] = df_P1['WorStatus'].apply(workingStatus)


# Privación material personal
def MatDepriv(x):
    if x == '1':
        return 'Yes'
    elif x == '2':
        return 'No affordable'
    elif x == '3': 
        return 'No, other reason'
    else:
        return 'Unknown / Not Declared'

    
list_pdepriv = ['MDClothes','MDShoes','MDFriends','MDLeisure','MDSelf','MDInternet']
    
df_P1[list_pdepriv] = df_P1[list_pdepriv].applymap(lambda s: MatDepriv(s)) 
        
df_P1.head()

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  self[k1] = value[k2]
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  errors=errors,
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.h

Unnamed: 0,Year,Country,IndID,Sex,YBirht,MarStatus,WorStatus,FStudies,CHealth,CrConditions,HLimitations,MDClothes,MDShoes,MDFriends,MDLeisure,MDSelf,MDInternet,FFTense,FFDown,FFCalm,FFDepressed,FFHappy,WSOovsat,WBSrelations,WBSowntime,WSBeconomy,HHId,Year_HHid,Year_IndID,AgeNumeric
0,2004,ES,101,Hombre,1964,Casado,Uknown / Not declared,Uknown,2.0,NChronic,NoLimited,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,,,,,,,,,,1,2004_1,2004_101,40
1,2004,ES,102,Mujer,1967,Casado,Uknown / Not declared,Uknown,2.0,NChronic,NoLimited,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,,,,,,,,,,1,2004_1,2004_102,37
2,2004,ES,201,Mujer,1941,Viudo,Uknown / Not declared,Uknown,4.0,YChronic,NoLimited,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,,,,,,,,,,2,2004_2,2004_201,63
3,2004,ES,301,Mujer,1964,Divorciado,Uknown / Not declared,Uknown,2.0,NChronic,NoSerLimitedG_limitado,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,,,,,,,,,,3,2004_3,2004_301,40
4,2004,ES,401,Hombre,1944,Casado,Uknown / Not declared,Uknown,3.0,YChronic,NoLimited,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,,,,,,,,,,4,2004_4,2004_401,60


# Fusión de las variables de dfHH y df_P1:
#### Datos de la persona y datos del hogar

In [144]:
df_P1.shape

(436818, 30)

In [142]:
dfFinal = dfHH.merge(df_P1, left_on = ['Year_HHid','Year','HHId'], right_on = ['Year_HHid','Year','HHId'], how = 'outer')
print(dfFinal.shape)
dfFinal.head()

(436818, 49)


Unnamed: 0,Year,HHId,HHHolidays,HHFood,HHReserves,HHPhone,HHTV,HHComputer,HHWashMachine,HHCar,AREMonth,HousingCost,HHHeath,HHnMembers,HHConsUnits,vhRentaa,vhRentaAIa,vhPobreza,vhMATDEP,Year_HHid,Region,Habitat,Country,IndID,Sex,YBirht,MarStatus,WorStatus,FStudies,CHealth,CrConditions,HLimitations,MDClothes,MDShoes,MDFriends,MDLeisure,MDSelf,MDInternet,FFTense,FFDown,FFCalm,FFDepressed,FFHappy,WSOovsat,WBSrelations,WBSowntime,WSBeconomy,Year_IndID,AgeNumeric
0,2004,1,Yes,Yes,Yes,Yes,Yes,Yes,Yes,Yes,4.0,MediumImpactHH,Yes,3,1.8,40821.0,44829.02,0,0,2004_1,País Vasco,Small,ES,101,Hombre,1964,Casado,Uknown / Not declared,Uknown,2.0,NChronic,NoLimited,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,,,,,,,,,,2004_101,40
1,2004,1,Yes,Yes,Yes,Yes,Yes,Yes,Yes,Yes,4.0,MediumImpactHH,Yes,3,1.8,40821.0,44829.02,0,0,2004_1,País Vasco,Small,ES,102,Mujer,1967,Casado,Uknown / Not declared,Uknown,2.0,NChronic,NoLimited,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,,,,,,,,,,2004_102,37
2,2004,2,No,Yes,Yes,Yes,Yes,Unknown / Not Declared,Yes,Unknown / Not Declared,2.0,HighImpactHH,Yes,1,1.0,5068.0,7665.9,1,0,2004_2,País Vasco,Small,ES,201,Mujer,1941,Viudo,Uknown / Not declared,Uknown,4.0,YChronic,NoLimited,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,,,,,,,,,,2004_201,63
3,2004,3,Yes,Yes,Yes,Yes,Yes,Unknown / Not Declared,Yes,Yes,4.0,MediumImpactHH,Yes,2,1.3,23040.0,25637.9,0,0,2004_3,País Vasco,Small,ES,301,Mujer,1964,Divorciado,Uknown / Not declared,Uknown,2.0,NChronic,NoSerLimitedG_limitado,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,,,,,,,,,,2004_301,40
4,2004,4,Yes,Yes,Yes,Yes,Yes,Unknown / Not Declared,Yes,Yes,4.0,MediumImpactHH,Yes,2,1.5,20020.0,23545.62,0,0,2004_4,País Vasco,Small,ES,401,Hombre,1944,Casado,Uknown / Not declared,Uknown,3.0,YChronic,NoLimited,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,Unknown / Not Declared,,,,,,,,,,2004_401,60
