In [1]:
import pandas as pd
import numpy as np
import os
import glob

### Creamos el datamart final para entrenar el modelo

In [2]:
def load_homes_external(datalake_path):
    """
    Carga y une los archivos homes.tsv y external_indicators.tsv de todos los años en un único DataFrame.
    La unión se realiza por 'Año' y 'CCAA'.
    """
    all_homes = glob.glob(os.path.join(datalake_path, "*", "homes.tsv"))
    all_external = glob.glob(os.path.join(datalake_path, "*", "external_indicators.tsv"))

    df_list = []

    for home_file, external_file in zip(all_homes, all_external):
        year = os.path.basename(os.path.dirname(home_file))  # Extraer el año de la ruta

        df_homes = pd.read_csv(home_file, sep="\t")
        df_external = pd.read_csv(external_file, sep="\t")

        df_homes["Año"] = int(year)
        df_external["Año"] = int(year)

        # Unir por Año y CCAA
        df_merged = pd.merge(df_homes, df_external, on=["Año", "CCAA"], how="inner")
        df_list.append(df_merged)

    if not df_list:
        raise ValueError("No se encontraron archivos homes.tsv o external_indicators.tsv en la ruta del datalake.")

    # Concatenar todos los DataFrames
    df_homes_external = pd.concat(df_list, ignore_index=True)
    return df_homes_external

In [3]:
def merge_with_datamart(df_homes_external, datamart_path):
    """
    Une el DataFrame combinado de homes y external_indicators con el datamart de supercategorías.
    La unión se realiza por 'Año' y 'NUMERO'. Cada supercategoría se convierte en una columna
    con el gasto mensual correspondiente.
    """
    df_datamart = pd.read_csv(datamart_path, sep="\t")

    # Pivotar el datamart: cada SUPER_CATEGORIA como columna
    df_pivot = df_datamart.pivot_table(
        index=["Año", "NUMERO"],
        columns="SUPER_CATEGORIA",
        values="GASTO_MENSUAL",
    ).reset_index()

    # Renombrar columnas para mayor claridad, por ejemplo: SC_011, SC_012, etc.
    df_pivot.columns = ['Año', 'NUMERO'] + [f"SC_{col}" for col in df_pivot.columns[2:]]

    # Unir con el DataFrame combinado
    df_final = pd.merge(df_homes_external, df_pivot, on=["Año", "NUMERO"], how="inner")
    return df_final


In [4]:
load_homes_external_path = "../../DataLake" 
datamart_path = "../../datamarts/datamart_supercategories_three_digits.tsv"
output_path = "../../datamarts/final_dataframe.tsv" 

# Cargar y unir los archivos homes y external_indicators
df_homes_external = load_homes_external(load_homes_external_path)

# Unir con el datamart
df_final = merge_with_datamart(df_homes_external, datamart_path)


In [5]:
df_final.head(15)  # Mostrar las primeras filas del DataFrame final

Unnamed: 0,NUMERO,CCAA,CAPROV,TAMAMU,DENSIDAD,NUMACTI,NUMOCU,NUMESTU,EDADSP,OCUSP,...,SC_104,SC_111,SC_112,SC_121,SC_123,SC_124,SC_125,SC_126,SC_127,SC_128
0,1,7,0,1,1,2,2,0,66,1,...,,812.373168,,120.268708,0.365467,,39.583333,,1.866225,
1,47,7,0,1,1,1,0,0,85,0,...,,,,,,,33.157499,,,
2,53,7,1,4,3,0,0,0,70,0,...,,135.956167,,,,,57.419168,,,
3,67,7,1,4,2,1,1,0,25,1,...,,4.883172,,,4.393566,,,,,
4,68,7,0,1,1,2,1,0,43,1,...,,388.191885,194.330834,89.409213,,,40.760001,,81.112,
5,69,7,1,5,3,1,1,0,68,0,...,,,,13.180592,,,65.079166,,,
6,76,7,1,4,2,1,0,1,59,0,...,,15.598649,20.278001,84.669601,12.1667,,40.833334,,40.556,
7,94,7,1,4,3,1,1,0,57,1,...,,210.039312,202.78,109.696399,,,66.055,,,
8,109,7,0,1,1,2,2,0,36,1,...,0.009343,476.874135,53.973661,80.713672,20.338234,0.019989,115.774354,0.003259,38.573073,
9,110,7,1,5,3,2,2,0,34,1,...,0.000417,412.313855,93.101941,29.814344,28.789791,0.001492,58.018608,0.000208,0.003417,0.657058


Eliminamos la columna de Comunidad Autonoma ya que viene reflejada en la columna CCAA

In [6]:
df_final.drop(columns=["Comunidad_Autonoma", 'NACION_EXT'], inplace=True) 

In [7]:
df_final.head()  # Mostrar las primeras filas del DataFrame final

Unnamed: 0,NUMERO,CCAA,CAPROV,TAMAMU,DENSIDAD,NUMACTI,NUMOCU,NUMESTU,EDADSP,OCUSP,...,SC_104,SC_111,SC_112,SC_121,SC_123,SC_124,SC_125,SC_126,SC_127,SC_128
0,1,7,0,1,1,2,2,0,66,1,...,,812.373168,,120.268708,0.365467,,39.583333,,1.866225,
1,47,7,0,1,1,1,0,0,85,0,...,,,,,,,33.157499,,,
2,53,7,1,4,3,0,0,0,70,0,...,,135.956167,,,,,57.419168,,,
3,67,7,1,4,2,1,1,0,25,1,...,,4.883172,,,4.393566,,,,,
4,68,7,0,1,1,2,1,0,43,1,...,,388.191885,194.330834,89.409213,,,40.760001,,81.112,


### Calculamos la inflación acumulada y la aplicamos a todos las columnas que sean tipo €

In [8]:
inflacion_df = pd.read_csv('../../data\inflacion_espana_2016_2023.csv', sep='\t')

In [9]:
codigos_comunidad = {
    "Andalucía": 1, "Aragón": 2, "Asturias, Principado de": 3, "Balears, Illes": 4,
    "Canarias": 5, "Cantabria": 6, "Castilla y León": 8, "Castilla-La Mancha": 7,
    "Cataluña": 9, "Comunitat Valenciana": 10, "Extremadura": 11, "Galicia": 12,
    "Madrid, Comunidad de": 13, "Murcia, Región de": 14, "Navarra, Comunidad Foral de": 15,
    "País Vasco": 16, "Rioja, La": 17, "Ceuta": 18, "Melilla": 19
}

# Agregar código de comunidad
inflacion_df["CCAA"] = inflacion_df["Comunidad Autónoma"].map(codigos_comunidad)


In [10]:
inflacion_df.head()

Unnamed: 0,Año,Comunidad Autónoma,Inflación (%),CCAA
0,2016,Nacional,1.6,
1,2016,Andalucía,1.6,1.0
2,2016,Aragón,1.6,2.0
3,2016,"Asturias, Principado de",1.6,3.0
4,2016,"Balears, Illes",1.6,4.0


In [11]:
def calcular_factores_acumulados_a_2023(df_inflacion):
    """
    Dado un DataFrame con columnas: 'Año', 'Comunidad Autónoma', 'Inflación (%)', 'CCAA',
    devuelve un DataFrame con la inflación acumulada para ajustar precios a 2023.
    """
    df = df_inflacion.copy()
    df = df.sort_values(['CCAA', 'Año'])

    # A porcentaje decimal
    df['inflacion_decimal'] = df['Inflación (%)'] / 100

    # Calcular factor acumulado por CCAA
    df['factor_acumulado'] = df.groupby('CCAA')['inflacion_decimal'].transform(lambda x: (1 + x).cumprod())

    # Obtener el factor en 2023 para cada CCAA
    factores_2023 = df[df['Año'] == 2023].set_index('CCAA')['factor_acumulado'].to_dict()

    # Crear factor de ajuste a 2023: factor_acumulado / factor_2023
    df['factor_ajuste_2023'] = df.apply(
        lambda row: row['factor_acumulado'] / factores_2023.get(row['CCAA'], np.nan),
        axis=1
    )

    return df[['Año', 'Comunidad Autónoma', 'CCAA', 'factor_ajuste_2023']]


In [12]:
inflacion_ajuste = calcular_factores_acumulados_a_2023(inflacion_df)
# Eliminar filas donde Comunidad Autónoma es Nacional
inflacion_ajuste = inflacion_ajuste[inflacion_ajuste['Comunidad Autónoma'] != 'Nacional']

inflacion_ajuste

Unnamed: 0,Año,Comunidad Autónoma,CCAA,factor_ajuste_2023
1,2016,Andalucía,1.0,0.834982
21,2017,Andalucía,1.0,0.844167
41,2018,Andalucía,1.0,0.852608
61,2019,Andalucía,1.0,0.856871
81,2020,Andalucía,1.0,0.854301
...,...,...,...,...
79,2019,Melilla,19.0,0.847833
99,2020,Melilla,19.0,0.848681
119,2021,Melilla,19.0,0.907240
139,2022,Melilla,19.0,0.967118


In [13]:
def aplicar_ajuste_inflacion(df_final, df_factores):
    """
    Aplica los factores de ajuste a 2023 a las columnas monetarias del df_final,
    modificando directamente las columnas que comienzan por 'SC_' más 'GASTOT' e 'IMPEXAC'.
    """
    df = df_final.copy()

    # Unir el factor a cada fila según Año y CCAA
    df = df.merge(df_factores[['Año', 'CCAA', 'factor_ajuste_2023']],
                  on=['Año', 'CCAA'], how='left')

    # Columnas monetarias a ajustar
    columnas_monetarias = [col for col in df.columns if col.startswith('SC_')]
    columnas_monetarias += [col for col in ['GASTOT', 'IMPEXAC'] if col in df.columns]

    # Ajustar directamente las columnas (manteniendo NaNs)
    for col in columnas_monetarias:
        df[col] = df[col] * df['factor_ajuste_2023']

    # Eliminar columna auxiliar
    df.drop(columns=['factor_ajuste_2023'], inplace=True)

    return df


In [14]:
df_final_ajustado = aplicar_ajuste_inflacion(df_final, inflacion_ajuste)
# Mostrar la casa NUMERO 1 en 2016, para df_final
df_final[df_final['NUMERO'] == 1][df_final['Año'] == 2016].head(15)

  df_final[df_final['NUMERO'] == 1][df_final['Año'] == 2016].head(15)


Unnamed: 0,NUMERO,CCAA,CAPROV,TAMAMU,DENSIDAD,NUMACTI,NUMOCU,NUMESTU,EDADSP,OCUSP,...,SC_104,SC_111,SC_112,SC_121,SC_123,SC_124,SC_125,SC_126,SC_127,SC_128
0,1,7,0,1,1,2,2,0,66,1,...,,812.373168,,120.268708,0.365467,,39.583333,,1.866225,


Pasamos el año a timestamp

In [15]:
df_final_ajustado[df_final_ajustado['NUMERO'] == 1][df_final_ajustado['Año'] == 2016].head(15)  # Mostrar la casa NUMERO 1 en 2016, para df_final_ajustado

  df_final_ajustado[df_final_ajustado['NUMERO'] == 1][df_final_ajustado['Año'] == 2016].head(15)  # Mostrar la casa NUMERO 1 en 2016, para df_final_ajustado


Unnamed: 0,NUMERO,CCAA,CAPROV,TAMAMU,DENSIDAD,NUMACTI,NUMOCU,NUMESTU,EDADSP,OCUSP,...,SC_104,SC_111,SC_112,SC_121,SC_123,SC_124,SC_125,SC_126,SC_127,SC_128
0,1,7,0,1,1,2,2,0,66,1,...,,668.274699,,98.935487,0.300641,,32.562055,,1.535195,


In [16]:
df_final_ajustado['Timestamp'] = pd.to_datetime(df_final_ajustado['Año'].astype(str) + '-01-01T00:00:00')
df_final_ajustado['Timestamp'] = df_final_ajustado['Timestamp'].dt.strftime('%Y-%m-%dT%H:%M:%S')

# Borrar la columna 'Año' si no es necesaria
df_final_ajustado.drop(columns=['Año'], inplace=True)

df_final_ajustado['Timestamp'].head()  

0    2016-01-01T00:00:00
1    2016-01-01T00:00:00
2    2016-01-01T00:00:00
3    2016-01-01T00:00:00
4    2016-01-01T00:00:00
Name: Timestamp, dtype: object

### Dividir el GASTOT entre el factor poblacional

In [17]:
### Dividir el GASTOT entre el factor poblacional Y PASARLO DE AÑO A MES
df_final_ajustado['GASTOT_DIV_P'] = df_final_ajustado['GASTOT'] / df_final_ajustado['FACTOR']
df_final_ajustado['GASTOT_MENSUAL'] = df_final_ajustado['GASTOT_DIV_P'] / 12  # Pasar de anual a mensual

# Borrar la columna 'GASTOT_DIV_P' si no es necesaria
df_final_ajustado.drop(columns=['GASTOT_DIV_P', 'GASTOT'], inplace=True)

In [18]:
df_final_ajustado.head()  # Mostrar las primeras filas de la columna GASTOT ajustada

Unnamed: 0,NUMERO,CCAA,CAPROV,TAMAMU,DENSIDAD,NUMACTI,NUMOCU,NUMESTU,EDADSP,OCUSP,...,SC_112,SC_121,SC_123,SC_124,SC_125,SC_126,SC_127,SC_128,Timestamp,GASTOT_MENSUAL
0,1,7,0,1,1,2,2,0,66,1,...,,98.935487,0.300641,,32.562055,,1.535195,,2016-01-01T00:00:00,1313.824812
1,47,7,0,1,1,1,0,0,85,0,...,,,,,27.276033,,,,2016-01-01T00:00:00,618.059831
2,53,7,1,4,3,0,0,0,70,0,...,,,,,47.234176,,,,2016-01-01T00:00:00,1343.725829
3,67,7,1,4,2,1,1,0,25,1,...,,,3.614237,,,,,,2016-01-01T00:00:00,295.01419
4,68,7,0,1,1,2,1,0,43,1,...,159.860498,73.549838,,,33.530006,,66.724382,,2016-01-01T00:00:00,2435.025827


### Renombramos las columnas de gasto mensual por categorías para que se entienda

In [19]:
def renombrar_columnas_sc(df, categoria_detallada):
    """
    Renombra las columnas SC_{codigo} a una abreviatura legible basada en el nombre de la categoría.
    Ejemplo: SC_011 → ALIMENTOS_011
    """
    df = df.copy()
    columnas_renombradas = {}

    for col in df.columns:
        if col.startswith("SC_"):
            codigo = col.split("_")[1]
            nombre_categoria = categoria_detallada.get(codigo.lstrip("0"), None)

            if nombre_categoria:
                # Tomamos una abreviatura clara: primeras palabras en mayúsculas, separadas por _
                abreviatura = (
                    nombre_categoria.upper()
                    .replace(",", "")
                    .replace(".", "")
                    .replace("/", "_")
                    .replace(" Y ", "_")
                    .replace(" ", "_")
                )
                nuevo_nombre = f"{abreviatura}_{codigo}"
                columnas_renombradas[col] = nuevo_nombre

    return df.rename(columns=columnas_renombradas)

In [20]:
# Diccionario de nombres sin puntos
categoria_detallada = {
        "11": "PRODUCTOS ALIMENTICIOS",
        "12": "BEBIDAS NO ALCOHÓLICAS",
        "21": "BEBIDAS ALCOHÓLICAS",
        "22": "TABACO",
        "31": "ARTÍCULOS DE VESTIR",
        "32": "CALZADO",
        "41": "ALQUILERES REALES DE LA VIVIENDA",
        "42": "ALQUILERES IMPUTADOS DE LA VIVIENDA",
        "43": "MANTENIMIENTO DE LA VIVIENDA",
        "44": "SUMINISTRO DE AGUA",
        "45": "ELECTRICIDAD, GAS Y OTROS COMBUSTIBLES",
        "51": "MUEBLES Y REVESTIMIENTOS",
        "52": "TEXTILES PARA EL HOGAR",
        "53": "GRANDES ELECTRODOMÉSTICOS",
        "54": "UTENSILIOS DEL HOGAR",
        "55": "HERRAMIENTAS CASA/JARDÍN",
        "56": "BIENES Y SERVICIOS PARA EL HOGAR",
        "61": "PRODUCTOS FARMACÉUTICOS",
        "62": "SERVICIOS MÉDICOS AMBULATORIOS",
        "63": "SERVICIOS HOSPITALARIOS",
        "71": "COMPRA DE VEHÍCULOS",
        "72": "USO DE VEHÍCULOS PERSONALES",
        "73": "SERVICIOS DE TRANSPORTE",
        "81": "SERVICIOS POSTALES",
        "82": "EQUIPOS TELÉFONO/FAX",
        "83": "SERVICIOS TELÉFONO/FAX",
        "91": "AUDIOVISUALES Y TECNOLOGÍA",
        "92": "BIENES DURADEROS DE OCIO",
        "93": "OCIO, JARDINERÍA Y MASCOTAS",
        "94": "SERVICIOS RECREATIVOS Y CULTURALES",
        "95": "PRENSA Y PAPELERÍA",
        "96": "PAQUETES TURÍSTICOS",
        "101": "EDUCACIÓN INFANTIL Y PRIMARIA",
        "102": "EDUCACIÓN SECUNDARIA Y POSTSECUNDARIA",
        "103": "EDUCACIÓN SUPERIOR",
        "104": "EDUCACIÓN NO FORMAL",
        "111": "RESTAURACIÓN",
        "112": "ALOJAMIENTO",
        "121": "CUIDADOS PERSONALES",
        "123": "EFECTOS PERSONALES",
        "124": "PROTECCIÓN SOCIAL",
        "125": "SEGUROS",
        "126": "SERVICIOS FINANCIEROS",
        "127": "OTROS SERVICIOS",
        "128": "REMESAS"
    }

df_final_ajustado = renombrar_columnas_sc(df_final_ajustado, categoria_detallada)

In [21]:
df_final_ajustado

Unnamed: 0,NUMERO,CCAA,CAPROV,TAMAMU,DENSIDAD,NUMACTI,NUMOCU,NUMESTU,EDADSP,OCUSP,...,ALOJAMIENTO_112,CUIDADOS_PERSONALES_121,EFECTOS_PERSONALES_123,PROTECCIÓN_SOCIAL_124,SEGUROS_125,SERVICIOS_FINANCIEROS_126,OTROS_SERVICIOS_127,REMESAS_128,Timestamp,GASTOT_MENSUAL
0,1,7,0,1,1,2,2,0,66,1,...,,98.935487,0.300641,,32.562055,,1.535195,,2016-01-01T00:00:00,1313.824812
1,47,7,0,1,1,1,0,0,85,0,...,,,,,27.276033,,,,2016-01-01T00:00:00,618.059831
2,53,7,1,4,3,0,0,0,70,0,...,,,,,47.234176,,,,2016-01-01T00:00:00,1343.725829
3,67,7,1,4,2,1,1,0,25,1,...,,,3.614237,,,,,,2016-01-01T00:00:00,295.014190
4,68,7,0,1,1,2,1,0,43,1,...,159.860498,73.549838,,,33.530006,,66.724382,,2016-01-01T00:00:00,2435.025827
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
166015,19940,18,1,4,3,4,0,0,43,0,...,,,,,26.666667,,,,2023-01-01T00:00:00,1907.573106
166016,20356,18,1,4,3,1,0,0,85,0,...,,228.246636,,,,,,,2023-01-01T00:00:00,3333.849793
166017,20450,18,1,4,3,2,0,0,30,0,...,,,,,,,,,2023-01-01T00:00:00,476.168490
166018,20607,18,1,4,3,2,2,1,64,1,...,,152.067557,,,66.666666,,,,2023-01-01T00:00:00,3694.234499


### Ordenamos las columnas de nuestro dataframe

In [22]:
columnas_prioritarias = [
    "Timestamp", "NUMERO", "CCAA", "FACTOR", "CAPROV", "TAMAMU", "DENSIDAD",
    "SUPERF", "AGUACALI", "CALEF", "ZONARES", "REGTEN", "NUMOCU", "NUMACTI",
    "NUMPERI", "NUMESTU", "NADUL_MAS", "NADUL_FEM", "NNINO_FEM", "NNINO_MAS",
    "OCUSP", "EDADSP", "NACION_ESP", "EDUC_SUPERIOR", "CAPROP", "CAJENA",
    "DISPOSIOV", "IMPEXAC", "GASTOT_MENSUAL"
]


In [23]:
def reordenar_columnas(df, columnas_prioritarias):
    # Asegurar que solo usamos las que realmente están en el df
    columnas_prioritarias = [col for col in columnas_prioritarias if col in df.columns]
    
    # Identificar columnas que no están en la lista prioritaria
    columnas_restantes = [col for col in df.columns if col not in columnas_prioritarias]
    
    # Orden final
    orden_final = columnas_prioritarias + columnas_restantes
    
    return df[orden_final]


In [24]:
df = reordenar_columnas(df_final_ajustado, columnas_prioritarias)


In [25]:
df['CCAA'].value_counts()  # Mostrar los números únicos de las casas

1     18084
16    17312
9     14472
10    13218
13    12924
7     10805
12    10558
8      8838
5      7695
11     7507
2      7398
14     7305
3      7118
6      5986
15     5454
17     5240
4      4440
18      882
19      784
Name: CCAA, dtype: int64

In [26]:
df.head(5)  # Mostrar las primeras filas del DataFrame reordenado

Unnamed: 0,Timestamp,NUMERO,CCAA,FACTOR,CAPROV,TAMAMU,DENSIDAD,SUPERF,AGUACALI,CALEF,...,EDUCACIÓN_NO_FORMAL_104,RESTAURACIÓN_111,ALOJAMIENTO_112,CUIDADOS_PERSONALES_121,EFECTOS_PERSONALES_123,PROTECCIÓN_SOCIAL_124,SEGUROS_125,SERVICIOS_FINANCIEROS_126,OTROS_SERVICIOS_127,REMESAS_128
0,2016-01-01T00:00:00,1,7,742.998897,0,1,1,96,1,1,...,,668.274699,,98.935487,0.300641,,32.562055,,1.535195,
1,2016-01-01T00:00:00,47,7,410.584193,0,1,1,100,1,1,...,,,,,,,27.276033,,,
2,2016-01-01T00:00:00,53,7,532.252963,1,4,3,80,1,1,...,,111.840309,,,,,47.234176,,,
3,2016-01-01T00:00:00,67,7,385.26884,1,4,2,85,1,1,...,,4.016997,,,3.614237,,,,,
4,2016-01-01T00:00:00,68,7,1101.175074,0,1,1,90,1,1,...,,319.334544,159.860498,73.549838,,,33.530006,,66.724382,


# Diccionario de Variables del Datamart

Este documento describe las variables contenidas en el datamart de viviendas y hogares, utilizadas para el análisis de consumo ajustado por inflación y características del entorno.

---

## 🆔 Identificación del registro

- **`Timestamp`**: Año en el que se recogió la muestra, en formato ISO 8601.  
  Ejemplo: `2016-01-01T00:00:00`. Rango: 2016 a 2023.
- **`NUMERO`**: Identificador único de la vivienda en ese año.  
  Forma clave primaria junto a `Timestamp`.
- **`CCAA`**: Código oficial de la comunidad autónoma.  
  Rango de valores: 1 a 19.

---

## 📊 Ponderación muestral

- **`FACTOR`**: Factor poblacional de expansión.  
  Representa cuántos hogares reales representa ese hogar en la muestra.

---

## 🌍 Información geográfica

- **`CAPROV`**: Indica si la vivienda está en una capital de provincia.  
  `1` → Sí, `0` → No.
- **`TAMAMU`**: Tamaño del municipio.  
  `5` → ≥100.000 hab.  
  `4` → 50k–100k  
  `3` → 20k–50k  
  `2` → 10k–20k  
  `1` → <10k
- **`DENSIDAD`**: Densidad de población en la zona.  
  `3` → Densamente poblada  
  `2` → Intermedia  
  `1` → Diseminada
- **`SUPERF`**: Superficie útil de la vivienda.  
  `'35'` → ≤35 m²  
  `36–299` → Valor real  
  `'300'` → ≥300 m²  
  `-9` → No consta
- **`ZONARES`**: Tipo de zona de residencia.  
  `7` → Urbana de lujo  
  `6` → Urbana alta  
  `5` → Urbana media  
  `4` → Urbana inferior  
  `3` → Rural industrial  
  `2` → Rural pesquera  
  `1` → Rural agraria  
  `-9` → No consta

---

## 🏠 Características del hogar

- **`AGUACALI`**: Disposición de agua caliente.  
  `1` → Sí · `0` → No
- **`CALEF`**: Disposición de calefacción.  
  `1` → Sí · `0` → No
- **`REGTEN`**: Régimen de tenencia de la vivienda.  
  `6` → Propiedad sin hipoteca  
  `5` → Propiedad con hipoteca  
  `4` → Alquiler  
  `3` → Alquiler reducido  
  `2` → Cesión semigratuita  
  `1` → Cesión gratuita

---

## 👨‍👩‍👧 Composición del hogar

- **`NUMOCU`**: Número de miembros ocupados en el hogar (0–20).
- **`NUMACTI`**: Número de miembros activos en el hogar.
- **`NUMPERI`**: Número de perceptores de ingresos en el hogar (0–20).
- **`NUMESTU`**: Número de estudiantes en el hogar (0–20).
- **`NADUL_MAS`**: Número de adultos masculinos en el hogar.
- **`NADUL_FEM`**: Número de adultos femeninos en el hogar.
- **`NNINO_MAS`**: Número de niños masculinos en el hogar.
- **`NNINO_FEM`**: Número de niños femeninos en el hogar.

---

## 🧍 Datos del sustentador principal

- **`OCUSP`**: Ocupación del sustentador principal.  
  `1` → Ocupado · `0` → No ocupado
- **`EDADSP`**: Edad del sustentador principal en años.  
  `85` → 85 o más años  
  `16–84` → Edad real entre 16 y 84
- **`NACION_ESP`**: Nacionalidad del sustentador principal.  
  `1` → Española · `0` → Extranjera
- **`EDUC_SUPERIOR`**: Estudios superiores completados por el sustentador principal.  
  `1` → Sí · `0` → No
- **`CAPROP`**: Ingresos del sustentador principal por cuenta propia.  
  `1` → Sí · `0` → No
- **`CAJENA`**: Ingresos por cuenta ajena.  
  `1` → Sí · `0` → No
- **`DISPOSIOV`**: Disposición de otras viviendas en los últimos 12 meses.  
  `1` → Sí · `0` → No

---

## 💰 Indicadores económicos

- **`IMPEXAC`**: Importe exacto de los ingresos mensuales netos totales del hogar, ajustado a precios constantes de 2023.
- **`GASTOT_MENSUAL`**: Estimación de gasto total mensual del hogar, ajustado a precios constantes de 2023.

---

## 🌡️ Variables de características del entorno

- **`Tmax_max`**: Temperatura máxima media anual de la comunidad autónoma (ºC).
- **`Tmin_min`**: Temperatura mínima media anual de la comunidad autónoma (ºC).
- **`Tasa_Paro`**: Tasa de paro en la comunidad autónoma (%) correspondiente al año de la encuesta.
- **`Inflacion`**: Tasa de inflación interanual (%) en la comunidad autónoma.
- **`Tipo_Interes`**: Tipo de interés medio anual del Banco Central Europeo (%).

---

## 📤 Variables de output

Estas variables representan el **gasto mensual del hogar en cada una de las categorías de consumo**, ya **ajustado a precios constantes de 2023** según la tasa de inflación anual por comunidad autónoma.

El nombre de cada variable sigue el formato:  
**`NOMBRE_DE_LA_CATEGORÍA_CODIGO`**, donde:

- `NOMBRE_DE_LA_CATEGORÍA` es una versión en mayúsculas del nombre oficial de la categoría ECOICOP, con espacios reemplazados por guiones bajos `_`.
- `CODIGO` es el identificador numérico de la supercategoría.

### 🧾 Ejemplos de variables de output:

- `PRODUCTOS_ALIMENTICIOS_11`
- `BEBIDAS_NO_ALCOHÓLICAS_12`
- `BEBIDAS_ALCOHÓLICAS_21`
- `TABACO_22`
- `ARTÍCULOS_DE_VESTIR_31`
- `CALZADO_32`
- `ALQUILERES_REALES_DE_LA_VIVIENDA_41`
- `ALQUILERES_IMPUTADOS_DE_LA_VIVIENDA_42`
- `MANTENIMIENTO_DE_LA_VIVIENDA_43`
- `SUMINISTRO_DE_AGUA_44`
- `ELECTRICIDAD_GAS_OTROS_COMBUSTIBLES_45`
- `MUEBLES_REVESTIMIENTOS_51`
- `TEXTILES_PARA_EL_HOGAR_52`
- `GRANDES_ELECTRODOMÉSTICOS_53`
- `UTENSILIOS_DEL_HOGAR_54`
- `HERRAMIENTAS_CASA_JARDÍN_55`
- `BIENES_SERVICIOS_PARA_EL_HOGAR_56`
- `PRODUCTOS_FARMACÉUTICOS_61`
- `SERVICIOS_MÉDICOS_AMBULATORIOS_62`
- `SERVICIOS_HOSPITALARIOS_63`
- `COMPRA_DE_VEHÍCULOS_71`
- `USO_DE_VEHÍCULOS_PERSONALES_72`
- `SERVICIOS_DE_TRANSPORTE_73`
- `SERVICIOS_POSTALES_81`
- `EQUIPOS_TELÉFONO_FAX_82`
- `SERVICIOS_TELÉFONO_FAX_83`
- `AUDIOVISUALES_TECNOLOGÍA_91`
- `BIENES_DURADEROS_DE_OCIO_92`
- `OCIO_JARDINERÍA_MASCOTAS_93`
- `SERVICIOS_RECREATIVOS_CULTURALES_94`
- `PRENSA_PAPELERÍA_95`
- `PAQUETES_TURÍSTICOS_96`
- `EDUCACIÓN_INFANTIL_PRIMARIA_101`
- `EDUCACIÓN_SECUNDARIA_POSTSECUNDARIA_102`
- `EDUCACIÓN_SUPERIOR_103`
- `EDUCACIÓN_NO_FORMAL_104`
- `RESTAURACIÓN_111`
- `ALOJAMIENTO_112`
- `CUIDADOS_PERSONALES_121`
- `EFECTOS_PERSONALES_123`
- `PROTECCIÓN_SOCIAL_124`
- `SEGUROS_125`
- `SERVICIOS_FINANCIEROS_126`
- `OTROS_SERVICIOS_127`
- `REMESAS_128`

Cada una de estas columnas representa el **importe medio mensual**, en euros, que el hogar ha destinado a dicha categoría.

> 📎 **Nota**: Para más información técnica y definiciones oficiales sobre las categorías de gasto, puede consultar el **anexo PDF** proporcionado por el INE:  
anexo_codes.pdf

In [27]:
# Guardar el DataFrame final en un archivo TSV
def save_final_dataframe(df_final, output_path):
    """
    Guarda el DataFrame final en un archivo TSV.
    """
    df_final.to_csv(output_path, sep="\t", index=False)

In [28]:
output_path = "../../datamarts/final_dataframe.tsv"

save_final_dataframe(df, output_path)

In [29]:
df.head()

Unnamed: 0,Timestamp,NUMERO,CCAA,FACTOR,CAPROV,TAMAMU,DENSIDAD,SUPERF,AGUACALI,CALEF,...,EDUCACIÓN_NO_FORMAL_104,RESTAURACIÓN_111,ALOJAMIENTO_112,CUIDADOS_PERSONALES_121,EFECTOS_PERSONALES_123,PROTECCIÓN_SOCIAL_124,SEGUROS_125,SERVICIOS_FINANCIEROS_126,OTROS_SERVICIOS_127,REMESAS_128
0,2016-01-01T00:00:00,1,7,742.998897,0,1,1,96,1,1,...,,668.274699,,98.935487,0.300641,,32.562055,,1.535195,
1,2016-01-01T00:00:00,47,7,410.584193,0,1,1,100,1,1,...,,,,,,,27.276033,,,
2,2016-01-01T00:00:00,53,7,532.252963,1,4,3,80,1,1,...,,111.840309,,,,,47.234176,,,
3,2016-01-01T00:00:00,67,7,385.26884,1,4,2,85,1,1,...,,4.016997,,,3.614237,,,,,
4,2016-01-01T00:00:00,68,7,1101.175074,0,1,1,90,1,1,...,,319.334544,159.860498,73.549838,,,33.530006,,66.724382,


In [30]:
# muestrame todas las columnas
pd.set_option('display.max_columns', None)
df.head(15)  # Mostrar las primeras filas del DataFrame final

Unnamed: 0,Timestamp,NUMERO,CCAA,FACTOR,CAPROV,TAMAMU,DENSIDAD,SUPERF,AGUACALI,CALEF,ZONARES,REGTEN,NUMOCU,NUMACTI,NUMPERI,NUMESTU,NADUL_MAS,NADUL_FEM,NNINO_FEM,NNINO_MAS,OCUSP,EDADSP,NACION_ESP,EDUC_SUPERIOR,CAPROP,CAJENA,DISPOSIOV,IMPEXAC,GASTOT_MENSUAL,Tmax_max,Tmin_min,Tasa_Paro,Inflacion,Tipo_Interes,PRODUCTOS_ALIMENTICIOS_11,BEBIDAS_NO_ALCOHÓLICAS_12,BEBIDAS_ALCOHÓLICAS_21,TABACO_22,ARTÍCULOS_DE_VESTIR_31,CALZADO_32,ALQUILERES_REALES_DE_LA_VIVIENDA_41,ALQUILERES_IMPUTADOS_DE_LA_VIVIENDA_42,MANTENIMIENTO_DE_LA_VIVIENDA_43,SUMINISTRO_DE_AGUA_44,ELECTRICIDAD_GAS_OTROS_COMBUSTIBLES_45,MUEBLES_REVESTIMIENTOS_51,TEXTILES_PARA_EL_HOGAR_52,GRANDES_ELECTRODOMÉSTICOS_53,UTENSILIOS_DEL_HOGAR_54,HERRAMIENTAS_CASA_JARDÍN_55,BIENES_SERVICIOS_PARA_EL_HOGAR_56,PRODUCTOS_FARMACÉUTICOS_61,SERVICIOS_MÉDICOS_AMBULATORIOS_62,SERVICIOS_HOSPITALARIOS_63,COMPRA_DE_VEHÍCULOS_71,USO_DE_VEHÍCULOS_PERSONALES_72,SERVICIOS_DE_TRANSPORTE_73,SERVICIOS_POSTALES_81,EQUIPOS_TELÉFONO_FAX_82,SERVICIOS_TELÉFONO_FAX_83,AUDIOVISUALES_TECNOLOGÍA_91,BIENES_DURADEROS_DE_OCIO_92,OCIO_JARDINERÍA_MASCOTAS_93,SERVICIOS_RECREATIVOS_CULTURALES_94,PRENSA_PAPELERÍA_95,PAQUETES_TURÍSTICOS_96,EDUCACIÓN_INFANTIL_PRIMARIA_101,EDUCACIÓN_SECUNDARIA_POSTSECUNDARIA_102,EDUCACIÓN_SUPERIOR_103,EDUCACIÓN_NO_FORMAL_104,RESTAURACIÓN_111,ALOJAMIENTO_112,CUIDADOS_PERSONALES_121,EFECTOS_PERSONALES_123,PROTECCIÓN_SOCIAL_124,SEGUROS_125,SERVICIOS_FINANCIEROS_126,OTROS_SERVICIOS_127,REMESAS_128
0,2016-01-01T00:00:00,1,7,742.998897,0,1,1,96,1,1,3,5,2,2,2,0,1,1,0,0,1,66,1,0,1,0,0,1007.709928,1313.824812,42.9,-8.0,18.3,1.6,0.0,72.913892,0.062772,,2.443704,15.237684,,,309.449703,,17.480683,47.71198,,,,,,3.649939,26.084551,5.560365,,,3.333047,3.959279,,,,,,,3.163079,1.166058,,,,,,668.274699,,98.935487,0.300641,,32.562055,,1.535195,
1,2016-01-01T00:00:00,47,7,410.584193,0,1,1,100,1,1,1,6,0,1,1,0,0,2,0,0,0,85,1,0,0,0,0,748.584518,618.059831,42.9,-8.0,18.3,1.6,0.0,148.568863,,,,,,,282.533648,,4.952174,89.995431,,,34.230919,,,,,,,,,,,,30.502762,,,,,,,,,,,,,,,,27.276033,,,
2,2016-01-01T00:00:00,53,7,532.252963,1,4,3,80,1,1,5,6,0,0,1,0,1,1,0,0,0,70,1,0,0,0,0,749.407138,1343.725829,42.9,-8.0,18.3,1.6,0.0,281.710458,9.829813,7.184699,,57.132283,,41.131018,377.370916,24.187589,116.455238,56.500691,,,,5.838335,,4.818217,,,,,69.523585,,,1.580258,23.526942,27.425978,,9.472365,70.96296,,,,,,,111.840309,,,,,47.234176,,,
3,2016-01-01T00:00:00,67,7,385.26884,1,4,2,85,1,1,5,4,1,1,1,0,0,1,0,0,1,25,1,0,0,1,0,370.179157,295.01419,42.9,-8.0,18.3,1.6,0.0,17.143372,,,,,,106.940645,,,5.528011,41.501197,,,,,,,,,,,47.016888,52.845277,,,,,,16.407566,,,,,,,,4.016997,,,3.614237,,,,,
4,2016-01-01T00:00:00,68,7,1101.175074,0,1,1,90,1,1,5,5,1,2,2,0,1,1,0,1,1,43,1,0,0,1,0,2303.336977,2435.025827,42.9,-8.0,18.3,1.6,0.0,152.499806,3.707276,,175.776547,140.411967,14.97116,,254.280259,,5.108473,120.966323,,,16.449692,,,27.656634,,33.362191,,,126.670105,,,18.222686,55.938184,55.719367,,214.492456,285.587951,,,80.205484,,,,319.334544,159.860498,73.549838,,,33.530006,,66.724382,
5,2016-01-01T00:00:00,69,7,697.542695,1,5,3,85,1,1,5,6,1,1,2,0,1,1,0,0,0,68,1,1,1,0,0,1365.549779,662.779431,42.9,-8.0,18.3,1.6,0.0,105.515173,13.688282,,,,,,242.384592,,84.531836,30.925672,,,,,,,,,,,81.56566,,,,39.790146,,,,,,,,,,,,,10.842623,,,53.535446,,,
6,2016-01-01T00:00:00,76,7,370.972834,1,4,2,74,1,1,6,6,0,1,1,1,0,1,0,1,0,59,1,1,0,0,0,1010.177789,1527.956094,42.9,-8.0,18.3,1.6,0.0,239.835813,30.203798,17.823083,,110.094324,29.191677,,349.068086,,161.964814,52.245523,,,,,,0.268086,,88.965843,,,,138.451954,,41.170584,70.120158,,,,,8.031598,,,,14.395857,,12.831766,16.681096,69.650936,10.008575,,33.590331,,33.362191,
7,2016-01-01T00:00:00,94,7,383.358779,1,4,3,89,1,1,5,6,1,1,1,0,1,1,0,0,1,57,1,0,0,1,1,1429.714167,2680.834934,42.9,-8.0,18.3,1.6,0.0,778.156753,29.280689,31.920978,,60.885498,8.747745,,641.918216,,52.80674,56.448208,0.542135,,,,,75.526025,,,,,110.391372,,,,44.602476,,,198.630847,,3.979466,102.827544,,,,,172.782612,166.810955,90.23849,,,54.338187,,,
8,2016-01-01T00:00:00,109,7,488.602611,0,1,1,198,1,1,6,5,2,2,2,0,1,1,0,0,1,36,1,1,0,1,0,3093.052513,3360.30642,42.9,-8.0,18.3,1.6,0.0,182.908508,2.110731,11.08535,70.425783,125.751082,15.114436,0.195702,752.933382,16.125059,48.497881,65.337543,53.941307,56.825483,29.694052,0.016978,17.75425,14.273961,0.184264,54.593451,0.003217,,24.596976,4.459508,1.610481,14.04122,86.28952,54.057761,,429.47337,387.758993,38.8696,154.46196,0.033959,0.025378,0.045574,0.007686,392.286367,44.399832,66.396709,16.730645,0.016443,95.23834,0.002681,31.730995,
9,2016-01-01T00:00:00,110,7,1403.40064,1,5,3,76,1,1,5,5,2,2,2,0,1,1,1,0,1,34,1,0,0,1,0,1584.366792,1844.642315,42.9,-8.0,18.3,1.6,0.0,216.965828,18.220688,0.108537,20.862125,69.468596,0.693716,0.011722,216.720318,0.294142,91.04736,43.301392,49.517762,0.001666,0.450247,0.13709,0.710339,0.488192,3.017742,15.24772,0.000363,,122.288447,1.293391,5.5e-05,0.026578,82.548183,0.177274,,5.734459,280.083302,2.48094,0.003812,90.49026,0.001282,0.002166,0.000343,339.177767,76.587552,24.525886,23.683068,0.001227,47.727288,0.000171,0.002811,0.540509


In [31]:
# Elimina la columna factor
df.drop(columns=['FACTOR'], inplace=True)


A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df.drop(columns=['FACTOR'], inplace=True)


In [32]:
df.isna().sum()  

Timestamp                         0
NUMERO                            0
CCAA                              0
CAPROV                            0
TAMAMU                            0
                              ...  
PROTECCIÓN_SOCIAL_124        154610
SEGUROS_125                    8166
SERVICIOS_FINANCIEROS_126    141436
OTROS_SERVICIOS_127          122600
REMESAS_128                  156039
Length: 78, dtype: int64

In [33]:
save_final_dataframe(df, output_path)  # Guardar el DataFrame final en un archivo TSV

In [34]:
df.head(15)  # Mostrar las primeras filas del DataFrame final

Unnamed: 0,Timestamp,NUMERO,CCAA,CAPROV,TAMAMU,DENSIDAD,SUPERF,AGUACALI,CALEF,ZONARES,REGTEN,NUMOCU,NUMACTI,NUMPERI,NUMESTU,NADUL_MAS,NADUL_FEM,NNINO_FEM,NNINO_MAS,OCUSP,EDADSP,NACION_ESP,EDUC_SUPERIOR,CAPROP,CAJENA,DISPOSIOV,IMPEXAC,GASTOT_MENSUAL,Tmax_max,Tmin_min,Tasa_Paro,Inflacion,Tipo_Interes,PRODUCTOS_ALIMENTICIOS_11,BEBIDAS_NO_ALCOHÓLICAS_12,BEBIDAS_ALCOHÓLICAS_21,TABACO_22,ARTÍCULOS_DE_VESTIR_31,CALZADO_32,ALQUILERES_REALES_DE_LA_VIVIENDA_41,ALQUILERES_IMPUTADOS_DE_LA_VIVIENDA_42,MANTENIMIENTO_DE_LA_VIVIENDA_43,SUMINISTRO_DE_AGUA_44,ELECTRICIDAD_GAS_OTROS_COMBUSTIBLES_45,MUEBLES_REVESTIMIENTOS_51,TEXTILES_PARA_EL_HOGAR_52,GRANDES_ELECTRODOMÉSTICOS_53,UTENSILIOS_DEL_HOGAR_54,HERRAMIENTAS_CASA_JARDÍN_55,BIENES_SERVICIOS_PARA_EL_HOGAR_56,PRODUCTOS_FARMACÉUTICOS_61,SERVICIOS_MÉDICOS_AMBULATORIOS_62,SERVICIOS_HOSPITALARIOS_63,COMPRA_DE_VEHÍCULOS_71,USO_DE_VEHÍCULOS_PERSONALES_72,SERVICIOS_DE_TRANSPORTE_73,SERVICIOS_POSTALES_81,EQUIPOS_TELÉFONO_FAX_82,SERVICIOS_TELÉFONO_FAX_83,AUDIOVISUALES_TECNOLOGÍA_91,BIENES_DURADEROS_DE_OCIO_92,OCIO_JARDINERÍA_MASCOTAS_93,SERVICIOS_RECREATIVOS_CULTURALES_94,PRENSA_PAPELERÍA_95,PAQUETES_TURÍSTICOS_96,EDUCACIÓN_INFANTIL_PRIMARIA_101,EDUCACIÓN_SECUNDARIA_POSTSECUNDARIA_102,EDUCACIÓN_SUPERIOR_103,EDUCACIÓN_NO_FORMAL_104,RESTAURACIÓN_111,ALOJAMIENTO_112,CUIDADOS_PERSONALES_121,EFECTOS_PERSONALES_123,PROTECCIÓN_SOCIAL_124,SEGUROS_125,SERVICIOS_FINANCIEROS_126,OTROS_SERVICIOS_127,REMESAS_128
0,2016-01-01T00:00:00,1,7,0,1,1,96,1,1,3,5,2,2,2,0,1,1,0,0,1,66,1,0,1,0,0,1007.709928,1313.824812,42.9,-8.0,18.3,1.6,0.0,72.913892,0.062772,,2.443704,15.237684,,,309.449703,,17.480683,47.71198,,,,,,3.649939,26.084551,5.560365,,,3.333047,3.959279,,,,,,,3.163079,1.166058,,,,,,668.274699,,98.935487,0.300641,,32.562055,,1.535195,
1,2016-01-01T00:00:00,47,7,0,1,1,100,1,1,1,6,0,1,1,0,0,2,0,0,0,85,1,0,0,0,0,748.584518,618.059831,42.9,-8.0,18.3,1.6,0.0,148.568863,,,,,,,282.533648,,4.952174,89.995431,,,34.230919,,,,,,,,,,,,30.502762,,,,,,,,,,,,,,,,27.276033,,,
2,2016-01-01T00:00:00,53,7,1,4,3,80,1,1,5,6,0,0,1,0,1,1,0,0,0,70,1,0,0,0,0,749.407138,1343.725829,42.9,-8.0,18.3,1.6,0.0,281.710458,9.829813,7.184699,,57.132283,,41.131018,377.370916,24.187589,116.455238,56.500691,,,,5.838335,,4.818217,,,,,69.523585,,,1.580258,23.526942,27.425978,,9.472365,70.96296,,,,,,,111.840309,,,,,47.234176,,,
3,2016-01-01T00:00:00,67,7,1,4,2,85,1,1,5,4,1,1,1,0,0,1,0,0,1,25,1,0,0,1,0,370.179157,295.01419,42.9,-8.0,18.3,1.6,0.0,17.143372,,,,,,106.940645,,,5.528011,41.501197,,,,,,,,,,,47.016888,52.845277,,,,,,16.407566,,,,,,,,4.016997,,,3.614237,,,,,
4,2016-01-01T00:00:00,68,7,0,1,1,90,1,1,5,5,1,2,2,0,1,1,0,1,1,43,1,0,0,1,0,2303.336977,2435.025827,42.9,-8.0,18.3,1.6,0.0,152.499806,3.707276,,175.776547,140.411967,14.97116,,254.280259,,5.108473,120.966323,,,16.449692,,,27.656634,,33.362191,,,126.670105,,,18.222686,55.938184,55.719367,,214.492456,285.587951,,,80.205484,,,,319.334544,159.860498,73.549838,,,33.530006,,66.724382,
5,2016-01-01T00:00:00,69,7,1,5,3,85,1,1,5,6,1,1,2,0,1,1,0,0,0,68,1,1,1,0,0,1365.549779,662.779431,42.9,-8.0,18.3,1.6,0.0,105.515173,13.688282,,,,,,242.384592,,84.531836,30.925672,,,,,,,,,,,81.56566,,,,39.790146,,,,,,,,,,,,,10.842623,,,53.535446,,,
6,2016-01-01T00:00:00,76,7,1,4,2,74,1,1,6,6,0,1,1,1,0,1,0,1,0,59,1,1,0,0,0,1010.177789,1527.956094,42.9,-8.0,18.3,1.6,0.0,239.835813,30.203798,17.823083,,110.094324,29.191677,,349.068086,,161.964814,52.245523,,,,,,0.268086,,88.965843,,,,138.451954,,41.170584,70.120158,,,,,8.031598,,,,14.395857,,12.831766,16.681096,69.650936,10.008575,,33.590331,,33.362191,
7,2016-01-01T00:00:00,94,7,1,4,3,89,1,1,5,6,1,1,1,0,1,1,0,0,1,57,1,0,0,1,1,1429.714167,2680.834934,42.9,-8.0,18.3,1.6,0.0,778.156753,29.280689,31.920978,,60.885498,8.747745,,641.918216,,52.80674,56.448208,0.542135,,,,,75.526025,,,,,110.391372,,,,44.602476,,,198.630847,,3.979466,102.827544,,,,,172.782612,166.810955,90.23849,,,54.338187,,,
8,2016-01-01T00:00:00,109,7,0,1,1,198,1,1,6,5,2,2,2,0,1,1,0,0,1,36,1,1,0,1,0,3093.052513,3360.30642,42.9,-8.0,18.3,1.6,0.0,182.908508,2.110731,11.08535,70.425783,125.751082,15.114436,0.195702,752.933382,16.125059,48.497881,65.337543,53.941307,56.825483,29.694052,0.016978,17.75425,14.273961,0.184264,54.593451,0.003217,,24.596976,4.459508,1.610481,14.04122,86.28952,54.057761,,429.47337,387.758993,38.8696,154.46196,0.033959,0.025378,0.045574,0.007686,392.286367,44.399832,66.396709,16.730645,0.016443,95.23834,0.002681,31.730995,
9,2016-01-01T00:00:00,110,7,1,5,3,76,1,1,5,5,2,2,2,0,1,1,1,0,1,34,1,0,0,1,0,1584.366792,1844.642315,42.9,-8.0,18.3,1.6,0.0,216.965828,18.220688,0.108537,20.862125,69.468596,0.693716,0.011722,216.720318,0.294142,91.04736,43.301392,49.517762,0.001666,0.450247,0.13709,0.710339,0.488192,3.017742,15.24772,0.000363,,122.288447,1.293391,5.5e-05,0.026578,82.548183,0.177274,,5.734459,280.083302,2.48094,0.003812,90.49026,0.001282,0.002166,0.000343,339.177767,76.587552,24.525886,23.683068,0.001227,47.727288,0.000171,0.002811,0.540509
