In [6]:
import pandas as pd

In [7]:
pd.set_option("display.max_columns", None)
pd.options.display.float_format = '{:.2f}'.format

# Indicadores de renta media y mediana

In [8]:
try:
    df_renta_zamora = pd.read_csv('raw_data/municipios/Zamora/31268.csv', encoding='utf-8', sep = ';')
except FileNotFoundError:
    print("Error: File not found. Please check the file path.")
except pd.errors.ParserError as e:
    print(f"Error parsing the CSV file: {e}")
except Exception as e:
    print(f"An unexpected error occurred: {e}")


In [9]:
df_renta_zamora['Indicadores de renta media y mediana'].unique()

array(['Renta neta media por persona', 'Renta neta media por hogar',
       'Media de la renta por unidad de consumo',
       'Mediana de la renta por unidad de consumo',
       'Renta bruta media por persona', 'Renta bruta media por hogar'],
      dtype=object)

In [10]:
df = df_renta_zamora.copy()
df['Provincia'] = 'Zamora'
df = df[df['Periodo'] == 2022]
df = df.rename(columns={'Municipios': 'Municipio'})
df['Total'] = df['Total'].str.replace('.', '').str.replace(',', '.')
df['Total'] = pd.to_numeric(df['Total'], errors='coerce')
df.head()

Unnamed: 0,Municipio,Distritos,Secciones,Indicadores de renta media y mediana,Periodo,Total,Provincia
0,49002 Abezames,,,Renta neta media por persona,2022,13494.0,Zamora
8,49002 Abezames,,,Renta neta media por hogar,2022,27244.0,Zamora
16,49002 Abezames,,,Media de la renta por unidad de consumo,2022,,Zamora
24,49002 Abezames,,,Mediana de la renta por unidad de consumo,2022,,Zamora
32,49002 Abezames,,,Renta bruta media por persona,2022,15881.0,Zamora


In [11]:
df.columns

Index(['Municipio', 'Distritos', 'Secciones',
       'Indicadores de renta media y mediana', 'Periodo', 'Total',
       'Provincia'],
      dtype='object')

In [12]:
df = df.pivot_table(
    index=['Periodo', 'Municipio', 'Provincia'],
    columns='Indicadores de renta media y mediana',
    values='Total')
df.fillna(0, inplace=True)
df.reset_index(inplace=True)
df[['CP', 'Municipio']] = df['Municipio'].str.split(' ', n=1, expand=True)
df_renta_zamora_limpio = df.copy()
df_renta_zamora_limpio.head()

Indicadores de renta media y mediana,Periodo,Municipio,Provincia,Media de la renta por unidad de consumo,Mediana de la renta por unidad de consumo,Renta bruta media por hogar,Renta bruta media por persona,Renta neta media por hogar,Renta neta media por persona,CP
0,2022,Abezames,Zamora,0.0,0.0,32063.0,15881.0,27244.0,13494.0,49002
1,2022,Alcañices,Zamora,17634.0,16450.0,31402.0,14089.0,27245.0,12224.0,49003
2,2022,Alcubilla de Nogales,Zamora,17196.0,15050.0,27269.0,14644.0,23642.0,12697.0,49004
3,2022,Alfaraz de Sayago,Zamora,17191.0,16450.0,27450.0,14400.0,23961.0,12570.0,49005
4,2022,Algodre,Zamora,18188.0,17150.0,30401.0,14987.0,26702.0,13163.0,49006


# Distribución por fuente de ingresos

In [26]:
try:
    df_ingresos_zamora = pd.read_csv('raw_data/municipios/Zamora/31269.csv', encoding='utf-8', sep = ';')
except FileNotFoundError:
    print("Error: File not found. Please check the file path.")
except pd.errors.ParserError as e:
    print(f"Error parsing the CSV file: {e}")
except Exception as e:
    print(f"An unexpected error occurred: {e}")

In [27]:
df_ingresos_zamora.head()

Unnamed: 0,Municipios,Distritos,Secciones,Distribución por fuente de ingresos,Periodo,Total
0,49002 Abezames,,,Renta bruta media por persona,2022,"15.881,0"
1,49002 Abezames,,,Renta bruta media por persona,2021,"14.246,0"
2,49002 Abezames,,,Renta bruta media por persona,2020,"13.874,0"
3,49002 Abezames,,,Renta bruta media por persona,2019,.
4,49002 Abezames,,,Renta bruta media por persona,2018,.


In [28]:
df = df_ingresos_zamora.copy()
df['Provincia'] = 'Zamora'
df = df[df['Periodo'] == 2022]
df = df.rename(columns={'Municipios': 'Municipio'})
df.fillna(0, inplace=True)
df['Total'] = df['Total'].str.replace('.', '').str.replace(',', '.')
df['Total'] = pd.to_numeric(df['Total'])
df = df.pivot_table(
    index=['Periodo', 'Municipio', 'Provincia'],
    columns='Distribución por fuente de ingresos',
    values='Total')
df.fillna(0, inplace=True)
df.reset_index(inplace=True)
df[['CP', 'Municipio']] = df['Municipio'].str.split(' ', n=1, expand=True)
df_ingresos_zamora_limpio = df.copy()
df_ingresos_zamora_limpio.head()

Distribución por fuente de ingresos,Periodo,Municipio,Provincia,Fuente de ingreso: otras prestaciones,Fuente de ingreso: otros ingresos,Fuente de ingreso: pensiones,Fuente de ingreso: prestaciones por desempleo,Fuente de ingreso: salario,Renta bruta media por persona,CP
0,2022,Abezames,Zamora,0.0,0.0,0.0,0.0,0.0,15881.0,49002
1,2022,Alcañices,Zamora,578.0,1499.0,4614.0,277.0,7121.0,14089.0,49003
2,2022,Alcubilla de Nogales,Zamora,481.0,748.0,5727.0,284.0,7403.0,14644.0,49004
3,2022,Alfaraz de Sayago,Zamora,808.0,1671.0,6538.0,79.0,5303.0,14400.0,49005
4,2022,Algodre,Zamora,831.0,2286.0,4598.0,448.0,6823.0,14987.0,49006


# Indicadores demográficos

In [45]:
try:
    df_demografia_zamora = pd.read_csv('raw_data/municipios/Zamora/31276.csv', encoding='utf-8', sep = ';')
except FileNotFoundError:
    print("Error: File not found. Please check the file path.")
except pd.errors.ParserError as e:
    print(f"Error parsing the CSV file: {e}")
except Exception as e:
    print(f"An unexpected error occurred: {e}")

In [46]:
df_demografia_zamora.head()

Unnamed: 0,Municipios,Distritos,Secciones,Indicadores demográficos,Periodo,Total
0,49002 Abezames,,,Edad media de la población,2022,552
1,49002 Abezames,,,Edad media de la población,2021,563
2,49002 Abezames,,,Edad media de la población,2020,599
3,49002 Abezames,,,Edad media de la población,2019,.
4,49002 Abezames,,,Edad media de la población,2018,.


In [53]:
df_demografia_zamora[(df_demografia_zamora['Municipios'] == '49275 Zamora') & (df_demografia_zamora['Indicadores demográficos'] == 'Población')].head()

Unnamed: 0,Municipios,Distritos,Secciones,Indicadores demográficos,Periodo,Total
43328,49275 Zamora,,,Población,2022,58.998
43329,49275 Zamora,,,Población,2021,59.15
43330,49275 Zamora,,,Población,2020,59.991
43331,49275 Zamora,,,Población,2019,60.585
43332,49275 Zamora,,,Población,2018,61.022


In [62]:
df = df_demografia_zamora.copy()
df['Provincia'] = 'Zamora'
df = df[df['Periodo'] == 2022]
df = df.rename(columns={'Municipios': 'Municipio'})
df.fillna(0, inplace=True)
df['Total'] = df['Total'].str.replace('.', '').str.replace(',', '.')
df[(df['Municipio'] == '49275 Zamora') & (df['Indicadores demográficos'] == 'Población')].head()
df = df[(df['Distritos'] == 0) & (df['Secciones'] == 0)]

In [64]:
df = df_demografia_zamora.copy()
df['Provincia'] = 'Zamora'
df = df[df['Periodo'] == 2022]
df = df.rename(columns={'Municipios': 'Municipio'})
df.fillna(0, inplace=True)
df = df[(df['Distritos'] == 0) & (df['Secciones'] == 0)]
df['Total'] = df['Total'].str.replace('.', '').str.replace(',', '.')
df['Total'] = pd.to_numeric(df['Total'])
df = df.pivot_table(
    index=['Periodo', 'Municipio', 'Provincia'],
    columns='Indicadores demográficos',
    values='Total')
df.fillna(0, inplace=True)
df.reset_index(inplace=True)
df[['CP', 'Municipio']] = df['Municipio'].str.split(' ', n=1, expand=True)
df_demografia_zamora_limpio = df.copy()
df_demografia_zamora_limpio.head()

Indicadores demográficos,Periodo,Municipio,Provincia,Edad media de la población,Población,Porcentaje de hogares unipersonales,Porcentaje de población de 65 y más años,Porcentaje de población española,Porcentaje de población menor de 18 años,Tamaño medio del hogar,CP
0,2022,Abezames,Zamora,55.2,65.0,50.0,36.9,98.5,7.7,1.9,49002
1,2022,Alcañices,Zamora,51.4,1031.0,43.9,32.1,88.5,9.7,2.2,49003
2,2022,Alcubilla de Nogales,Zamora,60.8,108.0,46.6,50.0,100.0,5.6,1.9,49004
3,2022,Alfaraz de Sayago,Zamora,55.0,123.0,53.9,37.4,100.0,8.1,1.9,49005
4,2022,Algodre,Zamora,59.6,142.0,38.6,39.4,99.3,2.1,2.0,49006


In [65]:
df_demografia_zamora_limpio[(df_demografia_zamora_limpio['Municipio'] == 'Zamora')].head()

Indicadores demográficos,Periodo,Municipio,Provincia,Edad media de la población,Población,Porcentaje de hogares unipersonales,Porcentaje de población de 65 y más años,Porcentaje de población española,Porcentaje de población menor de 18 años,Tamaño medio del hogar,CP
247,2022,Zamora,Zamora,48.2,58998.0,35.3,27.3,95.7,13.7,2.2,49275


# Indice Gini y Distribución de Renta

In [32]:
try:
    df_gini_zamora = pd.read_csv('raw_data/municipios/Zamora/37723.csv', encoding='utf-8', sep = ';')
except FileNotFoundError:
    print("Error: File not found. Please check the file path.")
except pd.errors.ParserError as e:
    print(f"Error parsing the CSV file: {e}")
except Exception as e:
    print(f"An unexpected error occurred: {e}")

In [33]:
df_gini_zamora.head()

Unnamed: 0,Municipios,Distritos,Secciones,Índice de Gini y Distribución de la renta P80/P20,Periodo,Total
0,49002 Abezames,,,Índice de Gini,2022,.
1,49002 Abezames,,,Índice de Gini,2021,.
2,49002 Abezames,,,Índice de Gini,2020,.
3,49002 Abezames,,,Índice de Gini,2019,.
4,49002 Abezames,,,Índice de Gini,2018,.


In [34]:
df = df_gini_zamora.copy()
df['Provincia'] = 'Zamora'
df = df[df['Periodo'] == 2022]
df = df.rename(columns={'Municipios': 'Municipio'})
df['Total'] = df['Total'].str.replace('.', '').str.replace(',', '.')
df['Total'] = pd.to_numeric(df['Total'])
df.fillna(0, inplace=True)
df = df.pivot_table(
    index=['Periodo', 'Municipio', 'Provincia'],
    columns='Índice de Gini y Distribución de la renta P80/P20',
    values='Total')
df.fillna(0, inplace=True)
df.reset_index(inplace=True)
df[['CP', 'Municipio']] = df['Municipio'].str.split(' ', n=1, expand=True)
df_gini_zamora_limpio = df.copy()
df_gini_zamora_limpio.head()

Índice de Gini y Distribución de la renta P80/P20,Periodo,Municipio,Provincia,Distribución de la renta P80/P20,Índice de Gini,CP
0,2022,Abezames,Zamora,0.0,0.0,49002
1,2022,Alcañices,Zamora,2.1,25.9,49003
2,2022,Alcubilla de Nogales,Zamora,2.2,24.3,49004
3,2022,Alfaraz de Sayago,Zamora,2.1,23.4,49005
4,2022,Algodre,Zamora,2.5,28.6,49006


In [35]:
indicadores_zamora = df_renta_zamora_limpio.join(
    df_ingresos_zamora_limpio.set_index(['Periodo', 'CP', 'Municipio', 'Provincia']),
    on=['Periodo', 'CP', 'Municipio', 'Provincia'],
    how='left',
    lsuffix='_renta',
    rsuffix='_ingresos'
).join(
    df_demografia_zamora_limpio.set_index(['Periodo', 'CP', 'Municipio', 'Provincia']),
    on=['Periodo', 'CP', 'Municipio', 'Provincia'],
    how='left',
    lsuffix='_ingresos',
    rsuffix='_demografia'
).join(
    df_gini_zamora_limpio.set_index(['Periodo', 'CP', 'Municipio', 'Provincia']),
    on=['Periodo', 'CP', 'Municipio', 'Provincia'],
    how='left',
    lsuffix='_demografia',
    rsuffix='_gini'
)

In [36]:
indicadores_zamora.head()

Unnamed: 0,Periodo,Municipio,Provincia,Media de la renta por unidad de consumo,Mediana de la renta por unidad de consumo,Renta bruta media por hogar,Renta bruta media por persona_renta,Renta neta media por hogar,Renta neta media por persona,CP,Fuente de ingreso: otras prestaciones,Fuente de ingreso: otros ingresos,Fuente de ingreso: pensiones,Fuente de ingreso: prestaciones por desempleo,Fuente de ingreso: salario,Renta bruta media por persona_ingresos,Edad media de la población,Población,Porcentaje de hogares unipersonales,Porcentaje de población de 65 y más años,Porcentaje de población española,Porcentaje de población menor de 18 años,Tamaño medio del hogar,Distribución de la renta P80/P20,Índice de Gini
0,2022,Abezames,Zamora,0.0,0.0,32063.0,15881.0,27244.0,13494.0,49002,0.0,0.0,0.0,0.0,0.0,15881.0,55.2,65.0,50.0,36.9,98.5,7.7,1.9,0.0,0.0
1,2022,Alcañices,Zamora,17634.0,16450.0,31402.0,14089.0,27245.0,12224.0,49003,578.0,1499.0,4614.0,277.0,7121.0,14089.0,51.4,1031.0,43.9,32.1,88.5,9.7,2.2,2.1,25.9
2,2022,Alcubilla de Nogales,Zamora,17196.0,15050.0,27269.0,14644.0,23642.0,12697.0,49004,481.0,748.0,5727.0,284.0,7403.0,14644.0,60.8,108.0,46.6,50.0,100.0,5.6,1.9,2.2,24.3
3,2022,Alfaraz de Sayago,Zamora,17191.0,16450.0,27450.0,14400.0,23961.0,12570.0,49005,808.0,1671.0,6538.0,79.0,5303.0,14400.0,55.0,123.0,53.9,37.4,100.0,8.1,1.9,2.1,23.4
4,2022,Algodre,Zamora,18188.0,17150.0,30401.0,14987.0,26702.0,13163.0,49006,831.0,2286.0,4598.0,448.0,6823.0,14987.0,59.6,142.0,38.6,39.4,99.3,2.1,2.0,2.5,28.6


In [37]:
indicadores_zamora.shape

(246, 25)

In [38]:
indicadores_zamora.describe()

Unnamed: 0,Periodo,Media de la renta por unidad de consumo,Mediana de la renta por unidad de consumo,Renta bruta media por hogar,Renta bruta media por persona_renta,Renta neta media por hogar,Renta neta media por persona,Fuente de ingreso: otras prestaciones,Fuente de ingreso: otros ingresos,Fuente de ingreso: pensiones,Fuente de ingreso: prestaciones por desempleo,Fuente de ingreso: salario,Renta bruta media por persona_ingresos,Edad media de la población,Población,Porcentaje de hogares unipersonales,Porcentaje de población de 65 y más años,Porcentaje de población española,Porcentaje de población menor de 18 años,Tamaño medio del hogar,Distribución de la renta P80/P20,Índice de Gini
count,246.0,246.0,246.0,246.0,246.0,246.0,246.0,246.0,246.0,246.0,246.0,246.0,246.0,246.0,246.0,246.0,246.0,246.0,246.0,246.0,246.0,246.0
mean,2022.0,15028.77,13432.84,28891.88,14195.44,25148.04,12367.09,629.6,1646.78,4224.74,229.82,5315.03,14195.44,57.1,355.67,43.6,41.73,96.56,6.35,2.02,2.07,24.9
std,0.0,5789.21,5203.87,3988.38,1414.39,3022.36,1050.92,326.74,976.43,2041.16,123.89,2583.97,1414.39,4.92,404.4,8.45,9.0,3.28,3.84,0.21,0.82,9.81
min,2022.0,0.0,0.0,20095.0,10622.0,17021.0,9396.0,0.0,0.0,0.0,0.0,0.0,10622.0,40.9,35.0,18.8,14.4,75.9,0.0,1.4,0.0,0.0
25%,2022.0,15529.75,13650.0,25635.75,13327.25,22852.5,11647.5,497.75,1124.25,3620.98,171.0,4711.0,13327.25,54.3,136.25,37.82,36.2,95.6,3.5,1.9,2.1,25.32
50%,2022.0,16960.5,15050.0,28801.5,14157.0,25220.5,12310.5,690.0,1715.0,4653.0,253.0,5721.0,14157.0,57.35,239.0,43.75,42.5,97.35,5.6,2.0,2.3,27.6
75%,2022.0,17793.5,15750.0,31899.75,14988.5,27244.0,12974.0,828.25,2207.25,5648.5,311.86,6895.0,14988.5,60.68,402.75,48.7,47.6,98.7,8.3,2.2,2.5,29.77
max,2022.0,22422.0,19775.0,44268.75,18724.0,36403.75,16092.0,1412.0,5823.0,8156.0,505.0,11511.0,18724.0,69.6,3218.07,67.9,66.0,100.0,20.9,2.6,4.2,44.2


In [40]:
indicadores_zamora[indicadores_zamora['Municipio'] == 'Zamora']

Unnamed: 0,Periodo,Municipio,Provincia,Media de la renta por unidad de consumo,Mediana de la renta por unidad de consumo,Renta bruta media por hogar,Renta bruta media por persona_renta,Renta neta media por hogar,Renta neta media por persona,CP,Fuente de ingreso: otras prestaciones,Fuente de ingreso: otros ingresos,Fuente de ingreso: pensiones,Fuente de ingreso: prestaciones por desempleo,Fuente de ingreso: salario,Renta bruta media por persona_ingresos,Edad media de la población,Población,Porcentaje de hogares unipersonales,Porcentaje de población de 65 y más años,Porcentaje de población española,Porcentaje de población menor de 18 años,Tamaño medio del hogar,Distribución de la renta P80/P20,Índice de Gini
245,2022,Zamora,Zamora,20085.93,18200.0,36929.56,16924.91,30891.55,14156.07,49275,702.35,1775.16,5040.07,280.87,9126.45,16924.91,48.79,3218.07,35.55,28.4,95.45,13.26,2.18,2.56,29.27
