## Procesamiento ficheros
Este notebook de python se encargas de procesar los ficheros concatenados que se obtienen con el notebook concatenacion_ficheros.ipynb.

### Importación de librerías:

In [2]:
import pandas as pd

### Defunciones:

In [2]:
# Lectura del csv de defunciones:
df = pd.read_csv('../01-Ficheros Concatenados/defunciones.csv')

# En el campo valor se sustituyen aquellos valores sin informar por 0:
df['Valor']=df['Valor'].replace('..',0)

# Se convierte el campo valor de str a int para poder sumarlo:
df['Valor']=df['Valor'].astype(int)

# Se eliminan las columnas que no son necesarias:
df = df.drop(columns=['AEB','Seccio_Censal','SEXE','EDAT_Q'])

# Se suman los valores de la columna 'valor':
df_agrupado = df.groupby(['Any','Codi_Districte','Nom_Districte','Codi_Barri', 'Nom_Barri'], as_index=False)['Valor'].sum()

# Se guarda el DataFrame modificado en un nuevo archivo CSV 
df_agrupado = df_agrupado.rename(columns={'Any':'Anno','Codi_Districte':'Cod_Distrito','Nom_Districte':'Nom_Distrito','Codi_Barri':'Cod_Barrio', 'Nom_Barri':'Nom_Barrio', 'Valor': 'Defunciones'})
df_agrupado.to_csv('../03-Ficheros Procesados/defunciones_procesado.csv', encoding='UTF-8', index=False)


### Densidad poblacional:

In [3]:
# Lectura del fichero de densidad:
df = pd.read_csv('../01-Ficheros Concatenados/densidad.csv')

# Se eliminan las columnas que no se consideran necesarias necesarias:
df = df.drop(columns=['Densitat neta (hab/ha)','Superfície Residencial (ha)'])

# Se cambia el nombre de las columnas
df=df.rename(columns={'Any':'Anno','Codi_Districte':'Cod_Distrito','Nom_Districte':'Nom_Distrito','Codi_Barri':'Cod_Barrio', 'Nom_Barri':'Nom_Barrio', 'Població': 'Habitantes', 'Superfície(ha)': 'Superficie(ha)', 'Densitat(hab/ha)': 'Densidad (hab/ha)'})

# Se guarda el fichero modificado:

df.to_csv('../03-Ficheros Procesados/densidad_procesado.csv', encoding='UTF-8', index=False)

### Emigrantes:

In [4]:
# Lectura del csv de emigrantes:
df = pd.read_csv('../01-Ficheros Concatenados/emigrantes.csv')

# En el campo valor se sustituyen aquellos valores sin informar por 0:
df['Valor']=df['Valor'].replace('..',0)

# Se convierte el campo valor de str a int para poder sumarlo:
df['Valor']=df['Valor'].astype(int)

# Se eliminan las columnas que no son necesarias:
df = df.drop(columns=['AEB','Seccio_Censal','SEXE','EDAT_Q'])

# Se suman los valores de la columna 'valor':
df_agrupado = df.groupby(['Any','Codi_Districte','Nom_Districte','Codi_Barri', 'Nom_Barri'], as_index=False)['Valor'].sum()

# Se guarda el DataFrame modificado en un nuevo archivo CSV 
df_agrupado = df_agrupado.rename(columns={'Any':'Anno','Codi_Districte':'Cod_Distrito','Nom_Districte':'Nom_Distrito','Codi_Barri':'Cod_Barrio', 'Nom_Barri':'Nom_Barrio', 'Valor': 'Emigrantes'})
df_agrupado.to_csv('../03-Ficheros Procesados/emigrantes_procesado.csv', encoding='UTF-8', index=False)

### Gini:

In [5]:
# Lectura del csv de gini:
df = pd.read_csv('../01-Ficheros Concatenados/gini.csv')

# En el campo 'Index_Gini' se sustituyen aquellos valores sin informar por 0 y se convierte en numérico:
df['Index_Gini']=df['Index_Gini'].replace('-',0.0)
df['Index_Gini']=df['Index_Gini'].replace('.',0.0)
df['Index_Gini']=df['Index_Gini'].astype(float)


# Se eliminan las columnas que no son necesarias:
df = df.drop(columns=['Seccio_Censal'])

# Se suman los valores de la columna 'Index_Gini':
df_agrupado = df.groupby(['Any','Codi_Districte','Nom_Districte','Codi_Barri', 'Nom_Barri'], as_index=False)['Index_Gini'].mean()

# Se guarda el DataFrame modificado en un nuevo archivo CSV 
df_agrupado = df_agrupado.rename(columns={'Any':'Anno','Codi_Districte':'Cod_Distrito','Nom_Districte':'Nom_Distrito','Codi_Barri':'Cod_Barrio', 'Nom_Barri':'Nom_Barrio', 'Index_Gini': 'Indice_Gini'})
df_agrupado.to_csv('../03-Ficheros Procesados/gini_procesado.csv', encoding='UTF-8', index=False)

### Incidentes:

In [6]:
# Lectura del csv de incidentes:
df = pd.read_csv('../01-Ficheros Concatenados/incidentes.csv')

# Se eliminan las columnas que no son necesarias:
df=df.drop(columns=['Codi_Incident','Descripcio_Incident','Mes_any','Nom_mes'])

# Se suman los valores de la columna 'Numero_incidents_GUB':
df_agrupado = df.groupby(['NK_Any','Codi_districte','Nom_districte','Codi_barri', 'Nom_barri'], as_index=False)['Numero_incidents_GUB'].sum()
df_agrupado['Numero_incidents_GUB']=df_agrupado['Numero_incidents_GUB'].astype(int)

# Se guarda el DataFrame modificado en un nuevo archivo CSV 
df_agrupado = df_agrupado.rename(columns={'NK_Any':'Anno','Codi_districte':'Cod_Distrito','Nom_districte':'Nom_Distrito','Codi_barri':'Cod_Barrio', 'Nom_barri':'Nom_Barrio', 'Numero_incidents_GUB': 'Incidentes'})
df_agrupado.to_csv('../03-Ficheros Procesados/incidentes_procesado.csv', encoding='UTF-8', index=False)

  df = pd.read_csv('../01-Ficheros Concatenados/incidentes.csv')


### Inmigrantes:

In [7]:
# Lectura del csv de inmigrantes:
df = pd.read_csv('../01-Ficheros Concatenados/inmigrantes.csv')

# En el campo valor se sustituyen aquellos valores sin informar por 0:
df['Valor']=df['Valor'].replace('..',0)

# Se convierte el campo valor de str a int para poder sumarlo:
df['Valor']=df['Valor'].astype(int)

# Se eliminan las columnas que no son necesarias:
df = df.drop(columns=['AEB','Seccio_Censal','SEXE','EDAT_Q'])

# Se suman los valores de la columna 'valor':
df_agrupado = df.groupby(['Any','Codi_Districte','Nom_Districte','Codi_Barri', 'Nom_Barri'], as_index=False)['Valor'].sum()

# Se guarda el DataFrame modificado en un nuevo archivo CSV 
df_agrupado = df_agrupado.rename(columns={'Any':'Anno','Codi_Districte':'Cod_Distrito','Nom_Districte':'Nom_Distrito','Codi_Barri':'Cod_Barrio', 'Nom_Barri':'Nom_Barrio', 'Valor': 'Inmigrantes'})
df_agrupado.to_csv('../03-Ficheros Procesados/inmigrantes_procesado.csv', encoding='UTF-8', index=False)

### Nacimientos:

In [8]:
# Lectura del csv de nacimientos:
df = pd.read_csv('../01-Ficheros Concatenados/nacimientos.csv')

# En el campo valor se sustituyen aquellos valores sin informar por 0:
df['Valor']=df['Valor'].replace('..',0)

# Se convierte el campo valor de str a int para poder sumarlo:
df['Valor']=df['Valor'].astype(int)

# Se eliminan las columnas que no son necesarias:
df = df.drop(columns=['AEB','Seccio_Censal','SEXE','NACIONALITAT_PAIS','NACIONALITAT_CONTINENT'])

# Se suman los valores de la columna 'valor':
df_agrupado = df.groupby(['Any','Codi_Districte','Nom_Districte','Codi_Barri', 'Nom_Barri'], as_index=False)['Valor'].sum()

# Se guarda el DataFrame modificado en un nuevo archivo CSV 
df_agrupado = df_agrupado.rename(columns={'Any':'Anno','Codi_Districte':'Cod_Distrito','Nom_Districte':'Nom_Distrito','Codi_Barri':'Cod_Barrio', 'Nom_Barri':'Nom_Barrio', 'Valor': 'Nacimientos'})
df_agrupado.to_csv('../03-Ficheros Procesados/nacimientos_procesado.csv', encoding='UTF-8', index=False)

### Personas por domicilio:

In [9]:
# Lectura del csv de personas por domicilio:
df = pd.read_csv('../01-Ficheros Concatenados/personas_por_domicilio.csv')

# En el campo valor se sustituyen aquellos valores sin informar por 0:
df['Valor'] = df['Valor'].replace('..',0)

# Se convierte el campo valor de str a int para poder sumarlo:
df['Valor'] = df['Valor'].astype(int)

# Convertir la columna 'Data_Referencia' a tipo datetime:
df['Data_Referencia'] = pd.to_datetime(df['Data_Referencia'])
df['Any'] = df['Data_Referencia'].dt.year

# Se eliminan las columnas que no son necesarias:
df = df.drop(columns=['AEB','Seccio_Censal','Data_Referencia'])

# Se suman los valores de la columna 'valor':
df_agrupado = df.groupby(['Any','Codi_Districte','Nom_Districte','Codi_Barri', 'Nom_Barri','N_PERSONES_AGG'], as_index=False)['Valor'].sum()

# Se guarda el DataFrame modificado en un nuevo archivo CSV 
df_agrupado = df_agrupado.rename(columns={'Any':'Anno','Codi_Districte':'Cod_Distrito','Nom_Districte':'Nom_Distrito','Codi_Barri':'Cod_Barrio', 'Nom_Barri':'Nom_Barrio','N_PERSONES_AGG': 'Personas_en_domicilio' ,'Valor': 'Domicilios'})
df_agrupado.to_csv('../03-Ficheros Procesados/personas_por_domicilio_procesado.csv', encoding='UTF-8', index=False)

### Renta bruta por persona:

In [10]:
# Lectura del csv de personas por domicilio:
df = pd.read_csv('../01-Ficheros Concatenados/renta_bruta_persona.csv')

# Se unifican en una columna los importes de las rentas, para ello se sustituyen por cero las no informadas.
df['Import_Renda_Bruta_€                ']= df['Import_Renda_Bruta_€                '].fillna(0)
df['Import_Renda_Bruta_€'] = df['Import_Renda_Bruta_€'].fillna(0)

df['Renda_Bruta_€'] = df['Import_Renda_Bruta_€'] + df['Import_Renda_Bruta_€                ']

# Se eliminan las columnas que no son necesarias:
df = df.drop(columns=['Seccio_Censal','Import_Renda_Bruta_€','Import_Renda_Bruta_€                '])

# Se hace la media de los valores de la columna 'Renda_Bruta_€':
df_agrupado = df.groupby(['Any','Codi_Districte','Nom_Districte','Codi_Barri', 'Nom_Barri'], as_index=False)['Renda_Bruta_€'].mean()

# Se guarda el DataFrame modificado en un nuevo archivo CSV 
df_agrupado = df_agrupado.rename(columns={'Any':'Anno','Codi_Districte':'Cod_Distrito','Nom_Districte':'Nom_Distrito','Codi_Barri':'Cod_Barrio', 'Nom_Barri':'Nom_Barrio','Renda_Bruta_€': 'Renta'})
df_agrupado.to_csv('../03-Ficheros Procesados/renta_bruta_persona_procesado.csv', encoding='UTF-8', index=False)

### Valor catastral:

In [4]:
# Lectura del csv de valor catastral:
df = pd.read_csv('../01-Ficheros Concatenados/valor_catastral.csv')

# Se eliminan las columnas que no son necesarias:
df = df.drop(columns=['Seccio_censal'])

# Se hace la media de los valores de la columna 'Renda_Bruta_€':
df_agrupado = df.groupby(['Any','Codi_districte','Nom_districte','Codi_barri', 'Nom_barri','Desc_valors'], as_index=False)['Valors'].mean()

# Se guarda el DataFrame modificado en un nuevo archivo CSV 
df_agrupado = df_agrupado.rename(columns={'Any':'Anno','Codi_districte':'Cod_Distrito','Nom_districte':'Nom_Distrito','Codi_barri':'Cod_Barrio', 'Nom_barri':'Nom_Barrio','Desc_valors': 'Desc_valor_catastral','Valors': 'valor_catastral'})
df_agrupado = df_agrupado[ df_agrupado['Desc_valor_catastral']=='Valor_cadastral_unitari_€/m2']
df_agrupado.to_csv('../03-Ficheros Procesados/valor_catastral_procesado.csv', encoding='UTF-8', index=False)