## G7 - Disuguaglianza di Reddito - Quintili

In [1]:
# Import librerie per analisi dati (Pandas) e dati Istat
import os
import pandas as pd
import numpy as np
from IPython.core.display import HTML
import istat
import jsonstat

# cache dir per velocizzare analisi in locale
cache_dir = os.path.abspath(os.path.join("..", "tmp/od_la_grande_fuga", "istat_cached"))
istat.cache_dir(cache_dir)
istat.lang(0)  # lingua italiano

dir_df = os.path.join(os.path.abspath(''),'stg')

In [2]:
istat_area_condizioni = istat.area(9)
istat_area_condizioni.datasets()

cod,name,dim
DCCV_ABITAFFOLL,Affollamento nell'abitazione,14
DCCV_ABITAFFOLL_PROVA,Affollamento nell'abitazione PROVA,14
DCCV_ABITPROBL,Problemi nell'abitazione,14
DCCV_ABITSPESA,Spesa per l'abitazione,12
DCCV_ABITSPESA_STRA,Spesa per l'abitazione delle famiglie con componenti stranieri,14
DCCV_ARRETRATI,Arretrati per alcune voci di spesa,13
DCCV_CARICOPES,Carico delle spese pesante,13
DCCV_DIFFBENDUR,Difficoltà acquisto beni durevoli,13
DCCV_FAMCOMPORT,Comportamento di spesa delle famiglia,6
DCCV_FAMNOVOCISPESA,Famiglie che non possono permettersi alcune voci di spesa,13


In [3]:
# Indicatori di reddito
ds_reddito = istat_area_condizioni.dataset('DCCV_QUINTOREDD')
ds_reddito

nr,name,nr. values,values (first 3 values)
0,Territorio,27,"1:'Italia', 4:'Nord-ovest', 33:'Nord-est' ..."
1,Tipo dato,1,51:'famiglie per quinto di reddito equivalente (per famiglie con le stesse caratteristiche)'
2,Misura,1,10:'valori per cento'
3,Quinto di reddito equivalente,5,"1:'primo', 2:'secondo', 3:'terzo' ..."
4,Presenza dei fitti imputati,1,1:'inclusi fitti imputati'
5,Numero di componenti,6,"1:'uno', 2:'due', 3:'tre' ..."
6,Tipologia familiare,10,"2:'persona sola con meno di 65 anni', 5:'persona sola con 65 anni o più', 7:'coppia senza figli con p.r. con meno di 65 anni' ..."
7,Numero di minori in famiglia,5,"1:'1 figlio minore', 2:'2 figli minori', 3:'3 figli minori o più' ..."
8,Numero di anziani in famiglia,4,"1:'1 anziano', 2:'2 anziani o più', 4:'nessun anziano' ..."
9,Sesso del principale percettore,3,"1:'maschi', 2:'femmine', 3:'totale' ..."


In [4]:
ds_reddito.dimension('Territorio')

'Territorio' (1:'Italia', 4:'Nord-ovest', 33:'Nord-est', 62:'Centro', 89:'Sud', 119:'Isole', 5:'Piemonte', 14:'Valle d'Aosta / Vallée d'Aoste', 16:'Liguria', 21:'Lombardia', 35:'Provincia Autonoma Bolzano / Bozen', 37:'Provincia Autonoma Trento', 39:'Veneto', 47:'Friuli-Venezia Giulia', 52:'Emilia-Romagna', 63:'Toscana', 74:'Umbria', 77:'Marche', 82:'Lazio', 90:'Abruzzo', 95:'Molise', 98:'Campania', 104:'Puglia', 110:'Basilicata', 113:'Calabria', 120:'Sicilia', 130:'Sardegna')

In [5]:
# NORD
spec_ne = {
"Territorio":4
}
spec_no = {
"Territorio":33
}

#SUD
spec_s = {
"Territorio":89
}

In [6]:
def quintili(ds, spec, nome):
    c = ds_reddito.getvalues(spec)
    ds = c.dataset(0)
    df = ds.to_data_frame('Anno')
    df.reset_index(level=0, inplace=True)
    df = df[['Anno','Quinto di reddito equivalente','Value']]
    df.columns = ['Anno','Quintile',nome]
    df=df[(df['Quintile']=='primo') |
           (df['Quintile']=='quinto')
         ]
    return df

In [7]:
df_s = quintili(ds_reddito,spec_s, 'Sud')
df_ne = quintili(ds_reddito,spec_ne, 'NordE')
df_no = quintili(ds_reddito,spec_no, 'NordO')

In [8]:
df_ne.columns = ['AnnoE','QuintileE','NordE']
df_n = pd.concat([df_no,df_ne],axis=1)

In [9]:
def nord(x):
    return round(((x['NordE'] + x['NordO'])/2),1)
df_n['Nord'] = df_n.apply(lambda x: nord(x), axis=1)
df_n = df_n[['Anno','Quintile','Nord']]

In [10]:
# Reshape Nord
df_n1=df_n[(df_n['Quintile']=='primo')]
df_n1=df_n1[['Anno','Nord']]
df_n1.columns = ['Anno','1° Quintile']
df_n5=df_n[(df_n['Quintile']=='quinto')]
df_n5=df_n5[['Anno','Nord']]
df_n5.columns = ['Anno','5° Quintile']

In [11]:
df_n1 = df_n1.set_index(['Anno'])
df_n5 = df_n5.set_index(['Anno'])

In [12]:
df_n = pd.concat([df_n1,df_n5],axis=1)
df_n

Unnamed: 0_level_0,1° Quintile,5° Quintile
Anno,Unnamed: 1_level_1,Unnamed: 2_level_1
2003,10.8,24.9
2004,10.6,24.3
2005,10.9,24.5
2006,10.7,24.8
2007,11.5,24.7
2008,11.3,25.0
2009,11.6,25.2
2010,11.2,25.4
2011,11.3,25.4
2012,10.9,26.0


In [13]:
# Reshape Sud
df_s1=df_s[(df_s['Quintile']=='primo')]
df_s1=df_s1[['Anno','Sud']]
df_s1.columns = ['Anno','1° Quintile']
df_s5=df_s[(df_s['Quintile']=='quinto')]
df_s5=df_s5[['Anno','Sud']]
df_s5.columns = ['Anno','5° Quintile']

In [14]:
df_s1 = df_s1.set_index(['Anno'])
df_s5 = df_s5.set_index(['Anno'])

In [15]:
df_s = pd.concat([df_s1,df_s5],axis=1)
df_s

Unnamed: 0_level_0,1° Quintile,5° Quintile
Anno,Unnamed: 1_level_1,Unnamed: 2_level_1
2003,36.7,9.5
2004,37.0,9.6
2005,36.8,9.4
2006,36.9,9.6
2007,36.1,9.3
2008,35.8,9.8
2009,35.2,9.4
2010,35.3,9.1
2011,35.1,9.1
2012,35.3,7.7


In [16]:
df_filename = r'df_g7_nord.pkl'
df_fullpath = os.path.join(dir_df, df_filename)
df_n.to_pickle(df_fullpath)

df_filename = r'df_g7_sud.pkl'
df_fullpath = os.path.join(dir_df, df_filename)
df_s.to_pickle(df_fullpath)