### Notebook: using jsonstat.py to explore ISTAT data (unemployment)
This Jupyter notebook shows how to use [jsonstat.py](http://github.com/26fe/jsonstat.py) python library to explore Istat data.
[Istat](http://www.istat.it/en/about-istat) is the Italian National Institute of Statistics. It publishs a rest api for browsing italian statistics. This api can return results in jsonstat format. 

In [1]:
from __future__ import print_function
import os
import pandas as pd
from IPython.core.display import HTML
import matplotlib.pyplot as plt
%matplotlib inline

import istat

Next step is to set a cache dir where to store json files downloaded from Istat. Storing file on disk speeds up development, and assures consistent results over time. Eventually, you can delete donwloaded files to get a fresh copy.

In [2]:
cache_dir = os.path.abspath(os.path.join("..", "tmp", "istat_cached"))
istat.cache_dir(cache_dir)
istat.lang(0)  #italian
print("cache_dir is '{}'".format(istat.cache_dir()))

cache_dir is '/Users/26fe_nas/gioprj.on_mac/prj.python/jsonstat.py/tmp/istat_cached'


List all datasets contained into area `LAB` (Labour)

In [3]:
HTML(istat.area('LAB').datasets_as_html())

cod,name,dim
DCCV_COMPL,Indicatori complementari,12
DCCV_DISOCCUPT,Disoccupati,10
DCCV_DISOCCUPTDE,Disoccupati - dati destagionalizzati,7
DCCV_DISOCCUPTMENS,Disoccupati - dati mensili,8
DCCV_FORZLV,Forze di lavoro,8
DCCV_FORZLVDE,Forze di lavoro - dati destagionalizzati,7
DCCV_FORZLVMENS,Forze lavoro - dati mensili,8
DCCV_INATTIV,Inattivi,11
DCCV_INATTIVDE,Inattivi - dati destagionalizzati,7
DCCV_INATTIVMENS,Inattivi - dati mensili,8


In [4]:
istat_forzlv = istat.dataset('LAB', 'DCCV_FORZLV')
HTML(istat_forzlv.info_dimensions_as_html(show_values=3))

nr,name,nr. values,values (first 3 values)
0,Territorio,136,"1:'Italia', 3:'Nord', 4:'Nord-ovest' ..."
1,Tipo dato,1,3:'numero di forze di lavoro15 anni e oltre (valori in migliaia)'
2,Misura,1,9:'valori assoluti'
3,Sesso,3,"1:'maschi', 2:'femmine', 3:'totale' ..."
4,Classe di età,10,"17:'45-54 anni', 4:'15-24 anni', 21:'55-64 anni' ..."
5,Titolo di studio,5,"11:'laurea e post-laurea', 12:'totale', 3:'licenza di scuola elementare, nessun titolo di studio' ..."
6,Cittadinanza,3,"1:'italiano-a', 2:'straniero-a', 3:'totale' ..."
7,Tempo e frequenza,193,"1536:'T4-1980', 2049:'T4-2007', 1540:'1981' ..."


In [5]:
spec = { 
    'Territorio':       'Italia',                            
    'Tipo dato':        'numero di forze di lavoro15 anni e oltre (valori in migliaia)',
    'Misura':           'valori assoluti',               
    'Sesso':            'totale',                           
    'Classe di età':    '15 anni e più',                            
    'Titolo di studio': 'totale', 
    'Cittadinanza':     'totale',                         
    'Tempo e frequenza': 0                    
}

df_forzlv = istat_forzlv.getvalues(spec).dataset(0).to_table(rtype=pd.DataFrame)
# df_forzlv

In [6]:
df_forzlv = df_forzlv.dropna()
df_forzlv = df_forzlv[df_forzlv['Tempo e frequenza'].str.contains(r'^T.*')]
df_forzlv.tail(6)

Unnamed: 0,Tempo e frequenza,Value
187,T2-2014,25419.15
188,T3-2014,25373.7
189,T4-2014,25794.44
190,T1-2015,25460.25
191,T2-2015,25598.29
192,T3-2015,25321.61


In [7]:
istat_inattiv = istat.dataset('LAB', 'DCCV_INATTIV')
HTML(istat_inattiv.info_dimensions_as_html(show_values=3))

nr,name,nr. values,values (first 3 values)
0,Territorio,136,"1:'Italia', 3:'Nord', 4:'Nord-ovest' ..."
1,Tipo dato,2,"3:'numero di forze di lavoro15 anni e oltre (valori in migliaia)', 4:'numero di inattivi (valori in migliaia)'"
2,Misura,1,9:'valori assoluti'
3,Sesso,3,"1:'maschi', 2:'femmine', 3:'totale' ..."
4,Classe di età,12,"1:'0-14 anni', 4:'15-24 anni', 7:'15-34 anni' ..."
5,Titolo di studio,5,"11:'laurea e post-laurea', 12:'totale', 3:'licenza di scuola elementare, nessun titolo di studio' ..."
6,Cittadinanza,3,"1:'italiano-a', 2:'straniero-a', 3:'totale' ..."
7,Condizione professionale,9,"6:'inattivi in età lavorativa', 7:'cercano lavoro non attivamente', 8:'cercano lavoro ma non disponibili a lavorare' ..."
8,Motivo inattività,7,"1:'scoraggiamento', 2:'motivi familiari', 3:'studio, formazione professionale' ..."
9,Condizione dichiarata,8,"1:'occupato', 6:'disoccupato alla ricerca di nuova occupazione', 7:'in cerca di prima occupazione' ..."


In [8]:
spec = { 
    'Territorio': 'Italia',                            
    'Tipo dato':   0, #'numero di inattivi (valori in migliaia)',                           
    'Misura':     'valori assoluti',               
    'Sesso':      'totale',                               
    'Classe di età': '15 anni e più',                            
    'Titolo di studio': 'totale', 
    'Tempo e frequenza': 0                    
}

df_inattiv = istat_inattiv.getvalues(spec).dataset(0).to_table(rtype=pd.DataFrame)
# df_inattiv

In [9]:
df_inattiv = df_inattiv.dropna()
df_inattiv = df_inattiv[df_inattiv['Tempo e frequenza'].str.contains(r'^T.*')]
df_inattiv.tail(6)

Unnamed: 0,Tipo dato,Cittadinanza,Condizione professionale,None,Condizione dichiarata,Tempo e frequenza,Value
37152,numero di inattivi (valori in migliaia),totale,totale,totale,totale,T2-2014,26594.57
37153,numero di inattivi (valori in migliaia),totale,totale,totale,totale,T3-2014,26646.9
37154,numero di inattivi (valori in migliaia),totale,totale,totale,totale,T4-2014,26257.15
37155,numero di inattivi (valori in migliaia),totale,totale,totale,totale,T1-2015,26608.07
37156,numero di inattivi (valori in migliaia),totale,totale,totale,totale,T2-2015,26487.67
37157,numero di inattivi (valori in migliaia),totale,totale,totale,totale,T3-2015,26746.26


In [10]:
istat_inattiv = istat.dataset('LAB', 'DCCV_DISOCCUPT')
HTML(istat_inattiv.info_dimensions_as_html(show_values=3))

nr,name,nr. values,values (first 3 values)
0,Territorio,136,"1:'Italia', 3:'Nord', 4:'Nord-ovest' ..."
1,Tipo dato,1,2:'numero di persone in cerca di occupazione 15 anni e oltre (valori in migliaia)'
2,Misura,1,9:'valori assoluti'
3,Sesso,3,"1:'maschi', 2:'femmine', 3:'totale' ..."
4,Classe di età,11,"17:'45-54 anni', 4:'15-24 anni', 21:'55-64 anni' ..."
5,Titolo di studio,5,"11:'laurea e post-laurea', 12:'totale', 3:'licenza di scuola elementare, nessun titolo di studio' ..."
6,Cittadinanza,3,"1:'italiano-a', 2:'straniero-a', 3:'totale' ..."
7,Condizione professionale,4,"3:'disoccupati ex-occupati', 4:'disoccupati ex-inattivi', 5:'disoccupati senza esperienza di lavoro' ..."
8,Durata disoccupazione,2,"2:'12 mesi o più', 3:'totale'"
9,Tempo e frequenza,193,"1536:'T4-1980', 2049:'T4-2007', 1540:'1981' ..."


$$Forzalav = Occupati + Disoccupati$$