# Criminalità Italia - Data Analysis

## KPI

1. Numero totale degli omicidi in Italia ultimo anno disponibile
2. Distribuzione omicidi per Regione


Next Step
1. Distribuzione omicidi per Città
2. Distribuzione omicidi totali per Anno
3. Recupero altri indicatori su (Italia, Regione e Città)
    - Es. N° Abitanti 
4. Confronto Top Città Europa (su num abitanti)
5. Confronto Top Città Mondo (su num abitanti)

## Open Data
1. Istat
    - http://dati.istat.it/Index.aspx
   
   
## Librerie
1. Jsonstat
    - http://jsonstatpy.readthedocs.io/en/latest/notebooks/istat_house_price_index.html


In [2]:
# Importo librerie per analisi dati (Pandas) e dati Isata
import os
import pandas as pd
import numpy as np
import istat

In [3]:
# Imposto cache dir per velocizzare analisi in locale
cache_dir = os.path.abspath(os.path.join("..", "tmp", "istat_cached"))
istat.cache_dir(cache_dir)
istat.lang(0)  # lingua italiano
print("cache_dir is '{}'".format(istat.cache_dir()))

cache_dir is '/home/acesarini/opendata/tmp/istat_cached'


In [4]:
# Lista delle aree di analisi disponibili
# istat.areas()

In [5]:
# Seleziono AREA Giustizia e Sicurezza
istat_area_lab = istat.area('JUS')
# istat_area_lab

In [6]:
# DATASET delitti http://dati.istat.it/Index.aspx?DataSetCode=dccv_delittips
istat_dataset_taxdisoccu = istat_area_lab.dataset('DCCV_DELITTIPS')
istat_dataset_taxdisoccu

nr,name,nr. values,values (first 3 values)
0,Territorio,148,"1:'Italia', 3:'Nord', 4:'Nord-ovest' ..."
1,Tipo dato,3,"1:'numero di delitti denunciati dalle forze di polizia all'autorità giudiziaria', 2:'delitti di cui si è scoperto l'autore nel corso dell'anno di riferimento (valori percentuali sul totale dei delitti dell'anno di riferimento)', 3:'delitti denunciati dalle forze di polizia all'autorità giudiziaria (valori per 100.000 abitanti)' ..."
2,Tipo di delitto,56,"1:'strage', 2:'omicidi volontari consumati', 3:'omicidi volontari consumati a scopo di furto o rapina' ..."
3,Identità autore nota,2,"2:'si', 3:'totale'"
4,Periodo del commesso delitto,3,"1:'prima dell'anno di riferimento', 2:'durante l'anno di riferimento', 3:'prima o durante l'anno di riferimento' ..."
5,Anno,9,"2129:'2012', 2034:'2007', 2148:'2013' ..."


In [7]:
# Lista di tutte le Dimensioni
# istat_dataset_taxdisoccu.dimensions()

In [8]:
# es. spec: Numero crimini registrati dalla polizia(Data Type) per Anno 2014 (Year) su tutto il Territorio Italia (Territory), Omicidi Intenzionali (Type of crime)
spec = {
    "Tipo dato":1,                      # 1 -> number of crimes reported by the police forces to the judicial authority
    "Anno":2167,                        # 2167 -> 2014
    #"Territory":,                      # 0 -> ALL
    #"Type of crime":,                  # 0 -> ALL   
    "Identità autore nota":3,           # 3 -> Total
    "Periodo del commesso delitto":2    # 2 -> during the reference year
}

collection = istat_dataset_taxdisoccu.getvalues(spec)

In [9]:
# Lista dei dataset presenti nella collection
# collection

In [10]:
# Leggo il primo e unico dataset
ds = collection.dataset(0)
ds

0,1,2,3,4
pos,id,label,size,role
0,IDITTER107,Territorio,133,
1,IDREATI_PS,Tipo di delitto,56,


In [11]:
# Trasformo il dataset in DataFrame
df = ds.to_data_frame('Territorio')

In [12]:
# Tengo solo Omicidi (verifica se possibile filtrare le dimensioni su jsonstat)
df_fil = df[(df['Tipo di delitto']=='strage') | 
            (df['Tipo di delitto']=='infanticidi') |
            (df['Tipo di delitto']=='omicidi preterintenzionali') |
            (df['Tipo di delitto'].str.contains('omicidi volontari')) |
            (df['Tipo di delitto'].str.contains('omicidi colposi'))
           ]
df_fil = df_fil.drop('Tipo di delitto', 1)

In [13]:
# df_fil.head()

In [14]:
# df_fil.info()

In [15]:
# Reset index per group-by
df_fil.reset_index(level=0, inplace=True)

In [16]:
# Raggruppo i valori per Territorio 
df_fil_agg = df_fil.groupby('Territorio',as_index=False)
df_fil_agg = df_fil_agg.agg({'Value' : np.max})

In [17]:
# writer = pd.ExcelWriter('output.xlsx')
# df_fil_agg.to_excel(writer,'Sheet1')
# writer.save()

### 1. Dataset -  Numero Omicidi Italia 2014

In [18]:
# Directory dove salvare i file, da utilizzare in data_visualization
dir_df = os.path.join(os.path.abspath(''),'df')

In [20]:
df_ita=df_fil_agg[(df_fil_agg['Territorio']=='Italia')]
# df_ita

Unnamed: 0,Territorio,Value
49,Italia,1633.0


In [21]:
df_ita_filename = r'df_ita.pkl'
df_ita_fullpath = os.path.join(dir_df, df_ita_filename)
df_ita.to_pickle(df_ita_fullpath)

### 2. Dataset - Numero Omicidi Regioni 2014

In [28]:
df_reg=df_fil_agg[(df_fil_agg['Territorio']=='Abruzzo') |
                  (df_fil_agg['Territorio']=='Basilicata') |
                  (df_fil_agg['Territorio']=='Calabria') |
                  (df_fil_agg['Territorio']=='Campania') |
                  (df_fil_agg['Territorio']=='Emilia-Romagna') |
                  (df_fil_agg['Territorio']=='Friuli-Venezia Giulia') |
                  (df_fil_agg['Territorio']=='Lazio') |
                  (df_fil_agg['Territorio']=='Liguria') |
                  (df_fil_agg['Territorio']=='Lombardia') |
                  (df_fil_agg['Territorio']=='Marche') |
                  (df_fil_agg['Territorio']=='Molise') |
                  (df_fil_agg['Territorio']=='Piemonte') |
                  (df_fil_agg['Territorio']=='Puglia') |
                  (df_fil_agg['Territorio']=='Sardegna') |
                  (df_fil_agg['Territorio']=='Sicilia') |
                  (df_fil_agg['Territorio']=='Toscana') |
                  (df_fil_agg['Territorio']=='Umbria') |
                  (df_fil_agg['Territorio']=='Veneto') |
                  (df_fil_agg['Territorio'].str.contains('Trentino Alto Adige')) |
                  (df_fil_agg['Territorio'].str.contains('''Valle d'Aosta'''))
                 ]
# df_reg.sum()

Territorio    AbruzzoBasilicataCalabriaCampaniaEmilia-Romagn...
Value                                                      1633
dtype: object

In [29]:
df_reg_filename = r'df_reg.pkl'
df_reg_fullpath = os.path.join(dir_df, df_reg_filename)
df_reg.to_pickle(df_reg_fullpath)

### 3. Dataset - Numero Omicidi Città 2014

### 4. Dataset - Serie storica omicidi Italia 2012-2014