# Analisi Delitti ISTAT 2014-2023

Dataset: Delitti denunciati dalle forze di polizia all'autoritÃ  giudiziaria

Fonte: dati.istat.it

In [None]:
import pandas as pd
import numpy as np
import plotly.graph_objects as go
import plotly.express as px

## 1. Caricamento dati

In [None]:
# Carica CSV con separatore ; e encoding corretto
df = pd.read_csv(
    '../data/raw/delitti_2014_2023_istat.csv',
    sep=';',
    encoding='utf-8'
)

print(f"Righe: {len(df)}")
print(f"Colonne: {len(df.columns)}")
df.head()

## 2. Esplorazione struttura

In [None]:
# Visualizza colonne
print("Colonne disponibili:")
print(df.columns.tolist())

In [None]:
# Info dataset
df.info()

In [None]:
# Valori univoci per campo territorio
print("Territori unici:")
print(df['Territorio'].unique()[:20])  # primi 20

In [None]:
# Valori univoci per tipo delitto
print(f"Tipologie delitto: {df['Tipo di delitto'].nunique()}")
print("\nPrimi 10:")
print(df['Tipo di delitto'].unique()[:10])

## 3. Filtro dati nazionali

In [None]:
# Filtra solo Italia nazionale
df_italia = df[df['Territorio'] == 'Italia'].copy()

print(f"Righe Italia: {len(df_italia)}")
df_italia.head()

## 4. Totale delitti per anno

In [None]:
# Cerca tipo delitto "Totale" (potrebbe avere nome diverso)
print("Cerca 'Totale' nei tipi delitto:")
totali = df_italia['Tipo di delitto'].str.contains('Totale', case=False, na=False)
print(df_italia[totali]['Tipo di delitto'].unique())

In [None]:
# Estrai totale delitti per anno
# NOTA: Adatta 'Totale' al nome esatto trovato sopra
df_totale = df_italia[df_italia['Tipo di delitto'] == 'Totale'].copy()

# Se TIME_PERIOD esiste come colonna
if 'TIME_PERIOD' in df_totale.columns:
    df_totale = df_totale[['TIME_PERIOD', 'OBS_VALUE']].copy()
    df_totale.columns = ['Anno', 'Delitti']
else:
    # Cerca colonna anno alternativa
    print("Colonne disponibili:")
    print(df_totale.columns.tolist())

df_totale['Anno'] = df_totale['Anno'].astype(int)
df_totale['Delitti'] = pd.to_numeric(df_totale['Delitti'], errors='coerce')

# Ordina per anno
df_totale = df_totale.sort_values('Anno').reset_index(drop=True)

print("Totale delitti per anno:")
print(df_totale)

## 5. Gestione valori mancanti

In [None]:
# Verifica missing values
print("Valori mancanti:")
print(df_totale.isnull().sum())

# Rimuovi righe con valori mancanti
df_totale = df_totale.dropna()
print(f"\nRighe dopo pulizia: {len(df_totale)}")

## 6. Grafico Plotly - Trend nazionale

In [None]:
# Crea grafico line chart
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_totale['Anno'],
    y=df_totale['Delitti'],
    mode='lines+markers',
    name='Delitti denunciati',
    line=dict(color='#2E86AB', width=3),
    marker=dict(size=10)
))

# Layout
fig.update_layout(
    title='Trend Delitti Denunciati in Italia (2014-2023)',
    xaxis_title='Anno',
    yaxis_title='Numero Delitti Denunciati',
    hovermode='x unified',
    template='plotly_white',
    height=600,
    font=dict(size=12)
)

# Aggiungi formattazione asse y (numeri con separatore migliaia)
fig.update_yaxes(tickformat=',')

fig.show()

## 7. Salvataggio dati puliti

In [None]:
# Salva dataset pulito
df_totale.to_csv('../data/processed/delitti_totale_italia_2014_2023.csv', index=False)
print("Dataset pulito salvato in data/processed/")

## 8. Statistiche descrittive

In [None]:
# Statistiche base
print("Statistiche descrittive:")
print(df_totale['Delitti'].describe())

# Variazione percentuale 2014-2023
if len(df_totale) >= 2:
    primo_anno = df_totale.iloc[0]['Delitti']
    ultimo_anno = df_totale.iloc[-1]['Delitti']
    variazione = ((ultimo_anno - primo_anno) / primo_anno) * 100
    print(f"\nVariazione 2014-2023: {variazione:.2f}%")