In [70]:
import dash

import pandas as pd
import plotly.express as px

data = pd.read_csv("../data/ISTAT_Italian_Excursion_2014_2022.csv")
# Convertire dati numerici in valori corretti 

dizionario_nomi = {
    'mese'    : 'Mese',
    'annrif'  : 'Anno',
    'progind' : 'Indice progressivo', # indice dell'intervista individuale
    'sesso'   : 'Sesso',
    'eta10'   : 'Età (0-10)', # TODO: convertre le categorie di età in range corretti
    'staciv4' : 'Stato civile',
    'reg'     : 'Regione',
    'rip'     : 'Zona d\'Italia',
    'istr4'   : 'Livello di istruzione',
    'condogg' : 'Stato di impiego',
    'posiz4'  : 'Grado di impiego',
    'ateco3'  : 'Settore di lavoro',
    'cond4'   : 'Impiego',
    'ORARIO'  : 'Tipo di impiego',
    'RAPP'    : 'Rapporto di lavoro',
    'CODPROF7': 'Categoria Professionale',
    'progesc' : 'Indice dell escursione',
    'DEST_EIE': 'Destinazione (italia o estero)',
    'DEST_ERE': 'Destinazione (regioni italiani o paesi esteri)',
    'DEST_EPR': 'Destinazione (città)',
    'MOTESC'  : 'Motivo dell escursione',
    'PARTESC' : 'Partecipanti fuori dalla famiglia',
    'NPARTESC': 'Partecipanti escursione',
    'EMEZZO'  : 'Mezzo',
    'TRIM'    : 'Stagione'
}

eta_mapping = {
    1: ' <=14',
    2: '15-24',
    3: '25-34',
    4: '35-44',
    5: '45-54',
    6: '55-64',
    7: '65-74',
    8: '>=75'
}

stato_civile_mapping = {
    '1': 'Celibe/nubile',
    '2': 'Coniugato',
    '3': 'Separato/Divorziato',
    '4': 'Vedovo'
}

regione_mapping = {
    '010': 'Piemonte',
    '020': "Valle d'Aosta/Vallee d'Aoste",
    '030': 'Lombardia',
    '040': 'Trentino A.Adige/Sudtirol',
    '050': 'Veneto',
    '060': 'Friuli-Venezia Giulia',
    '070': 'Liguria',
    '080': 'Emilia-Romagna',
    '090': 'Toscana',
    '100': 'Umbria',
    '110': 'Marche',
    '120': 'Lazio',
    '130': 'Abruzzo',
    '140': 'Molise',
    '150': 'Campania',
    '160': 'Puglia',
    '170': 'Basilicata',
    '180': 'Calabria',
    '190': 'Sicilia',
    '200': 'Sardegna'
}

zona_mapping = {
    1: 'Nord',
    2: 'Nord',
    3: 'Centro',
    4: 'Sud',
    5: 'Sud'
}

livello_di_istruzione_mapping = {
    1: 'Media',
    2: 'Media',
    3: 'Diploma',
    4: 'Laurea '
}

stato_di_impiego_mapping = {
    '0': 'Nessuno (meno di 14 anni)',
    '1': 'Impiegato',
    '2': 'Cercatore di lavoro',
    '3': 'Inattivo'
}

grado_di_impiego_mapping = {
    '0': 'Nessuno (meno di 14 anni)',
    '1': 'Manager, Esecutivo, Supervisore, Dipendente',
    '2': 'Apprendista lavoratore, Lavoratore domestico per conto di un\'azienda',
    '3': 'Imprenditore, Professionista autonomo',
    '4': 'Lavoratore autonomo, Socio cooperativo, Assistente, Freelancer, Fornitore di lavoro occasionale'
}

settore_di_lavoro_mapping = {
    '0': 'Nessuno (meno di 14 anni)',
    '1': 'Settore Primario',
    '2': 'Settore Secondario',
    '3': 'Settore Terziario'
}

impiego_mapping = {
    '0': 'Nessuno (meno di 14 anni)',
    '1': 'Impiegato',
    '2': 'Cercatore di Lavoro',
    '3': 'Casalinga/Studente/Altra Condizione',
    '4': 'Pensionato'
}

tipo_di_impiego_mapping = {
    '0': 'Nessuno (meno di 14 anni)',
    '1': 'Tempo Pieno',
    '2': 'Tempo Parziale'
}

RAPP_mapping = {
    '0': 'Nessuno (meno di 14 anni)',
    '1': 'A Termine',
    '2': 'A Tempo Indeterminato'
}

destinazione_italia_estero_mapping = {
    1: 'Italia',
    2: 'Estero'
}

destinazione_regioni_stato_mapping = {
    '001': 'Piemonte',
    '002': 'Valle d\'Aosta',
    '003': 'Lombardia',
    '004': 'Trentino-Alto Adige/Sudtirol',
    '005': 'Veneto',
    '006': 'Friuli-Venezia Giulia',
    '007': 'Liguria',
    '008': 'Emilia-Romagna',
    '009': 'Toscana',
    '010': 'Umbria',
    '011': 'Marche',
    '012': 'Lazio',
    '013': 'Abruzzo',
    '014': 'Molise',
    '015': 'Campania',
    '016': 'Puglia',
    '017': 'Basilicata',
    '018': 'Calabria',
    '019': 'Sicilia',
    '020': 'Sardegna',
    '121': 'Austria',
    '122': 'Belgio',
    '123': 'Danimarca',
    '124': 'Finlandia',
    '125': 'Francia',
    '126': 'Germania',
    '127': 'Grecia',
    '128': 'Irlanda',
    '130': 'Lussemburgo',
    '132': 'Paesi Bassi',
    '133': 'Polonia',
    '134': 'Portogallo',
    '135': 'Regno Unito',
    '136': 'Repubblica Ceca',
    '137': 'Slovacchia',
    '138': 'Spagna',
    '139': 'Svezia',
    '142': 'Ungheria',
    '159': 'Bulgaria',
    '161': 'Cipro',
    '163': 'Estonia',
    '164': 'Lettonia',
    '165': 'Lituania',
    '166': 'Malta',
    '167': 'Romania',
    '169': 'Slovenia',
    '172': 'Croazia',
    '200': 'Paesi Extra-UE (escluso Regno Unito)',
    '235': 'Regno Unito (Non-UE dal 2020)',
    '300': 'Nord America',
    '400': 'America Centrale e Meridionale',
    '500': 'Africa',
    '600': 'Asia-Oceania'
}

destinazione_citta_mapping = {
    '001': 'Torino',
    '002': 'Vercelli',
    '003': 'Novara',
    '004': 'Cuneo',
    '005': 'Asti',
    '006': 'Alessandria',
    '007': 'Valle d\'Aosta/Vallee d\'Aoste',
    '008': 'Imperia',
    '009': 'Savona',
    '010': 'Genova',
    '011': 'La Spezia',
    '012': 'Varese',
    '013': 'Como',
    '014': 'Sondrio',
    '015': 'Milano',
    '016': 'Bergamo',
    '017': 'Brescia',
    '018': 'Pavia',
    '019': 'Cremona',
    '020': 'Mantova',
    '021': 'Bolzano/Bozen',
    '022': 'Trento',
    '023': 'Verona',
    '024': 'Vicenza',
    '025': 'Belluno',
    '026': 'Treviso',
    '027': 'Venezia',
    '028': 'Padova',
    '029': 'Rovigo',
    '030': 'Udine',
    '031': 'Gorizia',
    '032': 'Trieste',
    '033': 'Piacenza',
    '034': 'Parma',
    '035': 'Reggio nell\'Emilia',
    '036': 'Modena',
    '037': 'Bologna',
    '038': 'Ferrara',
    '039': 'Ravenna',
    '040': 'Forlì-Cesena',
    '041': 'Pesaro e Urbino',
    '042': 'Ancona',
    '043': 'Macerata',
    '044': 'Ascoli Piceno',
    '045': 'Massa-Carrara',
    '046': 'Lucca',
    '047': 'Pistoia',
    '048': 'Firenze',
    '049': 'Livorno',
    '050': 'Pisa',
    '051': 'Arezzo',
    '052': 'Siena',
    '053': 'Grosseto',
    '054': 'Perugia',
    '055': 'Terni',
    '056': 'Viterbo',
    '057': 'Rieti',
    '058': 'Roma',
    '059': 'Latina',
    '060': 'Frosinone',
    '061': 'Caserta',
    '062': 'Benevento',
    '063': 'Napoli',
    '064': 'Avellino',
    '065': 'Salerno',
    '066': "L'Aquila",
    '067': 'Teramo',
    '068': 'Pescara',
    '069': 'Chieti',
    '070': 'Campobasso',
    '071': 'Foggia',
    '072': 'Bari',
    '073': 'Taranto',
    '074': 'Brindisi',
    '075': 'Lecce',
    '076': 'Potenza',
    '077': 'Matera',
    '078': 'Cosenza',
    '079': 'Catanzaro',
    '080': 'Reggio di Calabria',
    '081': 'Trapani',
    '082': 'Palermo',
    '083': 'Messina',
    '084': 'Agrigento',
    '085': 'Caltanissetta',
    '086': 'Enna',
    '087': 'Catania',
    '088': 'Ragusa',
    '089': 'Siracusa',
    '090': 'Sassari',
    '091': 'Nuoro',
    '092': 'Cagliari',
    '093': 'Pordenone',
    '094': 'Isernia',
    '095': 'Oristano',
    '096': 'Biella',
    '097': 'Lecco',
    '098': 'Lodi',
    '099': 'Rimini',
    '100': 'Prato',
    '101': 'Crotone',
    '102': 'Vibo Valentia',
    '103': 'Verbano-Cusio-Ossola',
    '104': 'Olbia-Tempio',
    '105': 'Ogliastra',
    '106': 'Medio Campidano',
    '107': 'Carbonia-Iglesias',
    '108': 'Monza e della Brianza',
    '109': 'Fermo',
    '110': 'Barletta-Andria-Trani',
    '111': 'Sud Sardegna',
    '999': 'Sconosciuto (Unknown)'
}

motivo_escursione_mapping = {
    1: 'Vacanza',
    2: 'Famiglia',
    3: 'Cultura',
    4: 'Cultura',
    5: 'Famiglia',
    6: 'Shopping',
    7: 'Lavoro',
    8: 'Famiglia',
    9: 'Cultura',
    10: 'Vacanza',
    11: 'Altro'
}

mezzo_mapping = {
    1: 'Aereo',
    2: 'Treno',
    3: 'Nave',
    4: 'Auto',
    5: 'Auto',
    6: 'Autobus',
    7: 'Autobus',
    8: 'Auto',
    9: 'Moto',
    10:'Altro',
    11:'Auto'
}

stagione_mapping = {
    '01': 'Gennaio-Marzo',
    '02': 'Aprile-Giugno',
    '03': 'Luglio-Settembre',
    '04': 'Ottobre-Dicembre'
}


data['Età'] = data['eta10'].map(eta_mapping)
data['Zona d Italia'] = data['rip'].map(zona_mapping)
data['Livello di Istruzione'] = data['istr4'].map(livello_di_istruzione_mapping)
data['Mezzo di Trasporto'] = data['EMEZZO'].map(mezzo_mapping)
data['Paese di Destinazione'] = data['DEST_EIE'].map(destinazione_italia_estero_mapping)
data['Motivo del Viaggio'] =data['MOTESC'].map(motivo_escursione_mapping) 


data

Unnamed: 0,ID,mese,annrif,progind,sesso,eta10,staciv4,reg,rip,istr4,...,PARTESC,NPARTESC,EMEZZO,TRIM,Età,Zona d Italia,Livello di Istruzione,Mezzo di Trasporto,Paese di Destinazione,Motivo del Viaggio
0,0,1,2014,16,2,1,1,170,4,1,...,1,4,5,1,<=14,Sud,Media,Auto,Italia,Famiglia
1,1,3,2014,21,1,1,1,180,4,1,...,1,4,5,1,<=14,Sud,Media,Auto,Italia,Cultura
2,2,7,2014,33,1,4,3,150,4,2,...,2,1,3,3,35-44,Sud,Media,Nave,Italia,Vacanza
3,3,7,2014,33,1,4,3,150,4,2,...,2,1,5,3,35-44,Sud,Media,Auto,Italia,Lavoro
4,4,3,2014,39,2,8,4,40,2,1,...,2,1,5,1,>=75,Nord,Media,Auto,Italia,Famiglia
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
37824,37824,1,2022,62880,1,5,2,30,1,2,...,1,4,5,1,45-54,Nord,Media,Auto,Italia,Vacanza
37825,37825,8,2022,62883,2,4,1,120,3,4,...,2,1,5,3,35-44,Centro,Laurea,Auto,Italia,Vacanza
37826,37826,12,2022,62899,1,6,2,40,2,3,...,1,3,5,4,55-64,Nord,Diploma,Auto,Italia,Cultura
37827,37827,12,2022,62899,1,6,2,40,2,3,...,1,3,5,4,55-64,Nord,Diploma,Auto,Italia,Cultura


In [71]:
# LINECHART
# Evoluzione degli spostamenti negli anni (età)

# TODO: Cambiare Nomi delle variabili
conteggio = data.groupby(['annrif', 'Età']).size().reset_index(name='count')

# Colori che vanno dal rosso (<= 14 yo) al verde (>= 75 yo)
colori = ['#FF0000', '#FF4500', '#FF8C00', '#FFD700', '#ADFF2F', '#7FFF00', '#32CD32', '#008000']

fig = px.line(conteggio,x='annrif', y='count' , color="Età",
              title='Evoluzione degli spostamenti negli anni (Età)',
              color_discrete_sequence=colori)
fig.show()


In [72]:
#Creazione Dashboard
fig = px.sunburst(data, path=['Zona d Italia','Livello di Istruzione', 'Paese di Destinazione'], width=800, height=500)

fig.show()
# SUNBURST
#TODO radio button per far scegliere all'utente l'anno


In [73]:
#Creazione Dashboard
new_data = data[data['DEST_EIE' ]== 2]
new_data
fig = px.sunburst(new_data, path=['Motivo del Viaggio','Mezzo di Trasporto'], width=800, height=500)

fig.show()
# SUNBURST
#TODO mostrare che per lavoro si preferisce mezzi pubblici


In [74]:
#Creazione Dashboard
new_data = data[data['DEST_EIE' ]== 1]
new_data
fig = px.sunburst(new_data, path=['Motivo del Viaggio','Mezzo di Trasporto'], width=800, height=500)

fig.show()
# SUNBURST
#TODO mostrare che per lavoro si preferisce mezzi pubblici


In [75]:
import numpy as np
# MAP
## PROVINCE DI DESTINAZIONE PREFERITE (analisi nel tempo)

# Funzione per la generazione dei colori della mappa (presa da internet)
def generateColorScale(colors, naColor):
    colorArray=[]
    colorArray.append([0,naColor])
    for grenze, color in zip(np.linspace(0.01,1,len(colors)), colors):
        colorArray.append([grenze, color])
    return colorArray
 
# Codice che riempe i valori nulli
data['Date'] = pd.to_datetime(data['annrif'].astype(str) + '-' + data['mese'].astype(str), format='%Y-%m')
data['Date'] = data['Date'].dt.strftime('%Y-%m')
date_range = pd.date_range(start='2014-01-01', end='2022-12-01', freq='MS').strftime('%Y-%m')
dest_epr_range = list(range(0, 112))

all_combinations = pd.DataFrame(
    [(date, dest_epr) for date in date_range for dest_epr in dest_epr_range],
    columns=['Date', 'DEST_EPR']
)

null_dataframe = pd.DataFrame(all_combinations)
null_dataframe['count'] = 0

# Creazione di una nuova tabella per visualizzare sulla mappa le province di destinazione più ambite rispetto all'andamento del tempo
# (Date, Destinazioni, NumeroEscursioni)
conteggio_destinazioni = data.groupby(['Date', 'DEST_EPR']).size().reset_index(name='count')

conteggio_destinazioni = pd.concat([null_dataframe, conteggio_destinazioni])

fig = px.choropleth(
  conteggio_destinazioni,
  geojson='https://raw.githubusercontent.com/openpolis/geojson-italy/master/geojson/limits_IT_provinces.geojson',
  locations='DEST_EPR',
  color='count',
  #color_continuous_scale='Reds',
  color_continuous_scale= generateColorScale(colors=["peachpuff","maroon"], naColor="whitesmoke"),
  featureidkey='properties.prov_istat_code_num',
  animation_frame='Date',
  range_color=(0, max(conteggio_destinazioni['count']))
  )

fig.update_layout(margin={"r": 0, "t": 0, "l": 0, "b": 0})
fig.update_geos(fitbounds="locations", visible=False)
fig.show()


In [76]:
## REGIONI DI PARTENZA
conteggio_partenze = data['reg'].value_counts().reset_index()
conteggio_partenze['reg'] = conteggio_partenze['reg']/10

fig = px.choropleth(
  conteggio_partenze,
  geojson='https://raw.githubusercontent.com/openpolis/geojson-italy/master/geojson/limits_IT_regions.geojson',
  locations='reg',
  color='count',
  color_continuous_scale='Blues',
  featureidkey='properties.reg_istat_code_num',
  #animation_frame='Date',
  range_color=(0, max(conteggio_partenze['count']))
  )

fig.update_layout(margin={"r": 0, "t": 0, "l": 0, "b": 0})
fig.update_geos(fitbounds="locations", visible=False)
fig.show()


In [77]:
# REGIONI DI PARTENZA
import numpy as np

# Funzione per la generazione dei colori della mappa (presa da internet)
def generateColorScale(colors, naColor):
    colorArray=[]
    colorArray.append([0,naColor])
    for grenze, color in zip(np.linspace(0.01,1,len(colors)), colors):
        colorArray.append([grenze, color])
    return colorArray



data = pd.read_csv("../data/ISTAT_Italian_Excursion_2014_2022.csv")
data['reg']= (data['reg']/10).astype(int)
# Codice che riempe i valori nulli
data['Date'] = pd.to_datetime(data['annrif'].astype(str) + '-' + data['mese'].astype(str), format='%Y-%m')
data['Date'] = data['Date'].dt.strftime('%Y-%m')
date_range = pd.date_range(start='2014-01-01', end='2022-12-01', freq='MS').strftime('%Y-%m')

reg_range = list(range(1, 21))


all_combinations = pd.DataFrame(
    [(date, reg) for date in date_range for reg in reg_range],
    columns=['Date', 'reg']
)


#Creazione di una nuova tabella per visualizzare sulla mappa le province di destinazione più ambite rispetto all'andamento del tempo
#(Date, Destinazioni, NumeroEscursioni)
conteggio_partenze = data.groupby(['Date','reg']).size().reset_index(name='count')

#null_dataframe = pd.DataFrame(all_combinations)
#null_dataframe['count'] = 0
#conteggio_partenze = pd.concat([null_dataframe, conteggio_partenze])

conteggio_partenze = pd.merge(all_combinations, conteggio_partenze, on=['Date', 'reg'], how='left')
conteggio_partenze['count'] = conteggio_partenze['count'].fillna(0).astype(int)


fig = px.choropleth(
  conteggio_partenze,
  geojson='https://raw.githubusercontent.com/openpolis/geojson-italy/master/geojson/limits_IT_regions.geojson',
  locations='reg',
  color='count',
  #color_continuous_scale='Reds',
  color_continuous_scale= generateColorScale(colors=["peachpuff","maroon"], naColor="whitesmoke"),
  featureidkey='properties.reg_istat_code_num',
  animation_frame='Date',
  range_color=(0, max(conteggio_partenze['count']))
  )

fig.update_layout(margin={"r": 0, "t": 0, "l": 0, "b": 0})
fig.update_geos(fitbounds="locations", visible=False)
fig.show()