# Dashboard

---

*Antonio Emanuele Cinà, Assistant Professor @ University of Genoa*

**Analisi e Rappresentazione dei Dati** --
17 Maggio 2024

## Lezione 12: Dashboard 4 - Esercitazione 2


Materiale: https://tinyurl.com/ARD24-L12

In [1]:
import pandas as pd
!pip install -q dash dash-bootstrap-components

import plotly.express as px

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.5/7.5 MB[0m [31m18.5 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m222.5/222.5 kB[0m [31m12.8 MB/s[0m eta [36m0:00:00[0m
[?25h

# Boston Housing

Il Dataset delle *BostonHousing* è derivato dalle informazioni raccolte dal Servizio Censimento degli Stati Uniti riguardanti le abitazioni nell'area di Boston, MA. Di seguito viene descritto il contenuto delle colonne del dataset:

- **CRIM**: tasso di criminalità pro capite per città
- **ZN**: proporzione di terreno residenziale suddiviso in lotti superiori a 25.000 piedi quadrati
- **INDUS**: proporzione di acri destinati ad attività non commerciali per città
- **CHAS**: variabile dummy del fiume Charles (1 se il tratto confina con il fiume; 0 altrimenti)
- **NOX**: concentrazione di ossidi di azoto (parti per 10 milioni)
- **RM**: numero medio di stanze per abitazione
- **AGE**: proporzione di unità occupate dai proprietari costruite prima del 1940
- **DIS**: distanze ponderate dai cinque principali centri di lavoro di Boston
- **RAD**: indice di accessibilità alle autostrade radiali
- **TAX**: tasso di imposta sulla proprietà a valore pieno per $10.000
- **PTRATIO**: rapporto alunni-insegnanti per città
- **B**: 1000(Bk - 0.63)^2 dove Bk è la proporzione di neri per città
- **LSTAT**: % di popolazione di stato socioeconomico inferiore
- **MEDV**: Valore mediano delle case occupate dai proprietari in migliaia di dollari


In [2]:
boston_data = pd.read_csv("https://github.com/Cinofix/analisi-e-rappresentazione-dati/raw/main/data/BostonHousing.csv")
boston_data.head(5)

Unnamed: 0,crim,zn,indus,chas,nox,rm,age,dis,rad,tax,ptratio,b,lstat,medv
0,0.00632,18.0,2.31,0,0.538,6.575,65.2,4.09,1,296,15.3,396.9,4.98,24.0
1,0.02731,0.0,7.07,0,0.469,6.421,78.9,4.9671,2,242,17.8,396.9,9.14,21.6
2,0.02729,0.0,7.07,0,0.469,7.185,61.1,4.9671,2,242,17.8,392.83,4.03,34.7
3,0.03237,0.0,2.18,0,0.458,6.998,45.8,6.0622,3,222,18.7,394.63,2.94,33.4
4,0.06905,0.0,2.18,0,0.458,7.147,54.2,6.0622,3,222,18.7,396.9,5.33,36.2


In [3]:
boston_data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 506 entries, 0 to 505
Data columns (total 14 columns):
 #   Column   Non-Null Count  Dtype  
---  ------   --------------  -----  
 0   crim     506 non-null    float64
 1   zn       506 non-null    float64
 2   indus    506 non-null    float64
 3   chas     506 non-null    int64  
 4   nox      506 non-null    float64
 5   rm       506 non-null    float64
 6   age      506 non-null    float64
 7   dis      506 non-null    float64
 8   rad      506 non-null    int64  
 9   tax      506 non-null    int64  
 10  ptratio  506 non-null    float64
 11  b        506 non-null    float64
 12  lstat    506 non-null    float64
 13  medv     506 non-null    float64
dtypes: float64(11), int64(3)
memory usage: 55.5 KB


In [4]:
dizionario_nomi = {
    'crim': 'tasso_criminalità',
    'zn': 'proporzione_terreno_residenziale',
    'indus': 'proporzione_acri_non_commerciali',
    'chas': 'confine_fiume_charles',
    'nox': 'concentrazione_ossidi_azoto',
    'rm': 'numero_medio_stanze',
    'age': 'proporzione_unità_occupate_costruite_prima_1940',
    'dis': 'distanza_centri_lavoro',
    'rad': 'indice_accessibilità_autostrade',
    'tax': 'tasso_imposta_proprietà',
    'ptratio': 'rapporto_alunni_insegnanti',
    'b': 'proporzione_b',
    'lstat': 'percentuale_stato_socioeconomico_inferiore',
    'medv': 'valore_medio_case'
}

## Descrizione dashboard

**Creazione dei componenti di input**
- Creare Dropdown per la selezione delle caratteristiche dell'asse X e dell'asse Y nei grafici a dispersione.
- Creare Dropdown per la selezione della caratteristica per l'istogramma.
- Creare Dropdown per la selezione della caratteristica per il violin plot.
- Creare Checklist per la selezione delle variabili per la heatmap di correlazione.

**Creazione dei grafici**
- Creare il grafico a dispersione con due Dropdown per la selezione delle caratteristiche sull'asse X e sull'asse Y.
- Creare l'istogramma con una Dropdown per la selezione della caratteristica.
- Creare il violin plot con una Dropdown per la selezione della caratteristica.
- Creare la heatmap di correlazione con una Checklist per la selezione delle variabili.


**Creazione callback**
- Callback per il grafico a dispersione. Aggiornare il grafico a dispersione quando vengono selezionate nuove caratteristiche sull'asse X e sull'asse Y.

- Callback per l'istogramma. Aggiornare l'istogramma quando viene selezionata una nuova caratteristica.

- Callback per il violin plot. Aggiornare il violin plot quando viene selezionata una nuova caratteristica.

- Callback per la heatmap di correlazione. Aggiornare la heatmap di correlazione quando vengono selezionate nuove variabili dalla Checklist.

In [5]:
import dash
from dash import dcc, html
from dash.dependencies import Input, Output
import pandas as pd
import plotly.express as px
import dash_bootstrap_components as dbc

# Inizializzazione dell'app Dash con il tema Material
app = dash.Dash(__name__, external_stylesheets=[dbc.themes.MATERIA])

# Inizializzazione dei componenti di input
xaxis_feature_dropdown = dcc.Dropdown(
    id='xaxis-feature',
    options=[{'label': dizionario_nomi[col], 'value': col} for col in boston_data.columns],
    value='rm'  # Valore predefinito
)

yaxis_feature_dropdown = dcc.Dropdown(
    id='yaxis-feature',
    options=[{'label': dizionario_nomi[col], 'value': col} for col in boston_data.columns],
    value='medv'  # Valore predefinito
)

hist_feature_dropdown = dcc.Dropdown(
    id='hist-feature',
    options=[{'label': dizionario_nomi[col], 'value': col} for col in boston_data.columns],
    value='medv'  # Valore predefinito
)

violin_feature_dropdown = dcc.Dropdown(
    id='violin-feature',
    options=[{'label': dizionario_nomi[col], 'value': col} for col in boston_data.columns],
    value='medv'  # Valore predefinito
)

variabili_checklist = dbc.Checklist(
    id='correlation-checklist',
    options=[{'label': dizionario_nomi[col], 'value': col} for col in boston_data.columns],
    value=['crim', 'medv', 'lstat'],  # Valori predefiniti
    inline=True
)

# Layout dell'app
app.layout = dbc.Container([
    html.H1("Analisi dei Dati delle Abitazioni di Boston"),
    dbc.Row([
        dbc.Col(
            dbc.Stack([
              html.Label("Seleziona la caratteristica dell'asse X:"),
              xaxis_feature_dropdown,
              html.Label("Seleziona la caratteristica dell'asse Y:"),
              yaxis_feature_dropdown,
              ])
            , width=6),
        dbc.Col(
            dbc.Stack([
              html.Label("Seleziona la caratteristica dell'asse Y:"),
              hist_feature_dropdown,
            ])
        , width=6, align="center"),
    ]),
    dbc.Row([
        dbc.Col(
            dbc.Stack([
              dcc.Graph(id='scatter-plot')
              ])
            , width=6),
        dbc.Col(
            dbc.Stack([
              dcc.Graph(id='histogram')
            ])
        , width=6),
    ]),
    dbc.Row([
        dbc.Col([
            dbc.Stack([
                html.Label("Select a feature to visualize with a violin plot:"),
                violin_feature_dropdown,
            ])
        ], width=4, align="center"),
        dbc.Col([
            dbc.Stack([
              html.Label("Seleziona le variabili per la heatmap di correlazione:"),
              variabili_checklist,
            ])
        ], width=8, align="center"),
    ]),
    dbc.Row([
        dbc.Col([
            dbc.Stack([
                dcc.Graph(id='violin-plot')
            ])
        ], width=4),
        dbc.Col([
            dbc.Stack([
              dcc.Graph(id='heatmap')
            ])
        ], width=8),
    ]),
])

# Callback per il grafico a dispersione (scatter plot)
@app.callback(
    Output('scatter-plot', 'figure'),
    [Input('xaxis-feature', 'value'),
     Input('yaxis-feature', 'value')]
)
def update_scatter(xaxis_feature, yaxis_feature):
    fig = px.scatter(boston_data, x=xaxis_feature, y=yaxis_feature, color='medv',
                     title=f'Grafico a dispersione di {dizionario_nomi[yaxis_feature]} vs {dizionario_nomi[xaxis_feature]}',
                     labels={xaxis_feature: xaxis_feature, yaxis_feature: yaxis_feature})
    fig.update_layout(margin=dict(l=50, r=50, t=50, b=50),)
    return fig

# Callback per l'istogramma
@app.callback(
    Output('histogram', 'figure'),
    [Input('hist-feature', 'value')]
)
def update_histogram(selected_feature):
    # Crea un istogramma basato sulla caratteristica selezionata
    fig = px.histogram(boston_data, x=selected_feature,
                       color_discrete_sequence=['#007bff'],  # Imposta il colore su blu
                       opacity=0.7,  # Imposta l'opacità per una migliore visibilità
                       title=f'Istogramma di {selected_feature}',
                       labels={selected_feature: selected_feature})

    # Personalizza il layout
    fig.update_layout(bargap=0.01,  # Imposta lo spazio tra le barre
                      bargroupgap=0.05,  # Imposta lo spazio tra i gruppi di barre
                      xaxis_title=selected_feature,  # Imposta il titolo dell'asse x
                      yaxis_title='Conteggio',  # Imposta il titolo dell'asse y
                      showlegend=False,  # Nasconde la legenda
                      margin=dict(l=0, r=0, t=50, b=30))  # Rimuove i margini

    return fig

# Callback per violin plot
@app.callback(
    Output('violin-plot', 'figure'),
    [Input('violin-feature', 'value')]
)
def update_violin_plot(selected_feature):
    # Crea violin plot sulla feature selezionata
    fig = px.violin(boston_data, y=selected_feature, box=True,
                    title=f'Violin Plot of {selected_feature}',
                    labels={selected_feature: dizionario_nomi[selected_feature]})
    fig.update_layout(margin=dict(l=30, r=30, t=70, b=30))  # Update layout to remove margins
    return fig

# Callback per la heatmap
@app.callback(
    Output('heatmap', 'figure'),
    [Input('correlation-checklist', 'value')]
)
def update_heatmap(selected_features):
    # Seleziona le colonne corrispondenti alle variabili selezionate
    selected_data = boston_data[selected_features]

    # Calcola la correlazione tra le variabili selezionate
    correlation_matrix = selected_data.corr()

    # Crea la heatmap
    fig = px.imshow(correlation_matrix,
                    labels=dict(color="Correlazione"),
                    x=correlation_matrix.index,
                    y=correlation_matrix.columns,
                    color_continuous_scale='RdBu',
                    zmin=-1, zmax=1)

    fig.update_layout(title="Heatmap Correlazione tra Variabili Selezionate",
                      xaxis_showgrid=False,
                      yaxis_showgrid=False)

    fig.update_traces(hoverongaps=False,
                      hovertemplate='Variabile X: %{y}<br>Variabile Y: %{x}<br>Correlazione: %{z:.2f}')

    return fig

# Esecuzione dell'app
if __name__ == '__main__':
    app.run_server(debug=True, jupyter_mode="external")


Dash app running on:


<IPython.core.display.Javascript object>