In [1]:
# Importazione delle librerie essenziali
import pandas as pd  # Gestione dei dati con DataFrame
import numpy as np

# Librerie per la visualizzazione dei dati
import plotly.graph_objects as go  # Visualizzazioni interattive avanzate
import plotly.subplots as sp  # Creazione di subplots interattivi
import seaborn as sns  # Grafici statistici
import matplotlib.pyplot as plt  # Grafici statici

# Librerie aggiuntive per l'analisi e la formattazione dei dati
import numpy as np  # Operazioni numeriche
import scipy.interpolate as spi  # Interpolazione e smoothing delle curve
import matplotlib.ticker as mtick  # Formattazione degli assi


# Importazione delle librerie necessarie
import plotly.graph_objects as go
from plotly.subplots import make_subplots

# Configurazione per visualizzare tutte le colonne nei DataFrame
pd.set_option('display.max_columns', None)

In [2]:
# List of CSV filenames
lista_nomi = ["inf_comunali.csv", "inf_cronologia_edifici.csv", "inf_età.csv", "inf_famiglie.csv",  
              "inf_interni.csv", "inf_numero_di_piani.csv", "inf_parrocchie.csv", "inf_provinciali.csv",  
              "inf_redditi_01.csv", "inf_redditi_02.csv", "inf_redditi_03.csv", "inf_regioni.csv",  
              "inf_scolarizzazione.csv", "inf_scuole.csv", "inf_settori.csv", "inf_stranieri.csv",  
              "informazioni_geografiche.csv", "Errori.csv"]

# Dictionary to hold DataFrames
dfs = {}

# Loop to load each CSV file
for df_name in lista_nomi:
    try:
        # Load the CSV into a DataFrame and clean the name for the dictionary key
        df_key = str(df_name).replace("inf_", "").replace(".csv", "")
        dfs[df_key] = pd.read_csv(f'data cleaning/{df_name}')
    except FileNotFoundError:
        print(f"File {df_name} not found. Skipping.")
    except pd.errors.EmptyDataError:
        print(f"File {df_name} is empty. Skipping.")
    except Exception as e:
        print(f"Error processing {df_name}: {e}")

# Check the dictionary
print(dfs.keys())

File informazioni_geografiche.csv not found. Skipping.
File Errori.csv not found. Skipping.
dict_keys(['comunali', 'cronologia_edifici', 'età', 'famiglie', 'interni', 'numero_di_piani', 'parrocchie', 'provinciali', 'redditi_01', 'redditi_02', 'redditi_03', 'regioni', 'scolarizzazione', 'scuole', 'settori', 'stranieri'])


In [3]:
def grafico_barre(df_plot, colonna_x, colonna_y, titolo, figsize=(12, 7), mostra_media=False, descrizione=None, orientazione='vertical'):
    # Stile di seaborn
    sns.set_style("whitegrid")
    
    # Crea la figura con la dimensione specificata
    plt.figure(figsize=figsize)
    
    # Imposta l'orientazione del grafico
    if orientazione == 'vertical':
        ax = sns.barplot(x=colonna_x, y=colonna_y, data=df_plot, color='#3498db', edgecolor='black')
        plt.xticks(rotation=45, ha='right', fontsize=12)
        for index, value in enumerate(df_plot[colonna_y]):
            ax.text(index, value + 0.5, str(value), ha='center', fontsize=12, fontweight='bold')
        plt.xlabel(colonna_x, fontsize=14)
        plt.ylabel(f'{colonna_y} Media', fontsize=14)
    else:
        ax = sns.barplot(y=colonna_x, x=colonna_y, data=df_plot, color='#3498db', edgecolor='black')
        plt.yticks(fontsize=12)
        for index, value in enumerate(df_plot[colonna_y]):
            ax.text(value + 0.5, index, str(value), va='center', fontsize=12, fontweight='bold')
        plt.ylabel(colonna_x, fontsize=14)
        plt.xlabel(f'{colonna_y} Media', fontsize=14)
    
    # Aggiunge una linea tratteggiata per la media se richiesto
    if mostra_media:
        media_valore = df_plot[colonna_y].mean()
        if orientazione == 'vertical':
            plt.axhline(media_valore, color='red', linestyle='dashed', linewidth=2, label=f'Media: {media_valore:.2f}')
        else:
            plt.axvline(media_valore, color='red', linestyle='dashed', linewidth=2, label=f'Media: {media_valore:.2f}')
        plt.legend(fontsize=12)
    
    # Migliora il design
    plt.title(titolo, fontsize=16, fontweight='bold')
    plt.grid(axis='y' if orientazione == 'vertical' else 'x', linestyle='--', alpha=0.7)
    
    # Aggiunge la descrizione sotto il grafico se presente
    if descrizione:
        plt.figtext(0.5, -0.1, descrizione, wrap=True, horizontalalignment='center', fontsize=10, color='dimgray')
    
    # Mostra il grafico
    plt.show()