# Esplorazione classi e sezioni
## Anno scolastico 2024-2025

In [29]:
# variabili ad hoc da gestire a mano
anno_scolastico = "2024-2025"
prime_f1 = "1C, 1J, 1M, 1P, 1R, 1T, 1U (mista)"
seconde_f1 = "2C, 2E, 2G, 2M"

In [30]:
import os
import pandas as pd
from datetime import datetime

# Percorso del file XLSX
file_path = 'estrazione.xlsx'

# Ottieni la data di creazione del file
creation_time = os.path.getctime(file_path)

# Converte la data di creazione in una stringa formattata
data_file = datetime.fromtimestamp(creation_time).strftime('%Y-%m-%d %H:%M:%S')

print(f'Data di creazione del file estrazione.xlsx: {data_file}')

Data di creazione del file estrazione.xlsx: 2024-08-07 12:54:25


In questo jupyter notebook sono presenti delle query e delle rappresentazioni grafiche che permettono di avere una visione generale delle classi e delle sezioni

In [31]:
# test importazione
## librerie necessarie
## attezione, si necessita dei seguenti pacchetti da installare: pip install pandas openpyxl xlrd

import pandas as pd

## importazione del file excel
df = pd.read_excel('estrazione.xlsx')
print(df.columns)
prova = df.head()
html_prova = prova.to_html()


Index(['Nome', 'Cognome', 'Sesso', 'Nazionalità', 'Domicilio',
       'Scuola Media di provenienza', 'Classe (anno)', 'Sezione',
       'Scuola frequentata precedentemente', 'Sezione anno precedente',
       'Classe anno precedente', 'Statuto'],
      dtype='object')


## Numero di sezioni

In [32]:
import pandas as pd

## importazione del file excel
df = pd.read_excel('estrazione.xlsx')

# Trova tutte le sezioni uniche
sezioni_uniche = df['Sezione'].unique()

# Conta il numero di sezioni uniche
numero_sezioni = len(sezioni_uniche)

# Rimuovi i valori nulli dalla colonna "Sezione"
df_cleaned = df.dropna(subset=['Sezione'])

# Trova tutte le sezioni uniche
sezioni_uniche = df_cleaned['Sezione'].unique()

# Conta il numero di sezioni uniche
numero_sezioni = len(sezioni_uniche)

print(f"Il numero totale di sezioni presenti nel dataframe è: {numero_sezioni}")



Il numero totale di sezioni presenti nel dataframe è: 52


In [33]:
import pandas as pd
import plotly.express as px

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Rimuovi i valori nulli dalla colonna "Sezione" e "Classe (anno)"
df_cleaned = df.dropna(subset=['Sezione', 'Classe (anno)'])

# Raggruppa per "Classe (anno)" e conta le sezioni uniche
sezioni_per_anno = df_cleaned.groupby('Classe (anno)')['Sezione'].nunique().reset_index()
sezioni_per_anno.columns = ['Anno', 'Numero di Sezioni']

# Definisci l'ordine desiderato delle categorie
ordine_anni = ['primo anno', 'secondo anno', 'terzo anno', 'quarto anno']

# Converte la colonna 'Anno' in una categoria ordinata
sezioni_per_anno['Anno'] = pd.Categorical(sezioni_per_anno['Anno'], categories=ordine_anni, ordered=True)

# Ordina il dataframe in base alla colonna 'Anno'
sezioni_per_anno = sezioni_per_anno.sort_values('Anno')

# Creare il grafico a istogrammi utilizzando Plotly
fig00 = px.bar(
    sezioni_per_anno,
    x='Anno',
    y='Numero di Sezioni',
    text='Numero di Sezioni',
)

# Aggiornare il testo delle barre per includere il valore
fig00.update_traces(
    texttemplate='%{text}',
    textposition='outside',
)

# Modificare le impostazioni dell'asse delle y per evitare il taglio del testo
fig00.update_layout(
    yaxis=dict(
        title='Numero di Sezioni',
        title_standoff=25  # Spazio tra l'asse y e il titolo
    ),
    margin=dict(t=60, b=40, l=40, r=40),  # Aggiungere margini per evitare che il testo venga tagliato
    template='plotly_white',  # Applicare il tema plotly_white
    title={
        'text': f'Numero di sezioni per anno<br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Configurazione per rimuovere il logo di Plotly
config = {
    'displaylogo': False
}

# Variabile per esportare grafico
grafico00 = fig00.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig00.show(config=config)



## Numero studenti per anno

In [34]:
# libreria
import pandas as pd

# importazione del file excel
df = pd.read_excel('estrazione.xlsx')

# NUMERO STUDENTI PRIMO ANNO
## filtro studenti primo anno
primo_anno = df[df['Classe (anno)']=="primo anno"]
## numero studenti primo anno
n_primo_anno = primo_anno['Classe (anno)'].count()
print("Numero studenti primo anno:", n_primo_anno)

# NUMERO STUDENTI SECONDO ANNO
## filtro studenti secondo anno
secondo_anno = df[df['Classe (anno)']=="secondo anno"]
## numero studenti secondo anno
n_secondo_anno = secondo_anno['Classe (anno)'].count()
print("Numero studenti secondo anno:", n_secondo_anno)

# NUMERO STUDENTI TERZO ANNO
## filtro studenti terzo anno
terzo_anno = df[df['Classe (anno)']=="terzo anno"]
## conta studenti terzo anno
n_terzo_anno = terzo_anno['Classe (anno)'].count()
print("Numero studenti terzo anno:", n_terzo_anno)

# NUMERO STUDENTI QUARTO ANNO 
## filtro studenti quarto anno 
quarto_anno = df[df['Classe (anno)']=="quarto anno"]
## conta studenti quarto anno
n_quarto_anno = quarto_anno['Classe (anno)'].count()
# conta studenti quarto anno
print("Numero studenti quarto anno:", n_quarto_anno)

# NUMERO STUDENTI TOTALE
n_studenti_tot = n_primo_anno + n_secondo_anno + n_terzo_anno + n_quarto_anno
print("Numero studenti totale:", n_studenti_tot)

Numero studenti primo anno: 388
Numero studenti secondo anno: 298
Numero studenti terzo anno: 230
Numero studenti quarto anno: 196
Numero studenti totale: 1112


In [35]:
# librerie
import pandas as pd
import plotly.express as px

# importazione del file excel
df = pd.read_excel('estrazione.xlsx')



In [36]:
### Grafico studenti per anno

In [37]:
import pandas as pd 
import plotly.express as px

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Contare il numero di studenti per ogni anno
studenti_per_anno = df['Classe (anno)'].value_counts().reset_index()
studenti_per_anno.columns = ['Anno', 'Numero di Studenti']

# Calcolare il numero totale di studenti
totale_studenti = studenti_per_anno['Numero di Studenti'].sum()

# Calcolare la percentuale di studenti per ogni anno
studenti_per_anno['Percentuale'] = (studenti_per_anno['Numero di Studenti'] / totale_studenti) * 100

# Creare il grafico a istogrammi utilizzando Plotly
fig = px.bar(
    studenti_per_anno,
    x='Anno',
    y='Numero di Studenti',
    text='Numero di Studenti',
)

# Aggiornare il testo delle barre per includere sia il valore assoluto che la percentuale
fig.update_traces(
    texttemplate='%{text} (%{customdata[0]:.1f}%)',
    textposition='outside',
    customdata=studenti_per_anno[['Percentuale']].values
)

# Modificare le impostazioni dell'asse delle y per evitare il taglio del testo
fig.update_layout(
    yaxis=dict(
        title='Numero di Studenti',
        title_standoff=25  # Spazio tra l'asse y e il titolo
    ),
    margin=dict(t=60, b=40, l=40, r=40),  # Aggiungere margini per evitare che il testo venga tagliato
    template='plotly_white',  # Applicare il tema plotly_white
    title={
        'text': f'Numero di studenti per anno<br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Configurazione per rimuovere il logo di Plotly
config = {
    'displaylogo': False
}

# Variabile per esportare grafico
grafico01 = fig.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig.show(config=config)


### Grafico con divisione maschi e femmine

In [38]:
import pandas as pd 
import plotly.express as px

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Contare il numero di studenti per ogni anno e sesso
studenti_per_anno_sesso = df.groupby(['Classe (anno)', 'Sesso']).size().reset_index(name='Numero di Studenti')

# Creare il grafico a istogrammi raggruppato per anno e sesso utilizzando Plotly
fig2 = px.bar(
    studenti_per_anno_sesso,
    x='Classe (anno)',
    y='Numero di Studenti',
    color='Sesso',
    text='Numero di Studenti',
    barmode='stack'  # Cambia in 'stack' per avere barre sovrapposte
)

# Aggiornare il testo delle barre con i valori assoluti
fig2.update_traces(
    texttemplate='%{text}',  # Mantieni solo il valore assoluto
    textposition='inside'
)

# Modificare le impostazioni dell'asse delle y per evitare il taglio del testo
fig2.update_layout(
    yaxis=dict(
        title='Numero di Studenti',
        title_standoff=25  # Spazio tra l'asse y e il titolo
    ),
    margin=dict(t=60, b=40, l=40, r=40),  # Aggiungere margini per evitare che il testo venga tagliato
    template='plotly_white',  # Applicare il tema plotly_white
    title={
        'text': f'Numero di studenti per anno suddivisi per sesso <br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Configurazione per rimuovere il logo di Plotly
config = {
    'displaylogo': False
}

# Variabile per esportare grafico
grafico02 = fig2.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig2.show(config=config)




In [39]:
import pandas as pd
import plotly.express as px

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Contare il numero di studenti per ogni anno e statuto
studenti_per_anno_statuto = df.groupby(['Classe (anno)', 'Statuto']).size().reset_index(name='Numero di Studenti')

# Definire l'ordine delle classi (anni) come una lista
ordine_classi = ['primo anno', 'secondo anno', 'terzo anno', 'quarto anno']

# Creare il grafico a istogrammi raggruppato per anno e statuto utilizzando Plotly
fig03 = px.bar(
    studenti_per_anno_statuto,
    x='Classe (anno)',
    y='Numero di Studenti',
    color='Statuto',
    text='Numero di Studenti',
    barmode='stack',  # Cambia in 'stack' per avere barre sovrapposte
    category_orders={'Classe (anno)': ordine_classi}  # Specifica l'ordine delle categorie
)

# Aggiornare il testo delle barre con i valori assoluti
fig03.update_traces(
    texttemplate='%{text}',  # Mantieni solo il valore assoluto
    textposition='inside',
    textangle=0  # Imposta l'angolo del testo a 0 gradi per mantenerlo orizzontale
)

# Modificare le impostazioni dell'asse delle y per evitare il taglio del testo
fig03.update_layout(
    yaxis=dict(
        title='Numero di Studenti',
        title_standoff=25  # Spazio tra l'asse y e il titolo
    ),
    margin=dict(t=60, b=40, l=40, r=40),  # Aggiungere margini per evitare che il testo venga tagliato
    template='plotly_white',  # Applicare il tema plotly_white
    title={
        'text': f'Numero di studenti per anno suddivisi per statuto <br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Configurazione per rimuovere il logo di Plotly
config = {
    'displaylogo': False
}

# Variabile per esportare grafico
grafico03 = fig03.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig03.show(config=config)

# Elenco studenti ripetenti
# studenti_ripetenti = df[df['Statuto'] == 'Ripetente']
# print(studenti_ripetenti[['Nome', 'Cognome', 'Sezione', 'Statuto']])

## Composizioni classi

### Primo anno

In [40]:
import pandas as pd
import plotly.graph_objects as go
import seaborn as sns

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Assicurarsi che le colonne esistano nel DataFrame
required_columns = ['Classe (anno)', 'Classe anno precedente', 'Scuola frequentata precedentemente', 'Nome', 'Cognome', 'Domicilio', 'Sezione']
for col in required_columns:
    if col not in df.columns:
        raise ValueError(f"La colonna '{col}' non esiste nel DataFrame")

# Studenti PRIMO ANNO
primo = df[df['Classe (anno)'] == "primo anno"]

# Definizione della funzione aggiornata
def determina_primo_anno_prec_custom(row):
    if row['Classe anno precedente'] == 'primo anno':
        return 'Ripetenti'
    
    # Lista delle scuole liceo
    scuole_liceo = [
        'Liceo di Bellinzona',
        'Liceo di Locarno',
        'Liceo di Lugano 1',
        'Liceo di Lugano 2',
        'Liceo di Lugano 3',
        'Liceo di Mendrisio'
    ]
    
    scuola_prec = str(row['Scuola frequentata precedentemente']) if not pd.isna(row['Scuola frequentata precedentemente']) else ''
    
    if scuola_prec in scuole_liceo:
        return 'Licei'
    elif not scuola_prec.startswith('SM'):
        return 'Altro'
    else:
        return scuola_prec

# Applicazione della funzione al DataFrame selezionato
df['sez_prec_custom'] = df.apply(determina_primo_anno_prec_custom, axis=1)

# Studenti PRIMO ANNO
primo_anno = df[df['Classe (anno)'] == "primo anno"]
primo_anno_custom = primo_anno[['Nome', 'Cognome', 'Domicilio', 'sez_prec_custom', 'Sezione']]

# Creazione flussi
# Conta i flussi tra sez_prec_custom e Sezione
flussi = primo_anno_custom.groupby(['sez_prec_custom', 'Sezione']).size().reset_index(name='conteggio')

# Ordine desiderato per source e target
ordine_source = ['SM Acquarossa','SM Agno', 'SM Ambrì', 'SM Balerna', 'SM Barbengo', 'SM Bedigliora', 'SM Bellinzona 1', 'SM Bellinzona 2', 'SM Biasca', 'SM Breganzona', 'SM Cadenazzo', 'SM Camignolo', 'SM Canobbio', 'SM Caslano', 'SM Castione', 'SM Cevio', 'SM Chiasso', 'SM Giornico', 'SM Giubiasco', 'SM Gordola', 'SM Gravesano', 'SM Istituto Elvetico', 'SM Locarno 1', 'SM Locarno 2', 'SM Lodrino', 'SM Losone', 'SM Massagno', 'SM Mendrisio', 'SM Minusio', 'SM Morbio Inferiore', 'SM Pregassona', 'SM Riva San Vitale', 'SM Stabio', 'SM Tesserete', 'SM Viganello', 'Licei', 'Ripetenti', 'Altro']
ordine_target = ['1 A', '1 B', '1 C', '1 D', '1 E', '1 F', '1 G', '1 H', '1 J', '1 L', '1 M', '1 N', '1 P', '1 Q', '1 R', '1 S', '1 T', '1 U']

# Aggiungi eventuali nodi mancanti a ordine_source e ordine_target
for nodo in flussi['sez_prec_custom'].unique():
    if nodo not in ordine_source:
        ordine_source.append(nodo)

for nodo in flussi['Sezione'].unique():
    if nodo not in ordine_target:
        ordine_target.append(nodo)

# Creare liste per source, target e valori
sources = flussi['sez_prec_custom'].tolist()
targets = flussi['Sezione'].tolist()
values = flussi['conteggio'].tolist()

# Unire le liste di source e target per ottenere nodi unici
nodi_source = list(set(sources))
nodi_target = list(set(targets))

# Riordinare i nodi secondo gli ordini desiderati
nodi_source_sorted = [nodo for nodo in ordine_source if nodo in nodi_source]
nodi_target_sorted = [nodo for nodo in ordine_target if nodo in nodi_target]

# Combinare i nodi ordinati mantenendo l'ordine desiderato
nodi_sorted = nodi_source_sorted + [nodo for nodo in nodi_target_sorted if nodo not in nodi_source_sorted]

# Creare un dizionario per mappare i nodi a numeri
nodi_map = {nodo: i for i, nodo in enumerate(nodi_sorted)}

# Convertire source e target in indici numerici
source_indices = [nodi_map[src] for src in sources]
target_indices = [nodi_map[tgt] for tgt in targets]

# Generare una gamma di colori distribuiti uniformemente usando seaborn
num_source_nodes = len(nodi_source_sorted)
palette = sns.color_palette("tab20", num_source_nodes)
colori_source = ['rgba' + str((int(r * 255), int(g * 255), int(b * 255), 0.8)) for r, g, b in palette]

# Colori per i target
colori_target = ['#AAAAAA'] * len(nodi_target_sorted)

# Combinare i colori dei nodi
node_colors_combined = colori_source + colori_target

# Mappare i colori dei nodi source agli indici
color_map = {nodo: colore for nodo, colore in zip(nodi_source_sorted, colori_source)}

# Assegnare i colori ai flussi basandosi sul nodo source
link_colors = [color_map[src] for src in sources]

# Creare il grafico Sankey
fig11 = go.Figure(data=[go.Sankey(
    node=dict(
        pad=25,  # Aumenta ulteriormente la distanza tra i nodi
        thickness=40,  # Aumenta ulteriormente lo spessore dei nodi
        line=dict(color="black", width=0.5),
        label=nodi_sorted,
        color=node_colors_combined
    ),
    link=dict(
        source=source_indices,
        target=target_indices,
        value=values,
        color=link_colors  # Assegna i colori ai flussi
    )
)])

# Aggiornare il layout del grafico con sottotitolo
fig11.update_layout(
    font_size=14,
    height=1000,
    title={
        'text': f'Composizione classi primo anno<br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Mostrare il grafico senza il logo di Plotly e salvare come file HTML
# fig.write_html('2024-2025_composizione classi_primo_anno.html', config=dict(displaylogo=False))

# variabile per esportare grafico
grafico11 = fig11.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig11.show(config=dict(displaylogo=False))


# Filtrare gli studenti nella sezione "Altro"
#studenti_altro = primo_anno_custom[primo_anno_custom['sez_prec_custom'] == 'Altro']
#print(studenti_altro)

In [1]:
import pandas as pd
import plotly.graph_objects as go
import seaborn as sns
import dash
from dash import dcc, html
from dash.dependencies import Input, Output, State

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Assicurarsi che le colonne esistano nel DataFrame
required_columns = ['Classe (anno)', 'Classe anno precedente', 'Scuola frequentata precedentemente', 'Nome', 'Cognome', 'Domicilio', 'Sezione']
for col in required_columns:
    if col not in df.columns:
        raise ValueError(f"La colonna '{col}' non esiste nel DataFrame")

# Studenti PRIMO ANNO
primo = df[df['Classe (anno)'] == "primo anno"]

# Definizione della funzione aggiornata
def determina_primo_anno_prec_custom(row):
    if row['Classe anno precedente'] == 'primo anno':
        return 'Ripetenti'
    
    # Lista delle scuole liceo
    scuole_liceo = [
        'Liceo di Bellinzona',
        'Liceo di Locarno',
        'Liceo di Lugano 1',
        'Liceo di Lugano 2',
        'Liceo di Lugano 3',
        'Liceo di Mendrisio'
    ]
    
    scuola_prec = str(row['Scuola frequentata precedentemente']) if not pd.isna(row['Scuola frequentata precedentemente']) else ''
    
    if scuola_prec in scuole_liceo:
        return 'Licei'
    elif not scuola_prec.startswith('SM'):
        return 'Altro'
    else:
        return scuola_prec

# Applicazione della funzione al DataFrame selezionato
df['sez_prec_custom'] = df.apply(determina_primo_anno_prec_custom, axis=1)

# Studenti PRIMO ANNO
primo_anno = df[df['Classe (anno)'] == "primo anno"]
primo_anno_custom = primo_anno[['Nome', 'Cognome', 'Domicilio', 'sez_prec_custom', 'Sezione']]

# Creazione flussi
# Conta i flussi tra sez_prec_custom e Sezione
flussi = primo_anno_custom.groupby(['sez_prec_custom', 'Sezione']).size().reset_index(name='conteggio')

# Ordine desiderato per source e target
ordine_source = ['SM Acquarossa','SM Agno', 'SM Ambrì', 'SM Balerna', 'SM Barbengo', 'SM Bedigliora', 'SM Bellinzona 1', 'SM Bellinzona 2', 'SM Biasca', 'SM Breganzona', 'SM Cadenazzo', 'SM Camignolo', 'SM Canobbio', 'SM Caslano', 'SM Castione', 'SM Cevio', 'SM Chiasso', 'SM Giornico', 'SM Giubiasco', 'SM Gordola', 'SM Gravesano', 'SM Istituto Elvetico', 'SM Locarno 1', 'SM Locarno 2', 'SM Lodrino', 'SM Losone', 'SM Massagno', 'SM Mendrisio', 'SM Minusio', 'SM Morbio Inferiore', 'SM Pregassona', 'SM Riva San Vitale', 'SM Stabio', 'SM Tesserete', 'SM Viganello', 'Licei', 'Ripetenti', 'Altro']
ordine_target = ['1 A', '1 B', '1 C', '1 D', '1 E', '1 F', '1 G', '1 H', '1 J', '1 L', '1 M', '1 N', '1 P', '1 Q', '1 R', '1 S', '1 T', '1 U']

# Aggiungi eventuali nodi mancanti a ordine_source e ordine_target
for nodo in flussi['sez_prec_custom'].unique():
    if nodo not in ordine_source:
        ordine_source.append(nodo)

for nodo in flussi['Sezione'].unique():
    if nodo not in ordine_target:
        ordine_target.append(nodo)

# Creare liste per source, target e valori
sources = flussi['sez_prec_custom'].tolist()
targets = flussi['Sezione'].tolist()
values = flussi['conteggio'].tolist()

# Unire le liste di source e target per ottenere nodi unici
nodi_source = list(set(sources))
nodi_target = list(set(targets))

# Riordinare i nodi secondo gli ordini desiderati
nodi_source_sorted = [nodo for nodo in ordine_source if nodo in nodi_source]
nodi_target_sorted = [nodo for nodo in ordine_target if nodo in nodi_target]

# Combinare i nodi ordinati mantenendo l'ordine desiderato
nodi_sorted = nodi_source_sorted + [nodo for nodo in nodi_target_sorted if nodo not in nodi_source_sorted]

# Creare un dizionario per mappare i nodi a numeri
nodi_map = {nodo: i for i, nodo in enumerate(nodi_sorted)}

# Convertire source e target in indici numerici
source_indices = [nodi_map[src] for src in sources]
target_indices = [nodi_map[tgt] for tgt in targets]

# Generare una gamma di colori distribuiti uniformemente usando seaborn
num_source_nodes = len(nodi_source_sorted)
palette = sns.color_palette("tab20", num_source_nodes)
colori_source = ['rgba' + str((int(r * 255), int(g * 255), int(b * 255), 0.8)) for r, g, b in palette]

# Colori per i target
colori_target = ['#AAAAAA'] * len(nodi_target_sorted)

# Combinare i colori dei nodi
node_colors_combined = colori_source + colori_target

# Mappare i colori dei nodi source agli indici
color_map = {nodo: colore for nodo, colore in zip(nodi_source_sorted, colori_source)}

# Assegnare i colori ai flussi basandosi sul nodo source
link_colors = [color_map[src] for src in sources]

# Funzione per creare il grafico Sankey
def create_sankey(selected_targets):
    if not selected_targets:
        selected_targets = nodi_target_sorted
    
    filtered_flussi = flussi[flussi['Sezione'].isin(selected_targets)]
    
    sources_filtered = filtered_flussi['sez_prec_custom'].tolist()
    targets_filtered = filtered_flussi['Sezione'].tolist()
    values_filtered = filtered_flussi['conteggio'].tolist()
    
    source_indices_filtered = [nodi_map[src] for src in sources_filtered]
    target_indices_filtered = [nodi_map[tgt] for tgt in targets_filtered]
    
    link_colors_filtered = [color_map[src] for src in sources_filtered]
    
    fig = go.Figure(data=[go.Sankey(
        node=dict(
            pad=25,
            thickness=40,
            line=dict(color="black", width=0.5),
            label=nodi_sorted,
            color=node_colors_combined
        ),
        link=dict(
            source=source_indices_filtered,
            target=target_indices_filtered,
            value=values_filtered,
            color=link_colors_filtered
        )
    )])
    
    fig.update_layout(
        font_size=14,
        height=1000,
        title={
            'text': f'Composizione classi primo anno<br><sup>a.s. 2024-2025</sup>',
            'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
        }
    )
    
    return fig

# Inizializzare l'app Dash
app = dash.Dash(__name__)

# Layout dell'app
app.layout = html.Div([
    html.H1("Grafico Sankey delle Classi del Primo Anno"),
    dcc.Dropdown(
        id='target-dropdown',
        options=[{'label': target, 'value': target} for target in nodi_target_sorted],
        value=nodi_target_sorted,  # Seleziona tutti i target di default
        multi=True,
        placeholder="Seleziona i target"
    ),
    html.Button('Seleziona Tutti', id='select-all', n_clicks=0),
    html.Button('Deseleziona Tutti', id='deselect-all', n_clicks=0),
    dcc.Graph(id='sankey-graph')
])

# Callback per aggiornare il dropdown dei target
@app.callback(
    Output('target-dropdown', 'value'),
    [Input('select-all', 'n_clicks'),
     Input('deselect-all', 'n_clicks')],
    [State('target-dropdown', 'value')]
)
def update_dropdown(select_all, deselect_all, current_value):
    ctx = dash.callback_context

    if not ctx.triggered:
        return current_value
    else:
        button_id = ctx.triggered[0]['prop_id'].split('.')[0]

    if button_id == 'select-all':
        return nodi_target_sorted
    elif button_id == 'deselect-all':
        return []

# Callback per aggiornare il grafico Sankey
@app.callback(
    Output('sankey-graph', 'figure'),
    Input('target-dropdown', 'value')
)
def update_sankey(selected_targets):
    return create_sankey(selected_targets)

# Eseguire l'app
if __name__ == '__main__':
    app.run_server(debug=True)



In [41]:
# Libreria
import pandas as pd 
import plotly.express as px

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Filtrare solo gli studenti del primo anno
df_primo_anno = df[df['Classe (anno)'] == 'primo anno']

# Contare il numero di studenti per ogni sezione del primo anno
studenti_per_sezione = df_primo_anno['Sezione'].value_counts().reset_index()
studenti_per_sezione.columns = ['Sezione', 'Numero di Studenti']

# Ordinare le sezioni in ordine alfabetico
studenti_per_sezione = studenti_per_sezione.sort_values('Sezione')

# Calcolare il numero medio di studenti per classe
media_studenti_per_classe = studenti_per_sezione['Numero di Studenti'].mean()

# Creare il grafico a istogrammi utilizzando Plotly
fig12 = px.bar(
    studenti_per_sezione,
    x='Sezione',
    y='Numero di Studenti',
    text='Numero di Studenti'
)

# Aggiornare il testo delle barre con i valori assoluti
fig12.update_traces(
    texttemplate='%{text}',
    textposition='outside'
)

# Aggiungere una linea continua per il numero medio di studenti per classe
fig12.add_shape(
    type='line',
    x0=-0.5, x1=len(studenti_per_sezione)-0.5,  # da un po' prima della prima barra a un po' dopo l'ultima
    y0=media_studenti_per_classe, y1=media_studenti_per_classe,
    line=dict(
        color='red',
        width=2,
    ),
)

# Aggiungere un'annotazione per indicare il numero medio di studenti per classe
fig12.add_annotation(
    x=len(studenti_per_sezione)-0.5,  # posizione orizzontale dell'annotazione
    y=media_studenti_per_classe,  # posizione verticale dell'annotazione
    text=f'Media: {media_studenti_per_classe:.2f}',
    showarrow=False,
    xanchor='left',  # ancorare l'annotazione a sinistra
    yshift=10  # spostare l'annotazione verso l'alto
)

# Modificare le impostazioni dell'asse delle y e inclinare le etichette dell'asse x
fig12.update_layout(
    yaxis=dict(
        title='Numero di Studenti',
        title_standoff=25  # Spazio tra l'asse y e il titolo
    ),
    xaxis=dict(
        tickangle=-45  # Inclinare le etichette dell'asse x a 45 gradi
    ),
    margin=dict(t=60, b=40, l=40, r=40),  # Aggiungere margini per evitare che il testo venga tagliato
    template='plotly_white',  # Applicare il tema plotly_white
    title={
        'text': f'Numero di studenti per sezione del primo anno <br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Configurazione per rimuovere il logo di Plotly
config = {
    'displaylogo': False
}

# variabile per esportare grafico
grafico12 = fig12.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig12.show(config=config)


In [42]:
# Libreria
import pandas as pd 
import plotly.express as px

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Filtrare solo gli studenti del primo anno
df_primo_anno = df[df['Classe (anno)'] == 'primo anno']

# Contare il numero di maschi e femmine per ogni sezione del primo anno
studenti_per_sezione_sesso = df_primo_anno.groupby(['Sezione', 'Sesso']).size().reset_index(name='Numero di Studenti')

# Creare il grafico a istogrammi raggruppato per sezione e sesso utilizzando Plotly
fig13 = px.bar(
    studenti_per_sezione_sesso,
    x='Sezione',
    y='Numero di Studenti',
    color='Sesso',
    text='Numero di Studenti',
    barmode='stack'  # Usa 'stack' per avere barre sovrapposte
)

# Aggiornare il testo delle barre con i valori assoluti
fig13.update_traces(
    texttemplate='%{text}',  # Mostra solo il numero assoluto
    textposition='inside',
    textangle=0  # Mantieni il testo orizzontale
)

# Modificare le impostazioni dell'asse delle y e inclinare le etichette dell'asse x
fig13.update_layout(
    yaxis=dict(
        title='Numero di Studenti',
        title_standoff=25  # Spazio tra l'asse y e il titolo
    ),
    xaxis=dict(
        tickangle=-45  # Inclinare le etichette dell'asse x a 45 gradi
    ),
    margin=dict(t=60, b=40, l=40, r=40),  # Aggiungere margini per evitare che il testo venga tagliato
    template='plotly_white',  # Applicare il tema plotly_white
    title={
        'text': f'Numero di studenti primo anno suddivisi per sezione e per sesso <br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Configurazione per rimuovere il logo di Plotly
config = {
    'displaylogo': False
}

# variabile per esportare grafico
grafico13 = fig13.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig13.show(config=config)


In [43]:
# Libreria
import pandas as pd 
import plotly.express as px

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Filtrare solo gli studenti del primo anno
df_primo_anno = df[df['Classe (anno)'] == 'primo anno']

# Contare il numero di studenti per ogni sezione e statuto del primo anno
studenti_per_sezione_statuto = df_primo_anno.groupby(['Sezione', 'Statuto']).size().reset_index(name='Numero di Studenti')

# Creare il grafico a istogrammi raggruppato per sezione e statuto utilizzando Plotly
fig14 = px.bar(
    studenti_per_sezione_statuto,
    x='Sezione',
    y='Numero di Studenti',
    color='Statuto',
    text='Numero di Studenti',
    barmode='stack'  # Usa 'stack' per avere barre sovrapposte
)

# Aggiornare il testo delle barre con i valori assoluti
fig14.update_traces(
    texttemplate='%{text}',  # Mostra solo il numero assoluto
    textposition='inside',
    textangle=0  # Mantieni il testo orizzontale
)

# Modificare le impostazioni dell'asse delle y e inclinare le etichette dell'asse x
fig14.update_layout(
    yaxis=dict(
        title='Numero di Studenti',
        title_standoff=25  # Spazio tra l'asse y e il titolo
    ),
    xaxis=dict(
        tickangle=-45  # Inclinare le etichette dell'asse x a 45 gradi
    ),
    margin=dict(t=60, b=40, l=40, r=40),  # Aggiungere margini per evitare che il testo venga tagliato
    template='plotly_white',  # Applicare il tema plotly_white
    title={
        'text': f'Numero di studenti primo anno suddivisi per sezione e per statuto <br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Configurazione per rimuovere il logo di Plotly
config = {
    'displaylogo': False
}

# variabile per esportare grafico
grafico14 = fig14.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig14.show(config=config)


### Secondo anno

In [44]:
import pandas as pd
import plotly.graph_objects as go
import seaborn as sns

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Studenti SECONDO ANNO
secondo = df[df['Classe (anno)'] == "secondo anno"]

# Definizione della funzione aggiornata
def determina_terzo_anno_prec_custom(row):
    if row['Classe anno precedente'] == 'secondo anno':
        return 'Ripetenti'
    elif row['Classe anno precedente'] != 'secondo anno' and row['Classe anno precedente'] != 'primo anno':
        return 'Altro'
    else:
        return row['Sezione anno precedente']

# Applicazione della funzione al DataFrame selezionato
df['sez_prec_custom'] = df.apply(determina_terzo_anno_prec_custom, axis=1)

# Studenti SECONDO ANNO
secondo_anno = df[df['Classe (anno)'] == "secondo anno"]
secondo_anno_custom = secondo_anno[['Nome', 'Cognome', 'Domicilio', 'sez_prec_custom', 'Sezione']]

# Creazione flussi
# Conta i flussi tra sez_prec_custom e Sezione
flussi = secondo_anno_custom.groupby(['sez_prec_custom', 'Sezione']).size().reset_index(name='conteggio')

# Ordine desiderato per source e target
ordine_source = ['1 A', '1 B', '1 C', '1 D', '1 E', '1 F', '1 G', '1 H', '1 J', '1 L', '1 M', '1 N', '1 P', '1 Q','1 R','1 S','1 T', '1 U', '1 V','1 Z','Ripetenti', 'Altro']
ordine_target = ['2 A', '2 B', '2 C', '2 D', '2 E', '2 F', '2 G', '2 H', '2 J', '2 L', '2 M', '2 N', '2 P','2 Q']

# Creare liste per source, target e valori
sources = flussi['sez_prec_custom'].tolist()
targets = flussi['Sezione'].tolist()
values = flussi['conteggio'].tolist()

# Unire le liste di source e target per ottenere nodi unici
nodi_source = list(set(sources))
nodi_target = list(set(targets))

# Riordinare i nodi secondo gli ordini desiderati
nodi_source_sorted = [nodo for nodo in ordine_source if nodo in nodi_source]
nodi_target_sorted = [nodo for nodo in ordine_target if nodo in nodi_target]

# Combinare i nodi ordinati mantenendo l'ordine desiderato
nodi_sorted = nodi_source_sorted + [nodo for nodo in nodi_target_sorted if nodo not in nodi_source_sorted]

# Creare un dizionario per mappare i nodi a numeri
nodi_map = {nodo: i for i, nodo in enumerate(nodi_sorted)}

# Convertire source e target in indici numerici
source_indices = [nodi_map[src] for src in sources]
target_indices = [nodi_map[tgt] for tgt in targets]

# Generare una gamma di colori distribuiti uniformemente usando seaborn
num_source_nodes = len(nodi_source_sorted)
palette = sns.color_palette("tab20", num_source_nodes)
colori_source = ['rgba' + str((int(r * 255), int(g * 255), int(b * 255), 0.8)) for r, g, b in palette]

# Colori per i target
colori_target = ['#AAAAAA'] * len(nodi_target_sorted)

# Combinare i colori dei nodi
node_colors_combined = colori_source + colori_target

# Mappare i colori dei nodi source agli indici
color_map = {nodo: colore for nodo, colore in zip(nodi_source_sorted, colori_source)}

# Assegnare i colori ai flussi basandosi sul nodo source
link_colors = [color_map[src] for src in sources]

# Creare il grafico Sankey
fig20 = go.Figure(data=[go.Sankey(
    node=dict(
        pad=25,  # Aumenta ulteriormente la distanza tra i nodi
        thickness=40,  # Aumenta ulteriormente lo spessore dei nodi
        line=dict(color="black", width=0.5),
        label=nodi_sorted,
        color=node_colors_combined
    ),
    link=dict(
        source=source_indices,
        target=target_indices,
        value=values,
        color=link_colors  # Assegna i colori ai flussi
    )
)])

# Aggiornare il layout del grafico con sottotitolo
fig20.update_layout(
    font_size=14,
    height=1000,
    title={
        'text': f'Composizione classi secondo anno<br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Mostrare il grafico senza il logo di Plotly e salvare come file HTML
#fig.write_html('2024-2025_composizione classi_secondo_anno.html', config=dict(displaylogo=False))

# variabile per esportare grafico
grafico20 = fig20.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig20.show(config=dict(displaylogo=False))


In [45]:
# Libreria
import pandas as pd 
import plotly.express as px

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Filtrare solo gli studenti del secondo anno
df_secondo_anno = df[df['Classe (anno)'] == 'secondo anno']

# Contare il numero di studenti per ogni sezione del secondo anno
studenti_per_sezione = df_secondo_anno['Sezione'].value_counts().reset_index()
studenti_per_sezione.columns = ['Sezione', 'Numero di Studenti']

# Ordinare le sezioni in ordine alfabetico
studenti_per_sezione = studenti_per_sezione.sort_values('Sezione')

# Calcolare il numero medio di studenti per classe
media_studenti_per_classe = studenti_per_sezione['Numero di Studenti'].mean()

# Calcolare la percentuale di studenti per sezione
studenti_per_sezione['Percentuale'] = (studenti_per_sezione['Numero di Studenti'] / studenti_per_sezione['Numero di Studenti'].sum()) * 100

# Creare il grafico a istogrammi utilizzando Plotly
fig21 = px.bar(
    studenti_per_sezione,
    x='Sezione',
    y='Numero di Studenti',
    text='Numero di Studenti',
    hover_data=['Percentuale']
)

# Aggiornare il testo delle barre con i valori assoluti
fig21.update_traces(
    texttemplate='%{text}',
    textposition='outside'
)

# Aggiungere una linea continua per il numero medio di studenti per classe
fig21.add_shape(
    type='line',
    x0=-0.5, x1=len(studenti_per_sezione)-0.5,  # da un po' prima della prima barra a un po' dopo l'ultima
    y0=media_studenti_per_classe, y1=media_studenti_per_classe,
    line=dict(
        color='red',
        width=2,
    ),
)

# Aggiungere un'annotazione per indicare il numero medio di studenti per classe
fig21.add_annotation(
    x=len(studenti_per_sezione)-0.5,  # posizione orizzontale dell'annotazione
    y=media_studenti_per_classe,  # posizione verticale dell'annotazione
    text=f'Media: {media_studenti_per_classe:.2f}',
    showarrow=False,
    xanchor='left',  # ancorare l'annotazione a sinistra
    yshift=10  # spostare l'annotazione verso l'alto
)

# Modificare le impostazioni dell'asse delle y e inclinare le etichette dell'asse x
fig21.update_layout(
    yaxis=dict(
        title='Numero di Studenti',
        title_standoff=25  # Spazio tra l'asse y e il titolo
    ),
    xaxis=dict(
        tickangle=-45  # Inclinare le etichette dell'asse x a 45 gradi
    ),
    margin=dict(t=60, b=40, l=40, r=40),  # Aggiungere margini per evitare che il testo venga tagliato
    template='plotly_white',  # Applicare il tema plotly_white
    title={
        'text': f'Numero di studenti per sezione del secondo anno <br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Configurazione per rimuovere il logo di Plotly
config = {
    'displaylogo': False
}

# variabile per esportare grafico
grafico21 = fig21.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig21.show(config=config)


In [46]:
# Libreria
import pandas as pd 
import plotly.express as px

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Filtrare solo gli studenti del primo anno
df_secondo_anno = df[df['Classe (anno)'] == 'secondo anno']

# Contare il numero di maschi e femmine per ogni sezione del primo anno
studenti_per_sezione_sesso = df_secondo_anno.groupby(['Sezione', 'Sesso']).size().reset_index(name='Numero di Studenti')

# Creare il grafico a istogrammi raggruppato per sezione e sesso utilizzando Plotly
fig22 = px.bar(
    studenti_per_sezione_sesso,
    x='Sezione',
    y='Numero di Studenti',
    color='Sesso',
    text='Numero di Studenti',
    barmode='stack'  # Usa 'stack' per avere barre sovrapposte
)

# Aggiornare il testo delle barre con i valori assoluti
fig22.update_traces(
    texttemplate='%{text}',  # Mostra solo il numero assoluto
    textposition='inside',
    textangle=0  # Mantieni il testo orizzontale
)

# Modificare le impostazioni dell'asse delle y e inclinare le etichette dell'asse x
fig22.update_layout(
    yaxis=dict(
        title='Numero di Studenti',
        title_standoff=25  # Spazio tra l'asse y e il titolo
    ),
    xaxis=dict(
        tickangle=-45  # Inclinare le etichette dell'asse x a 45 gradi
    ),
    margin=dict(t=60, b=40, l=40, r=40),  # Aggiungere margini per evitare che il testo venga tagliato
    template='plotly_white',  # Applicare il tema plotly_white
    title={
        'text': f'Numero di studenti secondo anno suddivisi per sezione e per sesso <br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Configurazione per rimuovere il logo di Plotly
config = {
    'displaylogo': False
}

# variabile per esportare grafico
grafico22 = fig22.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig22.show(config=config)


In [47]:
# Libreria
import pandas as pd 
import plotly.express as px

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Filtrare solo gli studenti del secondo anno
df_secondo_anno = df[df['Classe (anno)'] == 'secondo anno']

# Contare il numero di studenti per ogni sezione e statuto del secondo anno
studenti_per_sezione_statuto = df_secondo_anno.groupby(['Sezione', 'Statuto']).size().reset_index(name='Numero di Studenti')

# Creare il grafico a istogrammi raggruppato per sezione e statuto utilizzando Plotly
fig23 = px.bar(
    studenti_per_sezione_statuto,
    x='Sezione',
    y='Numero di Studenti',
    color='Statuto',
    text='Numero di Studenti',
    barmode='stack'  # Usa 'stack' per avere barre sovrapposte
)

# Aggiornare il testo delle barre con i valori assoluti
fig23.update_traces(
    texttemplate='%{text}',  # Mostra solo il numero assoluto
    textposition='inside',
    textangle=0  # Mantieni il testo orizzontale
)

# Modificare le impostazioni dell'asse delle y e inclinare le etichette dell'asse x
fig23.update_layout(
    yaxis=dict(
        title='Numero di Studenti',
        title_standoff=25  # Spazio tra l'asse y e il titolo
    ),
    xaxis=dict(
        tickangle=-45  # Inclinare le etichette dell'asse x a 45 gradi
    ),
    margin=dict(t=60, b=40, l=40, r=40),  # Aggiungere margini per evitare che il testo venga tagliato
    template='plotly_white',  # Applicare il tema plotly_white
    title={
        'text': f'Numero di studenti secondo anno suddivisi per sezione e per statuto <br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Configurazione per rimuovere il logo di Plotly
config = {
    'displaylogo': False
}

# variabile per esportare grafico
grafico23 = fig23.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig23.show(config=config)


### Terzo anno

In [48]:
import pandas as pd
import plotly.graph_objects as go
import seaborn as sns

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Studenti TERZO ANNO
terzo_anno = df[df['Classe (anno)'] == "terzo anno"]

# Definizione della funzione aggiornata
def determina_terzo_anno_prec_custom(row):
    if row['Classe anno precedente'] == 'terzo anno':
        return 'Ripetenti'
    elif row['Classe anno precedente'] != 'terzo anno' and row['Classe anno precedente'] != 'secondo anno':
        return 'Altro'
    else:
        return row['Sezione anno precedente']

# Applicazione della funzione al DataFrame selezionato
df['sez_prec_custom'] = df.apply(determina_terzo_anno_prec_custom, axis=1)

# Studenti TERZO ANNO
terzo_anno = df[df['Classe (anno)'] == "terzo anno"]
terzo_anno_custom = terzo_anno[['Nome', 'Cognome', 'Domicilio', 'sez_prec_custom', 'Sezione']]

# Creazione flussi
# Conta i flussi tra sez_prec_custom e Sezione
flussi = terzo_anno_custom.groupby(['sez_prec_custom', 'Sezione']).size().reset_index(name='conteggio')

# Ordine desiderato per source e target
ordine_source = ['2 A', '2 B', '2 C', '2 D', '2 E', '2 F', '2 G', '2 H', '2 J', '2 L', '2 M', '2 N', 'Ripetenti', 'Altro']
ordine_target = ['3 A', '3 B', '3 C', '3 D', '3 E', '3 F', '3 G', '3 H', '3 J', '3 L']

# Creare liste per source, target e valori
sources = flussi['sez_prec_custom'].tolist()
targets = flussi['Sezione'].tolist()
values = flussi['conteggio'].tolist()

# Unire le liste di source e target per ottenere nodi unici
nodi_source = list(set(sources))
nodi_target = list(set(targets))

# Riordinare i nodi secondo gli ordini desiderati
nodi_source_sorted = [nodo for nodo in ordine_source if nodo in nodi_source]
nodi_target_sorted = [nodo for nodo in ordine_target if nodo in nodi_target]

# Combinare i nodi ordinati mantenendo l'ordine desiderato
nodi_sorted = nodi_source_sorted + [nodo for nodo in nodi_target_sorted if nodo not in nodi_source_sorted]

# Creare un dizionario per mappare i nodi a numeri
nodi_map = {nodo: i for i, nodo in enumerate(nodi_sorted)}

# Convertire source e target in indici numerici
source_indices = [nodi_map[src] for src in sources]
target_indices = [nodi_map[tgt] for tgt in targets]

# Generare una gamma di colori distribuiti uniformemente usando seaborn
num_source_nodes = len(nodi_source_sorted)
palette = sns.color_palette("tab20", num_source_nodes)
colori_source = ['rgba' + str((int(r * 255), int(g * 255), int(b * 255), 0.8)) for r, g, b in palette]

# Colori per i target
colori_target = ['#AAAAAA'] * len(nodi_target_sorted)

# Combinare i colori dei nodi
node_colors_combined = colori_source + colori_target

# Mappare i colori dei nodi source agli indici
color_map = {nodo: colore for nodo, colore in zip(nodi_source_sorted, colori_source)}

# Assegnare i colori ai flussi basandosi sul nodo source
link_colors = [color_map[src] for src in sources]

# Creare il grafico Sankey
fig30 = go.Figure(data=[go.Sankey(
    node=dict(
        pad=25,  # Aumenta ulteriormente la distanza tra i nodi
        thickness=40,  # Aumenta ulteriormente lo spessore dei nodi
        line=dict(color="black", width=0.5),
        label=nodi_sorted,
        color=node_colors_combined
    ),
    link=dict(
        source=source_indices,
        target=target_indices,
        value=values,
        color=link_colors  # Assegna i colori ai flussi
    )
)])

# Aggiornare il layout del grafico con sottotitolo
fig30.update_layout(
    font_size=14,
    height=1000,
    title={
        'text': f'Composizione classi terzo anno<br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Mostrare il grafico senza il logo di Plotly e salvare come file HTML
#fig.write_html('2024-2025_composizione classi_terzo_anno.html', config=dict(displaylogo=False))

# variabile per esportare grafico
grafico30 = fig30.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig30.show(config=dict(displaylogo=False))


In [49]:
# Libreria
import pandas as pd 
import plotly.express as px

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Filtrare solo gli studenti del terzo anno
df_terzo_anno = df[df['Classe (anno)'] == 'terzo anno']

# Contare il numero di studenti per ogni sezione del terzo anno
studenti_per_sezione = df_terzo_anno['Sezione'].value_counts().reset_index()
studenti_per_sezione.columns = ['Sezione', 'Numero di Studenti']

# Ordinare le sezioni in ordine alfabetico
studenti_per_sezione = studenti_per_sezione.sort_values('Sezione')

# Calcolare il numero medio di studenti per classe
media_studenti_per_classe = studenti_per_sezione['Numero di Studenti'].mean()

# Calcolare la percentuale di studenti per sezione
studenti_per_sezione['Percentuale'] = (studenti_per_sezione['Numero di Studenti'] / studenti_per_sezione['Numero di Studenti'].sum()) * 100

# Creare il grafico a istogrammi utilizzando Plotly
fig31 = px.bar(
    studenti_per_sezione,
    x='Sezione',
    y='Numero di Studenti',
    text='Numero di Studenti',
    hover_data=['Percentuale']
)

# Aggiornare il testo delle barre con i valori assoluti
fig31.update_traces(
    texttemplate='%{text}',
    textposition='outside'
)

# Aggiungere una linea continua per il numero medio di studenti per classe
fig31.add_shape(
    type='line',
    x0=-0.5, x1=len(studenti_per_sezione)-0.5,  # da un po' prima della prima barra a un po' dopo l'ultima
    y0=media_studenti_per_classe, y1=media_studenti_per_classe,
    line=dict(
        color='red',
        width=2,
    ),
)

# Aggiungere un'annotazione per indicare il numero medio di studenti per classe
fig31.add_annotation(
    x=len(studenti_per_sezione)-0.5,  # posizione orizzontale dell'annotazione
    y=media_studenti_per_classe,  # posizione verticale dell'annotazione
    text=f'Media: {media_studenti_per_classe:.2f}',
    showarrow=False,
    xanchor='left',  # ancorare l'annotazione a sinistra
    yshift=10  # spostare l'annotazione verso l'alto
)

# Modificare le impostazioni dell'asse delle y e inclinare le etichette dell'asse x
fig31.update_layout(
    yaxis=dict(
        title='Numero di Studenti',
        title_standoff=25  # Spazio tra l'asse y e il titolo
    ),
    xaxis=dict(
        tickangle=-45  # Inclinare le etichette dell'asse x a 45 gradi
    ),
    margin=dict(t=60, b=40, l=40, r=40),  # Aggiungere margini per evitare che il testo venga tagliato
    template='plotly_white',  # Applicare il tema plotly_white
    title={
        'text': f'Numero di studenti per sezione del terzo anno <br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Configurazione per rimuovere il logo di Plotly
config = {
    'displaylogo': False
}

# variabile per esportare grafico
grafico31 = fig31.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig31.show(config=config)


In [50]:
# Libreria
import pandas as pd 
import plotly.express as px

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Filtrare solo gli studenti del primo anno
df_terzo_anno = df[df['Classe (anno)'] == 'terzo anno']

# Contare il numero di maschi e femmine per ogni sezione del primo anno
studenti_per_sezione_sesso = df_terzo_anno.groupby(['Sezione', 'Sesso']).size().reset_index(name='Numero di Studenti')

# Creare il grafico a istogrammi raggruppato per sezione e sesso utilizzando Plotly
fig32 = px.bar(
    studenti_per_sezione_sesso,
    x='Sezione',
    y='Numero di Studenti',
    color='Sesso',
    text='Numero di Studenti',
    barmode='stack'  # Usa 'stack' per avere barre sovrapposte
)

# Aggiornare il testo delle barre con i valori assoluti
fig32.update_traces(
    texttemplate='%{text}',  # Mostra solo il numero assoluto
    textposition='inside',
    textangle=0  # Mantieni il testo orizzontale
)

# Modificare le impostazioni dell'asse delle y e inclinare le etichette dell'asse x
fig32.update_layout(
    yaxis=dict(
        title='Numero di Studenti',
        title_standoff=25  # Spazio tra l'asse y e il titolo
    ),
    xaxis=dict(
        tickangle=-45  # Inclinare le etichette dell'asse x a 45 gradi
    ),
    margin=dict(t=60, b=40, l=40, r=40),  # Aggiungere margini per evitare che il testo venga tagliato
    template='plotly_white',  # Applicare il tema plotly_white
    title={
        'text': f'Numero di studenti terzo anno suddivisi per sezione e per sesso <br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Configurazione per rimuovere il logo di Plotly
config = {
    'displaylogo': False
}

# variabile per esportare grafico
grafico32 = fig32.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig32.show(config=config)

In [51]:
# Libreria
import pandas as pd 
import plotly.express as px

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Filtrare solo gli studenti del terzo anno
df_terzo_anno = df[df['Classe (anno)'] == 'terzo anno']

# Contare il numero di studenti per ogni sezione e statuto del terzo anno
studenti_per_sezione_statuto = df_terzo_anno.groupby(['Sezione', 'Statuto']).size().reset_index(name='Numero di Studenti')

# Creare il grafico a istogrammi raggruppato per sezione e statuto utilizzando Plotly
fig33 = px.bar(
    studenti_per_sezione_statuto,
    x='Sezione',
    y='Numero di Studenti',
    color='Statuto',
    text='Numero di Studenti',
    barmode='stack'  # Usa 'stack' per avere barre sovrapposte
)

# Aggiornare il testo delle barre con i valori assoluti
fig33.update_traces(
    texttemplate='%{text}',  # Mostra solo il numero assoluto
    textposition='inside',
    textangle=0  # Mantieni il testo orizzontale
)

# Modificare le impostazioni dell'asse delle y e inclinare le etichette dell'asse x
fig33.update_layout(
    yaxis=dict(
        title='Numero di Studenti',
        title_standoff=25  # Spazio tra l'asse y e il titolo
    ),
    xaxis=dict(
        tickangle=-45  # Inclinare le etichette dell'asse x a 45 gradi
    ),
    margin=dict(t=60, b=40, l=40, r=40),  # Aggiungere margini per evitare che il testo venga tagliato
    template='plotly_white',  # Applicare il tema plotly_white
    title={
        'text': f'Numero di studenti terzo anno suddivisi per sezione e per statuto <br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Configurazione per rimuovere il logo di Plotly
config = {
    'displaylogo': False
}

# variabile per esportare grafico
grafico33 = fig33.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig33.show(config=config)


### Quarto anno

In [52]:
import pandas as pd
import plotly.graph_objects as go
import seaborn as sns

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Studenti QUARTO ANNO
quarto_anno = df[df['Classe (anno)'] == "quarto anno"]

# Definizione della funzione aggiornata
def determina_terzo_anno_prec_custom(row):
    if row['Classe anno precedente'] == 'quarto anno':
        return 'Ripetenti'
    elif row['Classe anno precedente'] != 'quarto anno' and row['Classe anno precedente'] != 'terzo anno':
        return 'Altro'
    else:
        return row['Sezione anno precedente']

# Applicazione della funzione al DataFrame selezionato
df['sez_prec_custom'] = df.apply(determina_terzo_anno_prec_custom, axis=1)

# Studenti TERZO ANNO
quarto_anno = df[df['Classe (anno)'] == "quarto anno"]
quarto_anno_custom = quarto_anno[['Nome', 'Cognome', 'Domicilio', 'sez_prec_custom', 'Sezione']]

# Creazione flussi
# Conta i flussi tra sez_prec_custom e Sezione
flussi = quarto_anno_custom.groupby(['sez_prec_custom', 'Sezione']).size().reset_index(name='conteggio')

# Ordine desiderato per source e target
ordine_source = ['3 A', '3 B', '3 C', '3 D', '3 E', '3 F', '3 G', '3 H', '3 J', '3 L', 'Ripetenti', 'Altro']
ordine_target = ['4 A', '4 B', '4 C', '4 D', '4 E', '4 F', '4 G', '4 H', '4 J', '4 L']

# Creare liste per source, target e valori
sources = flussi['sez_prec_custom'].tolist()
targets = flussi['Sezione'].tolist()
values = flussi['conteggio'].tolist()

# Unire le liste di source e target per ottenere nodi unici
nodi_source = list(set(sources))
nodi_target = list(set(targets))

# Riordinare i nodi secondo gli ordini desiderati
nodi_source_sorted = [nodo for nodo in ordine_source if nodo in nodi_source]
nodi_target_sorted = [nodo for nodo in ordine_target if nodo in nodi_target]

# Combinare i nodi ordinati mantenendo l'ordine desiderato
nodi_sorted = nodi_source_sorted + [nodo for nodo in nodi_target_sorted if nodo not in nodi_source_sorted]

# Creare un dizionario per mappare i nodi a numeri
nodi_map = {nodo: i for i, nodo in enumerate(nodi_sorted)}

# Convertire source e target in indici numerici
source_indices = [nodi_map[src] for src in sources]
target_indices = [nodi_map[tgt] for tgt in targets]

# Generare una gamma di colori distribuiti uniformemente usando seaborn
num_source_nodes = len(nodi_source_sorted)
palette = sns.color_palette("tab20", num_source_nodes)
colori_source = ['rgba' + str((int(r * 255), int(g * 255), int(b * 255), 0.8)) for r, g, b in palette]

# Colori per i target
colori_target = ['#AAAAAA'] * len(nodi_target_sorted)

# Combinare i colori dei nodi
node_colors_combined = colori_source + colori_target

# Mappare i colori dei nodi source agli indici
color_map = {nodo: colore for nodo, colore in zip(nodi_source_sorted, colori_source)}

# Assegnare i colori ai flussi basandosi sul nodo source
link_colors = [color_map[src] for src in sources]

# Creare il grafico Sankey
fig40 = go.Figure(data=[go.Sankey(
    node=dict(
        pad=25,  # Aumenta ulteriormente la distanza tra i nodi
        thickness=40,  # Aumenta ulteriormente lo spessore dei nodi
        line=dict(color="black", width=0.5),
        label=nodi_sorted,
        color=node_colors_combined
    ),
    link=dict(
        source=source_indices,
        target=target_indices,
        value=values,
        color=link_colors  # Assegna i colori ai flussi
    )
)])

# Aggiornare il layout del grafico con sottotitolo
fig40.update_layout(
    font_size=14,
    height=1000,
    title={
        'text': f'Composizione classi quarto anno<br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)


# variabile per esportare grafico
grafico40 = fig40.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig40.show(config=dict(displaylogo=False))

In [53]:
# Libreria
import pandas as pd 
import plotly.express as px

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Filtrare solo gli studenti del quarto anno
df_quarto_anno = df[df['Classe (anno)'] == 'quarto anno']

# Contare il numero di studenti per ogni sezione del quarto anno
studenti_per_sezione = df_quarto_anno['Sezione'].value_counts().reset_index()
studenti_per_sezione.columns = ['Sezione', 'Numero di Studenti']

# Ordinare le sezioni in ordine alfabetico
studenti_per_sezione = studenti_per_sezione.sort_values('Sezione')

# Calcolare il numero medio di studenti per classe
media_studenti_per_classe = studenti_per_sezione['Numero di Studenti'].mean()

# Calcolare la percentuale di studenti per sezione
studenti_per_sezione['Percentuale'] = (studenti_per_sezione['Numero di Studenti'] / studenti_per_sezione['Numero di Studenti'].sum()) * 100

# Creare il grafico a istogrammi utilizzando Plotly
fig41 = px.bar(
    studenti_per_sezione,
    x='Sezione',
    y='Numero di Studenti',
    text='Numero di Studenti',
    hover_data=['Percentuale']
)

# Aggiornare il testo delle barre con i valori assoluti
fig41.update_traces(
    texttemplate='%{text}',
    textposition='outside'
)

# Aggiungere una linea continua per il numero medio di studenti per classe
fig41.add_shape(
    type='line',
    x0=-0.5, x1=len(studenti_per_sezione)-0.5,  # da un po' prima della prima barra a un po' dopo l'ultima
    y0=media_studenti_per_classe, y1=media_studenti_per_classe,
    line=dict(
        color='red',
        width=2,
    ),
)

# Aggiungere un'annotazione per indicare il numero medio di studenti per classe
fig41.add_annotation(
    x=len(studenti_per_sezione)-0.5,  # posizione orizzontale dell'annotazione
    y=media_studenti_per_classe,  # posizione verticale dell'annotazione
    text=f'Media: {media_studenti_per_classe:.2f}',
    showarrow=False,
    xanchor='left',  # ancorare l'annotazione a sinistra
    yshift=10  # spostare l'annotazione verso l'alto
)

# Modificare le impostazioni dell'asse delle y e inclinare le etichette dell'asse x
fig41.update_layout(
    yaxis=dict(
        title='Numero di Studenti',
        title_standoff=25  # Spazio tra l'asse y e il titolo
    ),
    xaxis=dict(
        tickangle=-45  # Inclinare le etichette dell'asse x a 45 gradi
    ),
    margin=dict(t=60, b=40, l=40, r=40),  # Aggiungere margini per evitare che il testo venga tagliato
    template='plotly_white',  # Applicare il tema plotly_white
    title={
        'text': f'Numero di studenti per sezione del quarto anno <br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Configurazione per rimuovere il logo di Plotly
config = {
    'displaylogo': False
}

# variabile per esportare grafico
grafico41 = fig41.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig41.show(config=config)


In [54]:
# libreria
import pandas as pd 
import plotly.express as px

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Filtrare solo gli studenti del primo anno
df_quarto_anno = df[df['Classe (anno)'] == 'quarto anno']

# Contare il numero di maschi e femmine per ogni sezione del primo anno
studenti_per_sezione_sesso = df_quarto_anno.groupby(['Sezione', 'Sesso']).size().reset_index(name='Numero di Studenti')

# Creare il grafico a istogrammi raggruppato per sezione e sesso utilizzando Plotly
fig42 = px.bar(
    studenti_per_sezione_sesso,
    x='Sezione',
    y='Numero di Studenti',
    color='Sesso',
    text='Numero di Studenti',
    barmode='stack'  # Usa 'stack' per avere barre sovrapposte
)

# Aggiornare il testo delle barre con i valori assoluti
fig42.update_traces(
    texttemplate='%{text}',  # Mostra solo il numero assoluto
    textposition='inside',
    textangle=0  # Mantieni il testo orizzontale
)

# Modificare le impostazioni dell'asse delle y e inclinare le etichette dell'asse x
fig42.update_layout(
    yaxis=dict(
        title='Numero di Studenti',
        title_standoff=25  # Spazio tra l'asse y e il titolo
    ),
    xaxis=dict(
        tickangle=-45  # Inclinare le etichette dell'asse x a 45 gradi
    ),
    margin=dict(t=60, b=40, l=40, r=40),  # Aggiungere margini per evitare che il testo venga tagliato
    template='plotly_white',  # Applicare il tema plotly_white
    title={
        'text': f'Numero di studenti quarto anno suddivisi per sezione e per sesso <br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Configurazione per rimuovere il logo di Plotly
config = {
    'displaylogo': False
}

# variabile per esportare grafico
grafico42 = fig42.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig42.show(config=config)

In [55]:
# Libreria
import pandas as pd 
import plotly.express as px

# Importazione del file Excel
df = pd.read_excel('estrazione.xlsx')

# Filtrare solo gli studenti del quarto anno
df_quarto_anno = df[df['Classe (anno)'] == 'quarto anno']

# Contare il numero di studenti per ogni sezione e statuto del quarto anno
studenti_per_sezione_statuto = df_quarto_anno.groupby(['Sezione', 'Statuto']).size().reset_index(name='Numero di Studenti')

# Creare il grafico a istogrammi raggruppato per sezione e statuto utilizzando Plotly
fig43 = px.bar(
    studenti_per_sezione_statuto,
    x='Sezione',
    y='Numero di Studenti',
    color='Statuto',
    text='Numero di Studenti',
    barmode='stack'  # Usa 'stack' per avere barre sovrapposte
)

# Aggiornare il testo delle barre con i valori assoluti
fig43.update_traces(
    texttemplate='%{text}',  # Mostra solo il numero assoluto
    textposition='inside',
    textangle=0  # Mantieni il testo orizzontale
)

# Modificare le impostazioni dell'asse delle y e inclinare le etichette dell'asse x
fig43.update_layout(
    yaxis=dict(
        title='Numero di Studenti',
        title_standoff=25  # Spazio tra l'asse y e il titolo
    ),
    xaxis=dict(
        tickangle=-45  # Inclinare le etichette dell'asse x a 45 gradi
    ),
    margin=dict(t=60, b=40, l=40, r=40),  # Aggiungere margini per evitare che il testo venga tagliato
    template='plotly_white',  # Applicare il tema plotly_white
    title={
        'text': f'Numero di studenti quarto anno suddivisi per sezione e per statuto <br><sup>a.s. {anno_scolastico}</sup>',
        'font': {'size': 24, 'family': 'Arial', 'color': 'black', 'weight': 'bold'}
    }
)

# Configurazione per rimuovere il logo di Plotly
config = {
    'displaylogo': False
}

# variabile per esportare grafico
grafico43 = fig43.to_html(full_html=False, config=config, include_plotlyjs='cdn')

# Mostrare il grafico
fig43.show(config=config)


## Html

In [56]:
# Creazione del file HTML dinamicamente
html_content = f"""
<!DOCTYPE html>
<html lang="en">
<head>
  <meta charset="UTF-8">
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  <meta http-equiv="X-UA-Compatible" content="ie=edge">
  <title>Dati e grafici creazione classi</title>
  <script src="https://cdn.plot.ly/plotly-latest.min.js"></script>

  <link rel="stylesheet" href="style.css">


</head>
<body>

  <div class="cover cover--intro sez__grey">
    <div class="cover__content">
      <h2 class="text-0">Creazione classi</h2>
      <h1>Dati e rappresentazioni grafiche</h1>
      <h2 class="mb-3">Anno scolastico 2024-2025</h2>
      <img class="img-res-mini" src="logo_scc_completo.png" alt="">      
    </div>
  </div>

  <div class="sez">
      <h2 class="gradient-underline">Aspetti generali</h2>
        <ul class="bulleted-list">
          <li>Anno scolastico di riferimento: <span class="var">{anno_scolastico}</span></li>
          <li>Data creazione estrazione GAGI: <span class="var">{data_file}</span></li>
          <li>Numero totale di studenti iscritti: <span class="var">{n_studenti_tot}</span></li>
          <li>Numero totale di sezioni: <span class="var">{numero_sezioni}</span></li>

        </ul>
        
         <div class="grafico">
          {grafico00}
        </div>
        
        <div class="grafico">
          {grafico01}
        </div>
        
        <div class="grafico">
          {grafico02}
        </div>
        
        <div class="grafico">
          {grafico03}
        </div>
        
  </div>
  
  <div class="sez">
      <h2 class="gradient-underline">Primo anno</h2>
      <ul class="bulleted-list">
          <li>Sezioni Francese 1: <span class="var">{prime_f1}</span></li>
        </ul>
      <div class="grafico">
          {grafico11}
          <p><small>Il grafico va letto prendendo in considerazione la <b>sezione di arrivo</b>. Indica quindi la <b>provenienza</b> degli studenti delle classi del <b>primo anno</b>.<small></p>
      </div>
                

      <div class="grafico">
          {grafico12}
      </div>
      <div class="grafico">
          {grafico13}
      </div>
      
      <div class="grafico">
          {grafico14}
      </div>
  
  <div class="sez">
      <h2 class="gradient-underline">Secondo anno</h2>
        <ul class="bulleted-list">
          <li>Sezioni Francese 1: <span class="var">{seconde_f1}</span></li>
        </ul>
        
      <div class="grafico">
          {grafico20}
            <p><small>Il grafico va letto prendendo in considerazione la <b>sezione di arrivo</b>. Indica quindi la <b>provenienza</b> degli studenti delle classi del <b>secondo anno</b>.<small></p>
      </div>
      <div class="grafico">
          {grafico21}
      </div>
      
      <div class="grafico">
          {grafico22}
      </div>
      
       <div class="grafico">
          {grafico23}
      </div>
  </div>
  
  <div class="sez">
      <h2 class="gradient-underline">Terzo anno</h2>
      <div class="grafico">
          {grafico30}
          <p><small>Il grafico va letto prendendo in considerazione la <b>sezione di arrivo</b>. Indica quindi la <b>provenienza</b> degli studenti delle classi del <b>terzo anno</b>.<small></p>

      </div>
      <div class="grafico">
          {grafico31}
      </div>
      <div class="grafico">
          {grafico32}
      </div>
      <div class="grafico">
          {grafico33}
      </div>
  </div>
  
  <div class="sez">
      <h2 class="gradient-underline">Quarto anno</h2>
      <div class="grafico">
          {grafico40}
          <p><small>Il grafico va letto prendendo in considerazione la <b>sezione di arrivo</b>. Indica quindi la <b>provenienza</b> degli studenti delle classi del <b>quarto anno</b>.<small></p>
      </div>
      <div class="grafico">
          {grafico41}
      </div>
       <div class="grafico">
          {grafico42}
      </div>
      <div class="grafico">
          {grafico43}
      </div>
  </div>
</body>
</html>

"""

# Salva il contenuto HTML in un file
with open("index.html", "w") as f:
    f.write(html_content)