In [1]:
import os
import pandas as pd
from loguru import logger

os.chdir("..")

In [2]:
# Configura il range di stagioni per la raccolta dati (es. 2026 per la stagione 2025/2026)
stag_iniziale = 2022
stag_finale = 2026

# Configurazioni aggiuntive
DATA_DIR = "data"
RAW_DIR = os.path.join(DATA_DIR, "raw")
PROCESSED_DIR = os.path.join(DATA_DIR, "processed")

In [9]:
def merge_dati(anno_inizio: int):
    anno_fine = anno_inizio + 1
    anno_fine_short = str(anno_fine)[-2:]
    
    logger.info(f"Elaborazione dei file per la stagione {anno_inizio}/{anno_fine_short} in corso...")
    
    file_quotazioni = os.path.join(
        RAW_DIR,
        "quotazioni",
        "Quotazioni_Fantacalcio_Stagione_" +
        str(anno_inizio) +
        "_" +
        anno_fine_short + 
        ".xlsx"
    )
    file_statistiche = os.path.join(
        RAW_DIR,
        "statistiche",
        "Statistiche_Fantacalcio_Stagione_" +
        str(anno_inizio) +
        "_" +
        anno_fine_short + 
        ".xlsx"
    )
    file_output = os.path.join(
        PROCESSED_DIR,
        "Dataset_" +
        str(anno_inizio) +
        "_" +
        anno_fine_short + 
        ".bcsv"
    )
    
    try:
        df_quotazioni = pd.read_excel(file_quotazioni, engine="openpyxl", header=1)
        df_statistiche = pd.read_excel(file_statistiche, engine="openpyxl", header=1)
    
        colonne_da_rimuovere = ["R", "Nome", "Squadra"]
        df_statistiche_pulito = df_statistiche.copy()
    
        for col in colonne_da_rimuovere:
            if col in df_statistiche_pulito.columns:
                df_statistiche_pulito = df_statistiche_pulito.drop(columns=[col])
            else:
                logger.warning(f"Attenzione: Colonna '{col}' non trovata nel DataFrame delle statistiche. Potrebbe essere già assente o avere un nome diverso.")

        df_merged = pd.merge(df_quotazioni, df_statistiche_pulito, on="Id", how="inner")
        logger.success(f"Dati stagione {anno_inizio}/{anno_fine_short} uniti con successo.")
        df_merged.to_csv(file_output, index=False)
        logger.success(f"Dati esportati con successo in '{file_output}'.")
    except Exception as e:
        logger.error(e)
        raise

In [10]:
for anno in range(stag_iniziale, stag_finale):
    merge_dati(anno)
    
logger.success("Elaborazione completata per tutte le stagioni specificate!")

[32m2025-08-29 21:57:55.237[0m | [1mINFO    [0m | [36m__main__[0m:[36mmerge_dati[0m:[36m5[0m - [1mElaborazione dei file per la stagione 2022/23 in corso...[0m
[32m2025-08-29 21:57:55.339[0m | [32m[1mSUCCESS [0m | [36m__main__[0m:[36mmerge_dati[0m:[36m48[0m - [32m[1mDati stagione 2022/23 uniti con successo.[0m
[32m2025-08-29 21:57:55.343[0m | [32m[1mSUCCESS [0m | [36m__main__[0m:[36mmerge_dati[0m:[36m50[0m - [32m[1mDati esportati con successo in 'data/processed/Dataset_2022_23.bcsv'.[0m
[32m2025-08-29 21:57:55.343[0m | [1mINFO    [0m | [36m__main__[0m:[36mmerge_dati[0m:[36m5[0m - [1mElaborazione dei file per la stagione 2023/24 in corso...[0m
[32m2025-08-29 21:57:55.489[0m | [32m[1mSUCCESS [0m | [36m__main__[0m:[36mmerge_dati[0m:[36m48[0m - [32m[1mDati stagione 2023/24 uniti con successo.[0m
[32m2025-08-29 21:57:55.493[0m | [32m[1mSUCCESS [0m | [36m__main__[0m:[36mmerge_dati[0m:[36m50[0m - [32m[1mDati esporta