In [1]:
import os
import pandas as pd

def carica_singoli_da_cartelle(base_dir):
    """
    Carica i file xlsx presenti nelle sottocartelle di una cartella base in un DataFrame.
    
    Argomenti:
    base_dir (str): Percorso della cartella base.
    
    Ritorno:
    dict: Un dizionario in cui le chiavi sono i nomi delle cartelle e i valori sono i DataFrame corrispondenti ai file xlsx.
    """
    dati = {}
    for cartella in os.listdir(base_dir):
        cartella_path = os.path.join(base_dir, cartella)
        if os.path.isdir(cartella_path):
            dati_cartella = {}
            for file in os.listdir(cartella_path):
                file_path = os.path.join(cartella_path, file)
                if file.endswith('.xlsx'):
                    df = pd.read_excel(file_path, sheet_name='Singoli', header=6)
                    dati_cartella[file] = df
            dati[cartella] = dati_cartella
    return dati

# utilizzo:
cartella_base = 'Iscrizioni'
dati = carica_singoli_da_cartelle(cartella_base)

In [2]:
df_singoli = pd.DataFrame()
for cartella, dati_cartella in dati.items():
    for file, df in dati_cartella.items():
        df.insert(1, 'SOCIETA', cartella)
        df_singoli = pd.concat([df_singoli, df], axis=0)

df_singoli = df_singoli.rename(columns={'ANNO NASCITA [2009-2018]': 'ANNO NASCITA'})
df_singoli = df_singoli.drop(columns=['Unnamed: 0', 'QUOTA DI ISCRIZIONE', 'CONVALIDA FINALE'])
df_singoli.index = df_singoli.index + 1
df_singoli.index.name = 'N_ISCRITTO_SOCIETA'
df_singoli = df_singoli.reset_index()
df_singoli.index = df_singoli.index + 1
df_singoli.index.name = 'ID_ISCRITTO'

In [3]:
df_singoli.to_parquet('Importati/singoli.parquet')
df_singoli

Unnamed: 0_level_0,N_ISCRITTO_SOCIETA,SOCIETA,COGNOME,NOME,SESSO,ANNO NASCITA,CINTURA,CATEGORIA
ID_ISCRITTO,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
1,1,Dojo Shotokan Treviso,PESANTE,GIULIA,Femmina,2015,GIALLA/ARANCIO,ELEFANTE
2,2,Dojo Shotokan Treviso,NASINI,ANTONIO,Maschio,2014,GIALLA/ARANCIO,ELEFANTE
3,3,Dojo Shotokan Treviso,VETTOR,PIETRO,Maschio,2017,GIALLA,GIRAFFA
4,4,Dojo Shotokan Treviso,D'IORIO,FRANCESCO,Maschio,2016,ARANCIO/VERDE,ZEBRE
5,5,Dojo Shotokan Treviso,VASSOTTO,ALICE,Femmina,2016,GIALLA/ARANCIO,ELEFANTE
...,...,...,...,...,...,...,...,...
264,12,TSKS,BALDOVIN,PIETRO,Maschio,2015,GIALLA,GIRAFFA
265,13,TSKS,ESEGIO,CARLOTTA,Femmina,2010,BLU/MARRONE,TIGRE
266,14,TSKS,FIORI,EMMA,Femmina,2010,MARRONE,TIGRE
267,15,TSKS,PAZOLLI,GABRIEL,Maschio,2014,ARANCIO,ELEFANTE


In [4]:
import os
import pandas as pd

def carica_squadre_da_cartelle(base_dir):
    """
    Carica i file xlsx presenti nelle sottocartelle di una cartella base in un DataFrame.
    
    Argomenti:
    base_dir (str): Percorso della cartella base.
    
    Ritorno:
    dict: Un dizionario in cui le chiavi sono i nomi delle cartelle e i valori sono i DataFrame corrispondenti ai file xlsx.
    """
    dati = {}
    for cartella in os.listdir(base_dir):
        cartella_path = os.path.join(base_dir, cartella)
        if os.path.isdir(cartella_path):
            dati_cartella = {}
            for file in os.listdir(cartella_path):
                file_path = os.path.join(cartella_path, file)
                if file.endswith('.xlsx'):
                    df = pd.read_excel(file_path, sheet_name='Squadre', header=4)
                    dati_cartella[file] = df
            dati[cartella] = dati_cartella
    return dati

# utilizzo:
cartella_base = 'Iscrizioni'
dati = carica_squadre_da_cartelle(cartella_base)

In [5]:
df_tot_squadra_A = pd.DataFrame()
df_tot_squadra_B = pd.DataFrame()
for cartella, dati_cartella in dati.items():
    for file, df in dati_cartella.items():
        df.insert(1, 'SOCIETA', cartella)
        squadra1 = df.iloc[0:3]
        squadra2 = df.iloc[9:12]
        df_tot_squadra_A = pd.concat([df_tot_squadra_A, squadra1], axis=0)
        df_tot_squadra_B = pd.concat([df_tot_squadra_B, squadra2], axis=0)

df_tot_squadra_A = df_tot_squadra_A.rename(columns={'ANNO NASCITA [2009-2018]': 'ANNO NASCITA'})
df_tot_squadra_A = df_tot_squadra_A.drop(columns=['Unnamed: 0', 'CONVALIDA'])
df_tot_squadra_A.index = df_tot_squadra_A.index + 1
df_tot_squadra_A.index.name = 'N_ISCRITTO_SOCIETA'
df_tot_squadra_A = df_tot_squadra_A.dropna(subset=['COGNOME'])
df_tot_squadra_A = df_tot_squadra_A.reset_index()
df_tot_squadra_A.index = df_tot_squadra_A.index + 1
df_tot_squadra_A.index.name = 'ID_ISCRITTO'

df_tot_squadra_B = df_tot_squadra_B.rename(columns={'ANNO NASCITA [2009-2018]': 'ANNO NASCITA'})
df_tot_squadra_B = df_tot_squadra_B.drop(columns=['Unnamed: 0', 'CONVALIDA'])
df_tot_squadra_B.index = df_tot_squadra_B.index + 1
df_tot_squadra_B.index.name = 'N_ISCRITTO_SOCIETA'
df_tot_squadra_B = df_tot_squadra_B.dropna(subset=['COGNOME'])
df_tot_squadra_B = df_tot_squadra_B.reset_index()
df_tot_squadra_B.index = df_tot_squadra_B.index + 1
df_tot_squadra_B.index.name = 'ID_ISCRITTO'

In [6]:
df_tot_squadra_A.to_parquet('Importati/squadra_A.parquet')
df_tot_squadra_A

Unnamed: 0_level_0,N_ISCRITTO_SOCIETA,SOCIETA,COGNOME,NOME,SESSO,ANNO NASCITA,CINTURA,CATEGORIA
ID_ISCRITTO,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
1,1,Karate Trevignano e Montebelluna,TANG,YIZI,Femmina,2009,MARRONE,TIGRE
2,2,Karate Trevignano e Montebelluna,CAVALLIN,ANITA,Femmina,2009,MARRONE,TIGRE
3,3,Karate Trevignano e Montebelluna,SEMENZATO,KIARA,Femmina,2011,MARRONE,TIGRE
4,1,Ki Kai Dojo Carbonera,SCALDAFERRI,JACOPO,Maschio,2013,BLU,SCIMMIA
5,2,Ki Kai Dojo Carbonera,FAVA,SAMUELE,Maschio,2013,VERDE/BLU,SCIMMIA
6,3,Ki Kai Dojo Carbonera,PIERAGNOLO,LEONE,Maschio,2015,VERDE/BLU,SCIMMIA
7,1,Scuola Karate Badoere,VEDELAGO,EVA,Femmina,2009,NERA,LEONE
8,2,Scuola Karate Badoere,FANTON,EMMA,Femmina,2009,NERA,LEONE
9,3,Scuola Karate Badoere,CARRARO,GIORGIA,Femmina,2009,NERA,LEONE
10,1,Scuola Karate Galliera Veneta,BEN OUNAISA,MOHAMED,Maschio,2010,VERDE/BLU,SCIMMIA


In [7]:
df_tot_squadra_B.to_parquet('Importati/squadra_B.parquet')
df_tot_squadra_B

Unnamed: 0_level_0,N_ISCRITTO_SOCIETA,SOCIETA,COGNOME,NOME,SESSO,ANNO NASCITA,CINTURA,CATEGORIA
ID_ISCRITTO,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
1,10,Karate Sacile,LAMBARKI,MALAC,Femmina,2014,GIALLA/ARANCIO,ELEFANTE
2,11,Karate Sacile,DONVITO,FRANCESCA,Femmina,2015,GIALLA/ARANCIO,ELEFANTE
3,12,Karate Sacile,GHEORGHITA,NATALIE,Femmina,2015,GIALLA/ARANCIO,ELEFANTE
4,10,Karate Trevignano e Montebelluna,MARCON,SOFIA,Femmina,2015,GIALLA/ARANCIO,ELEFANTE
5,11,Karate Trevignano e Montebelluna,VOLPATO,NICOLE,Femmina,2016,GIALLA/ARANCIO,ELEFANTE
6,12,Karate Trevignano e Montebelluna,GASPARETTO,REBECCA,Femmina,2014,GIALLA/ARANCIO,ELEFANTE
7,10,Ki Kai Dojo Carbonera,AGRIMI,GIACOMO,Maschio,2010,GIALLA/ARANCIO,ELEFANTE
8,11,Ki Kai Dojo Carbonera,MEZZAVILLA,NICOLO',Maschio,2010,GIALLA/ARANCIO,ELEFANTE
9,12,Ki Kai Dojo Carbonera,ROCCO,FEDERICO,Maschio,2010,ARANCIO/VERDE,ZEBRE
10,10,Scuola Karate Castelfranco Veneto,ferlin,tommaso,Maschio,2014,GIALLA/ARANCIO,ELEFANTE
