In [4]:
import os
import pandas as pd
import csv

def convert_csv_to_excel(cartella_input):
    if not os.path.exists(cartella_input):
        print(f"La cartella '{cartella_input}' non esiste.")
        return

    file_csv = [f for f in os.listdir(cartella_input) if f.endswith('.csv')]
    if not file_csv:
        print(f"Nessun file CSV trovato nella cartella '{cartella_input}'.")
        return

    cartella_output = os.path.join(cartella_input, "Excel_Output")
    os.makedirs(cartella_output, exist_ok=True)
    log_file = os.path.join(cartella_output, "errori_conversione.txt")

    for file in file_csv:
        percorso_csv = os.path.join(cartella_input, file)
        nome_excel = os.path.splitext(file)[0] + ".xlsx"
        percorso_excel = os.path.join(cartella_output, nome_excel)

        # Salta se il file Excel esiste già
        if 1:
            if os.path.exists(percorso_excel):
                print(f"File '{nome_excel}' già esistente. Saltato.")
                continue

        try:
            # Leggi il file CSV per trovare il numero massimo di colonne
            with open(percorso_csv, 'r', encoding='utf-8') as f:
                reader = csv.reader(f, delimiter=';')
                max_colonne = max(len(riga) for riga in reader)

            # Rileggi il file CSV con il numero massimo di colonne
            df = pd.read_csv(percorso_csv, header=None, names=range(max_colonne), delimiter=';', engine='python', on_bad_lines='warn')

            # Salva in Excel
            df.to_excel(percorso_excel, index=False, header=False, engine='openpyxl')
            print(f"Convertito: {file} -> {nome_excel}")
        except Exception as e:
            # Scrive il nome del file CSV problematico nel file di log
            with open(log_file, "a") as f:
                f.write(f"Errore in {file}: {e}\n")
            print(f"Errore durante la conversione di {file}. Dettagli salvati in {log_file}")


cartella = r"/mnt/f/2024/"
convert_csv_to_excel(cartella)

#cartella = r"/mnt/f/2025/"
#convert_csv_to_excel(cartella)

File 'ris_English_TOLC_E_2024.xlsx' già esistente. Saltato.
File 'ris_English_TOLC_F_2024.xlsx' già esistente. Saltato.
Errore durante la conversione di ris_English_TOLC_I_2024.csv. Dettagli salvati in /mnt/f/2024/Excel_Output/errori_conversione.txt
File 'ris_TOLC_AV_2024.xlsx' già esistente. Saltato.
File 'ris_TOLC_B_2024.xlsx' già esistente. Saltato.
File 'ris_TOLC_E_2024.xlsx' già esistente. Saltato.
File 'ris_TOLC_F_2024.xlsx' già esistente. Saltato.
File 'ris_TOLC_I_2024.xlsx' già esistente. Saltato.
File 'ris_TOLC_LP_2024.xlsx' già esistente. Saltato.
File 'ris_TOLC_PSI_2024.xlsx' già esistente. Saltato.
File 'ris_TOLC_SPS_2024.xlsx' già esistente. Saltato.
File 'ris_TOLC_SU_2024.xlsx' già esistente. Saltato.
File 'ris_TOLC_S_2024.xlsx' già esistente. Saltato.


In [5]:
def conta_righe_csv(percorso_csv, delimiter=';'):
    with open(percorso_csv, 'r', encoding='utf-8') as f:
        reader = csv.reader(f, delimiter=delimiter)
        righe = sum(1 for _ in reader)
    return righe

def conta_righe_excel(percorso_excel):
    df = pd.read_excel(percorso_excel, engine='openpyxl')
    return len(df)

def confronta_righe(cartella_input):
    if not os.path.exists(cartella_input):
        print(f"La cartella '{cartella_input}' non esiste.")
        return

    file_csv = [f for f in os.listdir(cartella_input) if f.endswith('.csv')]

    if not file_csv:
        print(f"Nessun file CSV trovato nella cartella '{cartella_input}'.")
        return

    cartella_output = os.path.join(cartella_input, "Excel_Output")
    if not os.path.exists(cartella_output):
        print(f"La cartella '{cartella_output}' non esiste. Esegui prima lo script di conversione.")
        return

    print("Confronta righe tra CSV e Excel:\n")

    for file in file_csv:
        percorso_csv = os.path.join(cartella_input, file)
        nome_excel = os.path.splitext(file)[0] + ".xlsx"
        percorso_excel = os.path.join(cartella_output, nome_excel)

        if not os.path.exists(percorso_excel):
            print(f"File Excel '{nome_excel}' non trovato. Saltato.")
            continue

        righe_csv = conta_righe_csv(percorso_csv, delimiter=';')
        righe_excel = conta_righe_excel(percorso_excel)

        print(f"File: {file}")
        print(f"Righe nel CSV: {righe_csv}")
        print(f"Righe nell'Excel: {righe_excel}")

        if righe_csv == righe_excel+1: # per il mio caso specifico
            print("Risultato: Le righe corrispondono.\n")
        else:
            print(f"Risultato: Le righe NON corrispondono! (Differenza: {abs(righe_csv - righe_excel)})\n")

cartella = r"/mnt/f/2024/"
confronta_righe(cartella)

cartella = r"/mnt/f/2025/"
confronta_righe(cartella)

Confronta righe tra CSV e Excel:

File: ris_English_TOLC_E_2024.csv
Righe nel CSV: 9412
Righe nell'Excel: 9411
Risultato: Le righe NON corrispondono! (Differenza: 1)

File: ris_English_TOLC_F_2024.csv
Righe nel CSV: 1306
Righe nell'Excel: 1305
Risultato: Le righe NON corrispondono! (Differenza: 1)

File Excel 'ris_English_TOLC_I_2024.xlsx' non trovato. Saltato.
File: ris_TOLC_AV_2024.csv
Righe nel CSV: 5428
Righe nell'Excel: 5427
Risultato: Le righe NON corrispondono! (Differenza: 1)

File: ris_TOLC_B_2024.csv
Righe nel CSV: 21779
Righe nell'Excel: 21778
Risultato: Le righe NON corrispondono! (Differenza: 1)

File: ris_TOLC_E_2024.csv
Righe nel CSV: 51282
Righe nell'Excel: 51281
Risultato: Le righe NON corrispondono! (Differenza: 1)

File: ris_TOLC_F_2024.csv
Righe nel CSV: 21968
Righe nell'Excel: 21967
Risultato: Le righe NON corrispondono! (Differenza: 1)

File: ris_TOLC_I_2024.csv
Righe nel CSV: 66792
Righe nell'Excel: 66791
Risultato: Le righe NON corrispondono! (Differenza: 1)

Fi