In [43]:
"""
VERIFICA E CARICAMENTO FILE BILANCI
Controllo esatto dei file disponibili e caricamento corretto
"""

import pandas as pd
import numpy as np
from pathlib import Path
import os
import warnings
warnings.filterwarnings('ignore')

# Configurazione
pd.set_option('display.max_columns', None)
pd.set_option('display.float_format', '{:.2f}'.format)

def verifica_files_disponibili(base_path):
    """
    Verifica esattamente quali file sono disponibili
    """
    base_path = Path(base_path)
    data_path = base_path / 'data' / 'bilancidiverifica'
    
    print("=" * 80)
    print("VERIFICA FILE DISPONIBILI")
    print("=" * 80)
    
    files_trovati = {'2024': [], '2025': []}
    
    for anno in ['2024', '2025']:
        path_anno = data_path / anno / 'excel'
        
        print(f"\nüìÅ Anno {anno}:")
        print(f"   Path: {path_anno}")
        
        if not path_anno.exists():
            print(f"   ‚ùå Path non esiste!")
            continue
        
        # Lista tutti i file .xlsx
        files = list(path_anno.glob('*.xlsx'))
        files.sort()
        
        print(f"   ‚úÖ Trovati {len(files)} file:")
        
        for file in files:
            print(f"      - {file.name}")
            files_trovati[anno].append(file)
    
    return files_trovati

def estrai_info_file(file_path):
    """
    Estrae mese e numero dal nome file
    """
    nome = file_path.stem  # es: "01_GENNAIO"
    parti = nome.split('_')
    
    if len(parti) >= 2:
        try:
            numero = int(parti[0])
            mese = parti[1]
            return numero, mese
        except:
            return None, nome
    else:
        return None, nome

def carica_e_analizza_file(file_path, anno):
    """
    Carica un singolo file e restituisce analisi base
    """
    try:
        df = pd.read_excel(file_path, header=None)
        
        # Funzione per convertire numeri italiani
        def converti_numero(val):
            if pd.isna(val) or val == 'nan' or val == '':
                return 0
            val_str = str(val).replace('.', '').replace(',', '.')
            try:
                return float(val_str)
            except:
                return 0
        
        # Estrai dati base
        ricavi_47 = 0
        costi_57 = 0
        costi_67 = 0
        costi_60_62 = 0
        
        for idx in range(4, min(len(df), 500)):
            try:
                row = df.iloc[idx]
                conto = str(row[0]) if pd.notna(row[0]) else ''
                
                if not conto or conto == 'nan' or 'Conto' in conto or '00:00:00' in conto:
                    continue
                
                dare = converti_numero(row[8])
                avere = converti_numero(row[9])
                
                # Ricavi (conti 47, escluso conto padre)
                if conto.startswith('47') and conto != '47':
                    ricavi_47 += avere
                
                # Costi per tipo
                if conto.startswith('57'):
                    costi_57 += dare
                elif conto.startswith('67'):
                    costi_67 += dare
                elif conto.startswith('60') or conto.startswith('61') or conto.startswith('62'):
                    costi_60_62 += dare
                    
            except:
                continue
        
        return {
            'ricavi': ricavi_47,
            'costi_57': costi_57,
            'costi_67': costi_67,
            'costi_60_62': costi_60_62,
            'costi_totali': costi_57 + costi_67 + costi_60_62,
            'records': len(df)
        }
        
    except Exception as e:
        return {
            'errore': str(e),
            'ricavi': 0,
            'costi_totali': 0
        }

def analisi_completa_files(base_path):
    """
    Analisi completa di tutti i file trovati
    """
    # 1. Verifica files
    files_trovati = verifica_files_disponibili(base_path)
    
    # 2. Carica e analizza ogni file
    print("\n" + "=" * 80)
    print("ANALISI CONTENUTO FILES")
    print("=" * 80)
    
    risultati = []
    
    for anno, files in files_trovati.items():
        print(f"\nüìä Analisi {anno}:")
        print("-" * 60)
        
        for file_path in files:
            num_mese, mese = estrai_info_file(file_path)
            
            print(f"\n   üìÑ {file_path.name}")
            print(f"      Mese: {mese} (numero: {num_mese})")
            
            # Carica e analizza
            dati = carica_e_analizza_file(file_path, anno)
            
            if 'errore' in dati:
                print(f"      ‚ùå Errore: {dati['errore']}")
            else:
                print(f"      ‚úì Records: {dati['records']}")
                print(f"      ‚úì Ricavi: ‚Ç¨{dati['ricavi']:,.0f}")
                print(f"      ‚úì Costi totali: ‚Ç¨{dati['costi_totali']:,.0f}")
                print(f"         - Conti 57: ‚Ç¨{dati['costi_57']:,.0f}")
                print(f"         - Conti 67: ‚Ç¨{dati['costi_67']:,.0f}")
                print(f"         - Conti 60-62: ‚Ç¨{dati['costi_60_62']:,.0f}")
                
                if dati['ricavi'] > 0:
                    margine = dati['ricavi'] - dati['costi_totali']
                    margine_perc = (margine / dati['ricavi'] * 100)
                    print(f"      ‚úì Margine: ‚Ç¨{margine:,.0f} ({margine_perc:.1f}%)")
                
                risultati.append({
                    'Anno': anno,
                    'File': file_path.name,
                    'Mese': mese,
                    'Num_Mese': num_mese,
                    'Ricavi': dati['ricavi'],
                    'Costi_57': dati['costi_57'],
                    'Costi_67': dati['costi_67'],
                    'Costi_60_62': dati['costi_60_62'],
                    'Costi_Totali': dati['costi_totali'],
                    'Margine': dati['ricavi'] - dati['costi_totali'] if dati['ricavi'] > 0 else 0,
                    'Margine_%': ((dati['ricavi'] - dati['costi_totali']) / dati['ricavi'] * 100) 
                                if dati['ricavi'] > 0 else 0
                })
    
    # 3. Crea DataFrame riepilogativo
    df_risultati = pd.DataFrame(risultati)
    
    print("\n" + "=" * 80)
    print("RIEPILOGO COMPLESSIVO")
    print("=" * 80)
    
    # Riepilogo per anno
    for anno in ['2024', '2025']:
        df_anno = df_risultati[df_risultati['Anno'] == anno]
        if len(df_anno) > 0:
            print(f"\nüìä {anno}:")
            print(f"   Files caricati: {len(df_anno)}")
            print(f"   Ricavi totali: ‚Ç¨{df_anno['Ricavi'].sum():,.0f}")
            print(f"   Costi totali: ‚Ç¨{df_anno['Costi_Totali'].sum():,.0f}")
            print(f"   Margine totale: ‚Ç¨{df_anno['Margine'].sum():,.0f}")
            print(f"   Margine medio %: {df_anno['Margine_%'].mean():.1f}%")
    
    # Confronto YoY per mesi comuni
    print("\nüìà CONFRONTO YEAR-OVER-YEAR:")
    print("-" * 60)
    
    mesi_2024 = set(df_risultati[df_risultati['Anno'] == '2024']['Mese'].values)
    mesi_2025 = set(df_risultati[df_risultati['Anno'] == '2025']['Mese'].values)
    mesi_comuni = mesi_2024 & mesi_2025
    
    print(f"Mesi comuni: {sorted(mesi_comuni)}")
    
    for mese in sorted(mesi_comuni):
        df_2024 = df_risultati[(df_risultati['Anno'] == '2024') & (df_risultati['Mese'] == mese)]
        df_2025 = df_risultati[(df_risultati['Anno'] == '2025') & (df_risultati['Mese'] == mese)]
        
        if len(df_2024) > 0 and len(df_2025) > 0:
            r_2024 = df_2024.iloc[0]['Ricavi']
            r_2025 = df_2025.iloc[0]['Ricavi']
            
            if r_2024 > 0:
                var = ((r_2025 - r_2024) / r_2024 * 100)
                print(f"\n   {mese}:")
                print(f"      2024: ‚Ç¨{r_2024:,.0f}")
                print(f"      2025: ‚Ç¨{r_2025:,.0f}")
                print(f"      Var%: {var:+.1f}%")
    
    # 4. Identifica problemi
    print("\n‚ö†Ô∏è POTENZIALI PROBLEMI:")
    print("-" * 60)
    
    # Files con margini anomali
    margini_anomali = df_risultati[
        (df_risultati['Margine_%'] > 95) | 
        (df_risultati['Margine_%'] < 0)
    ]
    
    if len(margini_anomali) > 0:
        print("\n   Margini anomali (>95% o negativi):")
        for _, row in margini_anomali.iterrows():
            print(f"      - {row['Anno']} {row['Mese']}: {row['Margine_%']:.1f}%")
    
    # Files con pochi costi
    pochi_costi = df_risultati[
        (df_risultati['Ricavi'] > 100000) & 
        (df_risultati['Costi_Totali'] < 10000)
    ]
    
    if len(pochi_costi) > 0:
        print("\n   Files con pochi costi rispetto ai ricavi:")
        for _, row in pochi_costi.iterrows():
            print(f"      - {row['Anno']} {row['Mese']}: Ricavi ‚Ç¨{row['Ricavi']:,.0f}, Costi ‚Ç¨{row['Costi_Totali']:,.0f}")
    
    # Salva risultati
    output_file = Path(base_path) / 'verifica_files_bilanci.xlsx'
    df_risultati.to_excel(output_file, index=False)
    print(f"\n‚úÖ Risultati salvati in: {output_file}")
    
    return df_risultati

# ============================================================================
# ESECUZIONE
# ============================================================================

if __name__ == "__main__":
    # Path base
    base_path = '/Users/stefanodellapietra/Desktop/Projects/HotelOPS/modules/CondGes'
    
    print("üîç VERIFICA E ANALISI FILE BILANCI")
    print("Sistema di controllo per identificare problemi nei dati")
    print("")
    
    # Esegui analisi completa
    df_risultati = analisi_completa_files(base_path)
    
    print("\n" + "=" * 80)
    print("‚úÖ ANALISI COMPLETATA")
    print("=" * 80)
    print("\nControlla il file Excel 'verifica_files_bilanci.xlsx' per i dettagli")
    print("\nSe ci sono problemi con i nomi dei file o margini anomali,")
    print("possiamo correggere il mapping nel sistema principale.")

FileNotFoundError: [Errno 2] No such file or directory: 'data/bilancidiverifica/2025/excel/08_AGOSTO.xlsx'