# Equipos

In [1]:
import os
import pandas as pd

# === 1. Carpeta base general ===
base_root = r"D:\Fut_Pred\Data_equipos\2024-2025"

# === 2. Funci√≥n para limpiar encabezados ===
def clean_col(col):
    parts = [str(c).strip() for c in col if str(c) != 'nan']
    parts = [p for p in parts if not p.startswith('Unnamed')]
    return '_'.join(parts) if parts else 'Unknown'

# === 3. Funci√≥n para detectar niveles de encabezado ===
def detect_header_levels(path):
    preview = pd.read_excel(path, nrows=3, header=None)
    empty_counts = preview.isna().sum().tolist()
    if sum(empty_counts) > len(preview.columns):  # si hay muchas vac√≠as arriba
        return [0,1,2]
    else:
        return [0,1]

# === 4. Recorrer todas las carpetas de ligas ===
for league_folder in os.listdir(base_root):
    league_path = os.path.join(base_root, league_folder)
    
    if os.path.isdir(league_path):
        print(f"\nüèüÔ∏è Procesando liga: {league_folder}")
        
        # Recorre todos los Excel dentro de la liga
        for filename in os.listdir(league_path):
            if filename.endswith(".xlsx"):
                input_path = os.path.join(league_path, filename)
                output_path = os.path.join(league_path, filename.replace(".xlsx", "_flat.csv"))

                try:
                    headers = detect_header_levels(input_path)
                    df = pd.read_excel(input_path, header=headers)
                    df.columns = [clean_col(col) for col in df.columns.values]
                    df.to_csv(output_path, index=False, encoding='utf-8-sig')

                    print(f"  ‚úÖ {filename} convertido correctamente ‚Üí {os.path.basename(output_path)}")
                except Exception as e:
                    print(f"  ‚ö†Ô∏è Error procesando {filename}: {e}")



üèüÔ∏è Procesando liga: Espa√±a
  ‚úÖ Alaves.xlsx convertido correctamente ‚Üí Alaves_flat.csv
  ‚úÖ Athletic_Club.xlsx convertido correctamente ‚Üí Athletic_Club_flat.csv
  ‚úÖ Atletico_Madrid.xlsx convertido correctamente ‚Üí Atletico_Madrid_flat.csv
  ‚úÖ Celta_Vigo.xlsx convertido correctamente ‚Üí Celta_Vigo_flat.csv
  ‚úÖ Espayol.xlsx convertido correctamente ‚Üí Espayol_flat.csv
  ‚úÖ FC_Barcelona.xlsx convertido correctamente ‚Üí FC_Barcelona_flat.csv
  ‚úÖ Getafe.xlsx convertido correctamente ‚Üí Getafe_flat.csv
  ‚úÖ Girona.xlsx convertido correctamente ‚Üí Girona_flat.csv
  ‚úÖ Las_Palmas.xlsx convertido correctamente ‚Üí Las_Palmas_flat.csv
  ‚úÖ Leganes.xlsx convertido correctamente ‚Üí Leganes_flat.csv
  ‚úÖ Mallorca.xlsx convertido correctamente ‚Üí Mallorca_flat.csv
  ‚úÖ Osasuna.xlsx convertido correctamente ‚Üí Osasuna_flat.csv
  ‚úÖ Rayo_Vallecano.xlsx convertido correctamente ‚Üí Rayo_Vallecano_flat.csv
  ‚úÖ Real_Betis.xlsx convertido correctamente ‚Üí Real_Betis

# Jugadores 

In [8]:
import os
import pandas as pd
# === 1. Carpeta base general de jugadores ===
base_root = r"D:\Fut_Pred\Datos_jugadores\2024-2025\Inglaterra"

# === 2. Funci√≥n para limpiar encabezados ===
def clean_col(col):
    parts = [str(c).strip() for c in col if str(c) != 'nan']
    parts = [p for p in parts if not p.startswith('Unnamed')]
    return '_'.join(parts) if parts else 'Unknown'

# === 3. Detecci√≥n autom√°tica del n√∫mero de niveles de encabezado ===
def detect_header_levels(path):
    preview = pd.read_excel(path, nrows=3, header=None)
    empty_counts = preview.isna().sum().tolist()
    if sum(empty_counts) > len(preview.columns):
        return [0,1,2]
    else:
        return [0,1]

# === 4. Procesar todas las ligas y equipos ===
for league_folder in os.listdir(base_root):
    league_path = os.path.join(base_root, league_folder)
    
    if os.path.isdir(league_path):
        print(f"\nüèüÔ∏è Procesando jugadores de la liga: {league_folder}")
        
        for filename in os.listdir(league_path):
            if filename.endswith(".xlsx"):
                input_path = os.path.join(league_path, filename)
                output_path = os.path.join(league_path, filename.replace(".xlsx", "_flat.csv"))

                try:
                    headers = detect_header_levels(input_path)
                    df = pd.read_excel(input_path, header=headers)
                    df.columns = [clean_col(col) for col in df.columns.values]
                    df.to_csv(output_path, index=False, encoding='utf-8-sig')
                    print(f"  ‚úÖ {filename} ‚Üí {os.path.basename(output_path)}")
                except Exception as e:
                    print(f"  ‚ö†Ô∏è Error procesando {filename}: {e}")


üèüÔ∏è Procesando jugadores de la liga: Arsenal
  ‚úÖ A1.xlsx ‚Üí A1_flat.csv
  ‚úÖ A2.xlsx ‚Üí A2_flat.csv
  ‚úÖ A3.xlsx ‚Üí A3_flat.csv

üèüÔ∏è Procesando jugadores de la liga: Aston
  ‚úÖ Aston1.xlsx ‚Üí Aston1_flat.csv
  ‚úÖ Aston2.xlsx ‚Üí Aston2_flat.csv
  ‚úÖ Aston3.xlsx ‚Üí Aston3_flat.csv
  ‚úÖ Aston4.xlsx ‚Üí Aston4_flat.csv

üèüÔ∏è Procesando jugadores de la liga: Bourth
  ‚úÖ Bourth1.xlsx ‚Üí Bourth1_flat.csv
  ‚úÖ Bourth2.xlsx ‚Üí Bourth2_flat.csv
  ‚úÖ Bourth3.xlsx ‚Üí Bourth3_flat.csv

üèüÔ∏è Procesando jugadores de la liga: Brentford
  ‚úÖ Brent1.xlsx ‚Üí Brent1_flat.csv
  ‚úÖ Brent2.xlsx ‚Üí Brent2_flat.csv
  ‚úÖ Brent3.xlsx ‚Üí Brent3_flat.csv

üèüÔ∏è Procesando jugadores de la liga: Brighton
  ‚úÖ Brighton1.xlsx ‚Üí Brighton1_flat.csv
  ‚úÖ Brighton2.xlsx ‚Üí Brighton2_flat.csv
  ‚úÖ Brighton3.xlsx ‚Üí Brighton3_flat.csv
  ‚úÖ Brighton4.xlsx ‚Üí Brighton4_flat.csv

üèüÔ∏è Procesando jugadores de la liga: Chelsea
  ‚úÖ Chealsea1.xlsx ‚Üí Chealsea1_flat.csv
  ‚ú