# Librerias 

In [4]:
import pandas as pd
from sqlalchemy import create_engine
import numpy as np
from datetime import datetime

# Conexion 

In [5]:
def cargar_datos_manchester_city(file_path):
    # Configuraci√≥n de conexi√≥n
    engine = create_engine('postgresql://postgres:1702@localhost/futbol_db')
    
    # Mapeo completo de columnas basado en el Excel
    column_mapping = {
        'Rk': 'rank',
        'Team': 'equipo',
        'Date': 'fecha',
        'Gls': 'goles',
        'Cmp': 'pases_completados',
        'SCA': 'acc_creacion_tiros',
        'GCA': 'acc_creacion_goles',
        'Won': 'duelos_aereos_ganados',
        'CrdY': 'amarillas',
        'CK': 'corners',
        'Off': 'fueras_de_juego',
        'Opp': 'oponente',
        'Comp': 'competicion',
        'Result': 'resultado',
        'GF': 'goles',
        'GA': 'goles_recibidos',
        'GD': 'diferencia_goles',
        'Poss': 'posesion',
        'G-PK': 'goles_sin_penales',
        'PK': 'penalties_marcados',
        'PKatt': 'penalties_intentados',
        'PKm': 'penalties_fallados',
        'Sh': 'tiros',
        'G/Sh': 'goles_por_tiro',
        'G/SoT': 'goles_por_tiro_puerta',
        'SoT': 'tiros_a_puerta',
        'SoT%': 'porcentaje_tiros_puerta',
        'Dist': 'distancia_tiros',
        'FK': 'tiros_falta',
        'Att': 'pases_intentados',
        'Cmp%': 'porcentaje_pases',
        'KP': 'pases_clave',
        '1/3': 'pases_ultimo_tercio',
        'PPA': 'pases_area',
        'CrsPA': 'centros_area',
        'PrgP': 'pases_progresivos',
        'TotDist': 'distancia_total_pases',
        'PrgDist': 'distancia_progresiva_pases',
        # Pases cortos (5-15 yards)
        'Cmp.1': 'pases_5_15_completados',
        'Att.1': 'pases_5_15_intentados',
        'Cmp%.1': 'pases_5_15_porcentaje',
        # Pases medios (15-30 yards)
        'Cmp.2': 'pases_15_30_completados',
        'Att.2': 'pases_15_30_intentados',
        'Cmp%.2': 'pases_15_30_porcentaje',
        # Pases largos (>30 yards)
        'Cmp.3': 'pases_30_completados',
        'Att.3': 'pases_30_intentados',
        'Cmp%.3': 'pases_30_porcentaje',
        # Desglose SCA
        'PassLive': 'pases_vivos_creacion_tiros',
        'PassDead': 'pases_muertos_creacion_tiros',
        'TO': 'regates_creacion_tiros',
        'Sh.1': 'tiros_creacion_tiros',
        'Fld': 'faltas_recibidas_creacion_tiros',
        'Def': 'defensa_creacion_tiros',
        # Desglose GCA
        'PassLive.1': 'pases_vivos_creacion_goles',
        'PassDead.1': 'pases_muertos_creacion_goles',
        'TO.1': 'regates_creacion_goles',
        'Sh.2': 'tiros_creacion_goles',
        'Fld.1': 'faltas_recibidas_creacion_goles',
        'Def.1': 'defensa_creacion_goles',
        # Duelos a√©reos
        'Lost': 'duelos_aereos_perdidos',
        'Won%': 'porcentaje_duelos_aereos',
        # Tipos de pases
        'Live': 'pases_vivos',
        'Dead': 'pases_muertos',
        'FK.1': 'pases_falta',
        'TB': 'pases_entre_lineas',
        'Sw': 'pases_cambios_banda',
        'Crs': 'centros',
        # Saques de banda y corners
        'TI': 'saques_lateral',
        'CK.1': 'corners_total',
        'In': 'corners_inswinging',
        'Out': 'corners_outswinging',
        'Str': 'corners_rectos',
        # Otras estad√≠sticas
        'Blocks': 'bloqueos',
        'CrdR': 'rojas',
        '2CrdY': 'segundas_amarillas',
        'Fls': 'faltas_cometidas',
        'Fld.2': 'faltas_recibidas',
        'PKwon': 'penalties_ganados',
        'PKcon': 'penalties_concedidos',
        'OG': 'autogoles',
        'Recov': 'recuperaciones'
    }

    # Cargar el Excel
    df = pd.read_excel(file_path)
    
    # Limpiar datos
    df_clean = df.rename(columns=column_mapping)
    
    # Eliminar filas vac√≠as o de encabezado
    df_clean = df_clean[df_clean['fecha'].notna()]
    df_clean = df_clean[df_clean['fecha'] != 'Date']
    
    # Convertir fecha
    df_clean['fecha'] = pd.to_datetime(df_clean['fecha'])
    
    # Obtener IDs de referencia
    equipo_id = get_db_id(engine, 'equipos', 'nombre', 'Manchester City')
    temporada_id = get_db_id(engine, 'temporadas', 'nombre', 'Temporada2024')
    
    print(f"Iniciando carga de {len(df_clean)} partidos...")
    
    for index, row in df_clean.iterrows():
        try:
            # Determinar si es local o visitante
            es_local = pd.isna(row.get('@', None))
            
            # Obtener competici√≥n
            competicion_nombre = row['competicion']
            competicion_id = get_db_id(engine, 'competiciones', 'nombre', competicion_nombre)
            
            if not competicion_id:
                print(f"‚ö†Ô∏è Competici√≥n no encontrada: {competicion_nombre}")
                continue
            
            # Obtener oponente
            oponente_nombre = row['oponente']
            oponente_id = get_db_id(engine, 'equipos', 'nombre', oponente_nombre)
            
            if not oponente_id:
                print(f"‚ö†Ô∏è Oponente no encontrado: {oponente_nombre}")
                continue
            
            # Determinar equipos local y visitante
            equipo_local_id = equipo_id if es_local else oponente_id
            equipo_visitante_id = oponente_id if es_local else equipo_id
            
            # Crear c√≥digo √∫nico del partido
            codigo_partido = f"{row['fecha'].strftime('%Y%m%d')}_{equipo_local_id}_{equipo_visitante_id}_{competicion_id}"
            
            # Verificar si el partido ya existe
            partido_existente = pd.read_sql(
                f"SELECT partido_id FROM partidos WHERE codigo_partido = '{codigo_partido}'", 
                engine
            )
            
            if partido_existente.empty:
                # Insertar nuevo partido
                partido_data = {
                    'temporada_id': temporada_id,
                    'competicion_id': competicion_id,
                    'fecha': row['fecha'],
                    'equipo_local_id': equipo_local_id,
                    'equipo_visitante_id': equipo_visitante_id,
                    'goles_local': row['goles'] if es_local else row['goles_recibidos'],
                    'goles_visitante': row['goles_recibidos'] if es_local else row['goles'],
                    'resultado': row['resultado'],
                    'posesion_local': row['posesion'] if es_local else (100 - row['posesion'] if not pd.isna(row['posesion']) else None),
                    'posesion_visitante': (100 - row['posesion']) if es_local else row['posesion'] if not pd.isna(row['posesion']) else None,
                    'codigo_partido': codigo_partido,
                    'reporte_partido': row.get('Match Report', '')
                }
                
                # Insertar partido
                partido_df = pd.DataFrame([partido_data])
                partido_df.to_sql('partidos', engine, if_exists='append', index=False)
                
                # Obtener el ID del partido reci√©n insertado
                partido_id = pd.read_sql(
                    f"SELECT partido_id FROM partidos WHERE codigo_partido = '{codigo_partido}'", 
                    engine
                ).iloc[0, 0]
                
                print(f"‚úÖ Nuevo partido creado: {row['fecha'].strftime('%Y-%m-%d')} vs {oponente_nombre}")
            else:
                partido_id = partido_existente.iloc[0, 0]
                print(f"‚ÑπÔ∏è Partido ya existe: {row['fecha'].strftime('%Y-%m-%d')} vs {oponente_nombre}")
            
            # Verificar si las estad√≠sticas ya existen
            stats_existente = pd.read_sql(
                f"SELECT estadistica_id FROM estadisticas_equipo_partido WHERE partido_id = {partido_id} AND equipo_id = {equipo_id}", 
                engine
            )
            
            if stats_existente.empty:
                # Preparar datos de estad√≠sticas
                stats_data = {
                    'partido_id': partido_id,
                    'equipo_id': equipo_id,
                    # Estad√≠sticas b√°sicas
                    'goles': safe_int(row.get('goles')),
                    'goles_recibidos': safe_int(row.get('goles_recibidos')),
                    'diferencia_goles': safe_int(row.get('diferencia_goles')),
                    'goles_sin_penales': safe_int(row.get('goles_sin_penales')),
                    'tiros': safe_int(row.get('tiros')),
                    'tiros_a_puerta': safe_int(row.get('tiros_a_puerta')),
                    'porcentaje_tiros_puerta': safe_float(row.get('porcentaje_tiros_puerta')),
                    'goles_por_tiro': safe_float(row.get('goles_por_tiro')),
                    'goles_por_tiro_puerta': safe_float(row.get('goles_por_tiro_puerta')),
                    'distancia_tiros': safe_float(row.get('distancia_tiros')),
                    'tiros_falta': safe_int(row.get('tiros_falta')),
                    # Posesi√≥n y pases
                    'posesion': safe_int(row.get('posesion')),
                    'pases_completados': safe_int(row.get('pases_completados')),
                    'pases_intentados': safe_int(row.get('pases_intentados')),
                    'porcentaje_pases': safe_float(row.get('porcentaje_pases')),
                    'pases_clave': safe_int(row.get('pases_clave')),
                    'pases_progresivos': safe_int(row.get('pases_progresivos')),
                    'pases_ultimo_tercio': safe_int(row.get('pases_ultimo_tercio')),
                    'pases_area': safe_int(row.get('pases_area')),
                    'centros_area': safe_int(row.get('centros_area')),
                    'distancia_total_pases': safe_int(row.get('distancia_total_pases')),
                    'distancia_progresiva_pases': safe_int(row.get('distancia_progresiva_pases')),
                    # Pases por distancia
                    'pases_5_15_completados': safe_int(row.get('pases_5_15_completados')),
                    'pases_5_15_intentados': safe_int(row.get('pases_5_15_intentados')),
                    'pases_5_15_porcentaje': safe_float(row.get('pases_5_15_porcentaje')),
                    'pases_15_30_completados': safe_int(row.get('pases_15_30_completados')),
                    'pases_15_30_intentados': safe_int(row.get('pases_15_30_intentados')),
                    'pases_15_30_porcentaje': safe_float(row.get('pases_15_30_porcentaje')),
                    'pases_30_completados': safe_int(row.get('pases_30_completados')),
                    'pases_30_intentados': safe_int(row.get('pases_30_intentados')),
                    'pases_30_porcentaje': safe_float(row.get('pases_30_porcentaje')),
                    # Acciones de creaci√≥n
                    'acc_creacion_tiros': safe_int(row.get('acc_creacion_tiros')),
                    'acc_creacion_goles': safe_int(row.get('acc_creacion_goles')),
                    'pases_vivos_creacion_tiros': safe_int(row.get('pases_vivos_creacion_tiros')),
                    'pases_muertos_creacion_tiros': safe_int(row.get('pases_muertos_creacion_tiros')),
                    'regates_creacion_tiros': safe_int(row.get('regates_creacion_tiros')),
                    'tiros_creacion_tiros': safe_int(row.get('tiros_creacion_tiros')),
                    'faltas_recibidas_creacion_tiros': safe_int(row.get('faltas_recibidas_creacion_tiros')),
                    'defensa_creacion_tiros': safe_int(row.get('defensa_creacion_tiros')),
                    'pases_vivos_creacion_goles': safe_int(row.get('pases_vivos_creacion_goles')),
                    'pases_muertos_creacion_goles': safe_int(row.get('pases_muertos_creacion_goles')),
                    'regates_creacion_goles': safe_int(row.get('regates_creacion_goles')),
                    'tiros_creacion_goles': safe_int(row.get('tiros_creacion_goles')),
                    'faltas_recibidas_creacion_goles': safe_int(row.get('faltas_recibidas_creacion_goles')),
                    'defensa_creacion_goles': safe_int(row.get('defensa_creacion_goles')),
                    # Duelos a√©reos
                    'duelos_aereos_ganados': safe_int(row.get('duelos_aereos_ganados')),
                    'duelos_aereos_perdidos': safe_int(row.get('duelos_aereos_perdidos')),
                    'porcentaje_duelos_aereos': safe_float(row.get('porcentaje_duelos_aereos')),
                    # Discipline y faltas
                    'amarillas': safe_int(row.get('amarillas')),
                    'rojas': safe_int(row.get('rojas')),
                    'segundas_amarillas': safe_int(row.get('segundas_amarillas')),
                    'faltas_cometidas': safe_int(row.get('faltas_cometidas')),
                    'faltas_recibidas': safe_int(row.get('faltas_recibidas')),
                    # Saques y corners
                    'corners': safe_int(row.get('corners')),
                    'saques_lateral': safe_int(row.get('saques_lateral')),
                    'corners_inswinging': safe_int(row.get('corners_inswinging')),
                    'corners_outswinging': safe_int(row.get('corners_outswinging')),
                    'corners_rectos': safe_int(row.get('corners_rectos')),
                    # Otras estad√≠sticas
                    'fueras_de_juego': safe_int(row.get('fueras_de_juego')),
                    'recuperaciones': safe_int(row.get('recuperaciones')),
                    'bloqueos': safe_int(row.get('bloqueos')),
                    # Penalties
                    'penalties_marcados': safe_int(row.get('penalties_marcados')),
                    'penalties_intentados': safe_int(row.get('penalties_intentados')),
                    'penalties_fallados': safe_int(row.get('penalties_fallados')),
                    'penalties_ganados': safe_int(row.get('penalties_ganados')),
                    'penalties_concedidos': safe_int(row.get('penalties_concedidos')),
                    # Autogoles
                    'autogoles': safe_int(row.get('autogoles')),
                    # Tipos de pases
                    'pases_vivos': safe_int(row.get('pases_vivos')),
                    'pases_muertos': safe_int(row.get('pases_muertos')),
                    'pases_falta': safe_int(row.get('pases_falta')),
                    'pases_entre_lineas': safe_int(row.get('pases_entre_lineas')),
                    'pases_cambios_banda': safe_int(row.get('pases_cambios_banda')),
                    'centros': safe_int(row.get('centros'))
                }
                
                # Insertar estad√≠sticas
                stats_df = pd.DataFrame([stats_data])
                stats_df.to_sql('estadisticas_equipo_partido', engine, if_exists='append', index=False)
                
                print(f"üìä Estad√≠sticas a√±adidas para Manchester City vs {oponente_nombre}")
            else:
                print(f"‚ÑπÔ∏è Estad√≠sticas ya existen para Manchester City vs {oponente_nombre}")
                
        except Exception as e:
            print(f"‚ùå Error procesando fila {index}: {str(e)}")
            continue

    print("‚úÖ Carga completada!")

def get_db_id(engine, table, column, value):
    """Obtener ID de la base de datos"""
    try:
        query = f"SELECT {table}_id FROM {table} WHERE {column} = %s"
        result = pd.read_sql(query, engine, params=(value,))
        return result.iloc[0, 0] if not result.empty else None
    except:
        return None

def safe_int(value):
    """Convertir seguro a entero"""
    try:
        return int(value) if not pd.isna(value) else None
    except:
        return None

def safe_float(value):
    """Convertir seguro a float"""
    try:
        return float(value) if not pd.isna(value) else None
    except:
        return None

# Ejecutar la carga
if __name__ == "__main__":
    cargar_datos_manchester_city('ManCity.xls')

ModuleNotFoundError: No module named 'psycopg2'