In [2]:
import pandas as pd
import warnings

# Ignorar advertencias (opcional)
warnings.filterwarnings('ignore')

# --- 1. Carga de Datos ---
# El notebook y el .xlsx están en la misma carpeta 'partidos/'
# por lo que solo necesitas el nombre del archivo.
# ¡Usamos read_excel() en lugar de read_csv()!
file_path = 'designacionesfecha-excel.xlsx'

try:
    df = pd.read_excel(file_path)

    print("--- ¡Archivo Excel Cargado Exitosamente! ---")

    # --- 2. Información General de las Columnas ---
    print("\n--- 1. Información General (df.info()) ---")
    # .info() nos muestra el tipo de dato de cada columna y si hay nulos
    df.info()

    # --- 3. Limpieza y Transformación de Columnas Clave ---
    # Es importante convertir las columnas de fecha y hora para poder analizarlas.

    print("\n--- 2. Transformando Columnas 'FECHA' y 'HORA' ---")

    # Convertir FECHA (asumiendo formato DD/MM/YYYY como vimos antes)
    try:
        df['FECHA'] = pd.to_datetime(df['FECHA'], format='%d/%m/%Y', errors='coerce')
        print("Columna 'FECHA' convertida a datetime.")

        # Extraer componentes útiles (Año, Mes)
        df['Año'] = df['FECHA'].dt.year
        df['Mes'] = df['FECHA'].dt.month

    except Exception as e:
        print(f"Error al convertir 'FECHA': {e}. Revisa el formato.")

    # Convertir HORA (asumiendo formato HH:MM:SS)
    try:
        # Convertimos a string primero por si acaso Excel lo leyó como un objeto time
        df['HORA_dt'] = pd.to_datetime(df['HORA'].astype(str), format='%H:%M:%S', errors='coerce')
        df['Hora_del_dia'] = df['HORA_dt'].dt.hour
        print("Columna 'HORA' convertida y 'Hora_del_dia' extraída.")

    except Exception as e:
        print(f"Error al convertir 'HORA': {e}. Revisa el formato.")


    # --- 4. Revisión Final ---
    print("\n--- 3. Primeras 5 filas con datos transformados (df.head()) ---")
    print(df.head())

    print("\n--- 4. Conteo de Valores Faltantes (después de limpieza) ---")
    print(df.isnull().sum())

except FileNotFoundError:
    print(f"ERROR: No se encontró el archivo en la ruta: {file_path}")
    print("Asegúrate de que el archivo 'designacionesfecha-excel.xlsx' esté en la misma carpeta que tu notebook.")
except Exception as e:
    print(f"Ocurrió un error inesperado: {e}")

--- ¡Archivo Excel Cargado Exitosamente! ---

--- 1. Información General (df.info()) ---
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 12204 entries, 0 to 12203
Data columns (total 9 columns):
 #   Column           Non-Null Count  Dtype 
---  ------           --------------  ----- 
 0   ID               12204 non-null  int64 
 1   LOCAL/VISITANTE  12204 non-null  object
 2   FECHA            12204 non-null  object
 3   HORA             12204 non-null  object
 4   COMPETENCIA      12204 non-null  object
 5   CATEGORÍA        12204 non-null  object
 6   FASE             12204 non-null  object
 7   GRUPO            12204 non-null  object
 8   JOR.             12204 non-null  int64 
dtypes: int64(2), object(7)
memory usage: 858.2+ KB

--- 2. Transformando Columnas 'FECHA' y 'HORA' ---
Columna 'FECHA' convertida a datetime.
Columna 'HORA' convertida y 'Hora_del_dia' extraída.

--- 3. Primeras 5 filas con datos transformados (df.head()) ---
      ID                          LOCAL/VISITAN