In [1]:
import pandas as pd
import os

def load_and_clean_data(filepath: str) -> pd.DataFrame:
    """Carga, limpia y prepara el DataFrame de avisos desde un archivo Excel."""
    
    # --- CAMBIO IMPORTANTE AQUÍ ---
    # Ya no construimos una ruta compleja, usamos el 'filepath' directamente.
    try:
        df = pd.read_excel(filepath)
    except FileNotFoundError:
        print(f"¡ERROR! No se encontró el archivo con nombre: '{filepath}'")
        print("Por favor, asegúrate de que el archivo .xlsx esté en la misma carpeta que este notebook.")
        return None
    except Exception as e:
        print(f"Ocurrió un error inesperado al leer el archivo: {e}")
        return None
    
    # 1. Sanitizar nombres de columnas
    df.columns = df.columns.str.lower().str.replace(' ', '_').str.replace('.', '', regex=False)
    
    # 2. Convertir fechas
    date_columns = ['creado_el', 'inicio_deseado', 'fin_deseado', 'fecha_de_cierre']
    for col in date_columns:
        df[col] = pd.to_datetime(df[col], errors='coerce')
        
    # 3. Manejar nulos (ejemplo)
    df['indicador_abc'].fillna('No Especificado', inplace=True)
    
    print("✅ Datos cargados y limpiados exitosamente.")
    return df

# --- La ruta ahora es solo el nombre del archivo ---
df = load_and_clean_data('avisos_prueba_tecnica.xlsx')

if df is not None:
    # Explora los datos
    print("\nColumnas del DataFrame:", df.columns.tolist())
    print("\nPrimeras 5 filas:")
    display(df.head())

✅ Datos cargados y limpiados exitosamente.

Columnas del DataFrame: ['sociedad_co', 'equipo', 'denominación', 'perfil_catálogo', 'ubicactécnica', 'indicador_abc', 'área_de_empresa', 'cte', 'clase_de_aviso', 'aviso', 'descripción', 'creado_el', 'inicio_deseado', 'fin_deseado', 'prioridad', 'fecha_de_cierre']

Primeras 5 filas:


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df['indicador_abc'].fillna('No Especificado', inplace=True)


Unnamed: 0,sociedad_co,equipo,denominación,perfil_catálogo,ubicactécnica,indicador_abc,área_de_empresa,cte,clase_de_aviso,aviso,descripción,creado_el,inicio_deseado,fin_deseado,prioridad,fecha_de_cierre
0,ISA,202718,Autotrafo Monofásico 230/115 kV-B,N-AUTOTR,LHER230ATR-1-AUTOT,No Especificado,SUR,38B70001,N4,230230,"Fijar tubo válvula aliv.presión, suelto",2011-02-16,2011-02-16,2011-06-16,5.0,2011-07-13
1,ISA,201232,Autotrafo Monofásico 230/115 kV-A,N-AUTOTR,TORC230ATR-2-AUTOT,No Especificado,CEN,38B80001,N4,230344,Cambiar silica,2011-02-18,2014-06-01,2014-07-30,2.0,2014-01-31
2,ISA,112136,Reactor línea monofásico 500 kV-C,N-REACTO,CERR500R12MC-REACT,No Especificado,NOR,38B60001,N2,231214,Corregir fuga aceite purg buchholz RL FC,2011-03-06,2011-07-01,2011-07-04,5.0,2011-07-19
3,ISAB,301717,Autotrafo monofasico 230/69/24.9 kV - A,N-AUTOTR,SUCR230ATR-1-AUTOT,No Especificado,SUC,38F10001,N4,231474,Cambiar silicagel ATR R,2011-03-09,2011-04-06,2011-04-06,2.0,2011-04-29
4,ISA,200597,Autotrafo Trifásico 230/115 kV,N-AUTOTR,ESME230ATR-2-AUTOT,No Especificado,SUR,38B70001,N4,232227,CAMBIAR SILICA GEL ATR2,2011-03-24,2011-04-20,2011-04-20,2.0,2011-05-06
