# Módulo: Carga y Normalización de Columnas
Este notebook define la función para levantar los archivos excel y limpiar sus columnas.
También define las rutas donde se ubican.

In [None]:
import pandas as pd
import janitor
import pathlib

## Definición de Rutas

In [None]:
base_dir = pathlib.Path(r"c:\Users\andre\OneDrive\filo\Projectos\fedepapa\archivos_prueba")
archivos = {
    'recaudo': base_dir / 'Recaudo_Mensual_2025_2024.xlsx',
    'precios': base_dir / 'Base_Precios_historica_07_2026.xlsx',
    'produccion': base_dir / 'produccion.xlsx'
}

In [None]:
def cargar_y_normalizar_columnas(ruta_archivo):
    """
    Carga el archivo excel y normaliza los nombres de sus columnas removiendo
    espacios extra, y devolviendo la eñe a la columna mes_año.
    """
    try:
        df = pd.read_excel(ruta_archivo)
        
        # Limpieza estándar de pyjanitor.
        df = df.clean_names()
        
        # Asegurar de reemplazar mes_ano o derivaciones a mes_año
        new_cols = []
        for col in df.columns:
            c = col.replace('mes_ano', 'mes_año').replace('mes_a_o', 'mes_año')
            
            # Reemplazo directo para columnas de año solitarias
            if c == 'ano' or c == 'year':
                c = 'año'
                
            new_cols.append(c)
            
        df.columns = new_cols
        return df
    except Exception as e:
        print(f"Error al cargar {ruta_archivo}: {e}")
        return None