In [1]:
# Librerías.
import pandas as pd
import Funciones as f
import unidecode

In [None]:
%%capture
%run "15. Eliminación de primeros ítems.ipynb"

In [3]:
# Criterio 1: Candidatos que son Other.
for Nombre_df, df in dfs_Finales.items():
    dfs_Finales[Nombre_df] = df[df['Categoria_PASO_2023'] != 'Other']

In [None]:
import os
import pandas as pd
from typing import Dict


def Verificar_Diccionario_Dfs_Finales() -> None:

    """
    
    Verifica que 'dfs_Finales' exista en el espacio global y que
    sea un diccionario cuyos valores sean DataFrames de pandas.
    
    Ejemplo:
        >>> Verificar_Diccionario_Dfs_Finales()
        ✅ 'dfs_Finales' es un diccionario.
        ✅ DataFrame 'df1' detectado con 100 filas.
    
    """

    # Verifica existencia y tipo del diccionario de DataFrames.
    if 'dfs_Finales' not in globals():
        print("❌ 'dfs_Finales' no encontrado en espacio global.")
        return

    Diccionario_Dfs = globals()['dfs_Finales']

    if isinstance(Diccionario_Dfs, dict):
        print("✅ 'dfs_Finales' es un diccionario.")
    else:
        print("⚠️ 'dfs_Finales' no es un diccionario.")

    for Nombre_Df, Df in Diccionario_Dfs.items():
        if isinstance(Df, pd.DataFrame):
            print(f"   ✅ DataFrame '{Nombre_Df}' detectado con "
                  f"{len(Df)} filas.")
        else:
            print(f"   ⚠️ '{Nombre_Df}' no es un DataFrame.")


def Verificar_Eliminacion_Categoria_Other(
    Diccionario_Dfs: Dict[str, pd.DataFrame]
) -> None:

    """
    
    Verifica que no queden filas con Categoria_PASO_2023 == 'Other'
    en cada DataFrame del diccionario.
    
    Ejemplo:
        >>> Verificar_Eliminacion_Categoria_Other(dfs_Finales)
    
    """

    # Recorre cada DataFrame y cuenta filas 'Other'.
    print("\n" + "=" * 60)
    print("VERIFICACIÓN DE ELIMINACIÓN DE OUTLIERS POR CATEGORÍA")
    print("=" * 60)

    for Nombre_Df, Df in Diccionario_Dfs.items():
        if 'Categoria_PASO_2023' not in Df.columns:
            print(f"❌ '{Nombre_Df}': falta columna "
                  f"'Categoria_PASO_2023'.")
            continue

        Total = len(Df)
        Cant_Other = Df['Categoria_PASO_2023'] \
            .eq('Other').sum()

        print(f"\n📋 DATAFRAME: {Nombre_Df}")
        print(f"   - Total filas tras filtro: {Total}")
        print(f"   - Filas con 'Other': {Cant_Other}")

        if Cant_Other == 0:
            print("   ✅ No quedan filas con categoría 'Other'.")
        else:
            print("   ❌ Quedan filas no filtradas con 'Other'.")


def Verificar_Exportacion_Archivos(
    Diccionario_Dfs: Dict[str, pd.DataFrame]
) -> None:

    """
    
    Verifica que los archivos Excel de controles existan para
    cada DataFrame procesado.
    
    Ejemplo:
        >>> Verificar_Exportacion_Archivos(dfs_Finales)
    
    """

    # Comprueba existencia de archivos Excel.
    print("\n" + "=" * 60)
    print("VERIFICACIÓN DE EXPORTACIÓN DE ARCHIVOS")
    print("=" * 60)

    for Nombre_Df in Diccionario_Dfs:
        Nombre_Archivo = (
            f"Controles/16. Eliminacion de outliers por categoría "
            f"({Nombre_Df}).xlsx"
        )
        if os.path.exists(Nombre_Archivo):
            print(f"✅ Archivo encontrado: {Nombre_Archivo}")
        else:
            print(f"❌ Archivo NO encontrado: {Nombre_Archivo}")


def Main() -> None:

    """
    
    Ejecuta todas las verificaciones de control para
    el notebook '16. Eliminacion de outliers por categoría'.
    
    Ejemplo:
        >>> Main()
    
    """

    # Ejecuta todas las funciones de verificación.
    print("=" * 80)
    print("VERIFICACIÓN: PROCESO DE ELIMINACIÓN DE OUTLIERS")
    print("=" * 80)

    Verificar_Diccionario_Dfs_Finales()

    if 'dfs_Finales' in globals():
        Dic_Dfs = globals()['dfs_Finales']
        Verificar_Eliminacion_Categoria_Other(Dic_Dfs)
        Verificar_Exportacion_Archivos(Dic_Dfs)


if __name__ == "__main__":
    Main()


In [5]:
# Exportar base para el control.
for Nombre_df, df in dfs_Finales.items():
    dfs_Finales[Nombre_df].head(50).to_excel(f'Controles/16. Eliminacion de outliers por categoría ({Nombre_df}).xlsx', index=False)