# Ténica de limpieza y transformación de datos con decoradores

# Librerías

In [1]:
import pandas as pd

In [2]:
# función para limpiar datos de tipo numérico
def clean_numeric_data(df, column_name):
    if df[column_name].dtype == 'int64' or df[column_name].dtype == 'float64':
        df[column_name] = pd.to_numeric(df[column_name], errors='coerce')
        df[column_name] = df[column_name].mean()
    
    return df
# función para limpiar datos de tipo cadena
def clean_string_data(df, column_name):
    if df[column_name].dtype == 'object':
        df[column_name] = df[column_name].astype(str).str.lower()
        df[column_name] = df[column_name].astype(str).str.strip()
    
    return df

¿Cómo podemos encadenar estas función usando un decorador?

- Lo que tenemos que hacer es una función que encadena funciones.

In [3]:
# función que encadena funciones de limpieza
def encadenar_funciones(*funcs):
    # definición del decorador
    def decorator(func):
        def wrapper(df, columna):
            for f in funcs:
                df = f(df, columna)
            return func(df, columna)
        return wrapper
    return decorator

In [7]:
# ecadenemos las funciones de limpieza
@encadenar_funciones(clean_numeric_data, clean_string_data)
def limpiar_datos(df, columna):
    """
    Función que limpia los datos de un DataFrame en una columna específica.
    
    :param df: DataFrame a limpiar
    :param columna: Nombre de la columna a limpiar
    :return: DataFrame limpio
    """
    return df

In [6]:
data = {
    'col1':[1, 2, 3, 4, 5,None],
    'col2':['  Abc', '  DFG', 'hijk', 'D', None,'Nh  ']
}
data = pd.DataFrame(data)
data.head()

Unnamed: 0,col1,col2
0,1.0,Abc
1,2.0,DFG
2,3.0,hijk
3,4.0,D
4,5.0,


In [9]:
# Limpiar los datos
data_limpia = limpiar_datos(data.copy(), 'col2')
print(data_limpia)

   col1  col2
0   1.0   abc
1   2.0   dfg
2   3.0  hijk
3   4.0     d
4   5.0  none
5   NaN    nh
