# Tecnicas de Limpieza y Transformacion de datos

## Decoradores

In [1]:
import pandas as pd

def limpiar_datos_numericos(df, columna):
    """
    Limpia una columna numérica del DataFrame.

    Args:
        df: DataFrame de Pandas.
        columna: Nombre de la columna a limpiar.

    Returns:
        DataFrame con la columna limpia.
    """
    # Implementación para limpiar datos numéricos
    if df[columna].dtype == 'int' or df[columna].dtype == 'float':
        df[columna] = pd.to_numeric(df[columna], errors='coerce')
        df[columna] = df[columna].fillna(df[columna].median())
    return df

def limpiar_datos_texto(df, columna):
    """
    Limpia una columna de texto del DataFrame.

    Args:
        df: DataFrame de Pandas.
        columna: Nombre de la columna a limpiar.

    Returns:
        DataFrame con la columna limpia.
    """
    # Implementación para limpiar datos de texto
    if df[columna].dtype == 'object':
        df[columna] = df[columna].astype(str).str.lower()
        df[columna] = df[columna].astype(str).str.strip()
    return df

def encadenar_funciones(*funcs):
    """
    Encadena múltiples funciones de limpieza.

    Args:
        *funcs: Funciones de limpieza a encadenar.

    Returns:
        Función decoradora que aplica las funciones encadenadas.
    """
    def decorador(func):
        def wrapper(df, columna):
            for f in funcs:
                df = f(df, columna)
            return func(df, columna)
        return wrapper
    return decorador

In [2]:
@encadenar_funciones(limpiar_datos_numericos, limpiar_datos_texto)
def procesar_columna(df, columna):
    """
    Procesa una columna aplicando las funciones de limpieza encadenadas.

    Args:
        df: DataFrame de Pandas.
        columna: Nombre de la columna a procesar.

    Returns:
        DataFrame con la columna procesada.
    """
    # Puedes añadir más procesamiento aquí si es necesario
    return df

In [4]:
data = {
    'col1': [1,2,'3',None],
    'col2': ['   Abc', '   dFGH ', 'HSDG', None]
    }

df = pd.DataFrame(data)

df2 = procesar_columna(df.copy(), 'col1')
print(df2)

df3 = procesar_columna(df.copy(), 'col2')
print(df3)

   col1      col2
0     1       Abc
1     2     dFGH 
2     3      HSDG
3  none      None
   col1  col2
0     1   abc
1     2  dfgh
2     3  hsdg
3  None  none
