# Limpieza de Datos Automatizada


In [None]:
import pandas as pd
import numpy as np
from datetime import datetime
import warnings
warnings.filterwarnings('ignore')

In [None]:
def limpiar_datos(df):
    """
    Función para limpiar un DataFrame eliminando valores nulos,
    corrigiendo fechas fuera de rango y eliminando datos inconsistentes.
    """
    # Copia del DataFrame original
    df = df.copy()

    # Eliminar columnas duplicadas
    df = df.loc[:,~df.columns.duplicated()]

    # Eliminar columnas constantes (sin variación)
    df = df.loc[:, df.nunique() > 1]

    # Eliminar filas completamente vacías
    df.dropna(how='all', inplace=True)

    # Eliminar filas con valores nulos
    df.dropna(inplace=True)

    # Eliminar duplicados
    df.drop_duplicates(inplace=True)

    # Rango de fechas permitido
    min_fecha = pd.Timestamp('1800-01-01')
    max_fecha = pd.Timestamp(datetime.now())

    for col in df.columns:
        if df[col].dtype == 'object':
            try:
                df[col] = pd.to_datetime(df[col], errors='coerce')
                fechas_validas = df[col].between(min_fecha, max_fecha)
                if fechas_validas.sum() > 0:
                    df = df[fechas_validas]
            except:
                continue

    # Convertir tipos donde sea posible
    df = df.convert_dtypes()

    return df

In [None]:
# Cargar datos (CSV)
# df = pd.read_csv("datos.csv")
# df_limpio = limpiar_datos(df)
# df_limpio.head()