In [1]:
import logging

# Configuración del logger
logger = logging.getLogger("PipelineLogger")
logger.setLevel(logging.INFO)

# Configuración del handler para archivo
file_handler = logging.FileHandler("pipeline.log", mode='w')
file_handler.setLevel(logging.INFO)
file_format = logging.Formatter('%(asctime)s - %(levelname)s - %(message)s')
file_handler.setFormatter(file_format)

# Configuración del handler para consola
console_handler = logging.StreamHandler()
console_handler.setLevel(logging.INFO)
console_format = logging.Formatter('%(levelname)s - %(message)s')
console_handler.setFormatter(console_format)

# Agregar handlers al logger
logger.addHandler(file_handler)
logger.addHandler(console_handler)

def ingest_data():
    """
    Ingesta de datos simulada: esta función representa la primera etapa de un pipeline,
    en la que los datos se 'ingresan' al sistema. En este caso, simplemente crea una lista de números.
    
    Returns:
        list: Lista de números de ejemplo que se ingresarán al pipeline.
    """
    logger.info("Iniciando ingesta de datos.")
    data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]  # Datos de ejemplo
    logger.info("Datos ingresados: %s", data)
    return data

def transform_data(data):
    """
    Transformación de datos: esta función representa una etapa de transformación,
    donde solo se procesan los datos que cumplen ciertas condiciones.
    En este ejemplo, se filtran los números pares y se multiplican por 2.

    Args:
        data (list): Lista de números a transformar.

    Returns:
        list: Lista de números transformados (pares multiplicados por 2).
    """
    logger.info("Iniciando transformación de datos.")
    transformed_data = [x * 2 for x in data if x % 2 == 0]
    logger.info("Datos transformados: %s", transformed_data)
    return transformed_data

def output_data(data):
    """
    Salida de datos: esta función representa la etapa final del pipeline,
    en la cual se realiza la salida o el guardado de los datos procesados.
    En este caso, solo imprime el resultado final en la consola.

    Args:
        data (list): Lista de números que representa el resultado final del pipeline.
    """
    logger.info("Mostrando datos finales.")
    print("Resultado final:", data)

def main_pipeline():
    """
    Función principal del pipeline: organiza las etapas del flujo de datos y ejecuta cada una en orden.
    Incluye la ingesta, transformación y salida de los datos, y registra el inicio y finalización del proceso.
    """
    logger.info("Iniciando el pipeline de datos.")
    
    # Paso 1: Ingesta de datos
    data = ingest_data()
    
    # Paso 2: Transformación de datos
    transformed_data = transform_data(data)
    
    # Paso 3: Salida de datos
    output_data(transformed_data)
    
    logger.info("Pipeline completado.")

# Ejecución del pipeline
if __name__ == "__main__":
    main_pipeline()


INFO - Iniciando el pipeline de datos.
INFO - Iniciando ingesta de datos.
INFO - Datos ingresados: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
INFO - Iniciando transformación de datos.
INFO - Datos transformados: [4, 8, 12, 16, 20]
INFO - Mostrando datos finales.
INFO - Pipeline completado.


Resultado final: [4, 8, 12, 16, 20]
