In [1]:
import logging

# Configuración del logger
logger = logging.getLogger("PipelineLoggerGabriel")
logger.setLevel(logging.INFO)

# Configuración del handler para archivo
file_handler = logging.FileHandler("pipeline.log", mode='w')
file_handler.setLevel(logging.INFO)
file_format = logging.Formatter('%(asctime)s - %(levelname)s - %(message)s')
file_handler.setFormatter(file_format)

# Configuración del handler para consola
console_handler = logging.StreamHandler()
console_handler.setLevel(logging.INFO)
console_format = logging.Formatter('%(levelname)s - %(message)s')
console_handler.setFormatter(console_format)

# Agregar handlers al logger
logger.addHandler(file_handler)
logger.addHandler(console_handler)

def ingest_data():
    """
    Ingesta de datos simulada: esta función representa la primera etapa de un pipeline,
    en la que los datos se 'ingresan' al sistema. En este caso, simplemente crea una lista de números.
    
    Returns:
        list: Lista de números de ejemplo que se ingresarán al pipeline.
    """
    logger.info("Iniciando ingesta de datos.")
    data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]  # Datos de ejemplo
    logger.info("Datos ingresados: %s", data)
    return data

def filter_even_numbers(data):
    """
    Filtra los números pares de la lista de datos.

    Args:
        data (list): Lista de números.

    Returns:
        list: Lista con solo números pares.
    """
    logger.info("Filtrando números pares.")
    even_data = [x for x in data if x % 2 == 0]
    logger.info("Números pares: %s", even_data)
    return even_data

def multiply_by_two(data):
    """
    Multiplica cada elemento de la lista por 2.

    Args:
        data (list): Lista de números.

    Returns:
        list: Lista con cada número multiplicado por 2.
    """
    logger.info("Multiplicando cada número por 2.")
    multiplied_data = [x * 2 for x in data]
    logger.info("Datos multiplicados: %s", multiplied_data)
    return multiplied_data

def calculate_statistics(data):
    """
    Calcula la suma y el promedio de los datos.

    Args:
        data (list): Lista de números.

    Returns:
        dict: Diccionario con la suma y el promedio de los datos.
    """
    logger.info("Calculando estadísticas de los datos.")
    total_sum = sum(data)
    average = total_sum / len(data) if data else 0
    stats = {'suma': total_sum, 'promedio': average}
    logger.info("Estadísticas calculadas: %s", stats)
    return stats

def output_data(data, stats):
    """
    Salida de datos: muestra el resultado final y las estadísticas calculadas.

    Args:
        data (list): Lista de números finales.
        stats (dict): Diccionario con las estadísticas calculadas.
    """
    logger.info("Mostrando datos finales y estadísticas.")
    print("Resultado final:", data)
    print("Estadísticas:")
    print(f" - Suma: {stats['suma']}")
    print(f" - Promedio: {stats['promedio']}")

def main_pipeline():
    """
    Función principal del pipeline: organiza las etapas del flujo de datos y ejecuta cada una en orden.
    Incluye ingesta, filtrado, transformación, cálculo de estadísticas y salida de los datos.
    """
    logger.info("Iniciando el pipeline de datos.")
    
    # Paso 1: Ingesta de datos
    data = ingest_data()
    
    # Paso 2: Filtrado de números pares
    even_data = filter_even_numbers(data)
    
    # Paso 3: Multiplicación de números pares por 2
    transformed_data = multiply_by_two(even_data)
    
    # Paso 4: Cálculo de estadísticas
    stats = calculate_statistics(transformed_data)
    
    # Paso 5: Salida de datos y estadísticas
    output_data(transformed_data, stats)
    
    logger.info("Pipeline completado.")

# Ejecución del pipeline
if __name__ == "__main__":
    main_pipeline()


INFO - Iniciando el pipeline de datos.
INFO - Iniciando ingesta de datos.
INFO - Datos ingresados: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
INFO - Filtrando números pares.
INFO - Números pares: [2, 4, 6, 8, 10]
INFO - Multiplicando cada número por 2.
INFO - Datos multiplicados: [4, 8, 12, 16, 20]
INFO - Calculando estadísticas de los datos.
INFO - Estadísticas calculadas: {'suma': 60, 'promedio': 12.0}
INFO - Mostrando datos finales y estadísticas.
INFO - Pipeline completado.


Resultado final: [4, 8, 12, 16, 20]
Estadísticas:
 - Suma: 60
 - Promedio: 12.0
