
# Computación Distribuida con Celery

Este notebook tiene como objetivo proporcionar una guía completa para implementar computación distribuida utilizando **Celery** en Python. Se exploran conceptos teóricos y técnicos, así como ejemplos prácticos para que los alumnos comprendan y apliquen Celery en distintos escenarios.

## Contenidos
1. Introducción a Celery
2. Conceptos Básicos de Celery
3. Introducción a Redis y RabbitMQ
4. Configuración de Celery con Redis
5. Ejemplo 1: Procesamiento Distribuido de Imágenes
6. Ejemplo 2: Análisis de Datos en Paralelo
7. Conclusión



## 1. Introducción a Celery

**Celery** es una biblioteca de Python para manejar tareas en segundo plano, distribuir trabajos entre múltiples máquinas y programar trabajos periódicos. Es útil en escenarios donde se requiere ejecutar procesos asíncronos o distribuir tareas para maximizar el uso de los recursos del sistema.

Celery se utiliza comúnmente en sistemas de **computación distribuida**, donde se necesita paralelizar el trabajo para mejorar el rendimiento y la eficiencia. Los principales componentes de Celery son:

- **Tareas (Tasks)**: Funciones que se ejecutan en segundo plano.
- **Workers**: Procesos que ejecutan las tareas en uno o varios nodos (máquinas).
- **Broker**: Sistema de mensajería que distribuye las tareas a los workers (ej., Redis o RabbitMQ).
- **Backend**: Almacena el estado y los resultados de las tareas ejecutadas.



## 2. Conceptos Básicos de Celery

Los elementos clave en el ecosistema de Celery son:

1. **Task (Tarea)**: Es una función Python que se define para ejecutarse en segundo plano. Celery envía las tareas a través del broker y se ejecutan por los workers.
2. **Worker**: Es un proceso que se ejecuta en segundo plano y espera tareas del broker. Un worker puede ejecutarse en una o varias máquinas, y Celery puede coordinar varios workers al mismo tiempo.
3. **Broker**: Es un sistema de mensajería que se encarga de distribuir las tareas a los workers. Los brokers más utilizados son Redis y RabbitMQ.
4. **Backend**: Es el sistema que almacena el estado y el resultado de las tareas. Puede ser el mismo sistema que el broker (por ejemplo, Redis) o uno distinto.

A continuación, se introduce Redis y RabbitMQ, los dos brokers más comunes usados con Celery.



## 3. Introducción a Redis y RabbitMQ

### Redis
**Redis** (Remote Dictionary Server) es una base de datos en memoria de estructura de datos clave-valor de alta velocidad. Actúa como broker en Celery al proporcionar colas de mensajes para la distribución de tareas.

Características clave de Redis:
- **Alto Rendimiento**: Redis está optimizado para manejar grandes cantidades de datos en memoria, lo que lo hace extremadamente rápido.
- **Simplicidad**: Configurar Redis es sencillo y tiene un API intuitiva.
- **Persistencia Opcional**: Aunque es una base de datos en memoria, Redis permite persistir datos en disco de forma opcional.

### RabbitMQ
**RabbitMQ** es un broker de mensajes más avanzado basado en el protocolo AMQP (Advanced Message Queuing Protocol). RabbitMQ permite colas más complejas y configuraciones avanzadas para la distribución de mensajes.

Características clave de RabbitMQ:
- **Soporte de AMQP**: RabbitMQ permite colas y mensajes más complejos que Redis.
- **Durabilidad y Persistencia**: Los mensajes pueden persistirse en disco, lo que lo hace adecuado para aplicaciones críticas.
- **Interoperabilidad**: RabbitMQ es compatible con muchos lenguajes y frameworks, lo que facilita su integración en sistemas heterogéneos.

En este notebook, se utilizará **Redis** como broker de ejemplo, dado su fácil configuración y rapidez.



## 4. Configuración de Celery con Redis

Para usar Celery con Redis, es necesario instalar Redis y la biblioteca Celery en el entorno de Python.

### Instalación
- Instalar Celery:
    ```bash
    pip install celery
    ```
- Instalar Redis en el sistema operativo o utilizar una instancia en la nube.

### Configuración Básica

A continuación, se muestra un ejemplo simple de configuración de Celery utilizando Redis como broker.

```python
# tasks.py
from celery import Celery

# Configuración de la aplicación Celery
app = Celery('tasks', broker='redis://localhost:6379/0', backend='redis://localhost:6379/0')

@app.task
def add(x, y):
    return x + y
```

Para ejecutar el worker de Celery, se utiliza el siguiente comando:

```bash
celery -A tasks worker --loglevel=info
```

El worker comenzará a escuchar tareas que se envíen al broker Redis. Este ejemplo configura una tarea simple (`add`) que suma dos números.



## 5. Ejemplo 1: Procesamiento Distribuido de Imágenes

En este ejemplo, se muestra cómo distribuir el procesamiento de imágenes utilizando Celery. Se dividirán las tareas de procesamiento de imágenes entre varios workers en diferentes máquinas.

```python
# tasks.py
from celery import Celery
from PIL import Image
import os

# Conexión a Redis como broker
app = Celery('image_processing', broker='redis://<BROKER_IP>:6379/0', backend='redis://<BROKER_IP>:6379/0')

@app.task
def process_image(image_path):
    # Abre y procesa la imagen
    with Image.open(image_path) as img:
        grayscale_image = img.convert('L')
        processed_path = os.path.splitext(image_path)[0] + '_processed.jpg'
        grayscale_image.save(processed_path)
        return processed_path
```

El worker se ejecuta con el siguiente comando:

```bash
celery -A tasks worker --loglevel=info
```

Para enviar tareas al worker:

```python
# main.py
from tasks import process_image

image_files = ['/path/to/image1.jpg', '/path/to/image2.jpg', '/path/to/image3.jpg']

for image in image_files:
    result = process_image.delay(image)
    print(f"Tarea enviada para {image}. Resultado en: {result.get()}")
```

### Explicación
- **Distribución de Tareas**: Las imágenes se distribuyen entre los workers, permitiendo que múltiples nodos procesen imágenes en paralelo.
- **Escalabilidad**: Se pueden agregar más workers para manejar grandes cantidades de imágenes.
