<img src="https://docs.dask.org/en/latest/_images/dask_horizontal.svg" align="right" width="30%" alt="Dask logo">
<img src="https://userena.cl/images/logos_web/descarga/test_hor.png" align="left" width="30%" alt="Dask logo">

Dask Local Cluster es una forma de crear un clúster de cálculo en tu máquina local para aprovechar la paralelización en Dask. Esto puede ser útil para tareas de procesamiento paralelo en tu computadora personal o estación de trabajo.

**Local Cluster:** El Dask Local Cluster es un tipo de clúster que se ejecuta en tu máquina local, lo que significa que utiliza los recursos de tu computadora para realizar cálculos paralelos.

**Ventajas de Dask Local Cluster:**

- **Aprovechamiento de recursos locales:** Puedes utilizar los recursos de tu máquina local para cálculos paralelos, lo que es útil para tareas de procesamiento intensivo.
- **Configuración flexible:** Puedes configurar el número de trabajadores y hilos según tus necesidades.
- **Interoperabilidad:** Dask Local Cluster se integra bien con otras partes de Dask, como DataFrames y Bags, para tareas más complejas de análisis de datos.

En resumen, Dask Local Cluster te permite aprovechar el poder de la programación paralela en tu máquina local, lo que puede acelerar significativamente el procesamiento de tareas intensivas en datos y cálculos. Es especialmente útil cuando necesitas utilizar los recursos de tu propia computadora para realizar cálculos paralelos.

**Paso 1: Importar las bibliotecas necesarias:**

In [1]:
import dask
from dask.distributed import LocalCluster, Client


**Paso 2: Crear un Local Cluster:**

Debes crear una instancia de Local Cluster que represente el clúster de cálculo que se ejecutará en tu máquina local. Puedes especificar el número de hilos (threads) y procesos que quieres utilizar para el clúster.

```python
cluster = LocalCluster(n_workers=4, threads_per_worker=2)
```

En este ejemplo, estamos creando un clúster con 4 trabajadores, y cada trabajador tiene 2 hilos.

In [2]:
cluster = LocalCluster(n_workers=4, threads_per_worker=2)

Perhaps you already have a cluster running?
Hosting the HTTP server on port 57559 instead


**Paso 3: Conectar un Cliente a tu Clúster:**
Luego, debes crear un cliente Dask que se conecte al clúster que acabas de crear. El cliente será el punto de entrada para ejecutar tareas en el clúster.


In [3]:
client = Client(cluster)

In [4]:
client

0,1
Connection method: Cluster object,Cluster type: distributed.LocalCluster
Dashboard: http://127.0.0.1:57559/status,

0,1
Dashboard: http://127.0.0.1:57559/status,Workers: 4
Total threads: 8,Total memory: 16.00 GiB
Status: running,Using processes: True

0,1
Comm: tcp://127.0.0.1:57560,Workers: 4
Dashboard: http://127.0.0.1:57559/status,Total threads: 8
Started: Just now,Total memory: 16.00 GiB

0,1
Comm: tcp://127.0.0.1:57580,Total threads: 2
Dashboard: http://127.0.0.1:57585/status,Memory: 4.00 GiB
Nanny: tcp://127.0.0.1:57566,
Local directory: /var/folders/g3/tl95nxj90c3dphy7dr5dpngw0000gn/T/dask-worker-space/worker-nrvogb_h,Local directory: /var/folders/g3/tl95nxj90c3dphy7dr5dpngw0000gn/T/dask-worker-space/worker-nrvogb_h

0,1
Comm: tcp://127.0.0.1:57577,Total threads: 2
Dashboard: http://127.0.0.1:57583/status,Memory: 4.00 GiB
Nanny: tcp://127.0.0.1:57565,
Local directory: /var/folders/g3/tl95nxj90c3dphy7dr5dpngw0000gn/T/dask-worker-space/worker-w4ia2e6p,Local directory: /var/folders/g3/tl95nxj90c3dphy7dr5dpngw0000gn/T/dask-worker-space/worker-w4ia2e6p

0,1
Comm: tcp://127.0.0.1:57576,Total threads: 2
Dashboard: http://127.0.0.1:57581/status,Memory: 4.00 GiB
Nanny: tcp://127.0.0.1:57564,
Local directory: /var/folders/g3/tl95nxj90c3dphy7dr5dpngw0000gn/T/dask-worker-space/worker-oaklp22e,Local directory: /var/folders/g3/tl95nxj90c3dphy7dr5dpngw0000gn/T/dask-worker-space/worker-oaklp22e

0,1
Comm: tcp://127.0.0.1:57575,Total threads: 2
Dashboard: http://127.0.0.1:57578/status,Memory: 4.00 GiB
Nanny: tcp://127.0.0.1:57563,
Local directory: /var/folders/g3/tl95nxj90c3dphy7dr5dpngw0000gn/T/dask-worker-space/worker-ru0phyz_,Local directory: /var/folders/g3/tl95nxj90c3dphy7dr5dpngw0000gn/T/dask-worker-space/worker-ru0phyz_


In [6]:
?LocalCluster

In [7]:
cluster.get_logs()

**Paso 4: Ejecutar Tareas en Paralelo:**

Ahora que tienes un cliente conectado a tu clúster local, puedes utilizar Dask para ejecutar tareas en paralelo. Aquí hay un ejemplo sencillo:


In [8]:
import dask.array as da

# Crear un arreglo Dask
x = da.ones((10000, 10000), chunks=(100, 100))


In [9]:
# Realizar una operación en paralelo
y = (x + x.T).mean()

In [10]:
# Calcular el resultado
result = y.compute()

**Paso 5: Cerrar el Clúster y el Cliente:**

Después de que hayas terminado de usar el clúster, es importante cerrarlo adecuadamente para liberar los recursos.


In [38]:
client.close()
cluster.close()