# Dask Distribuído

Além do processamento local utilizando *threads* ou processos, Dask possibilita que seu processamento seja realizado de maneira distribuída. Com isso, o processamento pode ser executado em máquinas remotas, seja em *cluster* de computadores ou máquinas alocadas utilizando recursos de computação em nuvem.

Uma das formas realizar o processamento distribuído é conectando o ambiente a um *scheduler*. Com isto, o ambiente que processa o código gera o DAG e repassa a esse *scheduler*, que será responsável por distribuir as tarefas às máquinas que realizarão o processamento.

Para executar o *scheduler*, execute no terminal

```bash
dask scheduler
```

In [1]:
from dask.distributed import Client
from dask import delayed
from time import sleep

Em seguida, podemos conectar ao scheduler, passando seu endereço IP e porta:

```python
client = Client(f'scheduler:8786')
```

Neste caso, `scheduler` corresponde ao nome do Docker Container, que será resolvido para o respectivo endereço IP.

In [2]:
client = Client(f'scheduler:8786')

Até este ponto, não há nenhum *worker* ligado ao *scheduler*. 

```python
client.nthreads
```

In [3]:
client.nthreads

<bound method Client.nthreads of <Client: 'tcp://172.20.0.2:8786' processes=0 threads=0, memory=0 B>>

Para tal, será necessário que outras máquinas conectectem ao *scheduler*, informando que são *workers*.

```bash
dask worker tcp://scheduler:8786
```

Após criar os novos *containers* e definí-los como *workers*, podemos observar novamente os recursos associados:

```python
client.nthreads
```

In [5]:
client.nthreads

<bound method Client.nthreads of <Client: 'tcp://172.20.0.2:8786' processes=2 threads=8, memory=2.00 GiB>>

In [None]:
#Pelo nome do container
client = Client(f'scheduler:8786')

In [3]:
client.nthreads

<bound method Client.nthreads of <Client: 'tcp://127.0.0.1:38425' processes=4 threads=4, memory=7.60 GiB>>

In [None]:
client.dashboard_link

In [None]:
def square(x):
        return x ** 2

def neg(x):
        return -x

In [None]:
def inc(x):
    print('.', end='')
    sleep(1)
    return x+1

def add(x,y):
    print('.', end='')
    sleep(1)
    return x+y

In [None]:
%%time
x = delayed(inc)(1)
y = delayed(inc)(2)
z = delayed(add)(x,y)

In [None]:
z.compute()