# Paralelismo Distribuído

O Paralelismo Distribuído refere-se à execução de tarefas em paralelo em várias máquinas em uma rede. No contexto de MLOps e aprendizado de máquina, isso geralmente se refere ao treinamento ou inferência distribuída de modelos em vários nós ou máquinas.

Uma das bibliotecas mais populares para paralelismo distribuído em Python é o `Dask`. O Dask permite que operações como treinamento de modelo e processamento de dados sejam distribuídas em vários nós de um cluster.

Vamos criar um exemplo simples usando o Dask e o Scikit-learn para demonstrar o paralelismo distribuído.

### Para instalar dask:

- via conda:
    - conda install dask
    - conda install -c conda-forge dask-ml
- via pip:
    - pip install dask
    - pip install dask-ml

Neste exemplo:

1. Criamos um cluster Dask local com 4 workers.
2. Geramos um conjunto de dados distribuído usando `dask_ml.datasets.make_classification`.
3. Dividimos os dados em conjuntos de treinamento e teste.
4. Treinamos um modelo de floresta aleatória usando Scikit-learn. Embora o modelo seja treinado localmente, o Dask gerencia a distribuição dos dados.
5. Calculamos a precisão do modelo.

Este é um exemplo simples de paralelismo distribuído em uma única máquina usando o Dask. Em um cenário real, você pode configurar um cluster Dask distribuído em várias máquinas para escalar ainda mais o processamento.

Para verdadeiro treinamento distribuído em vários nós, você pode explorar bibliotecas como Horovod ou os recursos de treinamento distribuído do PyTorch e TensorFlow. Estas bibliotecas permitem treinar modelos de aprendizado profundo em vários nós e GPUs em paralelo.

### Exemplo: Treinamento Distribuído com Dask e Scikit-learn


In [None]:
from dask.distributed import Client, LocalCluster
from dask_ml.datasets import make_classification
from dask_ml.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from dask_ml.metrics import accuracy_score

# Criar um cluster local e um cliente para interagir com esse cluster
cluster = LocalCluster(n_workers=4)
client = Client(cluster)

# Gerar um conjunto de dados distribuído
X, y = make_classification(n_samples=100000, n_features=20, chunks=10000)
X_train, X_test, y_train, y_test = train_test_split(X, y)

# Treinar um modelo de floresta aleatória distribuído
clf = RandomForestClassifier()
clf = clf.fit(X_train.compute(), y_train.compute())  # .compute() traz os dados para a memória local

# Prever e calcular a precisão
y_pred = clf.predict(X_test.compute())
accuracy = accuracy_score(y_test.compute(), y_pred)

print(f"Accuracy: {accuracy:.4f}")

# Fechar o cliente e o cluster
client.close()
cluster.close()