# Paralelismo de Hiperparâmetro

O Paralelismo de Hiperparâmetro refere-se à técnica de treinar vários modelos em paralelo com diferentes configurações de hiperparâmetros. Isso é comumente usado em busca de hiperparâmetros para encontrar a melhor configuração de hiperparâmetros para um modelo.

Vamos criar um exemplo simples usando o `Scikit-learn` e o `Joblib` para demonstrar o paralelismo de hiperparâmetro.

Neste exemplo:

1. Geramos um conjunto de dados sintético usando `make_classification`.
2. Definimos um modelo de floresta aleatória e um conjunto de hiperparâmetros a serem testados.
3. Configuramos a busca de hiperparâmetros usando `GridSearchCV` do Scikit-learn. O argumento `n_jobs=-1` indica que queremos usar todos os núcleos disponíveis na máquina.
4. Usamos o `parallel_backend` do Joblib para especificar que queremos usar threading para paralelismo.
5. Executamos a busca de hiperparâmetros e exibimos os melhores hiperparâmetros encontrados.

Ao executar este código em um Jupyter Notebook, o Scikit-learn e o Joblib trabalharão juntos para treinar modelos em paralelo com diferentes configurações de hiperparâmetros, acelerando significativamente o processo de busca de hiperparâmetros.

### Exemplo: Busca de Hiperparâmetros com Paralelismo usando Scikit-learn e Joblib


In [None]:
import numpy as np
from sklearn.datasets import make_classification
from sklearn.model_selection import GridSearchCV
from sklearn.ensemble import RandomForestClassifier
from joblib import parallel_backend

# Gerar um conjunto de dados sintético
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)

# Definir o modelo e os hiperparâmetros a serem testados
clf = RandomForestClassifier()
param_grid = {
    'n_estimators': [10, 50, 100],
    'max_depth': [None, 10, 20, 30],
    'min_samples_split': [2, 5, 10]
}

# Configurar a busca de hiperparâmetros com paralelismo
grid_search = GridSearchCV(clf, param_grid, cv=5, n_jobs=-1)

# Executar a busca de hiperparâmetros
with parallel_backend('threading', n_jobs=-1):  # Usar todos os núcleos disponíveis
    grid_search.fit(X, y)

# Exibir os melhores hiperparâmetros encontrados
print("Best hyperparameters:", grid_search.best_params_)
print("Best cross-validation score:", grid_search.best_score_)
