## Optuna: Otimização de Hiperparâmetros

Optuna é uma biblioteca Python de código aberto para otimização de hiperparâmetros. Ele permite que você encontre os melhores valores para os hiperparâmetros de seus modelos de aprendizado de máquina, maximizando seu desempenho.

**Como ele trata uma base de dados?**

Optuna não manipula diretamente a base de dados. Ele se concentra em encontrar os melhores hiperparâmetros para um modelo específico que você definir. Você fornece a Optuna:

1. **O modelo:** O modelo de aprendizado de máquina que você deseja otimizar (por exemplo, Random Forest, XGBoost, etc.).
2. **Os hiperparâmetros:** Os parâmetros do modelo que deseja otimizar (por exemplo, número de árvores em Random Forest, profundidade máxima das árvores, etc.).
3. **A métrica:** O critério que você deseja otimizar (por exemplo, precisão, recall, F1-score, etc.).
4. **A base de dados:** Essa é usada para treinar e avaliar o modelo com diferentes configurações de hiperparâmetros.

**Optuna funciona realizando uma busca aleatória inteligente**:

1. Ele cria uma série de tentativas aleatórias de combinações de hiperparâmetros.
2. Para cada combinação, ele treina o modelo e avalia seu desempenho na base de dados.
3. Ele utiliza a informação dos resultados para guiar as próximas tentativas, direcionando a busca para regiões promissoras do espaço de hiperparâmetros.

**Exemplo Simples em Python:**

```python
import optuna

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

def objective(trial):
    # Carrega os dados
    iris = load_iris()
    X = iris.data
    y = iris.target
    
    # Divide os dados em treinamento e teste
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

    # Define os hiperparâmetros para otimizar
    n_estimators = trial.suggest_int('n_estimators', 10, 100)
    max_depth = trial.suggest_int('max_depth', 2, 10)

    # Cria o modelo
    model = RandomForestClassifier(n_estimators=n_estimators, max_depth=max_depth)

    # Treina o modelo
    model.fit(X_train, y_train)

    # Avalia o modelo
    y_pred = model.predict(X_test)
    accuracy = accuracy_score(y_test, y_pred)

    # Retorna a métrica (neste caso, a precisão)
    return accuracy

# Realiza a otimização
study = optuna.create_study(direction="maximize")
study.optimize(objective, n_trials=100)

# Imprime os melhores hiperparâmetros
print("Melhores hiperparâmetros encontrados:", study.best_params)
print("Melhor precisão:", study.best_value)
```

**Neste exemplo:**

1. Definimos a função `objective` que recebe uma tentativa `trial` da Optuna.
2. Dentro da função, definimos os hiperparâmetros que queremos otimizar, usando `trial.suggest_int` para valores inteiros e `trial.suggest_float` para valores decimais.
3. Treinamos o modelo e calculamos a métrica (acurácia).
4. A função `objective` retorna a métrica.
5. Criamos um estudo `study` e o otimizamos usando a função `objective`.
6. Imprimimos os melhores hiperparâmetros e a melhor precisão encontrada.

* Optuna é uma ferramenta poderosa e fácil de usar para otimizar hiperparâmetros, permitindo que você explore o espaço de parâmetros de forma eficiente e encontre a melhor configuração para seu modelo de aprendizado de máquina.


In [2]:
!pip install optuna

Collecting optuna
  Downloading optuna-4.0.0-py3-none-any.whl.metadata (16 kB)
Collecting alembic>=1.5.0 (from optuna)
  Downloading alembic-1.13.2-py3-none-any.whl.metadata (7.4 kB)
Collecting colorlog (from optuna)
  Downloading colorlog-6.8.2-py3-none-any.whl.metadata (10 kB)
Collecting Mako (from alembic>=1.5.0->optuna)
  Downloading Mako-1.3.5-py3-none-any.whl.metadata (2.9 kB)
Downloading optuna-4.0.0-py3-none-any.whl (362 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m362.8/362.8 kB[0m [31m9.5 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading alembic-1.13.2-py3-none-any.whl (232 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m233.0/233.0 kB[0m [31m12.8 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading colorlog-6.8.2-py3-none-any.whl (11 kB)
Downloading Mako-1.3.5-py3-none-any.whl (78 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m78.6/78.6 kB[0m [31m5.0 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: Ma

In [3]:
import optuna

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

def objective(trial):
    # Carrega os dados
    iris = load_iris()
    X = iris.data
    y = iris.target

    # Divide os dados em treinamento e teste
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

    # Define os hiperparâmetros para otimizar
    n_estimators = trial.suggest_int('n_estimators', 10, 100)
    max_depth = trial.suggest_int('max_depth', 2, 10)

    # Cria o modelo
    model = RandomForestClassifier(n_estimators=n_estimators, max_depth=max_depth)

    # Treina o modelo
    model.fit(X_train, y_train)

    # Avalia o modelo
    y_pred = model.predict(X_test)
    accuracy = accuracy_score(y_test, y_pred)

    # Retorna a métrica (neste caso, a precisão)
    return accuracy

# Realiza a otimização
study = optuna.create_study(direction="maximize")
study.optimize(objective, n_trials=100)

# Imprime os melhores hiperparâmetros
print("Melhores hiperparâmetros encontrados:", study.best_params)
print("Melhor precisão:", study.best_value)

[I 2024-09-11 18:49:00,060] A new study created in memory with name: no-name-d23cb2ae-dee0-47d9-8916-8db750e88e4f
[I 2024-09-11 18:49:00,925] Trial 0 finished with value: 1.0 and parameters: {'n_estimators': 86, 'max_depth': 7}. Best is trial 0 with value: 1.0.
[I 2024-09-11 18:49:01,776] Trial 1 finished with value: 1.0 and parameters: {'n_estimators': 56, 'max_depth': 5}. Best is trial 0 with value: 1.0.
[I 2024-09-11 18:49:02,190] Trial 2 finished with value: 1.0 and parameters: {'n_estimators': 70, 'max_depth': 9}. Best is trial 0 with value: 1.0.
[I 2024-09-11 18:49:02,620] Trial 3 finished with value: 1.0 and parameters: {'n_estimators': 62, 'max_depth': 10}. Best is trial 0 with value: 1.0.
[I 2024-09-11 18:49:03,227] Trial 4 finished with value: 1.0 and parameters: {'n_estimators': 77, 'max_depth': 6}. Best is trial 0 with value: 1.0.
[I 2024-09-11 18:49:03,761] Trial 5 finished with value: 1.0 and parameters: {'n_estimators': 99, 'max_depth': 3}. Best is trial 0 with value: 1.

Melhores hiperparâmetros encontrados: {'n_estimators': 86, 'max_depth': 7}
Melhor precisão: 1.0


# Otimização de uma Rede LSTM - dados sintéticos

In [17]:
import optuna
import numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, Input # Make sure to import Input
from tensorflow.keras.utils import to_categorical
from sklearn.model_selection import train_test_split
from tensorflow.keras.optimizers import Adam

In [18]:
def create_model(trial):
    """Cria o modelo LSTM com hiperparâmetros definidos pelo Optuna."""

    # Define os hiperparâmetros a serem otimizados
    units = trial.suggest_int('units', 32, 128, step=32)
    dropout = trial.suggest_float('dropout', 0.0, 0.5)
    learning_rate = trial.suggest_float('learning_rate', 1e-4, 1e-2, log=True)

    # Cria o modelo LSTM
    model = Sequential()
    model.add(Input(shape=(X_train.shape[1], X_train.shape[2])))
    model.add(LSTM(units, dropout=dropout, return_sequences=True))
    model.add(LSTM(units))
    model.add(Dense(y_train.shape[1], activation='softmax'))

    # Define o otimizador
    optimizer = Adam(learning_rate=learning_rate)

    # Compila o modelo
    model.compile(loss='categorical_crossentropy', optimizer=optimizer, metrics=['accuracy'])

    return model

In [19]:
def objective(trial):
    """Função objetivo para a otimização do Optuna."""

    # Cria o modelo com os hiperparâmetros da tentativa atual
    model = create_model(trial)

    # Treina o modelo
    model.fit(X_train, y_train, epochs=10, batch_size=32, verbose=0)

    # Avalia o modelo no conjunto de teste
    _, accuracy = model.evaluate(X_test, y_test, verbose=0)

    # Retorna a acurácia como a métrica a ser otimizada
    return accuracy



In [20]:
# Carrega os dados (substitua pelo seu conjunto de dados)
# X: Dados de entrada
# y: Saídas
X = np.random.randn(100, 10, 5) # Exemplo de dados 3D para LSTM
y = np.random.randint(0, 3, size=(100))
y = to_categorical(y) # Convertendo para one-hot encoding



In [21]:
# Divide os dados em treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Cria um estudo Optuna
study = optuna.create_study(direction='maximize')
study.optimize(objective, n_trials=50)

[I 2024-09-11 19:00:01,245] A new study created in memory with name: no-name-990a6b42-6c1d-4c3e-a565-c9e45ead2ecd
[I 2024-09-11 19:00:07,695] Trial 0 finished with value: 0.4000000059604645 and parameters: {'units': 64, 'dropout': 0.21640703965241864, 'learning_rate': 0.0006569143566698815}. Best is trial 0 with value: 0.4000000059604645.
[I 2024-09-11 19:00:12,742] Trial 1 finished with value: 0.3499999940395355 and parameters: {'units': 64, 'dropout': 0.2869917777171265, 'learning_rate': 0.004738675767056707}. Best is trial 0 with value: 0.4000000059604645.
[I 2024-09-11 19:00:17,856] Trial 2 finished with value: 0.30000001192092896 and parameters: {'units': 96, 'dropout': 0.34667659315619365, 'learning_rate': 0.0003688428301544585}. Best is trial 0 with value: 0.4000000059604645.
[I 2024-09-11 19:00:23,613] Trial 3 finished with value: 0.30000001192092896 and parameters: {'units': 64, 'dropout': 0.314565145664965, 'learning_rate': 0.00017535967163698505}. Best is trial 0 with value:

In [28]:
# Imprime os melhores hiperparâmetros
print("Melhores hiperparâmetros encontrados:", study.best_params)
print("Melhor acurácia:", study.best_value)

Melhores hiperparâmetros encontrados: {'units': 64, 'dropout': 0.31793090746225156, 'learning_rate': 0.008049681085748344}
Melhor acurácia: 0.44999998807907104


* Lembrando que foi um teste com dados sintéticos

In [26]:
# Cria o modelo com os melhores hiperparâmetros
# Create a trial object with the best parameters
trial = optuna.trial.FixedTrial(study.best_params)
best_model = create_model(trial)
best_model.fit(X_train, y_train, epochs=10, batch_size=32, verbose=0)

<keras.src.callbacks.history.History at 0x7a68a01bff70>