In [6]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
from sklearn.metrics import accuracy_score
from tpot import TPOTClassifier

# Carregando o conjunto de dados Iris
iris = load_iris()
X = iris.data
y = iris.target

# Dividindo o conjunto de dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# ------------------------
# AutoML com TPOT - Floresta Aleatória
# ------------------------

# Inicializando o classificador TPOT com valores reduzidos
tpot = TPOTClassifier(
    generations=3,          # Número de gerações reduzido
    population_size=10,     # Número de indivíduos (modelos) por geração reduzido
    random_state=42,        # Semente para reprodutibilidade
    verbosity=3,            # Aumentar a verbosidade para 3 (mais detalhes)
    cv=5,                   # Validação cruzada de 5 folds para otimização
)

# Treinando o modelo com a otimização de hiperparâmetros
print("Iniciando o treinamento...")
tpot.fit(X_train, y_train)

# Fazendo previsões no conjunto de teste
y_pred_tpot = tpot.predict(X_test)

# Avaliando o desempenho do modelo otimizado
tpot_accuracy = accuracy_score(y_test, y_pred_tpot)
print(f"\nTPOT - Acurácia da Floresta Aleatória otimizada: {tpot_accuracy:.4f}")

# Exportando o pipeline otimizado
tpot.export('best_random_forest_pipeline.py')

print("\nO modelo otimizado foi salvo como 'best_random_forest_pipeline.py'.")


Iniciando o treinamento...
32 operators have been imported by TPOT.
Pipeline encountered that has previously been evaluated during the optimization process. Using the score from the previous evaluation.
                                                                            
Generation 1 - Current Pareto front scores:
                                                                            
-1	0.9583333333333334	KNeighborsClassifier(input_matrix, KNeighborsClassifier__n_neighbors=3, KNeighborsClassifier__p=1, KNeighborsClassifier__weights=distance)
_pre_test decorator: _random_mutation_operator: num_test=0 Unsupported set of arguments: The combination of penalty='l2' and loss='hinge' are not supported when dual=False, Parameters: penalty='l2', loss='hinge', dual=False.
                                                                            
Generation 2 - Current Pareto front scores:
                                                                            
-1	0.9583333333