In [1]:
# Importar bibliotecas
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score

# 1. Carregar o conjunto de dados Iris
iris = datasets.load_iris()
X = iris.data  # Características (comprimento/largura das pétalas e sépalas)
y = iris.target  # Classes das flores (Setosa, Versicolor, Virginica)

# 2. Dividir os dados em treino (80%) e teste (20%)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 3. Criar e treinar o modelo de Machine Learning
modelo = DecisionTreeClassifier()  # Modelo de Árvore de Decisão
modelo.fit(X_train, y_train)  # Treinar o modelo


# 4. Fazer previsões no conjunto de teste
y_pred = modelo.predict(X_test)
print(f'y_pred')

# 5. Avaliar o modelo com precisão (accuracy)
precisao = accuracy_score(y_test, y_pred)
print(f'A precisão do modelo é: {precisao:.2f}')



y_pred
A precisão do modelo é: 1.00


In [10]:
from sklearn.model_selection import GridSearchCV
from sklearn.ensemble import RandomForestRegressor

# Criar modelo
modelo = RandomForestRegressor()

# Definir hiperparâmetros a testar
parametros = {
    "n_estimators": [50, 100, 200],
    "max_depth": [None, 10, 20],
    "min_samples_split": [2, 5, 10]
}

# Aplicar Grid Search
grid_search = GridSearchCV(modelo, parametros, cv=5, scoring="neg_mean_absolute_error", n_jobs=-1)
grid_search.fit(X_train, y_train)

# Melhor combinação de hiperparâmetros
print("Melhores parâmetros:", grid_search.best_params_)

#outro Random Search (Busca Aleatória)

from sklearn.model_selection import RandomizedSearchCV

random_search = RandomizedSearchCV(modelo, parametros, n_iter=10, cv=5, scoring="neg_mean_absolute_error", n_jobs=-1, random_state=42)
random_search.fit(X_train, y_train)

print("Melhores parâmetros:", random_search.best_params_)

# Optuna / Bayesian Optimization (Otimização Bayesiana)'
#import optuna

#def objetivo(trial):
   ## max_depth = trial.suggest_int("max_depth", 5, 50)
    #n_estimators = trial.suggest_int("n_estimators", 50, 500)
    
    #modelo = RandomForestRegressor(n_estimators=n_estimators, max_depth=max_depth)
    #modelo.fit(X_train, y_train)
    #return -mean_absolute_error(y_test, modelo.predict(X_test))

##estudo = optuna.create_study(direction="minimize")
#estudo.optimize(objetivo, n_trials=30)




Melhores parâmetros: {'max_depth': 10, 'min_samples_split': 2, 'n_estimators': 50}
Melhores parâmetros: {'n_estimators': 50, 'min_samples_split': 2, 'max_depth': 10}


#print("Melhores parâmetros:", estudo.best_params)
Qual método usar?
✅ Se tiver poucos hiperparâmetros → Grid Search
✅ Se precisar de rapidez → Random Search
✅ Se quiser eficiência máxima → Optuna ou Bayesian Optimization