# Hiperparâmetros do Random Forest

## Principais hiperparâmetros e suas funções

| Hiperparâmetro      | Função                                                                                   |
|---------------------|------------------------------------------------------------------------------------------|
| **n_estimators**    | Número de árvores na floresta. Mais árvores podem melhorar a performance, mas tornam o treinamento mais lento. |
| **max_features**    | Número de features consideradas em cada divisão (split). Controla a aleatoriedade e diversidade das árvores.   |
| **bootstrap**       | Se a amostragem é feita com reposição (bootstrap). Usado para criar diversidade entre as árvores.              |
| **max_depth**       | Profundidade máxima das árvores. Limita o crescimento para evitar overfitting.                                  |
| **min_samples_split** | Mínimo número de amostras necessárias para dividir um nó. Controla o quão facilmente as árvores crescem.      |
| **min_samples_leaf**  | Mínimo número de amostras em uma folha (nó terminal). Evita folhas muito específicas.                          |
| **random_state**    | Define a semente para geração de números aleatórios, garantindo resultados reprodutíveis.                      |

---



In [1]:
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Carregando o dataset Iris
X, y = load_iris(return_X_y=True)

# Dividindo em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Criando o modelo Random Forest com hiperparâmetros configurados
rf_model = RandomForestClassifier(
    n_estimators=100,         # 100 árvores na floresta
    max_features='sqrt',      # número de features = raiz quadrada do total (padrão para classificação)
    bootstrap=True,           # amostragem com reposição
    max_depth=5,              # limita a profundidade das árvores para evitar overfitting
    min_samples_split=4,      # nó só será dividido se tiver pelo menos 4 amostras
    min_samples_leaf=2,       # folhas devem ter no mínimo 2 amostras
    random_state=42           # para resultados reproduzíveis
)

# Treinando o modelo
rf_model.fit(X_train, y_train)

# Fazendo previsões
y_pred = rf_model.predict(X_test)

# Avaliando a acurácia
print("Acurácia (Random Forest):", accuracy_score(y_test, y_pred))


Acurácia (Random Forest): 1.0
