# Principais diferenças.

| **Aspecto**           | **AdaBoost**                                                 | **Random Forest**                                            |
|------------------------|-------------------------------------------------------------|-------------------------------------------------------------|
| **Estratégia**         | Constrói modelos sequencialmente, ajustando pesos a cada iteração. | Constrói modelos de forma paralela e independente.          |
| **Base do modelo**     | Usa modelos fracos (como árvores de decisão rasas) e os combina para criar um modelo forte. | Constrói múltiplas árvores de decisão profundas e as combina por votação. |
| **Peso dos modelos**   | Atribui pesos diferentes aos modelos com base em seu desempenho. | Todos os modelos têm o mesmo peso na votação final.         |
| **Robustez a ruídos**  | Menos robusto, pois pode superajustar dados com ruídos significativos. | Mais robusto a ruídos, devido à combinação de múltiplas árvores. |
| **Velocidade**         | Mais lento, pois os modelos são construídos sequencialmente. | Geralmente mais rápido devido à construção paralela.         |


# os 5 hyperparametros importantes

| **Hiperparâmetro**     | **Descrição**                                                                 | **Valores Comuns**                   |
|------------------------|-------------------------------------------------------------------------------|--------------------------------------|
| `n_estimators`         | Número de estimadores (modelos fracos) a serem treinados.                    | Inteiros, como `50`, `100`, `200`.   |
| `learning_rate`        | Taxa de aprendizado que reduz a contribuição de cada modelo.                 | Valores entre `0.01` e `1.0`.        |
| `algorithm`            | Tipo de algoritmo usado para combinar os estimadores.                       | `SAMME` ou `SAMME.R` (padrão).       |
| `base_estimator`       | Modelo base usado como estimador fraco (geralmente uma árvore de decisão rasa). | `DecisionTreeClassifier` (padrão).  |
| `random_state`         | Semente para geração de números aleatórios, garantindo reprodutibilidade.    | Inteiro (ex.: `42`) ou `None`.       |


# passo a passo de acordo com o site.

In [6]:
from sklearn.ensemble import AdaBoostClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import train_test_split
X, y = load_iris(return_X_y=True)

clf = AdaBoostClassifier(n_estimators=100, algorithm="SAMME", random_state=0)
clf.fit(X, y)
clf.predict([[0, 0, 0, 0]])
clf.score(X, y)

0.98

In [11]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
param_grid = {
    'n_estimators': [10, 50, 100],
    'learning_rate': [0.01, 0.1, 1],
    'algorithm': ['SAMME', 'SAMME.R']
}
grid_search = GridSearchCV(estimator=clf , param_grid=param_grid, cv=5, scoring='accuracy')


grid_search.fit(X_train, y_train)


print("Melhores hiperparâmetros:", grid_search.best_params_)
print("Melhor pontuação (acurácia):", grid_search.best_score_)


best_model = grid_search.best_estimator_
print("Acurácia no teste:", best_model.score(X_test, y_test))



Melhores hiperparâmetros: {'algorithm': 'SAMME', 'learning_rate': 0.1, 'n_estimators': 100}
Melhor pontuação (acurácia): 0.9583333333333334
Acurácia no teste: 1.0
