### 1. Cite 5 diferenças entre o Random Forest e o AdaBoost:

1. **Estratégia de Construção**:
   - **Random Forest**: Constrói múltiplas árvores de decisão de forma independente, combinando suas previsões através de uma média (para regressão) ou voto majoritário (para classificação). Cada árvore é construída com um subconjunto aleatório dos dados de treinamento e um subconjunto aleatório de características.
   - **AdaBoost**: Constrói uma sequência de árvores de decisão (ou outros classificadores fracos) de forma sequencial. Cada nova árvore é ajustada para corrigir os erros das árvores anteriores, aumentando o peso dos exemplos mal classificados.

2. **Tipo de Modelo Base**:
   - **Random Forest**: Utiliza árvores de decisão completas como modelos base. Cada árvore é treinada independentemente das outras.
   - **AdaBoost**: Utiliza modelos fracos, frequentemente árvores de decisão rasas (com pouca profundidade, como árvores de decisão com um único nó de decisão).

3. **Tratamento de Erros**:
   - **Random Forest**: Não se preocupa diretamente com os erros das árvores individuais, confiando na agregação para reduzir o erro geral.
   - **AdaBoost**: Dá mais peso aos exemplos que foram mal classificados por classificadores anteriores, focando na correção desses erros.

4. **Resistência ao Overfitting**:
   - **Random Forest**: Geralmente mais robusto ao overfitting devido ao uso de árvores de decisão independentes e à técnica de bootstrap (amostragem com reposição) dos dados de treinamento.
   - **AdaBoost**: Pode ser mais suscetível ao overfitting, especialmente se os classificadores fracos forem muito complexos ou se o número de iterações for muito alto.

5. **Combinação de Previsões**:
   - **Random Forest**: Combina previsões através de votação majoritária para classificação ou média para regressão, sem priorizar árvores individuais.
   - **AdaBoost**: Combina previsões ponderando cada classificador pela sua precisão, dando maior influência aos classificadores que melhoraram a performance nas iterações anteriores.

### 2. Crie um Jupyter Notebook contendo o exemplo do AdaBoost.

In [22]:
from sklearn.model_selection import GridSearchCV, cross_val_score
from sklearn.datasets import load_iris
from sklearn.ensemble import AdaBoostClassifier

In [23]:
X, y = load_iris(return_X_y=True)
clf = AdaBoostClassifier(n_estimators=100)
scores = cross_val_score(clf, X, y, cv=5)
scores.mean()

0.9466666666666665

### 3. Cite 5 hyperparametros importantes no AdaBoost.

1. **`estimator`**:
   - **Descrição**: Classificador base para criar os *weak/base learners (Stumps)*. Por padrão, o estimador base é o algoritmo de árvore de decisão `DecisionTreeClassifier(max_depth=1)`. Sucessor do hiperparâmetro descontinuado `base_estimator`.
   - **Importância**: Define o tipo de classificador fraco utilizado em cada iteração do AdaBoost.

2. **`n_estimators`**:
   - **Descrição**: Número máximo de iterações para finalizar o processo de aprendizagem. Pode ser interrompido antes deste limite caso seja considerado perfeito. Quanto maior o número de estimadores, maior será o tempo de treinamento. Também se refere à quantidade de *Stumps*.
   - **Importância**: Aumentar o número de estimadores pode melhorar a performance, mas também aumenta o tempo de treinamento.

3. **`learning_rate`**:
   - **Descrição**: Valor do peso aplicado a cada classificador nas iterações de reforço. A relevância dos *Stumps* pode aumentar conforme essa definição, podendo haver uma compensação entre este hiperparâmetro e o `n_estimators`. Também conhecido como a taxa de aprendizado do AdaBoost.
   - **Importância**: Controla a contribuição de cada classificador fraco, influenciando a robustez e a precisão do modelo.

4. **`algorithm` (para `AdaBoostClassifier`)**:
   - **Descrição**: Define o algoritmo utilizado para atualizar os pesos dos exemplos durante o treinamento. Pode ser `SAMME` (Discrete AdaBoost) ou `SAMME.R` (Real AdaBoost), onde `SAMME.R` é recomendado para melhor desempenho.
   - **Importância**: O algoritmo selecionado pode afetar a eficiência e a performance do modelo, especialmente em problemas multiclasse.

5. **`loss` (para `AdaBoostRegressor`)**:
   - **Descrição**: Em problemas de regressão, este hiperparâmetro define a "função de perda" a ser usada ao atualizar os pesos após cada iteração de reforço. Pode ser `linear`, `square` ou `exponential`, tendo `linear` como padrão.
   - **Importância**: A função de perda selecionada afeta como os erros são corrigidos e, consequentemente, a performance do regressor.

### 4.(Opcional) Utilize o GridSearch para encontrar os melhores hyperparametros para o conjunto de dados do exemplo (load_iris)

In [24]:
from sklearn.tree import DecisionTreeClassifier

In [25]:
base_clf = DecisionTreeClassifier()
clf = AdaBoostClassifier(estimator=base_clf)

param_grid = {
    'n_estimators': [50, 100, 150],
    'learning_rate': [0.01, 0.1, 1],
    'estimator__max_depth': [1, 2, 3, 4]
}

grid_search = GridSearchCV(clf, param_grid, cv=5, scoring='accuracy', n_jobs=-1)

grid_search.fit(X, y)

best_params = grid_search.best_params_
print("Melhores hiperparâmetros encontrados:", best_params)

best_clf = grid_search.best_estimator_
scores = cross_val_score(best_clf, X, y, cv=5)
print("Acurácia média com os melhores hiperparâmetros:", scores.mean())

Melhores hiperparâmetros encontrados: {'estimator__max_depth': 3, 'learning_rate': 0.01, 'n_estimators': 50}
Acurácia média com os melhores hiperparâmetros: 0.9666666666666668
