1 - Cite 5 diferenças entre o Random Forest e o AdaBoost


1. **Algoritmo base:**
   - **AdaBoost** é um algoritmo de aprendizado de máquina ensemble que se concentra em melhorar o desempenho combinado de vários classificadores fracos, como árvores (Stumps) de decisão com pouca profundidade (profundidade 1). 
   - **Random Forest** é um algoritmo de aprendizado de máquina ensemble que cria múltiplas árvores de decisão independentes durante o treinamento e combina suas previsões para obter uma previsão final.

2. **Peso das amostras:**
   - **AdaBoost** atribui pesos às amostras durante o treinamento, dando mais importância às amostras mal classificadas para que o próximo classificador se concentre nelas.
   - **Random Forest** não atribui pesos às amostras; cada árvore é treinada em um subconjunto aleatório de dados, e todas as amostras têm igual importância no processo de treinamento.

3. **Método de combinação de previsões:**
   - **AdaBoost** combina as previsões dos classificadores fracos usando uma combinação ponderada, onde classificadores com melhor desempenho têm mais influência na previsão final.
   - **Random Forest** combina as previsões de várias árvores de decisão por meio de votação majoritária, onde a classe mais votada é escolhida como a previsão final.

4. **Sensibilidade a outliers:**
   - **AdaBoost** é sensível a outliers, pois atribui pesos às amostras mal classificadas para corrigir erros, o que pode levar a um ajuste excessivo se os outliers não forem tratados adequadamente.
   - **Random Forest** é menos sensível a outliers devido ao processo de amostragem aleatória e à votação majoritária, que reduz a influência de amostras individuais na previsão final.

5. **Interpretabilidade:**
   - **AdaBoost** pode ser menos intuitivo em termos de interpretabilidade devido à complexidade do processo de atribuição de pesos e combinação de previsões dos classificadores fracos.
   - **Random Forest** é relativamente mais fácil de interpretar, pois cada árvore de decisão individual pode ser visualizada e compreendida separadamente, além de fornecer medidas de importância de variáveis para ajudar na interpretação do modelo.

2 - Acesse o link Scikit-learn – adaboost, leia a explicação (traduza se for preciso) e crie um  jupyter notebook contendo o exemplo do AdaBoost.

In [2]:
from sklearn.model_selection import cross_val_score
from sklearn.datasets import load_iris
from sklearn.ensemble import AdaBoostClassifier

from sklearn.model_selection import GridSearchCV, RepeatedStratifiedKFold
from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import StandardScaler

X, y = load_iris(return_X_y=True)
clf = AdaBoostClassifier(n_estimators=100, algorithm="SAMME",)
scores = cross_val_score(clf, X, y, cv=5)
scores.mean()

0.9533333333333334

3 - Cite 5 Hyperparametros importantes no AdaBoost.

**class sklearn.ensemble.AdaBoostClassifier(estimator=None, *, n_estimators=50, learning_rate=1.0, algorithm='SAMME.R', random_state=None)**

* **estimator** - > valor padrão =None. Este parâmetro representa o estimador base que será usado pelo AdaBoost para construir o conjunto de estimadores.  O valor padrão é None, o que significa que o estimador base padrão será utilizado, geralmente uma árvore de decisão com pouca profundidade (DecisionTreeClassifier(max_depth=1)).
  
* **n_estimators** - > valor padrão =50. Este parâmetro define o número de estimadores (classificadores fracos) que serão combinados para formar o modelo final do AdaBoost. Um número maior de estimadores pode aumentar a capacidade do modelo de se ajustar aos dados de treinamento, mas também pode aumentar o tempo de treinamento e o risco de overfitting.
  
* **learning_rate** - > valor padrão =1.0. O learning_rate controla a contribuição de cada estimador para a correção dos erros do modelo durante o treinamento. Valores menores de learning_rate levam a uma correção mais gradual dos erros e geralmente requerem um número maior de estimadores para alcançar um bom desempenho. Por outro lado, valores maiores podem levar a um treinamento mais rápido, mas também aumentam o risco de overfitting.
  
* **algorithm** -> O algoritmo determina como os pesos das amostras são atualizados durante o treinamento. As opções comuns são 'SAMME' (Stagewise Additive Modeling using a Multi-class Exponential loss function) e 'SAMME.R' (SAMME Real), sendo este último uma versão mais suave do primeiro que usa probabilidades relativas para atualização de pesos.
  
* **random_state** - > valor padrão = None. Controla a contribuição de cada estimador para a correção dos erros do modelo. Quando um valor específico é fornecido, ele garante que o treinamento seja reproduzível e produza resultados consistentes em diferentes execuções. No entanto, se deixado como None, o processo de treinamento usará uma semente aleatória diferente a cada vez, o que pode resultar em resultados variáveis em diferentes execuções.


4 -  (Opcional) Utilize o GridSearch para encontrar os melhores hyperparametros para o conjunto de dados do exemplo (load_iris)

In [7]:
%%time
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.ensemble import AdaBoostClassifier
from sklearn.metrics import accuracy_score

# Carregar o conjunto de dados Iris
iris = load_iris()
X = iris.data
y = iris.target

# Dividir o conjunto de dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Criar um classificador AdaBoost
ada_boost = AdaBoostClassifier(random_state=42)

# Definir os parâmetros para grid search
parameters = {
    'n_estimators': [50, 100, 150],
    'learning_rate': [0.1, 0.5, 1.0]
    
}

# Criar um objeto GridSearchCV
grid_search = GridSearchCV(estimator=ada_boost, param_grid=parameters, cv=5)

# Treinar o modelo com grid search
grid_search.fit(X_train, y_train)

# Obter os melhores parâmetros
best_params = grid_search.best_params_
print("Melhores parâmetros encontrados:")
print(best_params)

# Fazer previsões no conjunto de teste com os melhores parâmetros
best_model = grid_search.best_estimator_
y_pred = best_model.predict(X_test)

# Calcular a acurácia do modelo
accuracy = accuracy_score(y_test, y_pred)
print(f"Acurácia do AdaBoost com melhores parâmetros: {accuracy}")


Melhores parâmetros encontrados:
{'learning_rate': 1.0, 'n_estimators': 50}
Acurácia do AdaBoost com melhores parâmetros: 1.0
CPU times: total: 5.3 s
Wall time: 8.52 s
