## 1.  Cite 5 diferenças entre o Random Forest e o AdaBoost

**Algoritmos base:** Random Forest é baseado em um conjunto de árvores de decisão independentes, enquanto o AdaBoost é baseado em um conjunto de classificadores fracos, geralmente árvores de decisão simples.

**Peso das amostras:** No Random Forest, cada árvore é treinada em um subconjunto aleatório dos dados de treinamento, sem considerar os pesos das amostras. No AdaBoost, cada classificador fraco é treinado com maior ênfase nas amostras classificadas incorretamente pelos classificadores anteriores, ajustando os pesos das amostras a cada iteração.

**Processo de treinamento:** Random Forest treina as árvores independentemente, de forma paralela, enquanto o AdaBoost treina os classificadores fracos sequencialmente, ajustando os pesos das amostras a cada iteração.

**Ponderação dos classificadores:** Em Random Forest, cada árvore tem o mesmo peso na previsão final. No AdaBoost, os classificadores fracos são ponderados com base em sua taxa de erro durante o treinamento, onde classificadores com menor taxa de erro têm maior peso na previsão final.

**Sensibilidade ao ruído:** Random Forest é menos sensível ao ruído nos dados de treinamento, pois as árvores individuais são treinadas em subconjuntos aleatórios dos dados. O AdaBoost pode ser mais sensível ao ruído, pois ajusta os pesos das amostras em cada iteração.

## 2. Exemplo do AdaBoost.

In [1]:
from sklearn.datasets import load_iris
from sklearn.ensemble import AdaBoostClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Carregar o conjunto de dados iris
data = load_iris()
X = data.data
y = data.target

# Dividir o conjunto de dados em treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Criar o classificador AdaBoost
adaboost = AdaBoostClassifier(n_estimators=50, random_state=42)

# Treinar o classificador
adaboost.fit(X_train, y_train)

# Fazer previsões no conjunto de teste
y_pred = adaboost.predict(X_test)

# Calcular a acurácia das previsões
accuracy = accuracy_score(y_test, y_pred)
print("Acurácia: {:.2f}%".format(accuracy * 100))


Acurácia: 100.00%


## 3. Cite 5 Hyperparametros importantes no AdaBoost.

**base_estimator:** O classificador fraco usado como base para construir o conjunto. Geralmente, árvores de decisão são usadas como classificadores fracos padrão.

**n_estimators:** O número de classificadores fracos no conjunto.

**learning_rate:** Controla a contribuição de cada classificador fraco no conjunto. Valores menores reduzem a influência de cada classificador fraco e requerem mais estimadores para atingir um desempenho semelhante.

**algorithm:** O algoritmo usado para ajustar os pesos das amostras. Pode ser "SAMME" ou "SAMME.R". "SAMME.R" é recomendado, pois permite estimativas de probabilidade.

**random_state:** O estado aleatório para garantir a reprodutibilidade dos resultados.

## 4.  Utilize o GridSearch para encontrar os melhores hyperparametros para o conjunto de dados do exemplo (load_iris)

In [2]:
from sklearn.datasets import load_iris
from sklearn.ensemble import AdaBoostClassifier
from sklearn.model_selection import GridSearchCV

# Carregar o conjunto de dados iris
data = load_iris()
X = data.data
y = data.target

# Criar o classificador AdaBoost
adaboost = AdaBoostClassifier()

# Definir os hiperparâmetros para ajustar
param_grid = {
    'n_estimators': [50, 100, 150],
    'learning_rate': [0.1, 0.5, 1.0]
}

# Realizar a busca de hiperparâmetros utilizando validação cruzada
grid_search = GridSearchCV(adaboost, param_grid, cv=5)
grid_search.fit(X, y)

# Exibir os melhores hiperparâmetros encontrados
print("Melhores hiperparâmetros:")
print(grid_search.best_params_)

# Exibir a melhor pontuação alcançada durante a busca de hiperparâmetros
print("Melhor pontuação:")
print(grid_search.best_score_)


Melhores hiperparâmetros:
{'learning_rate': 0.5, 'n_estimators': 50}
Melhor pontuação:
0.9533333333333334
