# Rodrigo Schulz

### 1. Diferenças entre Random Forest e Adaboost:

Random Forest:

É um ensemble de árvores de decisão que treina várias árvores independentes e combina suas previsões para obter um resultado final.
As árvores são treinadas de forma paralela.
A ponderação das árvores é igual para todas elas.
Cada árvore é construída a partir de um subconjunto aleatório dos dados de treinamento (amostragem com reposição).
Reduz o overfitting e é menos sensível a dados ruidosos.
Adaboost (Adaptive Boosting):

É um ensemble de árvores de decisão (ou outros classificadores fracos) que treina várias iterações, onde cada iteração dá mais peso aos exemplos classificados incorretamente nas iterações anteriores.
As árvores são treinadas sequencialmente, dando mais ênfase aos exemplos classificados incorretamente nas iterações anteriores.
A ponderação das árvores varia a cada iteração, dando mais peso às árvores que têm melhor desempenho.
Cada árvore é construída a partir de um subconjunto ponderado dos dados de treinamento, onde os exemplos classificados incorretamente recebem mais peso.
Pode ser mais suscetível ao overfitting se o número de iterações for muito alto ou se os classificadores fracos forem muito complexos.






### 2. Utilizando Adaboost

In [1]:
# Importando as bibliotecas necessárias
from sklearn.ensemble import AdaBoostClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Carregando o conjunto de dados Iris
iris = load_iris()
X = iris.data
y = iris.target

# Dividindo os dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Criando o classificador Adaboost usando árvores de decisão como classificador base
adaboost_clf = AdaBoostClassifier(n_estimators=50, random_state=42)

# Treinando o modelo
adaboost_clf.fit(X_train, y_train)

# Realizando previsões no conjunto de teste
y_pred = adaboost_clf.predict(X_test)

# Calculando a acurácia do modelo
accuracy = accuracy_score(y_test, y_pred)
print("Acurácia do modelo Adaboost:", accuracy)


Acurácia do modelo Adaboost: 1.0


### 3. Cinco hiperparâmetros importantes no Adaboost:

- base_estimator: O estimador base a ser usado no ensemble. Por padrão, são usadas árvores de decisão fracas (DecisionTreeClassifier(max_depth=1)), mas você pode usar outros classificadores fracos também.
- n_estimators: O número máximo de estimadores (ou classificadores fracos) que serão combinados. É importante ajustar esse hiperparâmetro, pois um número muito alto pode levar ao overfitting.
- learning_rate: Controla a contribuição de cada estimador no ensemble. Valores menores requerem mais estimadores para alcançar a mesma precisão.
- algorithm: O algoritmo usado para atualizar os pesos das amostras em cada iteração. Pode ser 'SAMME' para classificação binária ou 'SAMME.R' para regressão e classificação multiclasse.
- random_state: Controla a aleatoriedade para reprodução dos resultados.

### 4. Utilizando Gridsearch para encontrar os melhores hiperparametros

In [4]:
from sklearn.model_selection import GridSearchCV
from sklearn.tree import DecisionTreeClassifier

# Definindo os hiperparâmetros a serem testados
param_grid = {
    'n_estimators': [50, 100, 150],       # Testando diferentes números de estimadores
    'learning_rate': [0.01, 0.1, 0.5],    # Testando diferentes taxas de aprendizado
    'base_estimator__max_depth': [1, 2, 3] # Testando diferentes profundidades máximas da árvore base
}

# Criando o classificador Adaboost
adaboost_clf = AdaBoostClassifier(base_estimator=DecisionTreeClassifier(), random_state=42)

# Criando o objeto GridSearchCV
grid_search = GridSearchCV(adaboost_clf, param_grid, cv=5, scoring='accuracy')

# Realizando a busca pelos melhores hiperparâmetros
grid_search.fit(X, y)

# Imprimindo os melhores hiperparâmetros encontrados
print("Melhores hiperparâmetros encontrados:")
print(grid_search.best_params_)










Melhores hiperparâmetros encontrados:
{'base_estimator__max_depth': 3, 'learning_rate': 0.01, 'n_estimators': 50}


