<a href="https://colab.research.google.com/github/suelen-prs/EBAC/blob/main/Exercicio2_Modulo24.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Importações necessárias
from sklearn.ensemble import AdaBoostClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import GridSearchCV

# 1. Cite 5 diferenças entre o RandomForest e o AdaBoost os do exemplo (load_iris)

**Método de Construção:** RandomForest constrói várias árvores de decisão independentemente usando amostras de bootstrap dos dados. AdaBoost constrói modelos sequencialmente, onde cada modelo subsequente tenta corrigir os erros do anterior.

**Ponderação das Previsões:** No RandomForest, todas as árvores contribuem igualmente para a previsão final. No AdaBoost, modelos subsequentes recebem pesos baseados na precisão dos modelos anteriores, com modelos mais precisos tendo maior influência.

**Tratamento de Erros:** RandomForest trata erros reduzindo a variância através do ensemble de árvores. AdaBoost foca na redução de bias (viés), dando mais peso aos exemplos que foram classificados incorretamente.

**Seleção de Atributos:** No treinamento de RandomForest, um subconjunto aleatório de atributos é considerado para cada divisão. No AdaBoost, todos os atributos estão disponíveis para cada modelo na sequência.

**Complexidade e Overfitting:** RandomForest é geralmente robusto contra overfitting, especialmente quando o número de árvores é grande. AdaBoost pode ser mais suscetível a overfitting, especialmente em dados com ruído.

# 2. Acesse o link Scikit-learn–adaboost, leia a explicação (traduza se for preciso) e crie um jupyternotebook contendo o exemplo do AdaBoost.

In [None]:
# Carregar o conjunto de dados
iris = load_iris()
X, y = iris.data, iris.target

# Dividir em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Instanciar o modelo AdaBoost
ada_clf = AdaBoostClassifier(n_estimators=50, random_state=42)

# Treinar o modelo
ada_clf.fit(X_train, y_train)

# Avaliar o modelo
print(f"Score de Treinamento: {ada_clf.score(X_train, y_train)}")
print(f"Score de Teste: {ada_clf.score(X_test, y_test)}")


Score de Treinamento: 0.9666666666666667
Score de Teste: 1.0


# 3. Cite 5 Hyperparametrosimportantes no AdaBoost.

**n_estimators:** Número de modelos sequenciais a serem incluídos no ensemble.

**learning_rate:** Peso aplicado a cada classificador em cada iteração de boosting.

**base_estimator:** O modelo base utilizado para o processo de boosting, com um DecisionTreeClassifier de profundidade 1 como padrão.

**algorithm:** O algoritmo de boosting a ser usado, SAMME ou SAMME.R.

**random_state:** Controla a aleatoriedade do processo de seleção das amostras, garantindo resultados reproduzíveis

#4. (Opcional) Utilize o GridSearchpara encontrar os melhores hyperparametrospara o conjunto de dados do exemplo (load_iris)

In [None]:
# Carregar o conjunto de dados e dividir
iris = load_iris()
X, y = iris.data, iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Configurar o espaço de hiperparâmetros para testar
param_grid = {
    'n_estimators': [50, 100, 200],
    'learning_rate': [0.01, 0.1, 1]
}

# Instanciar o modelo AdaBoost com um classificador base
ada_clf = AdaBoostClassifier(base_estimator=DecisionTreeClassifier(max_depth=1), random_state=42)

# Instanciar e executar o GridSearch
grid_search = GridSearchCV(ada_clf, param_grid, cv=5, scoring='accuracy')
grid_search.fit(X_train, y_train)

# Melhores parâmetros e score
print(f"Melhores Parâmetros: {grid_search.best_params_}")
print(f"Melhor Score de Cross-Validation: {grid_search.best_score_}")




Melhores Parâmetros: {'learning_rate': 1, 'n_estimators': 200}
Melhor Score de Cross-Validation: 0.9416666666666668


# 5. Acessando o artigo do Jerome Friedman (Stochastic) e pensando no nome dado ao Stochastic GBM, qual é a maior diferença entre os dois algoritmos?

A maior diferença entre o Gradient Boosting Machine (GBM) tradicional e o Stochastic Gradient Boosting Machine (SGBM), conforme introduzido por Jerome Friedman, reside no processo de amostragem utilizado durante o treinamento das árvores.

No GBM tradicional, todas as árvores são treinadas usando todo o conjunto de dados de treinamento. Cada árvore tenta corrigir os erros da árvore anterior, focando nas instâncias mais difíceis de prever corretamente.

No Stochastic Gradient Boosting Machine (SGBM), por outro lado, cada árvore é treinada em uma amostra aleatória do conjunto de dados de treinamento. Esta amostra é tirada com reposição (bootstrap sample), semelhante ao que é feito no Bagging. A principal diferença é que, em vez de construir árvores em paralelo como no Bagging, o SGBM constrói as árvores sequencialmente, onde cada nova árvore é construída para corrigir os erros deixados pelas árvores anteriores.

Essa abordagem estocástica introduz mais diversidade nas árvores construídas, o que pode ajudar a reduzir o risco de overfitting e melhorar a generalização do modelo em dados não vistos. Além disso, treinar em subconjuntos dos dados torna o processo mais eficiente computacionalmente, permitindo que o SGBM lidere com grandes conjuntos de dados de forma mais eficaz.