# __AdaBoost__
O **AdaBoost** é um algoritmo de *ensemble* que combina vários modelos fracos, como **stumps** (que são árvores de decisão com profundidade 1), para fazer a construção de um modelo mais forte e preciso. O conceito principal em torno do AdaBoost é fortalecer esses modelos fracos de forma adaptativa, ajustando o peso das amostras com base na dificuldade de classificação.

## __Conceito e Intuição:__
Ele foi introduzido cmo uma forma de melhorar o desempenho de classificadores simples por meio de _Boosting_. Ou seja, ao combinar vários modelos fracos de forma inteligente, o AdaBoost consegue criar um modelo final forte e robusto. Ao invés de treinar um único classificador forte, ele treina diversos classificadores fracos e ajusta suas previsões com base nos erros dos classificadores anteriores.

## __Funcionamento:__
É um algoritmo que funciona em várias iterações, e em cada uma dessas iterações ele ajusta o peso das amostras dos classificadores.

- 1) __Inicialização dos pesos:__ Inicialmente, cada amostra do conjunto de dados recebe um peso igual, para que o classificador trate as amostras com o mesmo grau de importância.
- 2) __Treinamento do stump:__ O stump é o que utilizamos como classificador fraco. Esse stump tenta dividir os dados da forma mais precisa que for possível, mas com grandes limitações.
- 3) __Avaliação e Cálculo do Erro:__ A taxa de erro é utilizada para ajustar o peso do classificador e determinar o quanto ele deve influenciar as previsões finais. Classificadores que tiverem uma performance melhor irão receber pesos maiores, tornando-os mais influentes na hora da classificação final.
- 4) __Ajuste dos Pesos:__ Após cada iteração do classificador, é realizado o ajuste do peso das amostras. Nesse ajuste, amostras que foram classificadas incorretamente irão receber um peso maior, enquanto as classificadas corretamente irão receber um peso menor. Esse ajuste faz com que o classificador foque mais nas amostras que são difíceis de classificar, permitindo que o modelo se aperfeiçoe ao longo das iterações.
- 5) __Construção Sequencial dos Stumps:__ Cada stump é contruído de forma sequencial, onde o próximo modelo depende dos erros do modelo anterior para poder melhorar sua capacidade de classificação. Isso faz parte do processo iterativo mencionado anteriormente, e é um processo importantíssimo no AdaBoost, pois permite que o stump seguinte foque nos erros do stump anterior para que faça uma melhor classificação de amostras difíceis.
- 6) __Combinação dos Classificadores:__ Após realizar diversas iterações, o AdaBoost combina esses classificadores fracos ponderando cada um conforme a precisão. O modelo final irá utilizar uma votação ponderada, onde os classificadores mais precisos tem maior influência nas previsões.

## __Vantagens e Desvantagens__
__Vantagens:__
- Possui uma chance menor de acabar em Overfitting;
- É um algoritmo relativamente simples e eficiênte;
- Tem uma grande capacidade de adaptação.

__Desvantagens:__
- Embora seja um pouco resistente a ruídos, pode acabar dando um peso maior a ruídos que existirem no conjunto de dados;
- Precisa de classificadores fracos de boa qualidade.

## __Hiperparâmetros__
O número de iterações (classificadores fracos), e o learning rate, são alguns dos hiperparâmetros importantes de se ajustar para melhorar o desempenho do AdaBoost.

## __Pré-processamento__
- Limpar os dados de forma a remover outliers e remover ou corrigir valores ausentes;
- Avaliar a necessidade de normalização ou padronização dos dados, pois pode ajudar a melhorar o desempenho do modelo;
- Codificar varáveis categóricas, pois o AdaBoost utiliza variáveis numéricas;
- Seleção cuidadosa de variáveis.

In [None]:
# Importação do google drive
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
# Importações
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import pickle
import warnings
warnings.filterwarnings('ignore')
plt.style.use('ggplot')

from sklearn.ensemble import AdaBoostClassifier
from sklearn.model_selection import cross_val_score, StratifiedKFold

In [None]:
alvo = pd.read_pickle('/content/drive/MyDrive/Udemy/ML com Python/1 - Aprendizado Supervisionado: Classificacao/heart.pkl')

# Variáveis previsoras onde as variáveis categóricas foram transformadas em numéricas manualmente, sem escalonamento
previsores = pd.read_pickle('/content/drive/MyDrive/Udemy/ML com Python/1 - Aprendizado Supervisionado: Classificacao/heart2.pkl')

# previsores_esc = pd.read_pickle('/content/drive/MyDrive/Udemy/ML com Python/1 - Aprendizado Supervisionado: Classificacao/heart3.pkl')

# Variáveis previsoras onde as variáveis categóricas foram transformadas em numéricas pelo LabelEncoder.
previsores2 = pd.read_pickle('/content/drive/MyDrive/Udemy/ML com Python/1 - Aprendizado Supervisionado: Classificacao/heart4.pkl')

# Variáveis previsoras onde as variáveis categóricas foram transformadas em numéricas pelo LabelEncoder e OneHotEncoder, sem escalonamento.
previsores3 = pd.read_pickle('/content/drive/MyDrive/Udemy/ML com Python/1 - Aprendizado Supervisionado: Classificacao/heart5.pkl')

# Variáveis previsoras onde as variáveis categóricas foram transformadas pelo LabelEncoder e OHE, com escalonamento.
previsores3_esc = pd.read_pickle('/content/drive/MyDrive/Udemy/ML com Python/1 - Aprendizado Supervisionado: Classificacao/heart6.pkl')

In [None]:
# Criação do modelo
adaboost = AdaBoostClassifier(random_state=0)
skfold = StratifiedKFold(n_splits=5, shuffle=True, random_state=0)
resultado = cross_val_score(adaboost, previsores3_esc, alvo, cv=skfold)
print('Média: ', resultado.mean())
print('Desvio padrão: ', resultado.std())

Média:  0.8560940841054883
Desvio padrão:  0.030162951625930887


In [None]:
from sklearn.model_selection import GridSearchCV

In [None]:
# Valores a testar
params = {
    'n_estimators': [50, 100, 200, 300],
    'learning_rate': [1.0, 0.1, 0.01, 0.001],
    'random_state': [0]
}

In [None]:
grid = GridSearchCV(estimator=adaboost, param_grid=params, cv=skfold)
grid.fit(previsores3_esc, alvo)

In [None]:
# Melhores parâmetros
print(f'Melhores parâmetros: {grid.best_params_}')
print(f'Melhor score: {grid.best_score_}')

Melhores parâmetros: {'learning_rate': 0.1, 'n_estimators': 300, 'random_state': 0}
Melhor score: 0.8615169874079355
