# Modelos de Ensemble
Ensemble, em Machine Learning, refere-se a uma abordagem onde múltiplos modelos (geralmente chamados de "modelos fracos" ou "modelos base") são treinados e combinados para resolver um problema específico. A ideia central é que, ao combinar vários modelos, o conjunto resultante (ensemble) pode superar o desempenho de qualquer modelo individual.

Essa técnica baseia-se no princípio de que diferentes modelos podem capturar diferentes padrões ou erros nos dados. Ao agregá-los, os erros individuais tendem a se cancelar, enquanto os sinais (informações corretas) são reforçados.

- **Melhoria do Desempenho:** Modelos de ensemble geralmente têm melhor performance em termos de precisão e robustez em comparação com modelos individuais.
- **Redução de Variância e Viés:**
    -Redução de Variância: Combinações como o Bagging ajudam a reduzir a variabilidade dos modelos, tornando as previsões mais estáveis.
    -Redução de Viés: Técnicas como o Boosting focam em corrigir os erros dos modelos anteriores, reduzindo o viés total.
- **Robustez:** Modelos de ensemble são menos propensos a overfitting, especialmente quando os modelos individuais são diversos.



### Bagging
- Bagging é uma técnica de ensemble que combina múltiplos modelos de aprendizado de máquina para aumentar a precisão do modelo. 

- Bagging é uma abreviação de Bootstrap Aggregating.

- Random Forest é um exemplo que utiliza múltiplas árvores de decisão.




In [None]:
from sklearn.ensemble import RandomForestClassifier

modelo_rf = RandomForestClassifier(n_estimators=100)
modelo_rf.fit(X_train, y_train)


### Boosting

- Boosting é uma técnica de ensemble que combina múltiplos modelos de aprendizado de máquina para aumentar a precisão do modelo. Boosting treina modelos sequencialmente, onde cada modelo tenta corrigir os erros do anterior. 

- O modelo final é uma combinação ponderada de todos os modelos.

- Exemplos de algoritmos de Boosting incluem AdaBoost, Gradient Boosting e XGBoost.


In [None]:
#AdaBoost

from sklearn.ensemble import AdaBoostClassifier

modelo_adaboost = AdaBoostClassifier(n_estimators=50)
modelo_adaboost.fit(X_train, y_train)


In [None]:
#Gradient Boosting
from sklearn.ensemble import GradientBoostingClassifier

modelo_gb = GradientBoostingClassifier(n_estimators=100)
modelo_gb.fit(X_train, y_train)


### Função de Perda: Entropia Cruzada

- A entropia cruzada é uma métrica comum para avaliar a qualidade de um modelo de classificação.

- A entropia cruzada mede a divergência entre duas distribuições de probabilidade: a distribuição real dos dados e a distribuição prevista pelo modelo.

- A entropia cruzada é frequentemente usada como função de perda em problemas de classificação binária e multiclasse.

A fórmula de perda de entropia cruzada para classificação binária é dada por:

\begin{equation}
loss = 1/N \sum_{i=1}^{N} -[y_i * log(\hat{y}_i) + (1-y_i) * log(1-\hat{y}_i)]
\end{equation}




