### Cite 5 diferenças entre o Random Forest e o AdaBoost
``1.Estratégia de Aprendizado``

 ``Random Forest``: Usa ``Bagging`` (Bootstrap Aggregating), que treina vários modelos (árvores de decisão) em subconjuntos diferentes dos dados e combina os resultados por votação (classificação) ou média (regressão).
 ``AdaBoost``: Usa ``Boosting,`` onde os modelos fracos (árvores rasas, geralmente de um nível) são treinados sequencialmente, ajustando os pesos dos erros anteriores para melhorar a performance.

``2.Complexidade das Árvores``

  ``Random Forest``: Utiliza árvores profundas, que podem crescer até atingir um critério de parada (como profundidade máxima ou número mínimo de amostras por nó).
  ``AdaBoost``: Normalmente usa árvores rasas, chamadas de stumps (árvores com apenas um nível), tornando cada modelo fraco por design.

``3.Peso dos Modelos``

   ``Random Forest``: Todas as árvores contribuem igualmente para a predição final.
   ``AdaBoost``: Cada modelo recebe um peso baseado em seu desempenho, de modo que modelos mais precisos tenham maior influência na decisão final.

``4.Resistência a Overfitting``

   ``Random Forest``: Menos propenso ao overfitting, pois a aleatoriedade introduzida pelo Bagging reduz a variância.
   ``AdaBoost``: Mais sensível ao overfitting, especialmente em dados ruidosos ou com outliers, pois o modelo pode tentar se ajustar excessivamente a esses erros.

``Paralelização``

   ``Random Forest``: Pode ser facilmente paralelizado, pois as árvores são treinadas independentemente.
   ``AdaBoost``: Difícil de paralelizar, pois cada modelo depende do desempenho do anterior, exigindo um processo sequencial.

### 2.Acesse o link Scikit-learn – adaboost, leia a explicação (traduza se for preciso) e crie um jupyter notebook contendo o exemplo do AdaBoost.

O princípio central do adaboost é ajustar uma sequência de alunos fracos (ou seja, modelos que são apenas um pouco melhores do que adivinhação aleatórios, como pequenos árvores de decisão) em versões repetidamente modificadas dos dados. As previsões de todos eles são então combinados através de um voto majoritário ponderado (ou soma) a produzir a previsão final. As modificações de dados em cada chamado aumento iteração consiste em aplicar pesos w1, assim w2,...,wn para cada uma das amostras de treinamento. Inicialmente, esses pesos estão todos definidos como wi = 1/N, para que o primeiro passo simplesmente treine um aluno fraco no dados originais. Para cada iteração sucessiva, os pesos da amostra são modificado individualmente e o algoritmo de aprendizado é reaplicado para o reweweard dados. Em uma determinada etapa, aqueles exemplos de treinamento que foram previstos incorretamente pelo modelo impulsionado induzido na etapa anterior, seus pesos aumentam, enquanto os pesos diminuem para aqueles que foram previstos corretamente. Como iterações prosseguem, exemplos difíceis de prever recebem influência cada vez maior. Cada aluno fraco subsequente é assim forçado a concentre -se nos exemplos que são perdidos pelos anteriores na sequência [Htf] .

esse e um exemplo do uso do AdaBoost

In [1]:
import svc
from sklearn.model_selection import cross_val_score
from sklearn.datasets import load_iris
from sklearn.ensemble import AdaBoostClassifier

X, y = load_iris(return_X_y=True)
clf = AdaBoostClassifier(n_estimators=100)
scores = cross_val_score(clf, X, y, cv=5)
scores.mean()

np.float64(0.9533333333333334)

O número de alunos fracos é controlado pelo parâmetro n_estimators. O learning_rate parâmetro controla a contribuição dos alunos fracos em a combinação final. Por padrão, os alunos fracos são tocos de decisão. Diferente alunos fracos podem ser especificados através do estimator parâmetro. Os principais parâmetros para sintonizar para obter bons resultados são n_estimators e a complexidade dos estimadores de base (por exemplo, sua profundidade max_depth ou Número mínimo necessário de amostras para considerar uma divisão min_samples_split).

### Cite 5 Hyperparametros importantes no AdaBoost.

1.``n_estimators`` → Número de estimadores fracos (modelos base, como árvores de decisão) a serem treinados sequencialmente. Um número muito baixo pode levar a underfitting, enquanto um número muito alto pode causar overfitting.

2.``learning_rate`` → Controla o peso atribuído a cada modelo fraco. Valores menores podem exigir mais estimadores, enquanto valores maiores podem levar a overfitting.

3.``base_estimator`` → O modelo base usado como estimador fraco. Normalmente, usa-se ``DecisionTreeClassifier`` (árvore de decisão rasa), mas pode ser alterado para outros modelos.

4.``algorithm`` → Define a versão do AdaBoost utilizada. Os principais valores são:

   ``"SAMME"``: Para classificações multiclasses.
   ``"SAMME.R"``: Variante baseada em probabilidades que pode melhorar o desempenho.

5.``max_depth (quando o base_estimator é uma árvore de decisão)`` → Profundidade máxima das árvores de decisão fracas. Um valor pequeno mantém os modelos simples, enquanto um valor alto pode aumentar o risco de overfitting.

### 5.(Opcional) Utilize o GridSearch para encontrar os melhores hyperparametros para o conjunto de dados do exemplo (load_iris)

In [21]:
import pandas as pd
import numpy as np


In [22]:
credit = pd.read_csv('credit_scoring.csv', parse_dates = ['data_ref'])

credit['tempo_emprego'].fillna(-1, inplace=True)
credit.head()

The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  credit['tempo_emprego'].fillna(-1, inplace=True)


Unnamed: 0,data_ref,id_cliente,sexo,posse_de_veiculo,posse_de_imovel,qtd_filhos,tipo_renda,educacao,estado_civil,tipo_residencia,idade,tempo_emprego,qt_pessoas_residencia,renda,mau
0,2015-01-01,1,F,True,True,0,Assalariado,Secundário,Casado,Casa,49,8.605479,2.0,1916.54,0
1,2015-01-01,2,M,True,False,0,Empresário,Secundário,União,Casa,60,6.953425,2.0,2967.25,0
2,2015-01-01,3,F,True,False,0,Empresário,Secundário,Casado,Casa,28,0.682192,2.0,340.96,0
3,2015-01-01,4,F,False,True,0,Assalariado,Superior completo,Casado,Casa,60,1.879452,2.0,4903.16,0
4,2015-01-01,5,F,False,False,0,Empresário,Secundário,Casado,Casa,47,8.438356,2.0,3012.6,0


In [25]:
credit.drop(['data_ref'], axis=1, inplace=True)

In [26]:
# Split into train and test
from sklearn.model_selection import train_test_split, cross_val_score

X = credit.drop("renda", axis=1)
y = credit.renda

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1)

In [12]:

from sklearn import svm, datasets
from sklearn.model_selection import GridSearchCV

iris = datasets.load_iris()
clf = svm.SVC(kernel='linear')
clf.fit(iris.data, iris.target)