## 1. Cite 5 diferenças entre o AdaBoost e o GBM.

**Algoritmos base:** AdaBoost utiliza classificadores fracos, como árvores de decisão, para construir o conjunto final, enquanto GBM utiliza árvores de decisão como base para construir o conjunto iterativamente.

**Peso das amostras:** AdaBoost ajusta os pesos das amostras a cada iteração, dando maior importância às amostras classificadas incorretamente anteriormente. GBM ajusta os pesos das amostras a cada iteração, mas com base nos resíduos dos modelos anteriores.

**Processo de treinamento:** AdaBoost treina os classificadores fracos sequencialmente, ajustando os pesos das amostras a cada iteração. GBM treina os modelos iterativamente, onde cada modelo tenta corrigir os erros dos modelos anteriores.

**Sensibilidade ao ruído:** AdaBoost é mais sensível ao ruído nos dados de treinamento, pois ajusta os pesos das amostras a cada iteração. GBM é menos sensível ao ruído, pois os modelos subsequentes tentam corrigir os erros dos modelos anteriores.

**Taxa de aprendizado:** AdaBoost utiliza uma taxa de aprendizado fixa para controlar a contribuição de cada classificador fraco. GBM utiliza uma taxa de aprendizado para controlar a contribuição de cada modelo em cada iteração.

## 2. Exemplo de classificação e de regressão do GBM

In [1]:
from sklearn.datasets import load_iris, load_boston
from sklearn.ensemble import GradientBoostingClassifier, GradientBoostingRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, mean_squared_error

# Exemplo de classificação com Gradient Boosting
iris_data = load_iris()
X = iris_data.data
y = iris_data.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

gb_clf = GradientBoostingClassifier(n_estimators=100, learning_rate=0.1, random_state=42)
gb_clf.fit(X_train, y_train)
y_pred = gb_clf.predict(X_test)

accuracy = accuracy_score(y_test, y_pred)
print("Acurácia: {:.2f}%".format(accuracy * 100))

# Exemplo de regressão com Gradient Boosting
boston_data = load_boston()
X = boston_data.data
y = boston_data.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

gb_reg = GradientBoostingRegressor(n_estimators=100, learning_rate=0.1, random_state=42)
gb_reg.fit(X_train, y_train)
y_pred = gb_reg.predict(X_test)

mse = mean_squared_error(y_test, y_pred)
print("Erro quadrático médio: {:.2f}".format(mse))


Acurácia: 100.00%
Erro quadrático médio: 6.21


## 3. Cite 5 Hyperparametros importantes no GBM

**n_estimators:** O número de modelos de boosting a serem criados.

**learning_rate:** A taxa de aprendizado, controla a contribuição de cada modelo ao conjunto.

**max_depth:** A profundidade máxima das árvores de decisão.

**subsample:** A fração de amostras a serem usadas para o treinamento de cada árvore. Um valor menor reduz a variância, mas também pode levar a um viés maior.

**loss:** A função de perda a ser otimizada durante o treinamento.

## 4.  Utilize o GridSearch para encontrar os melhores hyperparametros para o conjunto de dados do exemplo

In [2]:
from sklearn.datasets import load_iris
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.model_selection import GridSearchCV

# Carregar o conjunto de dados iris
data = load_iris()
X = data.data
y = data.target

# Criar o classificador Gradient Boosting
gb_clf = GradientBoostingClassifier()

# Definir os hiperparâmetros para ajustar
param_grid = {
    'n_estimators': [50, 100, 150],
    'learning_rate': [0.1, 0.5, 1.0],
    'max_depth': [3, 5, None],
    'subsample': [0.8, 1.0],
}

# Realizar a busca de hiperparâmetros utilizando validação cruzada
grid_search = GridSearchCV(gb_clf, param_grid, cv=5)
grid_search.fit(X, y)

# Exibir os melhores hiperparâmetros encontrados
print("Melhores hiperparâmetros:")
print(grid_search.best_params_)

# Exibir a melhor pontuação alcançada durante a busca de hiperparâmetros
print("Melhor pontuação:")
print(grid_search.best_score_)


Melhores hiperparâmetros:
{'learning_rate': 0.1, 'max_depth': None, 'n_estimators': 50, 'subsample': 1.0}
Melhor pontuação:
0.9666666666666668


## 5. Qual é a maior diferença entre os dois algoritmos?

A maior diferença entre o Gradient Boosting e o Gradient Boosting Estocástico (Stochastic Gradient Boosting) é que o Stochastic Gradient Boosting introduz uma aleatoriedade adicional ao amostrar as instâncias de treinamento para cada modelo. Isso significa que cada modelo é ajustado em uma amostra aleatória diferente das instâncias de treinamento, o que adiciona uma abordagem estocástica ao processo de treinamento. Isso pode ajudar a reduzir o sobreajuste e melhorar a generalização do modelo.