# <font color='blue'>Otimização dos Parâmetros com Randomized Search</font>

Gradient Boosting ou Gradient Boostted Regression Trees (GBRT) é uma técnica de aprendizagem estatística não-paramétrica usada para problemas de <b>classificação e regressão</b>


Gradient Boosting = Gradient Descent + Boosting.

1 - Gera um regressor

2 - Computa o erro residual

3 - Aprende a prever o resíduo

<font color='red'>Como Funciona o Gradient Boosting</font>

1 - Realiza um conjunto de previsões (y)

2 - Calcula o erro das previsões (j)

3 - Tenta ajustar y reduzindo o erro (através de alpha - alpha é a taxa de aprendizado)

4 - Para cada estimador base, é estimado o gradiente da função de perda

5 - Estimadores subsequentes estimam o erro residual dos estimadores anteriores

6 - Aplica o GRADIENT DESCENT para reduzir j

7 - Soma os resultados dos estimadores, dando peso a cada passo de acordo com o valor de alpha

---
# Gradient Boosting Classifier

In [1]:
# Imports 
from sklearn.datasets import make_hastie_10_2
from sklearn.ensemble import GradientBoostingClassifier

In [2]:
# Definidino dados para X e Y
X, y = make_hastie_10_2(random_state = 0)
X_train, X_test = X[:2000], X[2000:]
y_train, y_test = y[:2000], y[2000:]

# Cria o classificador 
clf = GradientBoostingClassifier(n_estimators = 100, 
                                 learning_rate = 1.0,
                                 random_state = 0)

# Treina o modelo 
clf.fit(X_train, y_train)

In [3]:
clf.get_params()

{'ccp_alpha': 0.0,
 'criterion': 'friedman_mse',
 'init': None,
 'learning_rate': 1.0,
 'loss': 'log_loss',
 'max_depth': 3,
 'max_features': None,
 'max_leaf_nodes': None,
 'min_impurity_decrease': 0.0,
 'min_samples_leaf': 1,
 'min_samples_split': 2,
 'min_weight_fraction_leaf': 0.0,
 'n_estimators': 100,
 'n_iter_no_change': None,
 'random_state': 0,
 'subsample': 1.0,
 'tol': 0.0001,
 'validation_fraction': 0.1,
 'verbose': 0,
 'warm_start': False}

In [5]:
# Calculando a aCURÁCIA (SCORE)
clf.score(X_test, y_test)

0.9118

---
# Gradient Boosting Regressor 

In [7]:
# Imports 
import numpy as np
from sklearn.metrics import mean_squared_error
from sklearn.datasets import make_friedman1
from sklearn.ensemble import GradientBoostingRegressor

In [12]:
# Define dados para o X e y
X_reg, y_reg = make_friedman1(n_samples = 1200, random_state= 0, noise=1.0)
X_train_reg, X_test_reg = X_reg[:200], X_reg[200:]
y_train_reg, y_test_reg = y_reg[:200], y_reg[200:]

# Cria o regressor
est = GradientBoostingRegressor(n_estimators= 100, 
                                learning_rate= 0.1, 
                                max_depth= 1,
                                random_state= 0,
                                loss= "squared_error")

In [23]:
# Treina o regressor 
est.fit(X_train_reg, y_train_reg)

In [24]:
est.get_params()

{'alpha': 0.9,
 'ccp_alpha': 0.0,
 'criterion': 'friedman_mse',
 'init': None,
 'learning_rate': 0.1,
 'loss': 'squared_error',
 'max_depth': 1,
 'max_features': None,
 'max_leaf_nodes': None,
 'min_impurity_decrease': 0.0,
 'min_samples_leaf': 1,
 'min_samples_split': 2,
 'min_weight_fraction_leaf': 0.0,
 'n_estimators': 100,
 'n_iter_no_change': None,
 'random_state': 0,
 'subsample': 1.0,
 'tol': 0.0001,
 'validation_fraction': 0.1,
 'verbose': 0,
 'warm_start': False}

In [25]:
est.predict(X_test)

array([ 8.17149307,  8.7989088 ,  4.30704962, ...,  8.6955432 ,
       14.42647002,  7.61136583])

In [26]:
# Calcula o erro médio ao quadrado 
mean_squared_error(y_test_reg, est.predict(X_test_reg))

5.009154859960321

In [27]:
est.score(X_test_reg, y_test_reg)

0.8058912110043196

In [28]:
# FIM