# **XGBoost**

In [1]:
import os
import pandas as pd

caminho = os.path.join("..", "data", 'UCC.csv')

credit = pd.read_csv(caminho)

In [3]:
from xgboost import XGBClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report

#Separação dos dados
input = credit.drop(columns='default.payment.next.month')
output = credit['default.payment.next.month']
input_train, input_test, output_train, output_test = train_test_split(input, output, test_size = 0.2, random_state=47)

#Instanciar XGBoost
XGBC_model = XGBClassifier(max_depth=3, learning_rate=0.1, use_label_encoder=False, eval_metric='logloss')

#Treinando o Algoritimo
XGBC_model.fit(input_train, output_train)

XGBC_predict = XGBC_model.predict(input_test)

print("Acurácia:", accuracy_score(output_test, XGBC_predict))
print("Matriz de confusão:\n", confusion_matrix(output_test, XGBC_predict))
print("Relatório de classificação:\n", classification_report(output_test, XGBC_predict))

Acurácia: 0.8206666666666667
Matriz de confusão:
 [[4427  236]
 [ 840  497]]
Relatório de classificação:
               precision    recall  f1-score   support

           0       0.84      0.95      0.89      4663
           1       0.68      0.37      0.48      1337

    accuracy                           0.82      6000
   macro avg       0.76      0.66      0.69      6000
weighted avg       0.80      0.82      0.80      6000



Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


**Usando StandardScaler**

In [5]:
from sklearn.preprocessing import StandardScaler

#Separação dos dados
input = credit.drop(columns='default.payment.next.month')
output = credit['default.payment.next.month']
input_train, input_test, output_train, output_test = train_test_split(input, output, test_size = 0.2, random_state=47)

#Instanciar XGBoost
XGBC_model = XGBClassifier(n_estimators=100, max_depth=3, learning_rate=0.1, use_label_encoder=False, eval_metric='logloss')

#Escalonando os dados
scaler = StandardScaler()
input_train_scaled = scaler.fit_transform(input_train)

input_test_scaled = scaler.transform(input_test)

#Treinando o Algoritimo
XGBC_model.fit(input_train_scaled, output_train)

XGBC_predict = XGBC_model.predict(input_test_scaled)

print("Acurácia:", accuracy_score(output_test, XGBC_predict))
print("Matriz de confusão:\n", confusion_matrix(output_test, XGBC_predict))
print("Relatório de classificação:\n", classification_report(output_test, XGBC_predict))

Acurácia: 0.8206666666666667
Matriz de confusão:
 [[4427  236]
 [ 840  497]]
Relatório de classificação:
               precision    recall  f1-score   support

           0       0.84      0.95      0.89      4663
           1       0.68      0.37      0.48      1337

    accuracy                           0.82      6000
   macro avg       0.76      0.66      0.69      6000
weighted avg       0.80      0.82      0.80      6000



Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


**Usando MinMaxScaler**

In [7]:
from sklearn.preprocessing import MinMaxScaler

#Separação dos dados
input = credit.drop(columns='default.payment.next.month')
output = credit['default.payment.next.month']
input_train, input_test, output_train, output_test = train_test_split(input, output, test_size = 0.2, random_state=47)

#Escalonando os dados
scaler = MinMaxScaler()
input_train_scaled = scaler.fit_transform(input_train)

input_test_scaled = scaler.transform(input_test)

#Instanciar XGBoost
XGBC_model = XGBClassifier(n_estimators=100, max_depth=3, learning_rate=0.1, use_label_encoder=False, eval_metric='logloss')

#Treinando o Algoritimo
XGBC_model.fit(input_train_scaled, output_train)

XGBC_predict = XGBC_model.predict(input_test_scaled)

print("Acurácia:", accuracy_score(output_test, XGBC_predict))
print("Matriz de confusão:\n", confusion_matrix(output_test, XGBC_predict))
print("Relatório de classificação:\n", classification_report(output_test, XGBC_predict))

Acurácia: 0.8206666666666667
Matriz de confusão:
 [[4427  236]
 [ 840  497]]
Relatório de classificação:
               precision    recall  f1-score   support

           0       0.84      0.95      0.89      4663
           1       0.68      0.37      0.48      1337

    accuracy                           0.82      6000
   macro avg       0.76      0.66      0.69      6000
weighted avg       0.80      0.82      0.80      6000



Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)
