# **Random Forest**

In [1]:
import os
import pandas as pd

caminho = os.path.join("..", "data", 'UCC.csv')

credit = pd.read_csv(caminho)

In [15]:
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report

#Separação dos dados
input = credit.drop(columns='default.payment.next.month')
output = credit['default.payment.next.month']

input_train, input_test, output_train, output_test = train_test_split(input, output, test_size = 0.2, random_state=47)

#Instanciar randomforest
rf_model = RandomForestClassifier(n_estimators=100, max_depth=None, random_state=47)

#Treinando o Algoritimo
rf_model.fit(input_train, output_train)

rf_predict = rf_model.predict(input_test)

print("Acurácia:", accuracy_score(output_test, rf_predict))
print("Matriz de confusão:\n", confusion_matrix(output_test, rf_predict))
print("Relatório de classificação:\n", classification_report(output_test, rf_predict))

Acurácia: 0.8148333333333333
Matriz de confusão:
 [[4396  267]
 [ 844  493]]
Relatório de classificação:
               precision    recall  f1-score   support

           0       0.84      0.94      0.89      4663
           1       0.65      0.37      0.47      1337

    accuracy                           0.81      6000
   macro avg       0.74      0.66      0.68      6000
weighted avg       0.80      0.81      0.79      6000



**Usando StandardScaler**

In [13]:
from sklearn.preprocessing import StandardScaler

#Separação dos dados
input = credit.drop(columns='default.payment.next.month')
output = credit['default.payment.next.month']
input_train, input_test, output_train, output_test = train_test_split(input, output, test_size = 0.2, random_state=47)

#Instanciar randomforest
rf_model = RandomForestClassifier(n_estimators=100, max_depth=None, random_state=47)

#Escalonando os dados
scaler = StandardScaler()
input_train_scaled = scaler.fit_transform(input_train)

input_test_scaled = scaler.transform(input_test)

#Treinando o Algoritimo
rf_model.fit(input_train_scaled, output_train)

rf_predict = rf_model.predict(input_test_scaled)

print("Acurácia:", accuracy_score(output_test, rf_predict))
print("Matriz de confusão:\n", confusion_matrix(output_test, rf_predict))
print("Relatório de classificação:\n", classification_report(output_test, rf_predict))

Acurácia: 0.8146666666666667
Matriz de confusão:
 [[4396  267]
 [ 845  492]]
Relatório de classificação:
               precision    recall  f1-score   support

           0       0.84      0.94      0.89      4663
           1       0.65      0.37      0.47      1337

    accuracy                           0.81      6000
   macro avg       0.74      0.66      0.68      6000
weighted avg       0.80      0.81      0.79      6000



**Usando MinMaxScaler**

In [None]:
from sklearn.preprocessing import MinMaxScaler

#Separação dos dados
input = credit.drop(columns='default.payment.next.month')
output = credit['default.payment.next.month']
input_train, input_test, output_train, output_test = train_test_split(input, output, test_size = 0.2, random_state=47)

#Instanciar randomforest
rf_model = RandomForestClassifier(n_estimators=100, max_depth=None, random_state=47)

#Escalonando os dados
scaler = MinMaxScaler()
input_train_scaled = scaler.fit_transform(input_train)

input_test_scaled = scaler.transform(input_test)

#Treinando o Algoritimo
rf_model.fit(input_train_scaled, output_train)

rf_predict = rf_model.predict(input_test_scaled)

print("Acurácia:", accuracy_score(output_test, rf_predict))
print("Matriz de confusão:\n", confusion_matrix(output_test, rf_predict))
print("Relatório de classificação:\n", classification_report(output_test, rf_predict))

Acurácia: 0.8151666666666667
Matriz de confusão:
 [[4396  267]
 [ 842  495]]
Relatório de classificação:
               precision    recall  f1-score   support

           0       0.84      0.94      0.89      4663
           1       0.65      0.37      0.47      1337

    accuracy                           0.82      6000
   macro avg       0.74      0.66      0.68      6000
weighted avg       0.80      0.82      0.80      6000

