In [None]:
from sklearn.metrics import accuracy_score, classification_report
import pickle
from yellowbrick.classifier import ConfusionMatrix
from sklearn import tree
from sklearn.ensemble import RandomForestClassifier
from sklearn.tree import DecisionTreeClassifier
import matplotlib.pyplot as plt

# Árvores de decisão

## Base risco crédito

In [None]:
with open('Machine-Learning/Classificação/Pré-processamento de dados/risco_credito.pkl', 'rb') as f:
    x_risco_credito, y_risco_credito = pickle.load(f)

In [None]:
x_risco_credito, y_risco_credito

In [None]:
arvore_risco_credito = DecisionTreeClassifier(criterion='entropy')
arvore_risco_credito.fit(x_risco_credito, y_risco_credito)

In [None]:
arvore_risco_credito.feature_importances_

In [None]:
previsores = ['historia de credito', 'divida', 'garantia', 'renda']
figura, eixos = plt.subplots(nrows=1, ncols=1, figsize=(10,10))
tree.plot_tree(arvore_risco_credito, feature_names=previsores, class_names=arvore_risco_credito.classes_, filled=True);

In [None]:
# história boa, dívida alta, garantias nenhuma, renda > 35
# história ruim, dívida alta, garantias adequada, renda < 15
previsoes = arvore_risco_credito.predict([[0,0,1,2],[2,0,0,0]])
previsoes

## Base credit data

In [None]:
with open('Machine-Learning/Classificação/Pré-processamento de dados/credit.pkl', 'rb') as f:
  x_credit_treinamento, y_credit_treinamento, x_credit_teste, y_credit_teste = pickle.load(f)

In [None]:
x_credit_treinamento.shape, y_credit_treinamento.shape

In [None]:
x_credit_teste.shape, y_credit_teste.shape

In [None]:
arvore_credit = DecisionTreeClassifier(criterion='entropy', random_state = 0)
arvore_credit.fit(x_credit_treinamento, y_credit_treinamento)

In [None]:
previsoes = arvore_credit.predict(x_credit_teste)
previsoes

In [None]:
y_credit_teste

In [None]:
accuracy_score(y_credit_teste, previsoes)

In [None]:
cm = ConfusionMatrix(arvore_credit)
cm.fit(x_credit_treinamento, y_credit_treinamento)
cm.score(x_credit_teste, y_credit_teste)

In [None]:
print(classification_report(y_credit_teste, previsoes))

In [None]:
arvore_credit.classes_

In [None]:
previsores = ['income', 'age', 'loan']
fig, axes = plt.subplots(nrows = 1,ncols = 1,figsize = (20,20))
tree.plot_tree(arvore_credit, feature_names=previsores, class_names=['0','1'], filled=True);
fig.savefig('arvore_credit.png')

## Base census

In [None]:
with open('Machine-Learning/Classificação/Pré-processamento de dados/census.pkl', 'rb') as f:
  x_census_treinamento, y_census_treinamento, x_census_teste, y_census_teste = pickle.load(f)

In [None]:
x_census_treinamento.shape, y_census_treinamento.shape

In [None]:
x_census_teste.shape, y_census_teste.shape

In [None]:
arvore_census = DecisionTreeClassifier(criterion='entropy', random_state=0)
arvore_census.fit(x_census_treinamento, y_census_treinamento)

In [None]:
previsoes = arvore_census.predict(x_census_teste)
previsoes

In [None]:
y_census_teste

In [None]:
accuracy_score(y_census_teste, previsoes)

In [None]:
cm = ConfusionMatrix(arvore_census)
cm.fit(x_census_treinamento, y_census_treinamento)
cm.score(x_census_teste, y_census_teste)

In [None]:
print(classification_report(y_census_teste, previsoes))

## Random Forest

### Base credit data

In [None]:
with open('Machine-Learning/Classificação/Pré-processamento de dados/credit.pkl', 'rb') as f:
  x_credit_treinamento, y_credit_treinamento, x_credit_teste, y_credit_teste = pickle.load(f)

In [None]:
random_forest_credit = RandomForestClassifier(n_estimators=40, criterion='entropy', random_state = 0)
random_forest_credit.fit(x_credit_treinamento, y_credit_treinamento)

In [None]:
previsoes = random_forest_credit.predict(x_credit_teste)
previsoes

In [None]:
y_credit_teste

In [None]:
accuracy_score(y_credit_teste, previsoes)

In [None]:
cm = ConfusionMatrix(random_forest_credit)
cm.fit(x_credit_treinamento, y_credit_treinamento)
cm.score(x_credit_teste, y_credit_teste)

In [None]:
print(classification_report(y_credit_teste, previsoes))

### Base census

In [None]:
with open('Machine-Learning/Classificação/Pré-processamento de dados/census.pkl', 'rb') as f:
  x_census_treinamento, y_census_treinamento, x_census_teste, y_census_teste = pickle.load(f)

In [None]:
random_forest_census = RandomForestClassifier(n_estimators=100, criterion='entropy', random_state = 0)
random_forest_census.fit(x_census_treinamento, y_census_treinamento)

In [None]:
previsoes = random_forest_census.predict(x_census_teste)
previsoes

In [None]:
y_census_teste

In [None]:
accuracy_score(y_census_teste, previsoes)

In [None]:
cm = ConfusionMatrix(random_forest_census)
cm.fit(x_census_treinamento, y_census_treinamento)
cm.score(x_census_teste, y_census_teste)

In [None]:
print(classification_report(y_census_teste, previsoes))

****