                    Arvore de decisão de classificação

-> A árvore de decisão de classificação é um dos modelos de aprendizado de máquina
mais intuitivos e fáceis de entender, por que a sua lógica é muito parecida com a
forma como nós humanos, tomamos decisões.

-> Imagine que você esta tentando decidir se deve ou não levar um guarda-chuva
ao sair de casa. Você faria uma série de perguntas, em uma sequência lógica,
para chegar a uma conclusão. Por exemplo:

-> Primeira Pergunta: "Esta chovendo agora?"

    -> se sim: Leve o guarda-chuva.

    -> se não: Faça a próxima pergunta.

In [None]:
def computarModelo(xtrain, ytrain):
    
    from sklearn.tree import DecisionTreeClassifier
    
    classificador = DecisionTreeClassifier(criterion='entropy')
    
    classificador.fit(xtrain, ytrain)
    
    return classificador
    
    

In [19]:
def predicaoModelo(classificador, xtest):
    
    return classificador.predict(xtest)

In [20]:
def matrizConfusao(ytest, ypredicao, rotulos):
    
    from sklearn.metrics import confusion_matrix
    
    matriz = confusion_matrix(ytest, ypredicao, labels=rotulos)
    
    
    return matriz             

In [21]:
from minhasfuncoes import funcoes

def ArvoreDecisao(nome_do_arquivo, delimitador=',', inicio_preenchimento=None, fim_preenchimento = None, lista_rotulacao = None):
    
    x, y = funcoes.carregar_Dataset(nome_do_arquivo, delimitador)
    
    if inicio_preenchimento != None and fim_preenchimento != None:
        
        x = funcoes.preencherDadosFaltantes(x, inicio_preenchimento, fim_preenchimento)
    
    if lista_rotulacao != None:
        
        for i in lista_rotulacao:
            
            x = funcoes.rotulacao(x, i)
    
    
    xtrain, xtest, ytrain, ytest = funcoes.treino_teste(x, y, 0.2)
    
    xtrain_normalizado, escala = funcoes.normalizacao(xtrain)
    
    xtest_normalizado = escala.transform(xtest)
    
    classificador = computarModelo(xtrain_normalizado, ytrain)
    
    ypredicao = predicaoModelo(classificador, xtest_normalizado)
    
    rotulos = [0, 1]
    
    return matrizConfusao(ytest, ypredicao, rotulos)
    

Visualizando os resultados da classificação

In [22]:
ArvoreDecisao(nome_do_arquivo='Dados/admission.csv', delimitador=';', lista_rotulacao=[0])

array([[1, 0],
       [0, 1]])

Testando a eficiência do modelo

In [23]:
arvore = lambda: ArvoreDecisao(nome_do_arquivo='Dados/admission.csv', delimitador=';', lista_rotulacao=[0])


In [24]:

import numpy as np

def testar_modelo_classificacao(funcao, tamanho_do_loop, descricao='Não há descrição'):
    
    from tqdm import tqdm

    array_acuracias = []
    
    for i in tqdm(range(0, tamanho_do_loop), desc=descricao):
        
        modelo = funcao()
        
        array_acuracias.append(funcoes.acuracia(modelo))
    
    print("Média das acurácias do modelo de classificação: %.2f"% np.mean(array_acuracias))
    

In [25]:
testar_modelo_classificacao(arvore, 20, 'porcentagem de execução do teste de acurácia')

porcentagem de execução do teste de acurácia: 100%|██████████| 20/20 [00:00<00:00, 126.28it/s]

Média das acurácias do modelo de classificação: 0.95



