In [None]:
#@title Importação de Bibliotecas

import pandas as pd #Manipulação de conjuntos de dados
import numpy as np #Manipulações numéricas
import matplotlib.pyplot as plt #Análises gráficas
import seaborn as sns #Análises gráficas
import io #Manipulação de entradas e saídas
import gdown #Acesso a arquivos no Google Drive

from matplotlib.widgets import TextBox #Visualização de textos
from sklearn.preprocessing import StandardScaler #Normalização dos dados
from sklearn.neighbors import KNeighborsClassifier #Modelo KNN
from sklearn.ensemble import RandomForestClassifier #Modelo Floresta Aleatória
from sklearn.model_selection import train_test_split #Divisões dos conjuntos treino/teste
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score #Extração de indicadores
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay #Extração de matrizes

In [None]:
# @title Instanciando os Modelos
knn = KNeighborsClassifier(n_neighbors = 5)
rf = RandomForestClassifier(random_state = 42)

In [None]:
# @title Função para Aplicação de Modelo
def predicao(modelo, conjuntos):
    X_train, X_test, y_train, y_test = conjuntos

    #Fitting de Dados e Predição
    modelo.fit(X_train, y_train)
    y_pred = modelo.predict(X_test)

    #Calcula as métricas
    acc = accuracy_score(y_test, y_pred)
    prec = precision_score(y_test, y_pred)
    recall = recall_score(y_test, y_pred)
    f1 = f1_score(y_test, y_pred)
    cm = confusion_matrix(y_test, y_pred)

    return acc, prec, recall, f1, cm

In [None]:
# @title Aplicação de Modelo Utilizando Técnicas de Programação Funcional
%%time

MODELOS = { "KNN": knn, "Floresta Aleatória": rf}
INDICADORES = ["accuracy", "precision", "recall", "f1-score"]

#Variáveis para armazenar os resultados
dfResultados = pd.DataFrame(index=INDICADORES,columns=MODELOS.keys())
listMatrix = []

#Execução da rotina de predição
for descricao, modelo in MODELOS.items():
  *dfResultados[descricao] , matrix = predicao(modelo, (X_train, X_test, y_train, y_test))
  listMatrix.append(matrix)

In [None]:
# @title Indicadores
dfResultados.T.style.highlight_max(color='black')

In [None]:
# @title Exportação dos Resultados

PATH = "'\'recursos'\'" if os.name == "Windows" else "/recursos/"

treino = os.getcwd() + PATH + 'cars_train_clean.csv'
dfTreino.to_csv(treino,sep="\t",encoding='UTF-16')

teste = os.getcwd() + PATH + 'cars_test_clean.csv'
dfTest.to_csv(teste,sep="\t",encoding='UTF-16')