# Sistemas Inteligentes 2024/2025

## Projeto 4: Aprendizagem Automática
---

## 0. Entrega e Avaliação

### Entrega: 4 de Junho às 23:59

### Formação de grupos

A formação de grupos para o Projeto 4 está aberta até dia **21/maio às 23h59**.

**TODOS os alunos devem fazer parte de um grupo**, mesmo que seja um grupo com apenas uma pessoa para fazer o projeto individualmente. Quem não formar grupo antes do final do prazo terá **10% de PENALIZAÇÃO** na nota do projeto.


### Ficheiro Jupyter Notebook

Um dos elementos a entregar é um ficheiro Jupyter Notebook, que deve ser submetido no link disponibilizado no Moodle. Esse ficheiro deve chamar-se **Aprendizagem_SInt_24_25_grupoXX.ipynb**, onde substituem o **XX** pelo número do grupo. **Só se pretende UMA submissão por grupo**.

Quem submeter um ficheiro com a identificação errada do seu grupo, com um formato diferente do pedido, ou qualquer outra situação que não cumpra as regras de submissão, terá **10% de PENALIZAÇÃO** na nota do projeto.

Reparem que o Notebook que estão a ler (o enunciado) tem o nome Aprendizagem_SInt_24_25.ipynb. Façam uma cópia deste enunciado, acrescentando ao nome do ficheiro a identificação do vosso grupo, e trabalhem diretamente sobre essa cópia. É importante que o Notebook que entregam mantenha a estrutura deste enunciado. Sigam as regras explicadas em cada seção, ou o vosso projeto poderá não ser avaliado.

### Ficheiro Python

Todo o código desenvolvido na seção 3 do Notebook deve ser copiado para um ficheiro Python chamado **Aprendizagem_SInt_24_25_grupoXX.py** (a diferença está na extensão), onde substituem o **XX** pelo número do grupo. Este ficheiro deve ser submetido juntamente com o Notebook. Sendo assim, a entrega do trabalho consiste em 2 ficheiros.

### Avaliação

A avaliação do vosso projeto só será feita se a última célula do vosso Notebook (igual à última célula deste Notebook), identificada com a palavra **VERIFICAÇÃO**, correr sem erros e devolver **OK** em todos os testes de verificação. Esta célula **não avalia** o vosso trabalho, simplesmente verifica se estão a devolver os vossos resultados no formato certo. Caso algum teste de verificação falhe, o resultado será **ERRO** e o trabalho não poderá ser avaliado, tendo assim nota 0.

Os elementos usados para avaliação são, para cada modelo pedido:
  * A estimativa da qualidade do modelo (expressa com várias métricas, especificadas abaixo)
  * O desempenho do modelo em conjuntos de dados novos (que não vos são disponibilizados)

Os critérios de avaliação serão, para cada modelo pedido:

  * a qualidade esperada do modelo, segundo a estimativa feita
  * relação entre os resultados obtidos pelos vossos modelos nos dados novos e a estimativa feita 

O projeto vale, no total, 2.5 valores, divididos por ambos os critérios de avaliação e pelos três modelos que vos são pedidos.

**Dúvidas?** sgsilva@fc.ul.pt

## 1. Introdução

Neste projeto, fornecemos um conjunto de dados chamado `DadosAprendizagem.csv` (com 6 atributos mais a última coluna, que é a classe, sem cabeçalho) com o qual devem construir **3 classificadores** obtidos com métodos de aprendizagem diferentes: Árvores de Decisão (DT - Decision Trees), K-Vizinhos Mais Próximos (KNN - K-Nearest Neighbors) e Naive Bayes (NB). Para tal, devem usar o scikit-learn, a biblioteca de aprendizagem automática que usamos nas aulas PL.


<div style="display: flex; align-items: left;">
    <img src="pinguim_deslizante.PNG" alt="Left Image" style="border: 0px solid white; width: 100px; margin-right: 40px;">
    <span style="display: inline-block; max-width: 350px; text-align: left;">
        <br>Para não fugir ao tema, podemos dizer que estes dados referem-se a caraterísticas de pinguins 
        (como a altura, peso, cor do bico, etc) e à sua classificação como pinguins deslizantes ou saltitantes. 😊
    </span>
    <img src="pinguim_saltitante.PNG" alt="Right Image" style="border: 0px solid white; width: 100px; margin-left: 40px;">
</div>

## 2. Métodos e funções permitidos

Queremos que utilizem apenas os métodos e funções dados nos guiões das PL, e não queremos que utilizem nada que não faça parte dos guiões (o scikit-learn é um mundo muito vasto). Sendo assim, a primeira célula de código deste Notebook é a importação de **tudo o que podem usar**. Se quiserem usar algo para além disto, devem falar primeiro com os professores (e justificar a necessidade de usar algo que não foi dado):

In [9]:
import os
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

from sklearn.datasets import load_iris
from sklearn.datasets import load_diabetes
from sklearn.datasets import load_breast_cancer

import warnings
import random
from utilsAA import *

from sklearn import tree
from sklearn.inspection import DecisionBoundaryDisplay
from sklearn.tree import DecisionTreeClassifier, DecisionTreeRegressor
from sklearn.neighbors import KNeighborsClassifier, KNeighborsRegressor
from sklearn.naive_bayes import GaussianNB, CategoricalNB
from sklearn.cluster import AgglomerativeClustering, KMeans
import scipy.cluster.hierarchy as sch

from sklearn.model_selection import train_test_split
from sklearn.model_selection import KFold, StratifiedKFold, ShuffleSplit
from sklearn.model_selection import cross_val_score, GridSearchCV, RandomizedSearchCV
from sklearn.metrics import mean_squared_error, root_mean_squared_error
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
from sklearn.metrics import matthews_corrcoef, balanced_accuracy_score
from sklearn.metrics import classification_report, confusion_matrix, ConfusionMatrixDisplay
from sklearn.metrics import silhouette_score, davies_bouldin_score, calinski_harabasz_score

from sklearn.preprocessing import OneHotEncoder, OrdinalEncoder
from sklearn.preprocessing import StandardScaler, MinMaxScaler

**ATENÇÃO:** alguns destes imports referem-se a matéria que ainda não foi dada à data de saída do projeto. Aconselhamo-vos a começarem a desenvolver tudo o que já sabem, e depois vão completando e melhorando à medida que é dada a restante matéria. As datas de saída dos restantes guiões são:

  * Naive Bayes e Avaliação de Modelos: 2a feira dia 19/maio
  * Aprendizagem Não Supervisionada: 2 feira dia 26/maio

## 3. O vosso código

**Todo o código que desenvolverem nesta seção deve ser copiado para um único ficheiro Python chamado Aprendizagem_SInt_24_25_grupoXX.py, onde substituem o XX pelo número do vosso grupo.**

Podem inserir as células que quiserem para escreverem o vosso código. Podem definir as funções auxiliares que quiserem. Mas **não façam mais imports**, pois tudo o que podem usar é importado na célula anterior.

Por uma questão de organização, a estrutura desta seção divide-se nas partes:
  * 3.1. Carregamento dos dados
  * 3.2. Escolha dos parâmetros e eventuais pré-processamentos
  * 3.3. Estimativas de qualidade
  * 3.4. Criação dos modelos finais
  * 3.5. RESULTADOS
  
Há dois motivos para tal organização:
  * Para se habituarem a organizar a vossa *pipeline* de aprendizagem automática desta forma, como foi sugerido nas aulas (separando 'escolha dos parâmetros' de 'estimativa de qualidade' de 'criação dos modelos finais')
  * Para que não seja necessário correr todo o vosso Notebook para fazer a avaliação, uma vez que algumas partes podem demorar algum tempo a correr (nomeadamente a parte 3.2).

**ATENÇÃO:** Para fazer a avaliação do vosso Notebook, deverá ser necessário correr apenas:
  * A célula anterior, que faz os imports
  * O código das partes 3.1 e 3.4
  * O código da parte 3.5 (com os conjuntos de novos dados que usaremos para a avaliação)
  * A célula final de VERIFICAÇÃO (que, se der erros, impedirá a avaliação do projeto)

### 3.1 Carregamento dos dados

Todos os dados que vos são fornecidos para desenvolverem os modelos estão no ficheiro `DadosAprendizagem.csv`, disponibilizado com este enunciado. Na célula em baixo, fazemos já o carregamento desses dados e a sua separação em duas partes: input (os 6 atributos, variável `X`) e output (as classes esperadas, variável `y`).

In [2]:
data = pd.read_csv('DadosAprendizagem.csv', header=None) # os dados não têm cabeçalho
X = data.iloc[:, :-1]  # todas as colunas exceto a última
y = data.iloc[:, -1]  # última coluna

Aconselhamo-vos a explorarem os dados antes de iniciarem o trabalho.

### 3.2. Escolha dos parâmetros (e eventuais pré-processamentos)

Aqui devem desenvolver código que vos ajude a escolher quais os parâmetros a usar para criar os modelos finais, e quais os pré-processamentos de dados que eventualmente ajudem a obter modelos melhores. Não se esqueçam que vos pedimos **3 modelos** criados com 3 métodos diferentes (DT, KNN, NB)!

In [3]:
# Aqui acontece magia :-)

# O código aqui desenvolvido deve ser todo copiado para o ficheiro Python Aprendizagem_SInt_24_25_grupoXX.py,
# onde substituem o XX pelo número do vosso grupo.

### 3.3. Estimativas de qualidade

Devem extrair as estimativas de qualidade dos vossos modelos. Queremos que devolvam, para cada um (DT, KNN, NB):
  * Accuracy (exatidão, entre 0 e 1):
    * Primeiro quartil (Q1)
    * Segundo quartil (Q2), ou mediana
    * Terceiro quartil (Q3)
    * Adjacente superior (limite da haste superior)
    * Adjacente inferior (limite da haste inferior)
    * Máximo
    * Mínimo
  * F1 (macro):
    * (as mesmas indicadas para accuracy)
  * MCC (Matthew's Correlation Coefficient):
    * (as mesmas indicadas para accuracy e para F1)
  
Estas estimativas terão de ser gravadas no ficheiro de resultados, na parte 3.5.

In [4]:
# Aqui acontece magia :-)

# O código aqui desenvolvido deve ser todo copiado para o ficheiro Python Aprendizagem_SInt_24_25_grupoXX.py,
# onde substituem o XX pelo número do vosso grupo.

### 3.4. Criação dos modelos finais

Esta célula deve correr sem erros depois da parte 3.1, sem necessidade de correr as partes 3.2 e 3.3. Os modelos aqui definidos devem ser aqueles que são usados para gerar as previsões na parte 3.5.

In [5]:
# Aqui acontece magia :-)

# O código aqui desenvolvido deve ser todo copiado para o ficheiro Python Aprendizagem_SInt_24_25_grupoXX.py,
# onde substituem o XX pelo número do vosso grupo.

### 3.5. RESULTADOS

Na célula de código seguinte, é **OBRIGATÓRIO** que especifiquem o vosso número de grupo, na linha indicada.

Esta célula também especifica o nome do ficheiro de novos dados que se vai usar (por defeito, `DadosNovos.csv`, também fornecido com o enunciado). Os novos dados têm o mesmo número de atributos que `DadosAprendizagem.csv` menos a classe). Esse nome fica guardado na variável **`nome_ficheiro_dados_novos`**.

Finalmente, a célula também define o nome que devem usar no ficheiro que guardará os vossos resultados, Resultados_FICHEIRO_SInt_24_25_grupoXX.txt (onde FICHEIRO é o nome do ficheiro de novos dados, sem extensão, e XX é o número do vosso grupo). Esse nome fica guardado na variável **`nome_ficheiro_resultados`**.

Faz-se um print destes três elementos, só para verificação.
Daqui para a frente devem usar estas três variáveis para identificar estes elementos.

In [6]:
# É ABSOLUTAMENTE NECESSÁRIO indicar o número do grupo:
# (substituindo 0 pelo número do vosso grupo)
GRUPO = 0

# Podem alterar o nome do ficheiro se quiserem testar com outros ficheiros
nome_ficheiro_dados_novos = "DadosNovos.csv" # nome do ficheiro de novos dados
# Daqui para a frente, não se usa o nome DadosNovos.csv mas apenas a variável nome_ficheiro_dados_novos

# NÃO ALTERAR estas linhas:
# Aqui definimos o nome do ficheiro de resultados que devem gravar.
FICHEIRO = nome_ficheiro_dados_novos.split(".")[0] # nome do ficheiro sem extensão
nome_ficheiro_resultados = "Resultados_"+FICHEIRO+"_SInt_24_25_grupo"+str(GRUPO)+".txt"
# Daqui para a frente, usa-se a variável nome_ficheiro_resultados para identificar o ficheiro de resultados

print(GRUPO)
print(nome_ficheiro_dados_novos)
print(nome_ficheiro_resultados)

# Se desenvolverem algum código extra aqui,
# também o devem copiar para o ficheiro Python Aprendizagem_SInt_24_25_grupoXX.py,
# onde substituem o XX pelo número do vosso grupo.

GRUPO
DadosNovos.csv
Resultados_DadosNovos_SInt_24_25_grupo0.txt


Especificadas as variáveis que identificam o vosso grupo e os ficheiros de dados novos e de resultados, devem agora:

  * Usar os modelos finais (criados na parte 3.4) para prever as classes dos novos dados (aplicando-lhes primeiro qualquer pré-processamento que tenha sido usado nos dados de aprendizagem)
  * Gravar o ficheiro de resultados no mesmo diretório onde o Notebook é executado. 
  
Este ficheiro de resultados deve conter as estimativas de qualidade obtidas na parte 3.3 e as previsões obtidas pelos modelos finais nos dados novos, e deve ter um formato muito específico, detalhado a seguir. Se não cumprir esse formato, não passará os testes de verificação da célula final e o projeto não poderá ser avaliadao, tendo assim nota 0.

Este ficheiro de resultados não deve ser submetido, uma vez que os dados novos a utilizar para fazer a avaliação não são estes. O objetivo desta parte é que possa ser executada com outros conjuntos de dados (realmente usados para avaliação), devolvendo um ficheiro no formato correto para avaliação.

#### Formato do ficheiro de resultados:

O ficheiro de resultados que a célula seguinte deve gravar, em modo de texto, deve conter a seguinte informação no seguinte formato:

  * Primeira linha: o número do vosso grupo (só o número, sem qualquer espaço ou texto a acompanhar)
  * Linhas seguintes: as estimativas de qualidade do vosso modelo DT (Árvore de Decisão), uma por linha (só os números)
    * Accuracy (exatidão):
      * Primeiro quartil (Q1)
      * Segundo quartil (Q2), ou mediana
      * Terceiro quartil (Q3)
      * Adjacente superior (limite da haste superior)
      * Adjacente inferior (limite da haste inferior)
      * Máximo
      * Mínimo
    * F1 (macro):
      * (as mesmas indicadas para accuracy)
    * MCC (Matthew's Correlation Coefficient):
      * (as mesmas indicadas para accuracy e para F1)
  * Linhas seguintes: as classes previstas pelo vosso modelo DT para os dados de DadosNovos.csv, uma linha por classe prevista (no total, tantas linhas quantas o número de amostras em DadosNovos.csv)
  * Linhas seguintes: as estimativas de qualidade do vosso modelo KNN (K-Vizinhos Mais Próximos), uma por linha (só os números)
    * (as mesmas indicadas para DT)
  * Linhas seguintes: as classes previstas pelo vosso modelo KNN para os dados de DadosNovos.csv, uma linha por classe prevista (no total, tantas linhas quantas o número de amostras em DadosNovos.csv)
  * Linhas seguintes: as estimativas de qualidade do vosso modelo NB (Naive Bayes), uma por linha (só os números)
    * (as mesmas indicadas para DT e para KNN)
  * Linhas seguintes: as classes previstas pelo vosso modelo NB para os dados de DadosNovos.csv, uma linha por classe prevista (no total, tantas linhas quantas o número de amostras em DadosNovos.csv)

#### Exemplo de ficheiro de resultados:

Fornecemos um ficheiro de resultados de exemplo, chamado `Resultados_DadosNovos_SInt_24_25_grupo0.txt`, para verem o formato esperado. Fornecemos também o mesmo ficheiro com anotações que especificam o que deve estar em cada linha e cada bloco, chamado `ANOTADO_Resultados_DadosNovos_SInt_24_25_grupo0.txt`. Notem que estes resultados, apesar de cumprirem o formato, dão vários erros na verificação da célula final. Experimentem a correr o Notebook original, sem alterações, para verem esses erros no final.

In [7]:
# Código que gera e grava os resultados em modo de texto, no formato especificado acima.
# Atenção, não usem diretamente os nomes dos ficheiros de dados novos e resultados, mas sim as variáveis:
#  nome_ficheiro_dados_novos
#  nome_ficheiro_resultados

# O código aqui desenvolvido deve ser todo copiado para o ficheiro Python Aprendizagem_SInt_24_25_grupoXX.py,
# onde substituem o XX pelo número do vosso grupo.

## VERIFICAÇÃO

A célula seguinte vai verificar se o ficheiro de resultados gravado pela célula anterior cumpre todas as regras. Para que possam submeter o trabalho, têm de obter **OK** em todos os testes. Se obtiverem um ou mais **ERRO**, o trabalho não poderá ser avaliado e terá nota 0.

In [8]:
# NÃO ALTERAR ESTE CÓDIGO
# -----------------------
erros = False
n_medidas_estimativa = 7
data = pd.read_csv(nome_ficheiro_dados_novos, header=None)

try:
    res = np.loadtxt(nome_ficheiro_resultados)
except Exception as e:
    print(f"ERRO: {e}")
    erros=True

if not erros:
    
    linha = 0
    ID_grupo = res[linha]
    if not ID_grupo==GRUPO:
        print("ERRO: ID do grupo no ficheiro diferente da variável GRUPO.")
        erros = True
    if ID_grupo<1 or ID_grupo>99:
        print("ERRO: ID do grupo deve ser entre 1 e 99.")
        erros = True
    if not ID_grupo.is_integer():
        print("ERRO: ID do grupo deve ser um inteiro.")
        erros = True
    linha += 1

    DT_Accuracy = res[linha:linha+n_medidas_estimativa]
    if not np.all((DT_Accuracy >= 0) & (DT_Accuracy <= 1)):
        print("ERRO (DT): Métricas de Accuracy devem ser todas entre 0 e 1.")
        erros = True
    else:
        sorted_DT = [DT_Accuracy[6],DT_Accuracy[4],DT_Accuracy[2],DT_Accuracy[1],DT_Accuracy[0],DT_Accuracy[3],DT_Accuracy[5]]
        if not (sorted_DT == sorted(DT_Accuracy)):
            print("ERRO (DT): Métricas de Accuracy estão numa ordem errada.")
            erros = True
    linha += n_medidas_estimativa
    DT_F1 = res[linha:linha+n_medidas_estimativa]
    if not np.all((DT_F1 >= 0) & (DT_F1 <= 1)):
        print("ERRO (DT): Métricas de F1 devem ser todas entre 0 e 1.")
        erros = True
    else:
        sorted_DT = [DT_F1[6],DT_F1[4],DT_F1[2],DT_F1[1],DT_F1[0],DT_F1[3],DT_F1[5]]
        if not (sorted_DT == sorted(DT_F1)):
            print("ERRO (DT): Métricas de F1 estão numa ordem errada.")
            erros = True
    linha += n_medidas_estimativa
    DT_MCC = res[linha:linha+n_medidas_estimativa]
    if not np.all((DT_MCC >= -1) & (DT_MCC <= 1)):
        print("ERRO (DT): Métricas de MCC devem ser todas entre -1 e 1.")
        erros = True
    else:
        sorted_DT = [DT_MCC[6],DT_MCC[4],DT_MCC[2],DT_MCC[1],DT_MCC[0],DT_MCC[3],DT_MCC[5]]
        if not (sorted_DT == sorted(DT_MCC)):
            print("ERRO (DT): Métricas de MCC estão numa ordem errada.")
            erros = True
    linha += n_medidas_estimativa
    DT_previsoes = res[linha:linha+data.shape[0]]
    if not np.all((DT_previsoes==0) | (DT_previsoes==1)):
        print("ERRO (DT): Previsões das classes devem todas ser 0 ou 1.")
        erros = True
    linha += data.shape[0]

    KNN_Accuracy = res[linha:linha+n_medidas_estimativa]
    if not np.all((KNN_Accuracy >= 0) & (KNN_Accuracy <= 1)):
        print("ERRO (KNN): Métricas de Accuracy devem ser todas entre 0 e 1.")
        erros = True
    else:
        sorted_KNN = [KNN_Accuracy[6],KNN_Accuracy[4],KNN_Accuracy[2],KNN_Accuracy[1],KNN_Accuracy[0],KNN_Accuracy[3],KNN_Accuracy[5]]
        if not (sorted_KNN == sorted(KNN_Accuracy)):
            print("ERRO (KNN): Métricas de Accuracy estão numa ordem errada.")
            erros = True
    linha += n_medidas_estimativa
    KNN_F1 = res[linha:linha+n_medidas_estimativa]
    if not np.all((KNN_F1 >= 0) & (KNN_F1 <= 1)):
        print("ERRO (KNN): Métricas de F1 devem ser todas entre 0 e 1.")
        erros = True
    else:
        sorted_KNN = [KNN_F1[6],KNN_F1[4],KNN_F1[2],KNN_F1[1],KNN_F1[0],KNN_F1[3],KNN_F1[5]]
        if not (sorted_KNN == sorted(KNN_F1)):
            print("ERRO (KNN): Métricas de F1 estão numa ordem errada.")
            erros = True
    linha += n_medidas_estimativa
    KNN_MCC = res[linha:linha+n_medidas_estimativa]
    if not np.all((KNN_MCC >= -1) & (KNN_MCC <= 1)):
        print("ERRO (KNN): Métricas de MCC devem ser todas entre -1 e 1.")
        erros = True
    else:
        sorted_KNN = [KNN_MCC[6],KNN_MCC[4],KNN_MCC[2],KNN_MCC[1],KNN_MCC[0],KNN_MCC[3],KNN_MCC[5]]
        if not (sorted_KNN == sorted(KNN_MCC)):
            print("ERRO (KNN): Métricas de MCC estão numa ordem errada.")
            erros = True    
    linha += n_medidas_estimativa
    KNN_previsoes = res[linha:linha+data.shape[0]]
    if not np.all((KNN_previsoes==0) | (KNN_previsoes==1)):
        print("ERRO (KNN): Previsões das classes devem todas ser 0 ou 1.")
        erros = True
    linha += data.shape[0]

    NB_Accuracy = res[linha:linha+n_medidas_estimativa]
    if not np.all((NB_Accuracy >= 0) & (NB_Accuracy <= 1)):
        print("ERRO (NB): Métricas de Accuracy devem ser todas entre 0 e 1.")
        erros = True
    else:
        sorted_NB = [NB_Accuracy[6],NB_Accuracy[4],NB_Accuracy[2],NB_Accuracy[1],NB_Accuracy[0],NB_Accuracy[3],NB_Accuracy[5]]
        if not (sorted_NB == sorted(NB_Accuracy)):
            print("ERRO (NB): Métricas de Accuracy estão numa ordem errada.")
            erros = True
    linha += n_medidas_estimativa
    NB_F1 = res[linha:linha+n_medidas_estimativa]
    if not np.all((NB_F1 >= 0) & (NB_F1 <= 1)):
        print("ERRO (NB): Métricas de F1 devem ser todas entre 0 e 1.")
        erros = True
    else:
        sorted_NB = [NB_F1[6],NB_F1[4],NB_F1[2],NB_F1[1],NB_F1[0],NB_F1[3],NB_F1[5]]
        if not (sorted_NB == sorted(NB_F1)):
            print("ERRO (NB): Métricas de F1 estão numa ordem errada.")
            erros = True
    linha += n_medidas_estimativa
    NB_MCC = res[linha:linha+n_medidas_estimativa]
    if not np.all((NB_MCC >= -1) & (NB_MCC <= 1)):
        print("ERRO (NB): Métricas de MCC devem ser todas entre -1 e 1.")
        erros = True
    else:
        sorted_NB = [NB_MCC[6],NB_MCC[4],NB_MCC[2],NB_MCC[1],NB_MCC[0],NB_MCC[3],NB_MCC[5]]
        if not (sorted_NB == sorted(NB_MCC)):
            print("ERRO (NB): Métricas de MCC estão numa ordem errada.")
            erros = True
    linha += n_medidas_estimativa
    NB_previsoes = res[linha:linha+data.shape[0]]
    if not np.all((NB_previsoes==0) | (NB_previsoes==1)):
        print("ERRO (NB): Previsões das classes devem ser todas 0 ou 1.")
        erros = True
    linha += data.shape[0]

if not erros:
    print('OK!')

ERRO: ID do grupo deve ser entre 1 e 99.
ERRO (DT): Métricas de Accuracy devem ser todas entre 0 e 1.
ERRO (DT): Métricas de F1 estão numa ordem errada.
ERRO (DT): Previsões das classes devem todas ser 0 ou 1.
ERRO (KNN): Previsões das classes devem todas ser 0 ou 1.
ERRO (NB): Métricas de MCC devem ser todas entre -1 e 1.
