Repositório contendo arquivos e códigos para o trabalho final da disciplina de Machine Learning (CMP263) da UFRGS.
-
Alterar colunas que deveriam ser categóricas, mas estão numéricas;
-
Fazer upload do dataset completo;
-
Escolher métodos de treino que façam sentido para as características deste dataset;
- De acordo com artigos referenciados, podemos usar KNN, SVM, Random Forests para treino;
- Algumas variáveis categóricas podem ser tratadas usando One Hot Encoding;
- De acordo com artigos referenciados, podemos utilizar Select Percentile para seleção de features;
-
Escolher métricas de avaliação;
- Para ciber ataques é importante verificar o número de falsos positivos;
- Podemos manter as métricas comuns como Recall, Acurácia, F1, e Precisão;
-
Fazer a Análise Exploratória de Dados e fazer as devidas alterações (evitando Data Leakage!)
-
Aplicar os métodos;
-
Registrar tudo no relatório;
Adicionando link do template do artigo:
https://www.overleaf.com/4136642185hjcghhqdfkdr#5fe090
Sugestão de forma de trabalho:
Focar o código no colab (lembre-se de clicar na opção de salvar no github!!) Artigo no overleaf; Após concluido, colocar no git o artigo.