Trabalho Prático II da disciplina de Aprendizado de Máquina, ministrada pelo professor Adriano Veloso.
O trabalho foi feito em um ambiente Anaconda, cujas dependências estão salvas no arquivo environment.yml. Para criar um ambiente idêntico, é necessário:
- Estar no diretório raiz do projeto
- Usar o comando
conda env create -f environment.yml
Para ter os dados em seu computador local, você deve:
- Estar no diretório raiz do projeto
- Usar o comando
bash handle_data.sh
Todo o código relativo ao trabalho está presente no arquivo main.ipynb do diretório notebooks. Para executá-lo, basta ter as dependências necessárias instaladas e rodar as células do notebook como desejar.
ATENÇÃO: no código disponibilizado, os modelos de boosting são criados com um total de 500 estimadores, o que pode demorar algum tempo. Para uma experiência mais rápida de apenas checagem de funcionamento, é necessário alterar o valor da constante MAXIMUM_NUMBER_OF_STUMPS na segunda célula do arquivo principal. Recomendo valores entre 20 e 50 para execuções rápidas e simples.