Código do trabalho de conclusão do curso de Ciência de Dados e Inteligência Artificial da Pontifícia Universidade Católica de São Paulo (PUC-SP).
O trabalho tem como objetivo explorar diferentes metodologias de Processamento de Linguagem Natural (NLP) para a criação e aprimoramento de modelos de deteção de discurso de ódio.
O dataset utilizado está diponível no repositório Portuguese-Hate-Speech-Dataset e foi apresentado no artigo A Hierarchically-Labeled Portuguese Hate Speech Dataset (Fortuna et al., ALW 2019).