Uma Abordagem para Classificação de Sentimentos de Tweets Relacionados a Campanha Presidencial Brasileira 2022
Trabalho de Conclusão de Curso da Especialiazação em Engenharia e Ciência de Dados realizada no Centro de Informática da Universidade Federal de Pernambuco (CIn-UFPE)
O avanço da tecnologia e o desenvolvimento das redes sociais fez com que qualquer pessoa pudesse expressar sua opinião de forma pública,ocasionando dessa forma, uma avalanche de dados textuais produzidos a cada segundo, tornando-se um vasto campo de estudo para aplicação das técnicas de Processamento de Linguagem Natural. No Brasil o ano de 2022 foi caracterizado pela eleição presidencial e o Twitter tornou-se uma das redes sociais com volumes expressivos de comentários sobre o assunto. Neste contexto, no presente trabalho se propôs a realização da análise de sentimentos, dos tweets referentes aos quatro principais candidatos à presidência, com o uso de modelos de aprendizagem de máquina para otimização do processo. Os modelos Random Forest, Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM) e Bidirectional Encoder Representations from Transformers (BERT), foram treinados e avaliados, tendo os resultados obtidos para a classificação, juntamente com outras informações do contexto, disponibilizados em um dashboard intitulado Analisador de Tweets CPBr 2022.
Visando fornecer uma perspectiva do contexto das eleições presidenciais em função dos dados obtidos, foi desenvolvido um dashboard denominado Analisador de Tweets - CPBr 2022, abrangendo o período entre as datas 18 de setembro de 2022 e 31 de outubro de 2022. Este período inclui os dias de votação do primeiro e do segundo turno que ocorreram respectivamente nas datas 2 de outubro de 2022 e 30 de outubro de 2022. O dashboard desenvolvido com o software Tableau® está disponível publicamente no seguinte endereço: https://public.tableau.com/app/profile/david.soares/viz/TwitterAnalyzer-CPBr2022/Painel-Versao-1