Skip to content

Latest commit

 

History

History
11 lines (7 loc) · 767 Bytes

README.md

File metadata and controls

11 lines (7 loc) · 767 Bytes

Corpora-Calendario-da-Saude

Corpora de tweets sobre campanhas do calendário da saúde brasileiro


Descrição

O corpora é composto por datasets de cada campanha do calendário. Esses datasets possuem tweets do período de 10 anos (2010 a 2020), utilizando as hashtags mais frequentes das campanhas (ex.: #janeirobranco, #cuidadomental, #valorizese, ...). Os tweets foram extraidos através de uma modificação do package snscrape, que permite a extração e geração de dataframes em formato CSV (clique aqui para saber mais da branch).


Caso utilize esse corpora, por favor, inclua uma citação desse repositório junto ao trabalho.