O objetivo deste pacote é disponibilizar coletâneas de stopwords para uso em jurimetria. A proposta é construir, aos poucos, diferentes grupos de stopwords: institucionais, nomes de pessoas, nomes de juízes etc.
Os nomes dos dataframes estejam em português, mas a coluna com os nomes é sempre chamada “word” porque isso facilita na hora de dar um anti_join com o pacote tidytext.
remotes::install_github("jjesusfilho/justop")
Para ver os conjuntos de dados disponíveis, entre no índice de funções do pacote:
help(package= "justop")
Por exemplo, se você quiser ver os nomes mais comuns da lingua portuguesa no Brasil a fim de removê-las da sua base de julgados:
library(justop)
View(nomes)