layout | keywords | comments | title | description | author | micro_nav | page_nav | ||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
default |
false |
rwhatsapp |
Curso de coleta e tratamento de dados do WhatsApp |
|
false |
|
Este é um curso de curta duração cujo principal objetivo é apresentar, em uma linguagem objetiva e instrumental, técnicas de extração e tratamento de dados obtidos a partir de chats do WhatsApp. A oficina não se propõe a introduzir princípios e fundamentos da linguagem R ou da ciência de dados, mas alguns desses tópicos podem ser discutidos ao longo das aulas. No geral, pretende-se trabalhar com a exportação nativa de chats do WhatsApp, a inserção desses dados no software R Studio como um dataframe, e subsequente modelagem, transformação e visualização desses dados. Os alunos serão levados a exercitar essas habilidades e produzir análises exploratórias dos dados com estatísticas descritivas.
O curso tem caráter de oficina. Serão ministradas duas aulas síncronas com 4h de duração cada. Os alunos receberão material de apoio, documentação e scripts com os principais comandos executados a cada aula, por meio de um grupo da oficina no próprio WhatsApp. É necessário ter um computador (desktop ou laptop) com acesso à internet para o curso. Solicita-se a instalação prévia dos seguintes softwares, todos opensource:
- R https://cran-r.c3sl.ufpr.br/ (versões para Linux, Mac OS e Windows disponíveis)
- R Studio https://www.rstudio.com/products/rstudio/download/#download (versões para Linux, Mac OS e Windows disponíveis)
Instale sempre primeiro o software R e depois o R Studio. Usuários de Mac Os devem instalar também o X Quartz https://www.xquartz.org/. Durante o curso, outros pacotes e plugins serão instalados, conforme orientação do(a) professor(a) responsável.
rwhatsapp · # O rwhatsapp é um script desenvolvido por Johannes Gruber para manipulação e parse de dados exportados a partir de chats do WhatsApp. Para mais informações, consulte: https://github.com/JBGruber/rwhatsapp
dplyr · # O dplyr é um dos pacotes do Tidyverse e é voltado especificamente para o trabalho de manipulação de dados. O dplyr se estrutura em torno de um conjunto de verbos, que operam como funções para a manipulação de grandes bancos de dados. Para mais detalhes, acesse: https://dplyr.tidyverse.org/
-
Aquino, Jakson Alves de. R para cientistas sociais. Ilhéus: Editora da UESC, 2014.
-
Oliveira, Paulo Felipe de; Guerra, Saulo; McDonell, Robert. Ciência de Dados com R: Introdução. Brasília: Editora IBPad, 2018.
-
Wickham, Hadley; Grolemund, Garrett. R para data science. Rio de Janeiro: Alta Books, 2019.