Skip to content

leobarone/cebrap_lab_raspagem_r

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Cebrap.lab - Captura de dados na Internet com R

Informações básicas

Instrutor:

Leonardo S. Barone

Data, Hora e Local

De 14 a 18 de Maio de 2018, das 9h às 13h, no auditório do CEBRAP

Apresentação

O curso oferece uma introdução à captura de dados na Internet usando a linguagem R. Por meio de exercícios práticos, os participantes aprenderão estratégias de captura de páginas simples de internet, como páginas de Legislativos brasileiros e/ou de jornais com a finalidade de construir bases de dados úteis à pesquisa em ciências sociais. O curso contempla ainda uma rápida introdução ao uso de APIs de redes sociais [Twitter e Facebook] usando R. O requisito para participar do curso é ter tido exposição prévia à linguagem R ou realizar um tutorial de preparação antes do início das aulas.

Requisitos

Ter tido exposição prévia à linguagem R e ao ambiente de trabalho do RStudio.

Roteiros, calendário e tutoriais

  • 14/05/2018 - O básico da captura de páginas com R - páginas com tabelas
  • 15/05/2018 - O básico da captura de páginas com R - portais de notícias
  • 16/05/2018- Tópicos de captura de dados - Formulários web, twitter, facebook e .pdf
  • [17/05/2018] - Mineração de texto com R - uma introdução breve
  • [18/05/2018] - Desafios de raspagem de dados

Tutoriais

Tutorial 1 - Páginas com tabelas

Tutorial 2 - Introdução ao XPath

Tutorial 3 - Captura de notícias da Folha

Tutorial 4 - Captura de notícias do Data Folha

Tutorial 5 - Mineração de Texto - pacote stringr

Tutorial 6 - Mineração de Texto - pacote tm

Tutorial 7 - Mineração de Texto - pacote tidytext

Tutorial 8 - Formulários na web

Tutorial 9 - Twitter

Tutorial 10- PDF

Tutorial 11 - Facebook

Referências

  • Grolemund, Garrett (2014). Hands-On Programming with R. Ed: O'Reilly Media. Não distribuído gratuitamente. Informações no site da editora aqui
  • Wichkam, Hadley e Grolemund, Garrett (2016). R for Data Science. Ed: O'Reilly Media. Disponível gratuitamente Disponível gratuitamente aqui
  • Wichkam, Hadley (2014). Advanced R. Ed: Chapman and Hall/CRC. Disponível gratuitamente Disponível gratuitamente aqui
  • Gillespie, Colin e Lovelace, Robin (2016). Efficient R programming. Ed: O'Reilly Media. Disponível gratuitamente Disponível gratuitamente aqui

About

Cebrap.lab - Captura de dados na Internet com R

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Languages