Skip to content

Coletor de dados do Youtube para projeto de pesquisa sobre as Eleições de 2018

License

Notifications You must be signed in to change notification settings

resocie/youtube-data-monitor

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Monitor de Dados do Youtube

Este repositório compõe projeto de pesquisa com foco empírico nas eleições brasileiras de 2018 do grupo de pesquisa Resocie do Instituto de Ciência Política - IPOL com o apoio técnico do Departamento de Computação - CIC da Universidade de Brasília - UnB.

O projeto consiste na coleta sistemática de informações quantitativas da plataforma Youtube com o objetivo de subsidiar a análise do comportamento político de alguns atores da cena eleitoral durante o período de campanha. Além de seu objetivo finalístico para a coleta de dados, o projeto tem também por intuito servir de material de estudo dos alunos da disciplina Engenharia de Software do Departamento de Ciência da Computação da UnB no 1º semestre de 2018.

As instruções a seguir trazem orientações para aqueles que quiserem contribuir com a iniciativa.

Preparar ambiente

Um bom processo de trabalho em desenvolvimento de software começa com a preparação de um ambiente adequado de programação.

Instalar pacotes básicos

O Henrique Bastos fez uma postagem super relevante sobre organização de ambientes python. Vale a leitura.

Clonar repositório

$ git clone git@github.com:code4pol/youtube-data-monitor.git

Criar virtual env

$ mkvirtualenv youtube-data-monitor
$ workon youtube-data-monitor

Instalar dependências

Todas as bibliotecas de que o projeto depende estão listadas no arquivo requirements.txt. Para instalá-las, execute:

$ cd youtube-data-monitor
$ pip install -r requirements.txt

Acesso à API do youtube

Neste projeto, utilizamos a Youtube Data API v3. Para que o script funcione corretamente, é necessário que você registre seu projeto e crie as credenciais necessárias para acesso à API. As instruções estão disponíveis no Step 1 (INSTALLED APP) do Python Quickstart.

Executar os testes

Todos os testes foram desenvolvidos utilizando a biblioteca unittest nativa do Python. Para executá-los, a partir da pasta raiz do projeto, execute:

$ python -m unittest discover tests

Sugiro darem uma olhada nesta ótima introdução ao unittest

ToDo

Este é apenas um esqueleto de projeto para que o grupo comece a trabalhar. Resta ainda muito trabalho a ser feito. Algumas ideias:

  • Corrigir testes quebrados
  • Complementar testes e revisar o que faz e o que não faz sentido ser testado
  • Remover código hard-coded
  • Otimizar estratégia de autorização do script para que não a se requeira a cada nova execução.
  • Remover mensagens de DeprecationWarning
  • Expandir a variedade dos dados buscados
  • Explorar novas possibilidades de coleta
  • Avaliar outras opções para consumo da API
  • Criar interface CLI para execução do programa
  • Implementar mecanismo para automatização da coleta recorrente dos dados
  • Persistir dados coletados em base estruturada
  • Viabilizar interface de integração da base de dados criada com canal para geração de informações visuais

Licença

Código disponível sob Licença MIT

Troubleshooting

Pode se que durante a execução dos testes ocorra o erro ModuleNotFoundError: No module named 'oauth2client.locked_file'. Nesse caso, será necessário realizar o downgrade da biblioteca oauth2client para a versão 3.0.0.

About

Coletor de dados do Youtube para projeto de pesquisa sobre as Eleições de 2018

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages