Skip to content
Nesse projeto é realizado a raspagem, limpeza e análise dos dados da Assembléia Legislativa do Estado do Ceará visando extrair informações sobre o uso de verbas públicas pelos parlamentares no estado do Ceará. Os dados são obtidos da página de dados abertos da assembleia legislativa nesse link: https://www.al.ce.gov.br/index.php/transparencia/ve…
Branch: master
Clone or download
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
data
packrat
presentation Apresentação para o workshop Data Scraping with R Mar 23, 2019
src Facilitando entendimento do código Mar 23, 2019
vis Pequenas correções Mar 23, 2019
.Rprofile Criação da estrutura básica do projeto Mar 14, 2019
.gitignore
Dockerfile Suporte a Docker para execução do projeto. Mar 15, 2019
LICENSE Initial commit Mar 15, 2019
README.md Update README.md Mar 23, 2019
run_analyses.R
verba-de-desempenho-parlamentar.Rproj

README.md

Objetivo do Projeto

Nesse projeto é realizado a raspagem, limpeza e análise dos dados da Assembléia Legislativa do Estado do Ceará visando extrair informações sobre o uso de verbas públicas pelos parlamentares no estado do Ceará. Os dados são obtidos da página de dados abertos da assembleia legislativa nesse link.

Infelizmente os dados não apropriadamente disponibilizados em formatos amigáveis para análise (csv, XML, JSON etc), e alguém que deseja ter uma visão holística dos dados públicos necessitará de muito tempo e esforço, o que torna inviável essa análise.

Dessa forma o projeto tem como principais objetivo:

  • Tornar pública e facilmente acessível uma análise visual de como estão sendo direcionados os gastos públicos da assembleia legislativa cearense
  • Servir como modelo e fonte de aprendizado para pessoas com interesse em explorar mais esse tipo de informação
  • Motivar a comunidade Open Data a contribuir com diversos outros projetos

Para fins didáticos, esse projeto é divido em três principais partes:

  1. Raspagem dos dados (Web scraping)
  2. Limpeza dos dados
  3. Visualização de dados

Open Data Day Fortaleza

Esse projeto projeto será apresentado nas oficinas do encontro Open Data Day realizado em Fortaleza/CE no dia 23/03/2019. As oficinas serão dividias em três partes e ministradas por:

Maiores informações em: TODO

Instalação e dependências

Docker

TODO

Linux

TODO

Windows

TODO

Estrutura do projeto

A estrutura está descrita a seguir:

.
└── open-data-assembleia-legislativa-ce
    ├── src
    │   ├── web-scrapping.R 
    │   ├── clean-data.R 
      ├── data 
      │   ├── raw 
      |   ├── temp 
      │   └── processed 
      ├── README.md 
      ├── run_analyses.R 
      ├── Dockerfile 
      └── .gitignore

TODO

Adicional para aprendizado

Boas práticas de código

O projeto utiliza o seguinte padrão de código definido nesse guia de estilo.

Boas práticas de projeto

O projeto segue o guia de boas práticas descrito nesse link.

Referências Úteis

TODO

Como Extrair Dados de Arquivos PDF

Curso de Web Scaping com R

Como rodar seu ambiente R em Docker

You can’t perform that action at this time.