Skip to content

DadosAbertosDeFeira/empacotador

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

empacotador

O nosso empacotador de dados 📦

Como esse repositório está organizado?

Na pasta datasets você irá encontrar as bases de dados que estamos disponibilizando. Ela segue a estrutura:

datasets
  <orgao-publico>
    <base-de-dados>
        query.sql
        tableschema.json

De onde vem os dados?

Os dados são coletados e armazenados pela Maria Quitéria. Você pode acessá-los em nossa página no Kaggle.

Para baixar os dados localmente você precisará ter configurado a variável de ambiente DATABASE_URL (veja o arquivo .env.example).

Então execute o script seguinte passando como parâmetro o arquivo sql desejado e o nome escolhido:

python fetch_data.py datasets/prefeitura/licitacoes/query.sql
python fetch_data.py datasets/prefeitura/licitacoes/query.sql --filename licitacoes-da-prefeitura

O arquivo com o resultado será criado na mesma pasta do arquivo sql informado.

Como os dados são exportados?

Por enquanto é feito de maneira manual. Dentro de cada diretório de datasets você encontrará um query.sql com a query utilizada para exportação dos dados.

Como os dados são validados?

Utilizamos o Frictionless Data para criar o esquema de dados e, posteriormente, validá-los. Veja mais sobre o table-schema aqui.

Para validar um pacote de dados execute:

goodtables datasets/camara/assiduidade-dos-vereadores/datapackage-results.csv

É esperado que o arquivo esteja na mesma pasta que o seu table-schema.json.

Como contribuir?

Para contribuir você precisará ter instalado:

  • Postgres 9+
  • Poetry

Esse repositório segue o código de conduta e o guia de contribuição do Dados Abertos de Feira.