O LicitAl é um projeto da disciplina de Métodos de Desenvolvimento de Software, que visa automatizar a coleta de informações de licitações de todos os municípios de Alagoas a partir dos Diários Oficiais, além de disponibilizar as informações de forma facilitada para qualquer cidadão. Esse projeto é inspirado no projeto Exoonero, porém com foco em valores gastos com licitações.
O LicitAl é uma ferramenta essencial para quem estuda, trabalha ou está envolvido com a Universidade de Brasília. Com informações atualizadas e confiáveis sobre dados públicos e facilita o acesso a importantes informações.
O docker precisa estar corretamente configurado e o daemon em execução (necessário para rodar o apache tika).
O primeiro passo consistem em:
- Coletar os diários da AMA usando o querido diário
- Extrair o texto dos diários usando apache tika
- Segmentar o diário da AMA() em diversos diários municipais usando o script
extrair_diarios.py
.
Por exemplo, para coletar e processar os diários entre 01/06/2022 e 31/12/2022, basta executar o seguinte comando.
EM LINUX OU MAC:
START_DATE=2022-01-06 END_DATE=2022-12-31 ./coletador.sh
EM WINDOWS:
START_DATE=2022-01-06 END_DATE=2022-12-31 ./coletador_windows.sh
Vale notar que um mesmo dia pode ter mais de um diário, pois existem edições extras. Isso é tratado com a adição de um número depois da data
Essa execução irá gerar um conjunto de arquivos no diretório /data/diarios
. Listamos 2 tipos de arquivos:
-extraido.txt
: versão texto do diário da AMA;-resumo-extracao.json
: resultado da segmentação do diário da AMA em diferentes diários municipais.
Após a coleta, transformação em texto e segmentação do diário em diários, o próximo passo é utilizar o nosso extrator de valores referentes a licitações existentes nos diarios.
O script extrator.sh
processa todos os arquivos -resumo-extracao.json
. Ele extrairá os valores licitados de todos os diários municipais segmentados nos json.
./extrator.sh
A execução desse script gerará um arquivo api.json
contendo os valores de cada cidade em cada mês e ano.
Após realizar a extração das licitações dos diários municipais, basta executar:
python3 site_1.py
Esse script irá processar o arquivo api.json
e gerar arquivos nome-da-cidade.json
e um geral.json
contendo um resumo de todos os dados necessários para gerar a visualização em site.
Os arquivos de dados de cada cidade podem ser encontrados no diretório site
.
A documentação do projeto está disponivel aqui
Douglas |
Joyce |
Marco |
Iago |
Pedro Henrique |
Bruno |
Diego |
Esther |
Este projeto está licenciado sob os termos da licença MIT.