Skip to content
This repository has been archived by the owner on Oct 2, 2023. It is now read-only.

Critério para filtrar itens a serem coletados por data é falho #95

Closed
anapaulagomes opened this issue Apr 9, 2020 · 0 comments · Fixed by #99
Closed

Critério para filtrar itens a serem coletados por data é falho #95

anapaulagomes opened this issue Apr 9, 2020 · 0 comments · Fixed by #99
Labels
bug Something isn't working

Comments

@anapaulagomes
Copy link
Contributor

Atualmente o critério utilizado é o mesmo para todas as bases de dados:

return cls.objects.latest("crawled_at").crawled_at.date()

Porém esse critério não funciona para todas as bases. Exemplo:

Base de dados Data Última raspagem Próxima raspagem
Diário Oficial 29/03/2020 31/03/2020 01/04/2020
Contratos 01/08/2017 31/03/2020 01/04/2020

Atualmente vamos checar se os itens novos tem data maior ou igual a data da última raspagem e não a última data do item. Em nenhum dos dois casos vamos conseguir coletar os novos itens, caso eles tenham data menor que a data da última raspagem. No caso dos contratos da prefeitura, por exemplo, os contratos estão desatualizados desde 2017. Se os contratos dos últimos três anos forem atualizados, vamos acabar perdendo-os.
Um outro problema é que nem todos os registros têm, necessariamente, uma data.

Minha ideia no momento: cada model especificar o campo de data a ser utilizado. Caso não tenha um, usamos o crawled_at. O que acham?

@anapaulagomes anapaulagomes added the bug Something isn't working label Apr 9, 2020
@anapaulagomes anapaulagomes added this to To do in MVP - banco de dados via automation Apr 9, 2020
@anapaulagomes anapaulagomes moved this from To do to In progress in MVP - banco de dados Apr 18, 2020
@anapaulagomes anapaulagomes linked a pull request Apr 20, 2020 that will close this issue
MVP - banco de dados automation moved this from In progress to Done Apr 20, 2020
Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
bug Something isn't working
Projects
No open projects
Development

Successfully merging a pull request may close this issue.

1 participant