-
-
Notifications
You must be signed in to change notification settings - Fork 384
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
adicionando raspadores para abare, adustina, almadina, anage e andorinha #1134
Conversation
Tive este erro ao instalar os requirements de dev: ERROR: In --require-hashes mode, all requirements must have their versions pinned with ==. These do not: importlib-metadata>=4.6 from https://files.pythonhosted.org/packages/2d/0a/679461c511447ffaf176567d5c496d1de27cbe34a87df6677d7171b2fbd4/importlib_metadata-7.1.0-py3-none-any.whl (from build==1.0.3->-r data_collection/requirements-dev.txt (line 48)) e precisei instalar importlib e build. Signed-off-by: Cássia Sampaio <4005687+cassiasamp@users.noreply.github.com>
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
@cassiasamp, isso! caminhou bem!
Só deu errado a execução pq as URLs que devem ser usadas são as mesmas que estão naquela lista, só copiar.
Faz essas modificações que apontei aqui e tenta a coleta de novo
Co-authored-by: Juliana Trevine <44185775+trevineju@users.noreply.github.com> Signed-off-by: Cássia Sampaio <4005687+cassiasamp@users.noreply.github.com>
Co-authored-by: Juliana Trevine <44185775+trevineju@users.noreply.github.com> Signed-off-by: Cássia Sampaio <4005687+cassiasamp@users.noreply.github.com>
Co-authored-by: Juliana Trevine <44185775+trevineju@users.noreply.github.com> Signed-off-by: Cássia Sampaio <4005687+cassiasamp@users.noreply.github.com>
Co-authored-by: Juliana Trevine <44185775+trevineju@users.noreply.github.com> Signed-off-by: Cássia Sampaio <4005687+cassiasamp@users.noreply.github.com>
@trevineju testei aqui e parece que não eram as urls. vou fechar esse PR e mandar um novo, tudo bem? aí aproveito e separo do arquivo de request que tinha ido junto sem querer. |
Fechando este para mandar um novo com tudo certinho! |
Layout do site publicador de diários oficiais
Marque apenas um dos itens a seguir:
Código da(s) spider(s)
custom_settings
em meu raspador.Testes
.log
deste teste está anexado na PR..log
e.csv
deste teste estão anexados na PR..log
e.csv
deste teste estão anexados na PR.Verificações
.csv
gerados pela minha coleta conforme a documentação não encontrando problemas..log
gerados pela minha coleta conforme a documentação não encontrando problemas.No entanto, eu encontrei problemas nos arquivos de log e apenas os raspadores de Abaré e Almadina foram preenchidos com as páginas do diário.
Há erros nos logs de Adustina, Anagé e Andorinha, mas não sei como interpretá-los para corrigir o problema, se foi algum typo que está passando batido ou alguma outra configuração faltante.
Descrição
PR com os primeiros 5 municípios da issue #1115 - lembrando que apenas os raspadores de Abaré e Almadina coletaram dados.
Arquivos de csv e log gerados:
ba_andorinha.csv
ba_andorinha_jan_dec_2023.csv
log_ba_andorinha_jan_dec_2023.txt
log_ba_andorinha.txt
ba_anage_jan_dec_2023.csv
log_ba_anage_jan_dec_2023.txt
ba_anage.csv
log_ba_anage.txt
ba_adustina_jan_dec_2023.csv
log_ba_adustina_jan_dec_2023.txt
log_ba_adustina.txt
ba_adustina.csv
log_ba_almadina.txt
ba_almadina.csv
log_ba_almadina_jan_dec_2023.txt
ba_almadina_jan_dec_2023.csv
ba_abare.csv
log_ba_abare.txt
log_ba_abare_jan_dec_2023.txt
ba_abare_jan_dec_2023.csv